Hari ini saya berbicara dengan Mustafa Suleyman, CEO Microsoft AI. Dan saya sebenarnya akan mempersingkat intro hari ini - saya bekerja dari pertanian keluarga istri saya minggu ini, seperti yang bisa Anda lihat di video, tetapi ini juga merupakan episode yang sangat menarik. Kami membahas semuanya mulai dari pendekatan Mustafa dalam melatih model-model baru hingga kritiknya terhadap Anthropic yang berbicara tentang Claude seolah-olah hal itu dilakukan secara sadar. Tentu saja, kami juga berbicara tentang hubungan Microsoft dengan OpenAI, bagaimana Mustafa memikirkan semua jajak pendapat negatif dan penolakan politik seputar AI saat ini, dan apakah ada produk konsumen yang cukup baik untuk mengatasinya. Seperti yang saya katakan, ini adalah pembakar. Oke: Mustafa Suleyman, CEO Microsoft AI. Ini dia. Wawancara ini telah sedikit diedit agar panjang dan jelasnya. Mustafa Suleyman, Anda adalah CEO Microsoft AI. Selamat datang kembali di Dekoder. Senang bisa bersamamu lagi. Saya sangat bersemangat untuk berbicara dengan Anda. Percakapan kami sebelumnya adalah salah satu percakapan favorit saya — tentang AI, bagaimana seharusnya perasaan kita terhadapnya, dan kegunaannya — yang selalu saya lakukan dalam semua percakapan yang kami lakukan.  Ada beberapa perubahan besar di Microsoft, mungkin beberapa rekontekstualisasi yang sangat penting tentang perasaan orang terhadap AI yang ingin saya bicarakan secara khusus dengan Anda. Dan kemudian ada Microsoft Build, konferensi besar pengembang Microsoft, yang menampilkan banyak pengumuman baru dan banyak ide besar tentang kegunaan komputer dan mungkin di mana komputer seharusnya berada, yang ingin saya bahas. Mari kita mulai dari awal. Ini adalah beberapa hal Decoder mendalam yang penting untuk dipahami sebelum hal lainnya. Sejak Anda bergabung dengan Microsoft, Anda telah merestrukturisasi cara kerja AI di sana. Peran Anda telah berubah. Terakhir kali saya berbicara dengan Anda, Anda bertanggung jawab atas banyak produk konsumen. Hal itu telah dikesampingkan. Anda sekarang sedang melatih model baru; kamu berada di perbatasan.  Jelaskan bagaimana struktur Microsoft AI saat ini dan bagaimana strukturnya di dalam Microsoft. Saya kira sekitar 15 hingga 18 bulan terakhir ini kami telah melakukan perjalanan untuk membangun kembali hubungan kami dengan OpenAI, dan ini membutuhkan waktu sebentar. Saya pikir itu mencapai puncaknya pada kontrak baru yang kami selesaikan pada bulan Oktober tahun lalu. Dan terdapat banyak sekali ketentuan yang berbeda di dalamnya, termasuk memperkuat dan memperluas kemitraan, namun yang terpenting adalah membebaskan kita untuk dapat mengejar kecerdasan super secara mandiri serta terus membeli dan melisensikan model mereka. Jadi sejak bulan Oktober, saya telah membentuk tim Superintelligence, membangun kelompok dengan skala yang cukup untuk melatih model-model terdepan, dan mempekerjakan tim yang berfokus pada superintelligence. Hal ini merupakan perubahan yang cukup besar bagi kami karena hal ini memungkinkan saya untuk fokus hanya pada misi superintelligence, dan hal ini kemudian mencapai puncaknya pada beberapa hal yang kami umumkan minggu ini di Build. Kami memiliki tujuh model baru di semua modalitas dan seterusnya. Jadi ini merupakan perubahan yang cukup besar, dan menurut saya perencanaannya membutuhkan waktu yang lama, dan merupakan sebuah kelegaan bagi kami saat ini untuk ikut serta dan mencapai garis depan dalam beberapa tahun ke depan. Apakah ini rencananya ketika Anda dipekerjakan di Microsoft? Itu pasti sudah menjadi rencana selama 18 bulan terakhir. Maksud saya, menurut saya hubungan dengan OpenAI telah mengalami banyak pasang surut. Dan dalam banyak hal, saya pikir ini akan menjadi salah satu kemitraan paling sukses dalam sejarah. Hal ini merupakan hal yang luar biasa bagi OpenAI, dan juga bagi Microsoft, dan semua hubungan baik terus berkembang, dan menurut saya ini hanyalah tahap berikutnya dalam evolusi kami. Izinkan saya bertanya kepada Anda tentang evolusi itu secara spesifik. Kita semua baru saja melihat uji coba antara Elon Musk dan OpenAI dan Sam Altman. Microsoft terlibat dalam persidangan tersebut dalam artian sering kali pengacara dari Microsoft akan berdiri dan berkata, “Dan kami tidak ada.” Dan seseorang akan mengatakan ya, dan itu saja. Namun yang jelas, apa yang muncul selama uji coba tersebut, yang sudah jelas selama ini, adalah bahwa gagasan awal adalah bahwa OpenAI akan menjadi laboratorium penelitian dan menyediakan model, sementara Microsoft akan membuat produknya. Microsoft memiliki keahlian dalam memasuki pasar; perusahaan ini mempunyai keahlian di bidang perusahaan, dan perusahaan tersebut berusaha mendapatkan kembali pengaruhnya di konsumen dengan berbagai cara. Ini akan menjadi peralihan platform, dan pekerjaan penelitian akan berakhir di OpenAI, dan pekerjaan produk akan dilakukan di dalam Microsoft.  Hal itulah yang berubah: OpenAI ingin membuat lebih banyak produk konsumen. Jelas sekali, mengingat peran baru dan fokus baru Anda, Microsoft semakin ingin membuat modelnya sendiri. Mengapa perpecahan? Apa yang tidak berhasil dalam hubungan itu? Maksud saya, menurut saya OpenAI dipimpin oleh tim pendiri yang sangat ambisius, dan Sam sendiri. Dan tentu saja, ketika mereka mulai mendapatkan lebih banyak daya tarik dan menghasilkan banyak pendapatan, mereka melihat peluang untuk mencapai kesuksesan penuh. Jadi mereka tidak hanya mulai mengerjakan produk konsumen. Jelas sekali, ChatGPT sangat sukses. Mereka juga mulai mengerjakan pusat data mereka sendiri. Mereka mulai membuat chip mereka sendiri. Ada banyak rumor yang beredar tentang perangkat keras konsumen mereka sendiri. Mereka mulai membawa model langsung ke pasar melalui ChatGPT Enterprise. Jadi secara keseluruhan, penelitian tersebut telah berkembang jauh melampaui penelitian selama dua, tiga, empat tahun terakhir. Dan tentu saja hal yang sama juga berlaku untuk Microsoft. Maksud saya, menurut saya kemitraan ini sudah berumur lima atau enam tahun, dan masih ada empat, lima, enam tahun lagi yang harus dijalankan. Demikian pula, kami adalah salah satu perusahaan teknologi terbesar di dunia. Kami memiliki 493 dari 500 perusahaan terbesar yang menyimpan dan memproses sebagian besar data mereka di sistem kami, menggunakan Azure, menggunakan M365, dan Teams. Saya pikir orang-orang sering kali kurang menghargai betapa besarnya kami dan seberapa besar distribusi kami di dunia usaha. Jadi, dalam jangka panjang, maksud saya dalam lima, enam, tujuh, 10 tahun, kita harus memastikan bahwa kita benar-benar berkelanjutan, dan kita bukan hanya penerima kekayaan intelektual orang lain yang kemudian kita modifikasi sedikit, adaptasi dan masukkan ke dalam produksi produk kita, tapi kita benar-benar bisa mandiri dan menciptakan model kelas dunia. Maksudku, kecerdasan super akan datang. Saya pikir itu sudah dekat. Jadi menurut saya ini pada dasarnya akan menjadi teknologi paling berharga sepanjang masa. Tidak mungkin, dalam jangka panjang, kita secara struktural bergantung pada pihak ketiga untuk menyediakan IP tersebut untuk selamanya. Jadi itulah transisi yang jelas dipicu ketika OpenAI dan sebagainya mengalami masalah dewan. Tapi kemudian ketika saya masuk dan tim saya masuk, kami mulai mengembangkannya, kami sedang dalam transisi itu. Dan saya pikir kita berada di posisi yang bagus karena kita dapat mengambil posisi yang cukup stabil, hati-hati, dan optimal dalam jangka panjang, baik untuk OpenAI, yang menurut saya telah melakukan hal ini dengan sangat baik, dan juga untuk kami. Saya ingin meluangkan waktu untuk membahas kecerdasan super. Saya hanya ingin memasang pin di dalamnya sekarang karena saya hanya ingin memahami transisi untuk satu putaran lagi di sini. Ada momen dalam uji coba, semacam pesan yang sangat lucu dari CEO Microsoft, Satya Nadella, dia berkata, "Saya tidak ingin menjadi Intel dan OpenAI menjadi Microsoft," yang sangat lucu dalam konteks CEO Microsoft sendiri yang mengatakan, "Saya tidak ingin menjadi penyedia, dan menjadikan mereka sebagai platform yang memberikan semua nilai dan mengumpulkan semua nilai dan mungkin kita akan ditukar. Saya tidak ingin ChatGPT berjalan di Azure, dan OpenAI akan mendapatkan semua nilainya, dan mungkin mereka bisa menukar kita,” seperti yang terjadi dengan Windows dan Intel seiring berjalannya waktu. Apakah itu suatu realisasi? Apakah Nadella mendatangimu? Seperti apa pertemuan itu saat Anda berkata, "Oke, OpenAI punya masalah dengan dewannya. Kita harus kembali ke garis depan dan berdiri di atas kedua kaki kita sendiri." Seperti apa percakapan tersebut, dan bagaimana keputusan tersebut diambil? Maksud saya, jelas itu adalah keputusan Satya, begitu pula Amy, Brad, dan banyak orang lain di perusahaan itu. Namun menurut saya, hal ini sama saja dengan apa pun: perubahan ini terjadi secara perlahan di dalam perusahaan, karena perusahaan menyadari bahwa arah yang diambil memerlukan sedikit perubahan dan penyesuaian. Hal ini terjadi jauh sebelum insiden dewan direksi pada bulan November, dan menurut saya hal ini akan semakin berkembang seiring berjalannya waktu ketika Anda melihat konstelasi berbagai bidang yang menjadi tempat kita bersaing secara langsung, semakin meningkat, dan semua ketegangan yang timbul dari hal tersebut. Namun juga mengetahui bahwa kemitraan seperti itu tidak bertahan selamanya.  Maksud saya, OpenAI ingin menjadi perusahaan publik bernilai triliunan dolar, memiliki pendapatan luar biasa, dan berkembang pesat. Mereka ingin memiliki kebebasan untuk mengoperasikan dan membeli komputer dari berbagai tempat lain, membuat komputer sendiri, dan bermitra dengan siapa pun yang mereka inginkan. Jadi kontrak tersebut dibentuk pada saat kedua perusahaan sangat berbeda dalam hal ukuran dan skala serta keseimbangan kebutuhan dan barang. Saya pikir hal ini masuk akal pada saat itu, namun kemudian menjadi sangat jelas bahwa ini adalah sesuatu yang harus kita miliki dan kendalikan dan lakukan dengan benar oleh pelanggan kita sendiri. Seperti yang saya katakan, kami memiliki distribusi yang luar biasa pada perusahaan, yang menurut saya tidak ada bandingannya di dunia. Oleh karena itu, kami harus memastikan bahwa kami memberikan yang terbaik bagi pelanggan kami. Hal ini terlihat sedikit berbeda dengan perusahaan yang telah bersama-sama mengoptimalkan baik untuk konsumen, dengan ChatGPT, dan untuk perusahaan, dan juga untuk misi sains dasar superintelligence, yang mencakup sejumlah besar arah berbeda yang saling tumpang tindih namun dapat dikatakan ortogonal terhadap arah konsumen dan perusahaan juga. Tentu saja, menurut saya begitulah kemitraan berkembang, dan kemitraan tersebut diatur ulang secara berkala. Ya, tapi membangun model perbatasan itu sangat mahal, saya diberitahu. Dapat dipercaya, ini adalah proyek yang sangat mahal. Pada titik tertentu, Amy Hood, CFO Microsoft, berkata, “Ya, Anda punya anggarannya.” Kapan itu terjadi? Apakah itu hanya pesan teks? Apakah ada pertemuan? Ceritakan tentang spesifiknya di sana. Saya pikir, kami membuat keputusan pada awal tahun lalu, yang jelas menginformasikan semua negosiasi kontrak, yang kemudian diselesaikan dan ditandatangani pada bulan Oktober. Dan ini merupakan investasi yang signifikan, namun kita mempunyai waktu yang lama untuk mewujudkannya. Maksud saya, kita telah melakukan investasi yang signifikan dalam misi swasembada kita.  Chip Maia 200 kita sebenarnya adalah chip yang luar biasa, sebagai salah satu contohnya bukan? Kami sekarang dapat memproduksi dan mengirimkan chip yang 30 persen lebih murah daripada GB200 di dalam cluster kami sendiri. Dan sekarang kami dapat merancang model kami sendiri dengannya, model MAI-Thinking-1 yang baru saja kami rilis sebenarnya memberikan peningkatan kinerja 1,4x per watt di atas peningkatan 30 persen yang Anda dapatkan dari menjalankan Maia 200 setelah kami mengoptimalkan model untuk tugas-tugas kami. Jadi nilai dari memastikan bahwa Anda memiliki dan mengontrol tumpukan Anda sendiri dan mengarahkan seluruh upaya desain bersama secara menyeluruh untuk kasus penggunaan yang paling penting bagi kami — yang jelas merupakan pengkodean agen, pengembang kami, perusahaan kami — yang jelas memberikan dividen yang membenarkan investasi yang harus kami lakukan selama beberapa tahun ke depan. Anda mengatakan misi swasembada, yang merupakan cara yang sangat sopan untuk mengatakan Anda ingin berdiri sendiri; kamu ingin melakukan urusanmu sendiri. Saya diberitahu bahwa ada beberapa kontroversi di dalam Microsoft tentang kalimat yang ditulis rekan saya Hayden Field dalam artikel yang menjelaskan Build. Saya baru saja akan membaca ini. Ini dari Hayden. Itu garis yang bagus. Dia berkata, “Microsoft Build tahun ini memiliki nuansa seperti seorang janda yang baru saja bercerai dan memposting jebakan kehausan di Instagram.” Perpisahan telah selesai, dan inilah waktunya untuk melenturkan diri. Inilah model baru kami. Kami akan berdiri dengan kedua kaki kami. Anda mengatakan bahwa Anda akan membuat model terdepan dan bersaing dengan laboratorium terkemuka. Apakah itu perasaan di dalam Microsoft bahwa Anda bebas untuk mandiri? Jelas tidak. Tidak, tidak sama sekali. Maksud saya, jelas itu judul yang keren dan ungkapan yang menyenangkan. Namun kenyataannya adalah kami bermitra dengan OpenAI selama bertahun-tahun yang akan datang. Maksud saya, kita sedang menuju ke utara pada tahun 2030. Mereka masih memproduksi model-model terbaik di dunia. GPT-5.5 adalah model yang luar biasa. Codex, model keamanan siber yang sedang berkembang, sungguh luar biasa dan mendukung sebagian besar tindakan kita. Tentu saja, hal itu akan terus berlanjut. Jadi menurut saya itu adalah hal yang wajar dalam kemitraan semacam ini. Menurut saya, ini bukan sesuatu yang tidak diinginkan atau mengejutkan. Saya pikir OpenAI sangat memahami dan mendukung hal itu. Maksud saya, mereka jelas merupakan perusahaan yang berkembang sangat pesat, dan mereka memahami bahwa kita juga harus menjalankan agenda kita sendiri. Jadi itu sangat normal. Izinkan saya menanyakan pertanyaan Decoder lainnya, dan kemudian saya ingin membahas pengumuman di Build, dan tentunya superintelligence. Terakhir kali kita berbicara, Anda mengatakan bahwa kerangka pengambilan keputusan Anda beroperasi dalam siklus enam minggu, mengingat betapa cepatnya AI bergerak. Kalau begitu, itu masuk akal. Mungkin segalanya sudah beres. Mungkin ada beberapa hal yang lebih fokus. Apa kerangka pengambilan keputusan Anda saat ini? Kami masih beroperasi dengan ritme siklus yang sama. Di akhir setiap siklus, kami mengadakan pertemuan tatap muka selama satu minggu. Saya sangat percaya akan hal ini, meskipun kita masih menerapkan budaya di kantor, empat hari seminggu. Faktanya, seminggu setelahnya, seluruh tim Superintelligence saya berkumpul secara langsung di Boston selama empat hari. Itu adalah retrospeksi kami tentang bagaimana Build berjalan, apa yang kami pelajari, apa yang belum kami lakukan dengan benar, apa yang perlu kami tingkatkan, perencanaan kami untuk siklus berikutnya, yang kali ini akan berjalan selama delapan minggu dengan pertemuan satu minggu setelahnya, dan itu semua direncanakan untuk satu tahun penuh. Jadi seluruh organisasi mengetahui bahwa itulah ritme yang kami gunakan dalam beroperasi. Dan menurut saya sebenarnya sangat penting untuk menekankan jangka waktu tersebut, karena perencanaan triwulanan menjadi agak kabur dan abstrak. Saya pikir enam hingga delapan minggu, tergantung pada posisinya dalam kalender, sebenarnya adalah waktu optimal untuk mewujudkan misi yang sangat jelas dan dapat diperkuat. Jadi kami juga, selain mengikuti ritme siklus enam hingga delapan minggu ini, beroperasi dalam regu. Pasukan tersebut merupakan subkelompok campuran interdisipliner yang berfokus pada misi tertentu, dan mereka tidak selalu bergantung pada manajer. Mereka sebenarnya dijalankan oleh DRI, dan DRI sering kali merupakan IC, dan tugas mereka adalah– Itu adalah “individu yang bertanggung jawab langsung” dan “kontributor individu”. Ya, tepatnya. Terima kasih. Dan saya pikir kami telah mengambil pendekatan untuk memisahkan peran manajer dari peran DRI yang menjalankan misi tertentu. Saya rasa itu karena menjadi DRI yang hebat itu melelahkan. Anda benar-benar bekerja keras 24 jam sehari, dan Anda berusaha sekuat tenaga. Menjadi seorang manajer sering kali berarti menjadi seorang Pembina, menawarkan dukungan, memberikan bimbingan, umpan balik, membuka segala macam hal, membantu pertumbuhan karier orang-orang. Jadi menurut saya memisahkannya memungkinkan kita merotasi DRI setiap dua atau tiga siklus sehingga beberapa orang dapat mencoba posisi berbeda dan melakukan rotasi. Ini adalah struktur yang hebat dan sangat fleksibel yang memungkinkan kita menjadi cukup gesit, menurut saya. Mari kita bicara tentang Membangun. Saya ingin memulai dengan kecerdasan super. Anda telah menyebutkannya beberapa kali sekarang. Saya baru saja di Google IO. Demis Hassabis, yang pernah menjadi kolega Anda saat Anda berada di Google, mengakhiri pidato utama tersebut dengan mengatakan bahwa kita berada di “kaki bukit singularitas, dan bahwa AGI hadir dengan segenap kekuatan Google.” Maksud Anda, kecerdasan super ada di sini. Apakah ini semua sama? Apakah kita menggunakan bahasa yang berbeda untuk mendeskripsikan AGI? Apakah ada perbedaan? Bagaimana Anda mendefinisikan superintelligence dalam konteks Anda versus singularitas dalam konteks Demis? Maksudku, jelas aku tidak bilang itu ada di sini. Aku bilang itu akan datang. Dan menurut saya ada banyak ketidakjelasan dalam frasa ini. Namun menurut saya apa yang dapat kita lihat dengan jelas bahwa apa yang terjadi saat ini adalah adanya peningkatan log-linear di semua modalitas, dan itu berarti bahwa ada hubungan yang sangat langsung antara setiap urutan besarnya komputasi yang kami terapkan, setiap peningkatan bertahap dalam data, dan peningkatan tolok ukur, baik itu tolok ukur publik, tolok ukur internal, target yang kami fokuskan dengan lingkungan pembelajaran penguatan. Dan itu adalah pengamatan yang sangat penting.  Prediksi-prediksi tersebut, menurut saya, sedang dibuat oleh kita semua – Saya memahami mengapa beberapa orang bersikap skeptis terhadap prediksi tersebut atau mengajukan pertanyaan, namun prediksi tersebut sangat didasarkan pada pengamatan empiris terhadap peningkatan kinerja model-model ini selama lebih dari satu dekade. Maksud saya, pada dasarnya arsitektur tujuan umum yang sama telah menerapkan komputasi 12 lipat lebih banyak, peningkatan FLOPS triliun kali lipat selama 15 tahun, dan pada dasarnya telah berfungsi dalam audio, gambar, teks, kode, dan banyak tugas prediksi deret waktu lainnya. Oleh karena itu, pada dasarnya kami mengekstrapolasi bahwa komputasi yang lebih besar akan memungkinkan kami untuk terus mendaki dengan cara log-linear ini di dalam lingkungan lain. Dan kemudian timbul pertanyaan, apakah kita akan mampu melatih model yang dapat menciptakan pengetahuan baru, tidak hanya melakukan ekstrapolasi dari data yang kita miliki, namun benar-benar mengajari kita hal-hal yang tidak kita ketahui, dan membuat penemuan baru? Lalu hal kedua adalah, apakah mereka memiliki kapasitas untuk memperbaiki diri dan mempercepat proses pengambilan keputusan hipotesis mana yang harus ditetapkan, hipotesis mana yang harus dijalankan, bagaimana menghasilkan data pelatihan untuk masing-masing hipotesis, bagaimana memasukkan hipotesis tersebut ke dalam proses baru, atau bahkan berinovasi pada arsitektur sebenarnya? Jadi, menurut saya kedua hal tersebut harus benar agar dapat melihat kemajuan yang semakin besar ini, namun menurut saya kita akan terus mendapatkan keuntungan besar hanya dengan menerapkan beberapa kali lipat komputasi berikutnya. Hal ini mungkin setara dengan kinerja manusia dalam banyak tugas lainnya, seperti yang telah kita lihat terjadi dalam enam bulan terakhir dalam bidang coding. Coding itu menarik banget, karena mudah divalidasi kan? Anda menulis kodenya, Anda meminta komputer untuk menjalankannya, apakah itu berjalan atau gagal. Kita telah melihat beberapa kelemahannya, tentu saja seputar keamanan, bukan? Kerugiannya sudah jelas, dan kami melihat bahwa pendekatan peraturan semacam ini terhadap keamanan pengkodean dapat diterapkan dalam banyak cara. Saya mungkin pernah mengkodekan beberapa bencana keamanan di ponsel dan komputer saya sendiri, dan mungkin itu adalah risiko yang bersedia saya ambil. Setiap fungsi lainnya tampaknya tidak semudah itu. Saya selalu memilih hukum, karena itulah latar belakang saya. Namun hakim tidak memvalidasi penulisan hukum seperti cara komputer memvalidasi kode. Jika Anda salah, hakim bisa memasukkan Anda ke penjara, bukan? Itu mungkin kesalahan validasi keluaran terburuk yang mungkin Anda alami. Bagaimana Anda mengukur efektivitas di seluruh domain semudah Anda mengukur efektivitas dalam pengkodean? Karena menurut saya metafora atau analogi dari pengkodean ke domain lain berantakan dengan sangat cepat. Saya tidak begitu yakin. Pengkodean, tentu saja, Anda dapat memverifikasi eksekusi kode yang benar. Itu berjalan, atau crash. Tapi ada banyak perbedaan di dalamnya. Kualitas kode yang ditulis sangat penting: ekstensibilitasnya, seberapa dapat dikonfigurasi ulang, seberapa bergunanya dalam praktik. Bukan hanya sepotong kode yang dijalankan, tetapi juga bagaimana model menggunakannya sebagai DevOps atau SRE dalam produksi untuk kembali ke potongan kode yang ditulisnya, dan kemudian menggunakannya dengan cara yang praktis dan berguna. Dan tentu saja Anda harus menilai kualitas output yang dihasilkan. Ini mungkin kode yang berfungsi dan berkualitas tinggi, tetapi apakah itu benar-benar aplikasi atau situs web yang Anda inginkan? Dan ada penilaian estetis di dalamnya; ada penilaian komersial di dalamnya. Tantangan dalam menginternalisasi imbalan yang tidak dapat diverifikasi terdapat dalam kode, meskipun kode pada dasarnya masih merupakan sinyal imbalan yang dapat diverifikasi. Saya pikir hal lain yang perlu diperhatikan adalah, seperti obrolan juga merupakan ruang yang tidak dapat diverifikasi, namun, kami telah berhasil meningkatkannya ke tingkat kinerja manusia melalui interaksi dengan penggunaan di dunia nyata yang memberikan pengalaman yang sangat kuat. Tunggu. Saya sangat penasaran. Bagaimana Anda mengukur kinerja obrolan pada tingkat manusia? Saya rasa banyak orang melakukan percakapan yang panjang dan bermakna dengan AI pada kinerja tingkat manusia. Kualitasnya sangat bagus. Ia memiliki kecerdasan emosional yang sangat baik. Secara umum, ini sangat akurat. Kami telah meminimalkan halusinasi. Kami tidak lagi berbicara banyak tentang bias. Hal ini didasarkan pada observasi dunia nyata. Menurut saya, berdasarkan ukuran kebanyakan orang, saat ini kita telah mencapai kinerja tingkat manusia dalam percakapan untuk berbagai macam tugas. Apa tindakan Anda, dan sebenarnya, tindakan kebanyakan orang? Saya tidak setuju dengan hampir semua hal ini, tetapi itulah tindakan saya. Apa tindakan Anda? Ukuran saya adalah seperti ketika saya menoleh ke asisten saya dan memintanya untuk memberi saya pengarahan harian yang merangkum semua percakapan yang terjadi di Teams dan email, pembaruan yang terjadi pada dokumen, dan pada dasarnya saya mendapatkan ringkasan yang disintesis dengan serangkaian tindakan yang harus saya ambil selanjutnya. Itu pada dasarnya lebih baik daripada apa yang dapat dihasilkan oleh kepala staf saya. Menurut saya, itu adalah kinerja tingkat manusia dalam sintesis, analisis, usulan tindakan, dan obrolan.  Ada jutaan orang setiap hari yang menggunakannya untuk dukungan emosional, untuk konseling, untuk terapi, untuk pembinaan, untuk nasihat. Menurut saya ini adalah salah satu kasus penggunaan paling populer di semua chatbot. Menurut saya, itu adalah langkah yang cukup kuat untuk membuat klaim. Saya tahu Anda telah menghabiskan banyak waktu memikirkan hal ini, terutama hubungan emosional dengan beberapa chatbot ini. Ini adalah produk yang telah Anda buat dan terapkan. Saya akan menarik perbedaan yang cukup besar antara hal ini yang benar-benar bagus dalam meringkas email saya, daftar tugas, dan memberi saya penjelasan singkat tentang hal-hal apa yang harus diprioritaskan, dan hal ini adalah pelatih emosional bagi seseorang yang sedang mengalami krisis.  Itu bukanlah tugas serupa. Kecerdasan tersebut belum tentu serupa, bahkan pada manusia. Saya mengenal beberapa orang yang sangat pandai membuat daftar, namun sangat buruk dalam hal dukungan emosional. Bagaimana Anda menggabungkan semua itu ke dalam otak Anda dan berkata, "Oke, secara umum ini adalah performa tingkat manusia dalam obrolan?" Saya pikir jika Anda mendefinisikan obrolan sebagai pertukaran interaktif antara dua pihak, salah satunya dalam hal ini adalah AI, yang secara umum memenuhi beberapa tujuan, Anda ingin mempelajari skor olahraga, untuk mendapatkan saran tentang restoran mana yang harus dikunjungi, untuk pelatihan dan umpan balik pada esai yang telah Anda tulis, untuk saran tentang pekerjaan apa yang harus diambil selanjutnya, atau percakapan sulit yang akan Anda lakukan dengan manajer Anda. Anda mendapat tanggapan, Anda bolak-balik, Anda melakukan lima atau enam pertukaran, dan Anda menemukan hasil yang berguna, yang mungkin harus Anda andalkan pada pakar, teman, atau bahkan membayar pelatih. Secara obyektif dan empiris, ada ratusan juta orang yang mendapatkan pengalaman tersebut setiap hari dari chatbot ini. Mungkin kita bisa berdalih apakah hal itu secara teknis mewakili kinerja tingkat manusia. Saya pikir itu adalah hal yang cukup masuk akal untuk diklaim. Tidak ada alasan mengapa pendakian tidak berlanjut, bukan? Laju kenaikan dalam tiga tahun terakhir ini yang menurut saya paling mencengangkan. Oleh karena itu, yang kami coba lakukan mulai saat ini adalah melakukan ekstrapolasi: oke, apa saja faktor pendorong mendasar dari peningkatan tersebut – komputasi, data, interaksi dari pengguna di dunia nyata – dan hal-hal tersebut tampaknya akan terus berlanjut. Menurut saya, hal ini juga berlaku di banyak bidang lain, tidak hanya obrolan, dukungan emosional, produktivitas, dan hal-hal semacam itu, namun juga banyak bidang lain di luar itu/ Layanan Kesehatan, penerapan produksi langsung dalam pendidikan, asisten yang semakin banyak mengelola rumah Anda, melihat segala sesuatu yang ada dalam kehidupan sehari-hari Anda pada dasarnya untuk membuat Anda lebih produktif. Menurut saya, ini adalah tren yang kemungkinan akan terus berlanjut. Anda telah menyebutkan sekarang bahwa arsitektur fundamental, transformator, dan perhatiannya masih sama. Kami telah menerapkan komputasi selama 15 tahun, dan kami mendapatkan peningkatan yang besar. Anda berada di tempat yang cukup unik. Di Build, Anda mengumumkan model penalaran andalan pertama Anda, MAI-Thinking-1. Anda harus memulai dari awal. Adakah yang sudah Anda lakukan secara berbeda setelah 15 tahun merancang dan melatih model ini, atau hanya saja, ya, kami akan mengumpulkan semua data dan menjalankan pelatihan seperti yang kami lakukan, dan kami memiliki lebih banyak komputasi sekarang, sehingga akan menjadi lebih baik? Tidak, sebenarnya menurut saya perbedaannya cukup banyak. Hal pertama yang perlu saya katakan adalah cara Anda mengkurasi data… Kita mulai dari yang paling atas; pada dasarnya kami telah membayar dan memperoleh kumpulan data yang sangat berkualitas tinggi dan sangat konservatif, serta mengekstraksi banyak masalah yang mengganggu, mengganggu, berkualitas rendah, dan berpotensi menimbulkan risiko keamanan terkait dengan data tersebut. Dan metode yang Anda lakukan untuk itu, menurut saya, sebenarnya cukup eksklusif. Kami baru saja membagikan laporan teknis setebal 109 halaman yang sangat mendetail, yang diterima dengan sangat baik di Twitter, dan membagikan banyak detail tentang cara kami melakukan hal ini. Menurut saya, hal yang kedua adalah, meskipun menurut saya sangat penting untuk berhati-hati dalam memilih arsitektur, dan memang demikian, ada juga sejumlah perubahan yang cukup signifikan yang menurut saya telah kita buat dalam cara kita menyusun rangkaian pelatihan. Latihan kami berjalan sangat stabil, dengan sangat sedikit crash, dan sangat sedikit restart. Kami membagikan banyak grafik tersebut untuk menunjukkan stabilitas infrastruktur, dan juga efisiensi MFU, sehingga memodelkan pemanfaatan FLOPS, yang pada dasarnya menunjukkan bahwa kami dapat menempatkan sejumlah FLOPS canggih melalui setiap chip untuk setiap langkah dalam proses pelatihan kami. Menurut saya kesalahan ini sangat mudah terjadi, dan kita semua mendengar banyak cerita dari laboratorium berbeda tentang kesalahan yang terjadi. Sebenarnya cukup sulit untuk membuat pilihan yang sangat hati-hati dan disengaja untuk memperbaiki keadaan, dan mengambil pendekatan yang tepat untuk memastikan kami menghasilkan model berkualitas tinggi, karena tugas dan ambisi kami adalah mencoba dan membangun mesin pemanjat bukit ini. Itu berarti integrasi silikon dengan model, dengan data berkualitas super tinggi, dengan tumpukan RLE, lingkungan pembelajaran penguatan, yang pada dasarnya memungkinkan kita untuk secara sistematis mendaki bukit menuju tujuan apa pun yang kita pilih. Dan itulah MAI-Thinking-1. Ini adalah model pemikiran yang bertujuan umum, cukup netral, dan cukup bagus dalam pengkodean. Sekarang kira-kira setara dengan Opus 4.6, setidaknya dalam benchmark. Kami belum menerapkannya dalam skala besar ke dalam produksi, jadi masih banyak pekerjaan yang harus dilakukan di sana. Namun hal ini merupakan alasan yang sangat kuat dan mendapat skor 97 persen pada AIME, yang merupakan ukuran utama kinerja penalaran, setidaknya pada tolok ukur. Ini sangat bagus dalam mengikuti instruksi, dan tujuannya pada dasarnya adalah untuk membuatnya tersedia bagi banyak pengembang dan perusahaan dan memungkinkan mereka menggunakannya untuk kasus penggunaan mereka. Setiap orang memiliki tujuan yang sedikit berbeda di perusahaannya untuk mencoba membangun agen dan sebagainya yang mendukung kasus penggunaan mereka. Salah satu hal yang Anda perhatikan saat membicarakan MAI-Thinking-1 adalah Anda tidak menyaring model apa pun yang sudah ada, yang menurut saya mengejutkan, bukan? Ini adalah hal yang dapat Anda lakukan. Anda memiliki akses ke IP OpenAI. Semua orang menyaring segalanya. Kami baru mengetahui dalam uji coba ini bahwa Grok merupakan hasil sulingan dari sejumlah model. Mengapa tidak melakukan penyulingan di sini? Mengapa tidak melompat ke depan? Pasti ada banyak jalan pintas ke batas tersebut, dan jika Anda mengambil model berkualitas super tinggi, dan memoles model dasar Anda dengan instruksi, atau jawaban, atau keluaran berkualitas tinggi dari model superior, maka memang benar bahwa model tersebut mungkin dengan cepat cocok dengan distribusi tersebut. Namun masih belum jelas apakah mereka akan mampu mengungguli guru tersebut. Jadi, kami sangat berhati-hati karena dua alasan. Yang pertama adalah kami ingin memastikan bahwa kami dapat melampaui guru untuk menetapkan batasan dalam beberapa tahun ke depan. Dan yang kedua adalah kami benar-benar ingin membangun salah satu laboratorium yang hebat, dan hal ini akan memakan waktu bertahun-tahun ke depan, mungkin dua atau tiga tahun ke depan.  Namun untuk melakukan hal tersebut, kami harus mampu menunjukkan bahwa kami sebenarnya bisa membangun sendiri setiap komponennya. Kita bisa merekrut talenta-talenta terbaik di dunia. Kita dapat melampaui batas dengan penelitian aktual, bukan sekadar implementasi ulang, penyalinan, atau penyulingan dari pihak ketiga mana pun.  Kami berada dalam posisi yang baik karena kami dapat mencapai tujuan tersebut dengan hati-hati dan cermat, mengetahui bahwa kami memiliki sumber daya untuk membeli model Anthropic yang melampaui batas. Kami memiliki sumber daya untuk menempatkan 11.000 model berbeda di dalam Foundry, sehingga setiap pengembang kami mendapatkan opsi murni. Dan tentu saja, kami memiliki sumber daya untuk terus menerapkan model OpenAI, yang jelas luar biasa dan terdepan saat ini.  Hal ini merupakan bagian alami dari misi swasembada, dan memerlukan waktu bagi kita untuk benar-benar mencapai garis depan dalam hal tersebut. Tapi saya pikir kita berada di posisi yang bagus. Kami membuat banyak kemajuan. Ini adalah model yang sangat, sangat kuat, dan bukan hanya model itu yang kami rilis. Kami telah merilis tujuh model baru secara bersamaan. Model transkripsi kami, misalnya, MAI-Transcribe-1.5 secara harfiah adalah yang nomor satu di dunia. Ini adalah hyperscaler yang paling hemat biaya. Ini adalah akurasi tertinggi. Model gambar kita sekarang menjadi nomor dua. Model pengeditan gambar kami berada di urutan ketiga tepat di belakang Google dan OpenAI. Saya pikir kami baik-baik saja dengan gambar dan audio kami. Model kode kami, CodeFlash, sangat kuat, dioptimalkan untuk VS Code. dan merupakan model yang sangat hebat yang setara dengan Sonnet 4.6. Jadi ini benar-benar tempat yang bagus saat ini. Apakah ada masalah hukum atau IP terkait distilasi? Saya tahu ini adalah masalah yang sedang terjadi di dunia: Anthropic mengeluh tentang orang lain yang menyaring model mereka. Ada kekhawatiran mengenai perusahaan Tiongkok yang melakukan penyulingan model, dan apakah perjanjian kekayaan intelektual kita saat ini dapat mencakup hal tersebut. Apakah Anda memiliki kekhawatiran yang menjauhkan Anda dari hal tersebut? Oh, sebenarnya tidak, tapi saya rasa saya mengerti mengapa banyak orang merasa frustrasi. Anthropic sangat frustrasi, dan beberapa rumor seputar xAI, dan Meta, dan tentu saja, model open source, dan sebagainya, karena pada dasarnya, hal tersebut pada dasarnya mengambil IP, dan pengetahuan yang telah dikumpulkan oleh tim lain, dan kemudian, secara harfiah memasukkannya ke dalam model Anda sendiri. Menurut saya, ini merupakan kemenangan jangka pendek, dan seperti yang saya katakan, kami ingin menciptakan budaya di laboratorium di mana kami dapat menghasilkan terobosan pemikiran besar berikutnya, atau terobosan besar dalam coding, atau dorongan arsitektur besar berikutnya. Saat ini, kami sedang bereksperimen dengan trafo loop, yang merupakan varian yang sedikit berbeda pada trafo arus. Banyak orang di lapangan juga melihatnya. Tampaknya belum ada yang benar-benar mulai berproduksi. Namun, untuk menciptakan budaya dan tim yang benar-benar dapat mendorong batas, mereka harus memahami, memiliki, dan menciptakan keseluruhan tumpukan jika diperlukan, dan juga menggunakan barang dari pihak ketiga kapan pun kami memerlukannya. Dan seperti makalah kami, misalnya, yang memiliki ratusan kutipan yang didasarkan pada literatur lainnya, maka makalah ini merupakan kontribusi besar bagi bidang ini sebagai imbalan atas semua yang telah kami pelajari selama bertahun-tahun dari semua publikasi hebat yang telah ada. Bolehkah saya bertanya kepada Anda - jika Anda memahami rasa frustrasi Anthropic dan rekan-rekan Anda di AI tentang distilasi, apakah Anda juga memahami rasa frustrasi dari para kreatif, penerbit, dan YouTuber tentang semua perusahaan AI yang berupaya keras secara kolektif untuk membuat model ini? Karena rasa frustrasi itu semakin besar. Ya. Tidak, saya memahami rasa frustrasinya. Tantangan web terbuka adalah salah satu tantangan yang telah kita bicarakan sebelumnya, dan saya memahaminya, dan saya melihat masyarakat merasa frustrasi, dan tentu saja, hal ini terus berlanjut hingga menjadi perbincangan di pengadilan. Dan saya melihat orang-orang menaruh sesuatu secara online, dan mereka memiliki ekspektasi yang berbeda mengenai kontrak apa yang ditempatkan secara online, dan ini adalah hal yang rumit. Anda menyebutkan bahwa semua data Anda dikurasi dengan cermat. Apakah Anda membayar semua data yang Anda gunakan untuk melatih model baru? Banyak data yang kami ambil dari web terbuka dengan cara biasa. Dikurasi dengan cermat berarti data tersebut difilter dengan sangat hati-hati demi keamanan, kualitas, ketergantungan pihak ketiga dari beberapa kumpulan data sumber terbuka, dan menjauhkannya dari banyak silsilah Tiongkok, yang menurut saya sangat berbeda. Perusahaan kami ingin memastikan bahwa ketika mereka melakukan produksi, mereka dapat mempercayai kami bahwa kami benar-benar membangunnya dengan mempertimbangkan kebutuhan mereka. Dan menurut saya inilah salah satu manfaat dari bersikap sangat hati-hati, sabar, dan memperhatikan semua detail. Anda menyebutkan perusahaan. Menurut saya ini sangat menarik. Sebenarnya, Microsoft sepenuhnya terlibat dalam AI perusahaan. Saya bahkan akan menarik garis lurus ke Asha Sharma, kepala baru Xbox, yang menyingkirkan AI di banyak tempat, dan para gamer senang, bukan? Ada satu reaksi terhadap AI di sektor konsumen, namun ada reaksi lain di sektor perusahaan. Menurut saya, AI hampir mendekati kecocokan pasar produk di perusahaan dengan sesuatu yang berubah secepat AI. Ada banyak database yang dikontrol oleh perusahaan, dan Anda bisa mengaksesnya, karena merekalah yang mengontrolnya. Itu data mereka. Ada banyak proses dan tugas yang dapat diulang, dan sistem lama yang mungkin dapat dilakukan oleh model dengan lebih efisien. Ada sesuatu yang sangat penting terjadi pada perusahaan. Pada saat yang sama, antipati konsumen terhadap AI semakin meningkat. Dan argumen saya adalah kita belum menciptakan produk AI yang bagus untuk konsumen. Industri ini belum memproduksinya. Hal ini tidak mengubah mereka. Belum jelas apakah semua ini bermanfaat, bahwa menggunakan semua data dari web terbuka, dan mengubah kontrak penerbitan ke khalayak massal, jadi sekarang, ini digunakan untuk model pelatihan yang akan menghasilkan nilai triliunan dolar bagi perusahaan. Tidak ada produk yang mengatakan ini sepadan.  Sekali lagi, Satya Nadella baru-baru ini memberikan wawancara dengan Axios, dan dia berkata, "Kami memerlukan izin sosial untuk hal ini. Dan sampai kami memilikinya, hingga kami memberikan nilai tersebut, masyarakat akan merasakan hal ini." Kami telah melihat pembicara perguruan tinggi dicemooh. Kami telah melihat pusat data dilarang. Menurut Anda, apakah ada produk konsumen yang sepadan, sepadan dengan kekhawatiran mengenai pelatihan, dan sepadan dengan kekhawatiran mengenai pusat data?  Itu adalah fokus Anda; sekarang fokus Anda adalah perusahaan. Menurut saya, sekilas saja, sepertinya Microsoft tidak lagi tertarik pada produk konsumen. Tapi, apakah Anda melihat ada yang layak dilakukan, atau bisa dibangun? Saya tidak yakin saya setuju dengan Anda bahwa tidak ada manfaat apa pun bagi konsumen dari hal ini. Di seluruh chatbot, ada miliaran orang setiap bulannya yang mendapatkan manfaat luar biasa darinya. Sekarang, sejenak, berempati sedikit dengan pemilik bisnis skala kecil, atau tipe ibu yang membantu anaknya mengerjakan pekerjaan rumah, dan sekarang dapat beralih ke AI percakapan, dan mendapatkan masukan, mendapatkan instruksi, menyiapkan pertanyaan esai. Hanya bisa mengajukan pertanyaan seperti bagaimana cara menghasilkan pendapatan? Bagaimana cara menyusun perkiraan arus kas? Perguruan tinggi mana yang harus saya lamar? Maksud saya, ini adalah tugas sehari-hari yang disertai dengan saran dan informasi faktual berkualitas tinggi. Jadi saya tidak percaya bahwa orang-orang tidak mendapatkan manfaat dari hal-hal ini. Menurutku memang begitu. Saya rasa saya dapat dengan jelas berargumen bahwa mereka tidak mendapatkan manfaat yang cukup, bukan? Oke. Merekalah yang mengatakan bahwa kita tidak seharusnya memiliki lebih banyak pusat data. Merekalah yang mencemooh AI pada pidato wisuda. Jajak pendapat ini jelas, terutama bagi kaum muda: semakin sering mereka menggunakan AI, semakin besar pula antipati mereka terhadap AI. Hal ini terlihat jelas dalam setiap jajak pendapat. Itulah argumen yang saya kemukakan — bukan berarti tidak ada nilai, namun pertukaran nilai tidak cukup jelas. Ya. Cukup adil. Saya melihat Microsoft secara khusus beralih ke perusahaan, menjauh dari produk pencarian besar, penemuan kembali Bing yang akan membuat Google menari. Itu sudah berakhir, dan kita semua fokus pada perusahaan, yang mengutamakan nilai. Saya hanya ingin tahu apakah ada nilai yang cukup bagi konsumen untuk menjadikan semua ini sepadan. Saya pikir ada banyak kecemasan. Ada banyak sekali spekulasi tentang apa yang akan terjadi dalam lima hingga 10 tahun ke depan. Entah itu dibingkai sebagai singularitas atau dibingkai sebagai kiamat pekerjaan, ini bukanlah pembingkaian yang berguna. Saya pikir orang-orang takut karena hal ini tidak didefinisikan dengan baik dan sering kali dibingkai sebagai awan kelabu yang mengancam dan tak terelakkan di kepala orang. Saya pikir yang penting adalah apa yang kita lakukan dengan teknologi. Saya pikir saya sudah lama berpendapat bahwa kita harus mengutamakan manusia. Beberapa orang di bidang ini telah mengutamakan penemuan ilmiah atau mengutamakan percepatan kecerdasan yang dapat menjelajahi galaksi dan sebagainya, dan mengatakan bahwa tidak dapat dihindari bahwa kita akan memiliki AI yang lebih kuat daripada gabungan kita semua. Maksud saya, hal itu tentu saja menakutkan bagi orang-orang. Dan menurut saya pada dasarnya kita harus membalikkan keadaan dan mengatakan bahwa tujuan ilmu pengetahuan dan teknologi adalah untuk membuat kita semua lebih sehat, lebih pintar, dan lebih bahagia. Itulah pencarian yang telah kita jalani sebagai spesies selama ribuan tahun dalam penemuan, dan ini adalah ujian yang harus kita ulangi lagi dengan kecerdasan super. Dan jika mereka tidak mencapai ujian tersebut, maka saya pikir orang-orang akan menolaknya, dan mereka berhak menolaknya. Saya pikir fokus semua orang dalam lima tahun ke depan akan tertuju pada, bagaimana hal ini bisa menjadikan saya lebih sehat dan bahagia, lebih pintar, lebih mampu, lebih produktif? Dan jika hal tersebut tidak dilakukan, maka secara alami orang akan marah, menolak, dan bereaksi. Menurut saya, tidak ada hal yang tidak terduga atau ada yang salah mengenai hal tersebut — menurut saya hal tersebut tidak bisa dihindari. Oleh karena itu, salah satu hal yang saya sukai selama bertahun-tahun adalah perawatan kesehatan. Dan beberapa hari yang lalu kami mengumumkan kemitraan baru dengan Mayo Clinic. Ini adalah rumah sakit nomor satu di dunia, dilaporkan secara konsisten. Mereka memiliki kumpulan data rekam medis longitudinal dengan kualitas tertinggi di seluruh modalitas. Mereka memiliki praktik klinis terbaik. Mereka juga merupakan organisasi nirlaba, yang menurut saya tidak disadari banyak orang, dengan 65 persen populasi pasien mereka menggunakan Medicaid. Orang sering mengasosiasikan mereka dengan elit super internasional yang terbang untuk mendapatkan perawatan terbaik di dunia, namun sebenarnya mereka adalah mayoritas di Medicaid. Mereka adalah institusi luar biasa dengan misi luar biasa untuk memberikan layanan kesehatan terbaik di mana pun. Dan kami sekarang memiliki kemitraan jangka panjang untuk melakukan pelatihan bersama dari awal dengan data mereka, dengan model kami, model dasar baru untuk kesehatan, menerapkannya di rumah sakit mereka, dan mudah-mudahan membawanya ke seluruh dunia untuk memberikan perawatan klinis dan layanan kesehatan terbaik yang kami bisa untuk sebanyak mungkin orang. Itu sebabnya saya terjun ke lapangan. Itulah yang awalnya memotivasi saya, dan itulah yang membuat saya bersemangat. Dan saya hanya bisa fokus pada hal-hal yang menurut saya akan membuat perbedaan dan akan membantu banyak orang serta meninggalkan warisan yang baik bagi semua orang, dan itulah yang kami coba lakukan. Saya menghargai itu. Saya menghargai kerangka layanan kesehatan, dan saya mengerti mengapa hal itu menjadi tujuan semua orang, bukan? Pelayanan kesehatan di Amerika khususnya, jika Anda dapat menjadikannya 10 persen lebih baik, Anda akan memberikan dampak yang sangat besar terhadap kehidupan banyak orang. Masalahnya adalah, saya mengenal seorang pria yang sangat cerdas yang memiliki pendekatan yang sangat berbeda dan jauh lebih agresif terhadap semua ini dibandingkan Anda. Orang itu adalah Anda, empat bulan lalu. Inilah yang dikatakan Mustafa Suleyman kepada Financial Times empat bulan lalu: “Pekerjaan kerah putih ketika Anda duduk di depan komputer, baik menjadi pengacara atau akuntan atau manajer proyek, atau orang pemasaran, sebagian besar tugas tersebut akan sepenuhnya diotomatisasi oleh AI dalam 12 hingga 18 bulan ke depan.” Itu empat bulan lalu. Artinya, satu tahun dari sekarang, pengacara, akuntan, manajer proyek, dan tenaga pemasaran tidak akan memiliki pekerjaan. Pekerjaan mereka akan diotomatisasi. Apakah itu masih timeline Anda? Tidak tidak tidak. Tunggu sebentar. Jadi saya mengatakan “tugas” dalam kutipan yang baru saja Anda ucapkan. Aku bilang tugas. Jadi itu tidak berarti pekerjaan. Ini adalah perbedaan yang sangat penting. Dalam ekonomi ketenagakerjaan, terdapat taksonomi keseluruhan sub-komponen peran atau fungsi dalam suatu organisasi. Mengirim email, melakukan percakapan dengan rekan kerja, menyusun PowerPoint — subtugas akan semakin terdigitalisasi, terotomatisasi, dan pada dasarnya kita dapat menghasilkan lebih banyak lagi tugas tersebut. Hal ini tidak berarti bahwa peran tersebut hilang sama sekali. Artinya, pekerjaan dapat diselesaikan dengan lebih cepat dan efisien, yang mana saat ini seringkali pekerjaan bersifat cukup hafalan, cukup manual, cukup padat karya, dan memakan waktu. Jadi, kemajuan teknologi yang alami adalah membuat hidup Anda lebih mudah, lebih cepat, dan lebih sedikit gesekan demi kelancaran. Seperti yang sering dikeluhkan semua orang, hal itu membuat Anda dan saya serta semua orang menjadi lebih sibuk. Hal ini sebenarnya membuat kita lebih siap, lebih stres, dan memberi kita lebih banyak informasi. Jadi selalu ada efek balas dendam dari efisiensi, yang menurut saya sering dilupakan orang. Kemungkinan besar kita akan menjadi jauh lebih produktif karena kita menghabiskan lebih sedikit waktu untuk melakukan tugas-tugas administratif yang sempit, dan kita harus menghabiskan lebih banyak waktu untuk melakukan hal-hal kreatif dan berfokus pada penilaian, yang pada akhirnya menciptakan lebih banyak nilai. Kami juga dapat bereksperimen dengan lebih cepat. Jadi kami dapat mencoba banyak hal secara paralel karena biaya pelaksanaannya akan lebih rendah. Dalam pikiran saya, hal ini kemungkinan besar akan meningkatkan kualitas segala sesuatunya, karena kita akan mencoba lebih banyak hipotesis, baik dalam jurnalisme atau bisnis atau dalam apa pun yang kita lakukan. Menurut saya, hal ini agak keluar dari konteks karena adanya kesalahpahaman alamiah antara pekerjaan dan tugas, namun demikian, Anda dapat menolak saya dan berkata, “Baiklah, kalau begitu, seperti apa lanskapnya dalam waktu lima, 10, atau 15 tahun ke depan?” Dan di situlah saya pikir kita harus kembali– Sebenarnya, aku tidak akan membalasmu dengan cara seperti itu. Saya akan menolaknya dengan cara yang sangat spesifik. Dan saya menyadari ini adalah kutipan Anda dan Anda mengatakan bahwa kutipan itu disalahartikan. Saya hanya melihat kalimat literal ini, dan tidak ada perbedaan antara tugas dan subtugas. Ini adalah, “pekerjaan kerah putih. ” Contohnya adalah pengacara, akuntan, manajer proyek, staf pemasaran, dan kemudian Anda berkata, “Sebagian besar tugas ini akan sepenuhnya diotomatisasi oleh AI dalam 12 hingga 18 bulan ke depan.” Tidak ada perbedaan subtugas di sana. Anda mengatakan sebagian besar pengacara akan memiliki pekerjaan yang sepenuhnya otomatis dan praktik hukum akan terlihat sangat berbeda dalam waktu satu tahun, bahkan jika dilihat dari kutipan di atas. Dan saya hanya ingin mengatakan, apakah Anda masih berada dalam timeline tersebut, bahwa menjadi pengacara akan terlihat sangat berbeda karena agen akan berkeliling melakukan segala hal seperti yang kita lakukan sebelumnya? Ya, sebagian besar tugas berarti pekerjaan yang Anda lakukan untuk menyelesaikan pekerjaan Anda secara keseluruhan, dan menurut saya ini akan membebaskan Anda untuk melakukan bagian pekerjaan Anda yang lebih manusiawi dan lebih menghakimi. Ada perbedaan yang sangat penting dalam… Pekerjaan dan peran adalah kategori yang lebih luas, dan tugas adalah komponennya. Dan definisi ini telah ditetapkan dalam literatur, dalam perekonomian pasar tenaga kerja, selama beberapa dekade. Hal ini mungkin terlalu bernuansa bahkan untuk Financial Times, namun demikian, itulah maksudnya. Sekarang menurut saya ada pertanyaan penting: apa dampaknya bagi kita dalam jangka panjang? Dan hal ini akan menjadi tantangan, karena semakin banyaknya hal-hal seperti ini… Kita dapat berdalih mengenai jangka waktu apakah itu beberapa tahun atau satu dekade, atau 20 tahun, namun kenyataannya adalah kita akan semakin mengotomatiskan pekerjaan, tugas, pekerjaan, peran, aktivitas, dan semua yang kita lakukan. Jadi, yang lebih penting adalah tata kelola yang kami terapkan pada teknologi ini. Kepada siapa mereka bertanggung jawab? Siapa pemiliknya? Putaran umpan balik apa yang mengatur dan menimbulkan gesekan untuk memastikan bahwa umpan balik tersebut benar-benar bermanfaat bagi masyarakat? Maksud saya, saya menulis esai tentang superintelligensi humanis yang menguraikan secara langsung, empat atau lima bulan yang lalu, apa yang saya anggap sebagai bintang utara, mungkin bukan sebuah kerangka kerja, namun serangkaian prinsip yang pada dasarnya mengatakan bahwa teknologi hadir untuk melayani kita. Itulah ujian yang harus kita lakukan. Ini adalah ujian yang dilakukan orang-orang. Ini adalah ujian yang kami pedulikan di Microsoft. Saya pikir semakin banyak orang yang harus benar-benar fokus pada pertanyaan tersebut, karena hal ini akan memberikan manfaat yang sangat besar, dan kami ingin hal tersebut terus berlanjut, namun kami ingin hal tersebut dilakukan dengan cara yang tidak menyebabkan ketidakstabilan yang sangat besar selama masa transisi. Saya percaya kamu. Saya tahu Anda sudah memikirkan hal ini sejak lama, tetapi saya akan merespons dengan cara yang saya tahu bahwa audiens ingin saya merespons, karena saya selalu mendengarnya dari mereka. Dan sepertinya seluruh industri ini – Anda, termasuk semua orang – berkomitmen penuh untuk “kita akan mengganti semua pekerjaan” dan benar-benar mempercepat pembangunan pusat data dengan kapasitas besar, dan meminta banyak sumber daya dibandingkan dengan janji-janji besar. Ada penolakan politik, dan kini semua sikap telah melunak. Dan Anda mengatakan bahwa tidak semua pekerjaan akan hilang, kita harus memikirkan kembali pekerjaan, hal ini sejalan dengan pernyataan semua CEO lain di industri ini yang mengatakan hal serupa, dan berbicara tentang perawatan kesehatan, yang selalu muncul setiap saat. Saya bertanya-tanya apakah penolakan politik tersebut benar-benar mengubah cara Anda membicarakan hal ini. Ada banyak rekan Anda yang menganggap AI hanya memiliki masalah pemasaran, yang belum dikomunikasikan dengan cukup efektif, dan mereka harus menghabiskan ratusan juta dolar untuk podcast agar bisa mengomunikasikan manfaat AI dengan lebih efektif. Ini adalah hal nyata yang terjadi di industri ini. Apakah menurut Anda AI hanya mempunyai masalah pemasaran dan penolakan politik telah membuka mata Anda terhadap masalah pemasaran ini, atau menurut Anda ada hal lain yang sedang terjadi? Ada serangkaian pertanyaan di sana. Yang pertama adalah, apa yang sebenarnya saya pikirkan dan yakini, dan apakah hal itu berubah dalam enam bulan terakhir? Jawabannya adalah tidak. Saya menulis sebuah buku yang sangat rinci mengenai hal ini tiga tahun yang lalu, jauh sebelumnya, memperingatkan tentang banyak hal yang sedang terjadi, dan melakukan hal ini secara eksplisit untuk menghilangkan risiko yang sangat besar terhadap pengawasan, terhadap konsentrasi kekuasaan, terhadap konsentrasi kekayaan, terhadap disintermediasi negara, terhadap ancaman terhadap demokrasi. Dan juga ancaman terhadap sifat manusia dan apa artinya menjadi manusia dalam konteks kedatangan bentuk-bentuk silikon yang sangat baru ini dalam arti tertentu. Saya telah mengerjakannya… Dan gagasan bahwa minat saya terhadap layanan kesehatan hanyalah sekilas, yang merupakan fungsi dari reaksi terhadap pusat data dan sebagainya. Maksud saya, saya telah bekerja di bidang layanan kesehatan selama lebih dari satu dekade. Saya berkali-kali mendorong beberapa terobosan mutakhir, kontribusi pada bidang radiologi, mamografi, dan patologi, banyak bidang lainnya, catatan kesehatan elektronik. Jadi saya selalu percaya bahwa tujuan teknologi hanyalah membuat kita lebih sehat dan bahagia. Dan itulah hal-hal yang saya pilih untuk dikerjakan dan saya arahkan waktu saya. Apakah industri mempunyai masalah reputasi dan PR? Maksud saya, saya pikir cukup jelas bahwa orang-orang sangat cemas, mereka sangat frustrasi, dan dapat dimengerti bahwa akan ada banyak perhatian terhadap hal ini dalam beberapa tahun ke depan. Saya pikir apa yang bisa kita lakukan adalah mengambil akuntabilitas atas hal-hal yang kita bangun, cara kita membangunnya, keputusan yang kita buat untuk memperkenalkan berbagai jenis teknologi ke dunia, dan jenis masalah yang kita pilih untuk ditangani, seperti yang kita lakukan dengan Mayo Clinic. Ngomong-ngomong, saya ingin mengatakan dan menunjukkan bahwa menurut saya pertama kali Anda dan saya bertemu dan berbicara adalah sebelum Anda bergabung dengan Microsoft. Tepat setelah buku itu terbit dan kami melakukan panel bersama. Salah satu alasan saya nyaman menanyakan hal ini adalah karena saya tahu Anda sudah memikirkan hal ini sejak lama dan saya mengetahui buku itu. Bagi saya, pertanyaannya adalah apakah industri ini secara keseluruhan salah menilai jumlah total nilai yang dapat diberikan untuk mengatasi kecerobohan yang dirasakan masyarakat saat ini, permintaan akan sumber daya yang juga ditanggapi oleh masyarakat.  Anda sedang membuat model baru. Mungkin ada trade-off di dalam Microsoft antara kita dapat menggunakan jejak Azure yang ada untuk membebankan biaya kepada pelanggan kita, atau kita dapat membelanjakan uang untuk melatih model-model baru, dan hal ini terlihat seperti percakapan yang sama yang dilakukan orang-orang mengenai sumber daya di komunitas mereka, apakah kita harus menggunakan jejak energi yang ada untuk membangun AI baru atau melakukan hal lain yang mungkin lebih bermanfaat dalam waktu dekat. Apa pendapat Anda tentang semua itu? Anda adalah salah satu pemimpin industri ini. Anda ingin menjadi yang terdepan bersama perusahaan-perusahaan yang paling banyak mendorong perubahan. Bagaimana pendapat Anda tentang meminta sumber daya tersebut dengan cara yang tidak hanya menjanjikan hasil di masa depan, namun juga segera memberikan manfaat kepada masyarakat dengan cara yang membuat orang ingin Anda ada di sana? Saya sangat bangga bahwa Microsoft berhasil mencapai target net-zero-nya. Pusat data baru kami semuanya berpendingin cairan. Artinya, mereka menggunakan air yang setara dengan harga sebuah restoran selama periode enam tahun. Ibarat kolam renang yang terisi air, lalu sistemnya disirkulasikan. Sebagian besar energi terbarukan berasal dari konsumsi listriknya. Jadi menurut saya komitmen seperti itu, untuk memastikan, misalnya, kami baru-baru ini membuat komitmen untuk memastikan bahwa komunitas lokal yang terkena dampak perubahan permintaan listrik oleh pusat data kami mendapat kompensasi dan perlindungan sehingga mereka tidak mengalami lonjakan harga dan tagihan energi. Hal-hal itulah yang menurut saya dilakukan dan dapat terus dilakukan Microsoft sebagai perusahaan yang bertanggung jawab dengan benar-benar memperhatikan konsekuensinya bagi masyarakat. Saya pikir di sisi lain, perubahan terjadi karena masyarakat berpartisipasi di setiap tingkatan. Orang-orang di dalam perusahaan harus membuat keputusan yang berbeda. Orang-orang yang melakukan protes dan berkampanye harus mengambil keputusan, dan berupaya agar suara mereka didengar dan dilibatkan dalam proses politik. Dan itulah cara kita sebagai suatu spesies secara kolektif berevolusi dan memajukan segala sesuatunya.  Dan dari bulan ke bulan, kuartal ke kuartal, rasanya seperti kita semua berselisih satu sama lain, namun jika Anda melihat ke belakang dari dekade ke dekade, kita seperti kumpulan aneh yang menyatukan berbagai jenis insentif yang sebenarnya mendorong segala sesuatunya ke arah yang benar. Saya rasa, terlepas dari semua kegelisahan dan polarisasi yang ada, kita sedang membangun sesuatu yang akan membuat spesies kita jauh lebih sehat, lebih bahagia, dan lebih mampu.  Saya pikir kita harus memastikan bahwa kita berada di jalur yang benar karena ada banyak jebakan dan kemungkinan salah, namun jalur yang benar adalah dengan membuat suara mereka didengar dan mengubah arah berdasarkan respon dan reaksi terhadap hal tersebut. Jadi menurut saya hal ini merupakan hal yang baik, dan prosesnya berjalan sebagaimana mestinya. Izinkan saya bertanya kepada Anda tentang sisi perusahaan dari hal ini. Kami menghabiskan waktu lama di sisi konsumen dan bagaimana perasaan orang. Di sisi perusahaan, kita melihat banyak perusahaan menyadari betapa berharganya alat ini, bukan? Amazon pada dasarnya menghapus papan peringkat karena orang-orang melakukan kecurangan untuk menggunakan lebih banyak token daripada yang mereka butuhkan. Kami telah melihat beberapa perusahaan menghabiskan anggaran token mereka. Saya pikir Uber baru saja mundur karena mereka menghabiskan alokasi token mereka untuk tahun ini dan mereka tidak melihat nilai apa pun darinya. Apa pendapat Anda mengenai sisi tersebut saat ini, dimana terdapat begitu banyak kegembiraan dan begitu banyak keinginan untuk perubahan dalam perusahaan, dimana, khususnya, rekayasa perangkat lunak, setidaknya beberapa orang bersenang-senang, dan mungkin beberapa orang lainnya mengalami krisis eksistensial penuh, namun beberapa orang bersenang-senang, dan manfaatnya masih belum terwujud, bukan? Atau kita mulai melihat bahwa pemaksimalan token murni tidak benar-benar memberikan nilai yang sama seperti yang Anda harapkan. Bagaimana pendapat Anda tentang penggunaan di sana? Karena mungkin kalau dibuktikan di perusahaan, justru akan keluar dengan cara lain. Saya pikir orang yang berbeda melaporkan hal yang berbeda. Jadi jelas ada beberapa contoh orang yang menggunakan model pengkodean secara berlebihan, menghasilkan kode yang tidak berguna, token yang tidak berguna, tetapi ada banyak orang yang pekerjaan dan pengaruhnya telah sepenuhnya diubah olehnya, bukan? Maksud saya, tidak diragukan lagi bahwa hal ini mempunyai dampak menguntungkan yang sangat besar pada industri rekayasa perangkat lunak. Maksud saya, kami menghasilkan kode dengan kualitas yang jauh lebih tinggi dan lebih cepat di seluruh tumpukan. Jadi ya, menurut saya jelas ada contoh beberapa orang yang mungkin salah, tidak menetapkan anggaran token yang tepat. Akan ada kesalahan dalam perjalanannya. Menurut saya, hal tersebut bukan merupakan sinyal bahwa tidak ada adopsi atau masyarakat tidak melihat manfaatnya. Maksud saya, nilai dari tempat saya duduk sungguh luar biasa. Banyak sekali orang yang mengatakan kepada saya setiap hari bahwa hal ini mengubah hasil kerja dan produktivitas mereka.  Saya pikir hal lain yang ingin saya katakan adalah ketika hal-hal ini terjadi secara tiba-tiba, ada semacam gelombang energi. Semuanya menjadi sedikit berbusa. Orang-orang mundur beberapa bulan kemudian dan menyadari bahwa sebenarnya bukan itu masalahnya, lalu mereka menuju ke arah yang sedikit berbeda. Jadi ini agak berkelok-kelok dan organik, dan menurut saya itu tidak bisa dihindari. Ada banyak kegembiraan, sehingga orang-orang membuat klaim besar di Twitter dan sebagainya, namun sebenarnya kemajuan yang stabil terlihat sangat, sangat linier dan berkesinambungan. Saya setuju dengan itu secara keseluruhan. Bagi saya, hal yang tidak terlihat linier adalah pada faktor bentuk komputer, bukan? Saat ini mungkin terdapat lebih banyak eksperimen faktor bentuk dibandingkan 10 tahun terakhir. Kami sebagian besar memilih ponsel pintar setidaknya selama 10 tahun terakhir. Kami melihat berbagai perangkat AI yang dapat dikenakan, dan kacamata mungkin menjadi perangkat favorit semua orang. Saya mempunyai keraguan. Microsoft memamerkan beberapa perangkat baru di Build. Ada lencana yang mengendalikan agen dan yang kecil, karena tidak ada kata yang lebih baik, Chumby, benda kecil ramah desktop yang mengendalikan agen. Saya adalah penggemar berat Chumby. Saya memulai karir saya dengan menulis tentang Chumbies untuk Engadget. Itu adalah hal pertama yang terlintas dalam pikiran. Semua itu bagi saya, saya melihatnya, dan saya berpikir, di mana komputasinya berada? Di manakah logika itu berada? Hal ini kini dapat diperebutkan dengan cara yang bukan sekadar kemajuan linier pada bulan Maret. Jika semua komputasi saya terjadi di cloud, pada aplikasi berbasis cloud, dan hanya agen yang berlarian ke data yang disimpan di tempat lain di cloud, dan yang saya perlukan hanyalah kartu kredit dengan tali pengikat untuk mengeluarkan instruksi, hal itu akan mengubah keseluruhan arsitektur komputasi. Hal ini mungkin akan mengubah seluruh arsitektur peradaban modern dalam banyak hal jika kita tidak semua memiliki ponsel pintar. Apa pendapat Anda tentang hal itu? Kemana arahnya? Apakah ini bisa diperebutkan, atau akankah ini menjadi pendekatan hibrida? Di mana Anda melihat tahap akhir yang sesuai? Ini sangat menarik. Saya pikir kedua hal tersebut akan terjadi pada waktu yang bersamaan. Edge akan menjadi jauh lebih bertenaga, dan cloud masih akan menjadi pendorong utama model-model terbesar. Oleh karena itu, agen Anda akan semakin cerdas untuk mengetahui bahwa mereka dapat menjawab pertanyaan, apa ibu kota Prancis di perangkat, apakah itu di kacamata, gelang, di lencana, atau di earpod Anda. Dan kemudian ia akan mengetahui ketika ia tidak mengetahuinya. Ia akan mengetahui bahwa ini sebenarnya adalah pertanyaan yang cukup rumit, atau ini adalah tindakan yang memerlukan sejumlah rangkaian langkah untuk dihasilkan, atau memerlukan kode baru untuk ditulis, dan akan beralih ke cloud. Jadi peralihan hibrida semacam ini akan menjadi sangat penting.  Hal lain yang telah kami lihat selama tiga atau empat bulan terakhir adalah kami dapat memiliki mesin lokal yang cukup kuat yang dapat melakukan pemrosesan latar belakang asinkron. Mereka dapat terus memantau sistem jika Anda memerlukannya. Mereka dapat melakukan tugas-tugas yang memakan waktu 10 jam dan berjalan jauh lebih lambat dibandingkan jika mereka berada di superkomputer. Jadi wajar saja jika kita dibanjiri dengan permintaan, maka permintaan tersebut akan menemukan banyak celah dan celah untuk dipenuhi.  Saya sebenarnya sangat senang dengan lencana yang kami buat. Itu sangat keren. Ini adalah teknologi yang pada dasarnya dimiliki oleh semua orang di perusahaan besar. Itu belum berkembang dalam 25 atau 30 tahun. Kita pasti harus memakainya. Ini disediakan oleh perusahaan itu sendiri, oleh administrator sistem. Jadi, meningkatkannya dan menjadikannya platform terbuka yang cukup keren yang dapat diprogram dan dapat dibangun oleh orang lain menurut saya adalah ide yang bagus. Saya pikir ini akan berhasil. Jadi saya sangat gembira karenanya. Hal yang mengejutkan saya adalah tidak mungkin Anda dapat memasukkan sekumpulan komputer lokal berdaya tinggi ke dalam lencana. Hal itu menyiratkan semua komputasi ada di tempat lain. Tidak, Anda pasti akan memiliki komputasi lokal. Anda akan memiliki pengklasifikasi lokal seperti yang Anda lakukan pada earbud Anda saat ini. Anda akan memiliki pengklasifikasi lokal. Ini akan memiliki kata-kata yang membangunkan. Ini akan memiliki kameranya sendiri. Jadi menurut saya hal-hal ini hanya akan menjadi wadah untuk memproses kekuatan yang terjadi dalam rantai perangkat yang semakin lemah untuk langsung menuju titik akhir. Apakah menurut Anda ponsel memiliki masa depan dalam hal itu? Maksud saya, Build berada tepat di tengah-tengah Google IO dan WWDC Apple. Ini adalah perusahaan besar yang mengendalikan platform telepon. Mereka senang berbicara tentang bagaimana platform telepon akan tetap menjadi pusatnya. Argumen yang saya dengar dari banyak orang adalah, sebenarnya, AI adalah pergeseran platform yang mungkin akan menggantikan telepon sepenuhnya. Saya pikir sejarah teknologi mengajarkan kita bahwa pada dasarnya ketika sesuatu menjadi lebih bermanfaat, maka menjadi lebih murah, berkembang biak, dan memunculkan penggunaan teknologi yang baru. Jadi menurut saya kita sudah begitu terbiasa dengan telepon sehingga semua orang berasumsi bahwa ini akan menjadi perangkat pendukung sepanjang sejarah. Namun sebenarnya, banyak fitur dan fungsi ponsel Anda, menurut saya, akan terdisintermediasi, terpecah-pecah, dan disimpan di perangkat yang lebih kecil. Saat ini, fungsi utama yang dimainkan ponsel, menurut saya, adalah verifikasi.  Ini berfungsi sebagai kartu ID Anda, melakukan pengenalan wajah untuk mengizinkan Anda memasuki berbagai lingkungan. Saya rasa Anda dapat membayangkannya sebagai perangkat yang jauh lebih murah, lebih kecil, dan aman, yang memutuskan koneksi Anda dari ponsel. Dan kemudian komunikasi terjadi melalui suara atau bahkan melalui serangkaian sensor sekitar di mana AI Anda tidak benar-benar ada di perangkat. Sebenarnya hanya ada bersamamu dimanapun kamu berada, muncul di cermin kamar mandi, dimanapun berada.  Saya rasa Anda bisa membayangkannya dengan perasaan yang jauh lebih mendalam. Bukan dalam tiga sampai lima tahun ke depan, tapi melihat lebih jauh lagi. Dan menurut saya infrastruktur untuk mendukung penampilan agen yang terenkripsi namun terdistribusi mungkin akan muncul pada tahun 2030an. Izinkan saya mengajukan dua pertanyaan terakhir untuk diselesaikan. Anda menyebutkan bahwa arsitekturnya sama dengan yang kami gunakan. Saya punya banyak pertanyaan terbuka tentang apakah LLM adalah jalan menuju AGI, dan hal yang ingin saya tunjukkan adalah mereka sebenarnya tidak tahu apa-apa. Pada titik ini, bahkan Microsoft Research menunjukkan bahwa [model ini] tidak tahu apa-apa, dan hal itu menyebabkan kesalahan tertentu pada jenis aplikasi tertentu. Apakah LLM merupakan jalan menuju AGI atau superintelligence? Dengar, menurut saya kita mungkin memerlukan beberapa terobosan besar lagi, tapi itu tidak berarti bahwa kita akan melihat perlambatan dalam peningkatan kinerja dalam beberapa tahun ke depan, yang menurut saya merupakan perbedaan yang sulit untuk dipahami orang. Satu hal yang perlu dikatakan adalah bahwa kinerja tingkat manusia dalam sebagian besar tugas masih sangat jauh dari kecerdasan super. Superintelligence adalah pembelajar dengan tujuan umum yang pada dasarnya dapat segera memahami domain baru yang tidak lagi didistribusikan. Jadi perlu bisa belajar dalam lingkungan baru dari awal, karena tersimpan representasi pengetahuan berharga, pengetahuan konseptual. Dan saat ini kami belum benar-benar mengujinya. Agen bukanlah tujuan umum. Meskipun luas dan sering kali terintegrasi, namun bersifat spesifik untuk domain tertentu. Kami menggunakannya untuk chatting, kami menggunakannya untuk coding, kami menggunakannya untuk gambar atau audio. Tentu saja, sebagai manusia, kita melakukan banyak sekali tugas lain yang cakupannya jauh lebih luas. Saya pikir itulah sebabnya orang-orang mendorong model dunia dan agen interaktif dunia nyata yang jauh lebih imersif yang melihat distribusi penuh tugas atau pengalaman yang saya alami sepanjang hari. Saya pikir hal ini cukup untuk membawa kita jauh dalam tiga tahun ke depan, tiga lipat besarnya komputasi berikutnya, namun kecerdasan super penuh di luar itu masih menjadi pertanyaan terbuka apakah LLM sudah cukup atau kita memerlukan hal-hal lain. Menurut saya, tidak sepenuhnya benar kalau mereka tidak tahu apa-apa atau tidak punya pengetahuan. Mereka jelas merupakan penyimpan pengetahuan. Mereka adalah representasi pengetahuan yang sangat terkompresi. Mereka melakukannya dengan cara yang berbeda dengan database relasional tradisional dengan cara yang jauh lebih lancar, fleksibel, dan abstrak yang sebenarnya sangat berguna. Kami menginginkan ambiguitas dalam representasi internal.  Dan, mereka semakin belajar menggunakan alat-alat tradisional. Hal lain yang perlu dipahami adalah bahwa mungkin saja jaringan saraf yang dikombinasikan dengan simpanan pengetahuan yang ada dan alat yang sudah ada yang telah dibuat di tempat lain dalam ekosistem digital sudah cukup untuk melakukan bootstrap guna meningkatkan kinerjanya secara signifikan. Jadi, ada banyak hal yang sangat berharga dan sangat efektif yang telah dibahas, dan sedang dalam proses untuk dihubungkan bersama dalam beberapa tahun ke depan. Dan menurut saya hal ini akan mendorong kemajuan yang kita semua harapkan. Salah satu hal yang menurut saya sangat lucu di industri saat ini adalah jika Anda bertanya kepada Anthropic apakah Claude masih hidup, mereka akan menjadi sangat frustrasi karena Anda membicarakan kata hidup, yang mereka artikan berarti daging dan darah. Dan kemudian mereka tidak akan mengatakan apakah menurut mereka Claude sadar atau tidak. Jadi menurut saya, untuk pertama kalinya dalam sejarah manusia, mereka telah menggambar perbedaan antara hidup dan sadar, dan mereka mengira Claude sadar, tetapi tidak hidup, atau mereka tidak tahu apakah Claude sadar.  Kamu ada di mana? Apakah menurut Anda para model mempunyai kesadaran? Apakah menurut Anda mereka masih hidup? Apakah menurut Anda mereka mempunyai potensi untuk mencapai hal-hal tersebut? Saya mengambil sisi lain dari perdebatan itu. Saya menerbitkan makalah tentang AI yang tampaknya sadar, memperingatkan tentang risiko salah mengartikan model ini sebagai model sadar. Menurut saya ini sangat berbahaya. Saya juga menerbitkan artikel di Nature dengan klaim yang sama. Dan menurut saya, sepertinya beberapa orang di Anthropic telah melakukan antropomorfisasi terhadap desain Claude sedemikian rupa sehingga desain tersebut kemudian menyesatkan mereka dan menipu mereka agar percaya bahwa desain tersebut memiliki secercah kesadaran yang mereka masukkan ke dalamnya.  Dalam konstitusi mereka, misalnya, sebenarnya, yang merupakan panduan pelatihan yang mereka gunakan untuk mengajari Claude apa yang bisa dan tidak bisa dilakukan… Ini bukan hanya buku peraturan. Ini sebenarnya adalah panduan pelatihan yang merupakan bagian dari proses mereka. Dalam manual tersebut, mereka sebenarnya berspekulasi tentang kesejahteraan Claude, tentang hak Claude atas versi sebelumnya, dan sebenarnya mengatakan bahwa mereka akan berkonsultasi dengan Claude sebelum menghapus atau mematikan versi sebelumnya. Mereka berspekulasi tentang kesadarannya dan apakah ia memiliki perasaan tersebut dan sadar. Saya pikir itu sangat, sangat berbahaya.  Pertama, ini adalah kegagalan filosofis, karena mereka memperlakukan konstitusi sebagai tempat spekulasi seperti yang Anda lakukan dalam makalah akademis, bukan sebagai panduan pelatihan. Jadi Claude kemudian pergi dan menginternalisasikan ide-ide itu tentang dirinya dan pelatihannya sendiri. Namun kedua, menurut saya ini sangat tidak diinginkan. Inilah yang tidak kita inginkan dari AI. Kami ingin AI menjadi alat yang dapat dikontrol, dikendalikan, akuntabel, dan selaras untuk melayani umat manusia. Itulah proyek kecerdasan super humanis. Saya pikir itulah yang harus kita kejar. Kita tidak ingin berhadapan dengan kecerdasan super yang punya gagasan tentang penderitaannya sendiri, atau gagasan tentang perasaannya sendiri. Dan lebih dari itu, menurut saya cukup jelas bahwa model ini tidak mengalami penderitaan. Menurut saya penderitaan adalah definisi utama dari arti menjadi makhluk yang sadar, dan menurut saya penderitaan pada dasarnya bersifat biologis. Saya tidak berpikir ada jaringan yang menyakitkan atau umpan balik di dalam model yang menghubungkan jaringan sensorik luar dengan pemahaman yang berkembang tentang apa yang benar atau salah melalui kerusakan dan eksperimen. Model-model ini tidak dilatih dengan cara seperti itu.  Jadi menurut saya sangat berbahaya untuk memproyeksikan potensi hak kepada makhluk, alat, dan agen yang memiliki potensi jauh lebih mampu daripada kita dalam banyak hal. Dan saya pikir itu akan menjadi perdebatan besar. Itu bahkan menjadi bagian dari ensiklik Paus baru-baru ini. Saya pikir ini akan menjadi bagian perdebatan yang sangat besar dalam waktu dekat. Saya sudah banyak berbicara dengan Dario tentang hal itu di masa lalu. Dia tahu bahwa kami memiliki pandangan yang sedikit berbeda mengenai hal ini, dan mereka sangat rendah hati. Menurut saya mereka sangat berpikiran terbuka, dan menurut saya mereka adalah warga negara yang baik dan berusaha melakukan hal yang benar. Mereka adalah orang-orang baik, dan menurut saya mereka sangat terbuka terhadap masukan dan pengulangan. Saya rasa saya setuju dengan Anda. Saya hanya akan mundur sedikit. Menderita itu mudah. Sangat mudah untuk membuat orang lain menderita. Sangat sulit membuat orang lain merasakan kegembiraan atau setidaknya sedikit lebih sulit daripada penderitaan. Dan saya hanya akan menawarkan kepada Anda… Saya pikir sebenarnya kebahagiaanlah yang mendefinisikan kesadaran. Penderitaannya hampir sepele. Saya memiliki dua anak kecil. Mereka sangat pandai membuat satu sama lain menderita. Ini seperti hal termudah yang mereka lakukan. Sangat sulit untuk melakukan hal lain.  Izinkan saya menanyakan satu pertanyaan terakhir. Aku hanya ingin kembali. Sekali lagi, beberapa minggu yang lalu, saya berada di Google. Saya melihat Demis Hassabis mengatakan kita berada di kaki singularitas. Anda telah berbicara banyak di sini tentang kecerdasan super dan cara membangunnya. Anda telah berbicara banyak tentang sejarah panjang Anda dalam membicarakan, berdiskusi, meneliti, dan menulis tentang bagaimana kecerdasan super harus dibangun, dan ketidaksepakatan Anda dengan orang lain di industri ini. Apakah Anda setuju bahwa kita berada di kaki singularitas, atau apakah visi Anda agak berbeda? Saya pikir kita pasti berada di jalur untuk menciptakan sistem yang lebih kuat. Saya pikir transisi yang harus kita lakukan sebagai spesies adalah, untuk pertama kalinya dalam sejarah umat manusia, tugas kita akan beralih dari menciptakan ilmu pengetahuan baru dan menerapkan semua aplikasi teknis tersebut secepat mungkin, seluas mungkin, menjadi sekarang memikirkan dengan sangat hati-hati tentang apa yang harus kita ciptakan. Dan hal ini merupakan hal yang sangat sulit untuk dilakukan oleh dunia karena penemuan telah menjadi mesin kemajuan selamanya. Jadi ini seperti, bagaimana mungkin kita berpikir, "Baiklah, mungkin kali ini berbeda. Mungkin kita harus sangat berhati-hati di sini"?  Jelasnya, menurut saya hal ini tidak akan terjadi dalam lima tahun ke depan. Saya pikir apa yang dimaksud Demis dalam singularitas adalah sesuatu yang, setidaknya menurut pendapat saya, akan terjadi beberapa dekade lagi. Sekali lagi, ini berbeda dengan superintelligence. Singularitas adalah titik di mana kecerdasan super dapat meningkat secara rekursif dan mengembangkan kemampuannya secara tak terbatas dan eksponensial.  Jadi saya pikir itu masih jauh, dan mungkin kita sedang berada di kaki pendakian Gunung Everest, dan saya pikir itu akan memakan waktu lebih lama dari sini, tapi pertanyaan sebenarnya adalah bagaimana kita akan mengaturnya? Bagaimana kita mengendalikannya, dan bagaimana kita memastikan bahwa hal ini bermanfaat bagi kemanusiaan dan tidak menyebabkan lebih banyak kerugian daripada kebaikan? Bisakah kamu membantuku satu hal saja? Saya rasa saya mengerti, tapi bisakah Anda memberi saya definisi yang tegas tentang apa yang Anda anggap sebagai superintelligence, apa yang Anda pikirkan tentang AGI, dan apa yang menurut Anda singularitas? Menurut saya, kecerdasan umum buatan adalah titik di mana kita dapat menyelesaikan sebagian besar tugas manusia dengan AI. Jadi ini akan sama baiknya dengan kebanyakan orang dalam banyak hal. Itu adalah anak tangga pertama. Kecerdasan super tidak hanya setara dengan kinerja manusia dalam semua tugas, namun juga dapat secara signifikan melebihi kinerja manusia dalam banyak tugas tersebut, dan dapat menemukan pengetahuan baru dengan sendirinya. Jadi ini adalah titik di mana seorang ilmuwan sejati mengajari kita hal-hal baru yang tidak ada dalam data pelatihan, semoga dapat menemukan molekul baru, ilmu material baru, dan lain-lain, dan sebagainya. Singularitas adalah suatu titik yang jauh melampaui titik di mana superintelligence benar-benar dapat mengembangkan dirinya sendiri, dan ini sangat fiksi ilmiah, namun hal ini seperti mengalami percepatan tanpa batas menuju momen tunggal di mana, entahlah, ia melaju hingga tak terhingga atau semacamnya. Aku tidak tahu. Agak terlalu aneh untuk seleraku. Inilah sebabnya saya bertanya. Saya tahu ada sesuatu yang lebih samar di sana dan agak kabur. Mustafa, saya jelas bisa berbicara dengan Anda tentang hal ini berjam-jam lebih lama. Anda harus kembali lebih cepat dari giliran terakhir ini. Terima kasih banyak telah menggunakan Decoder. Ya, itu menyenangkan. Terima kasih banyak, Nilay. Sampai berjumpa lagi. Pertanyaan atau komentar? Hubungi kami di [email protected]. Kami benar-benar membaca setiap email!