Microsoft'un yapay zeka şefi süper zekanın yakında olduğunu ancak işinizi elinizden almayacağını söylüyor
⚡ Hızlı Özet
Bugün Microsoft AI CEO'su Mustafa Süleyman ile konuşuyorum.
Bugün Microsoft AI CEO'su Mustafa Süleyman ile konuşuyorum. Ve aslında bugünkü girişi kısa tutacağım - videoda göreceğiniz gibi bu hafta karımın aile çiftliğinde çalışıyorum ama aynı zamanda bu gerçekten bir bölüm yakıcı.
Mustafa’nın yeni model yetiştirme yaklaşımından, Antropik’in Claude hakkında sanki bilinçliymiş gibi konuşmasına yönelik eleştirilerine kadar her şeyi ele aldık. Elbette Microsoft'un OpenAI ile olan ilişkisinden, Mustafa'nın şu anda yapay zeka ile ilgili tüm olumsuz anketler ve siyasi tepkiler hakkında nasıl düşündüğünden ve tüketici ürünlerinden herhangi birinin bunun üstesinden gelebilecek kadar iyi olup olmadığından da bahsettik.
Dediğim gibi bu bir yakıcı.
Tamam: Mustafa Süleyman, Microsoft AI CEO'su. İşte başlıyoruz.
Bu röportaj uzunluk ve netlik açısından hafifçe düzenlendi.
Mustafa Süleyman, sen Microsoft AI'nin CEO'susun. Decoder'a tekrar hoş geldiniz.
Tekrar sizlerle birlikte olmak harika.
Seninle konuşacağım için çok heyecanlıyım. Önceki sohbetimiz, yaptığımız tüm sohbetlerde en sevdiğim sohbetlerden biriydi - yapay zeka, bize nasıl hissettirmesi gerektiği ve ne işe yaradığı hakkında.
Microsoft'ta bazı büyük değişiklikler var, belki de sizinle özellikle konuşmak istediğim, insanların yapay zeka hakkında ne hissettiğine dair çok önemli bazı yeniden bağlamlaştırmalar var. Ve sonra, birçok yeni duyurunun ve bilgisayarların ne işe yaradığına ve belki de nerede olmaları gerektiğine dair benim de dahil olmak istediğim birçok büyük fikrin yer aldığı büyük Microsoft geliştirici konferansı Microsoft Build var.
En baştan başlayalım. Bu, geri kalanından önce anlaşılması önemli olan bazı derin Kod Çözücü konularıdır. Microsoft'a katıldığınızdan beri yapay zekanın orada çalışma şeklini yeniden yapılandırdınız. Rolünüz değişti. Seninle en son konuştuğumda bir grup tüketici ürününden sorumluydun. O zamandan beri bu bir kenara bırakıldı. Artık yeni modeller eğitiyorsunuz; sınırdasın.
Microsoft AI'nın şu anda nasıl yapılandırıldığını ve Microsoft içinde nasıl yapılandırıldığını açıklayın.
Sanırım son 15 ila 18 aydır OpenAI ile ilişkimizi yeniden kurmak için bu yolculuğa çıkıyoruz ve bu bir dakika sürdü. Sanırım bu, geçen yılın ekim ayında yaptığımız yeni bir sözleşmeyle sonuçlandı. Ve bunda ortaklığın sağlamlaştırılması ve genişletilmesi de dahil olmak üzere çok ama çok farklı hükümler vardı, ancak en önemlisi süper zekayı bağımsız olarak takip edebilmemiz ve aynı zamanda onların modellerini satın almaya ve lisanslamaya devam edebilmemiz için bizi özgürleştiriyordu.
Ekim ayından bu yana Süper Zeka ekibini kuruyorum, öncü modelleri eğitmek için yeterli ölçekte kümeler oluşturuyorum ve süper zekaya odaklanan bir ekip tutuyorum. Bu bizim için oldukça büyük bir değişimdi çünkü bir nevi sadece süper istihbarat görevine odaklanmamı sağladı ve bu, bu hafta Build'da duyurduğumuz birkaç şeyle sonuçlandı. Tüm modalitelerde yedi yeni modelimiz var. Yani oldukça büyük bir değişim oldu ve sanırım planlamada uzun bir zaman geçti ve artık oyunda olmamız ve önümüzdeki birkaç yıl içinde mutlak sınırın peşinde koşmamız bizim için büyük bir rahatlama oldu.
Microsoft'ta işe alındığınızda planınız bu muydu?
Kesinlikle son 18 ayın planıydı. Yani OpenAI ile ilişkinin pek çok iniş ve çıkışlardan geçtiğini düşünüyorum. Ve pek çok açıdan tarihin en başarılı ortaklıklarından biri olarak anılacağını düşünüyorum. OpenAI için harika oldu, Microsoft için de harika oldu ve tüm iyi ilişkiler gelişiyor ve bence bu, evrimimizin sadece bir sonraki aşaması.
Size bu evrimi özellikle sormama izin verin. Hepimiz Elon Musk ile OpenAI ve Sam Altman arasındaki davayı gördük. Microsoft bu duruşmaya, Microsoft'tan bir avukatın sık sık ayağa kalkıp "Ve biz orada değildik" demesiyle dahil oldu. Birisi evet derdi ve hepsi bu. Ancak açıkçası, bu deneme sırasında ortaya çıkan ve tüm bu süre boyunca net olan şey, orijinal fikrin OpenAI'nin bir araştırma laboratuvarı olacağı ve modeller sağlayacağı, Microsoft'un ise ürünleri oluşturacağıydı. Microsoft'un pazara açılma konusunda uzmanlığı vardı; girişimde uzmanlığı vardı ve çeşitli yollarla tüketicide yeniden yer edinmeye çalışıyordu. Bu bir platform değişikliği olacak ve araştırma çalışmaları OpenAI'de bitecek, ürün çalışmaları ise Microsoft'un içinde gerçekleşecek.
Değişen şey şuydu: OpenAI giderek daha fazla tüketici ürünü yapmak istiyordu. Açıkçası, yeni rolünüz ve yeni odak noktanız göz önüne alındığında, Microsoft giderek daha fazla kendi modellerini oluşturmak istiyor. Neden bölünme? Bu ilişkide ne işe yaramadı?
Demek istediğim, OpenAI'nin inanılmaz derecede hırslı bir kurucu ekip ve bizzat Sam tarafından yönetildiğini düşünüyorum. Ve doğal olarak, daha fazla ilgi görmeye ve tonlarca gelir elde etmeye başladıkça, tam kapasiteye ulaşma fırsatlarını gördüler. Yani sadece tüketici ürünleri üzerinde çalışmaya başlamadılar. Açıkçası ChatGPT inanılmaz derecede başarılıydı. Ayrıca kendi veri merkezleri üzerinde çalışmaya başladılar. Kendi çiplerini yaratmaya başladılar. Kendi tüketici donanım cihazları hakkında ortalıkta dolaşan pek çok söylenti var. Modelleri ChatGPT Enterprise aracılığıyla doğrudan pazara sunmaya başladılar. Yani son iki, üç, dört yılda araştırmaların ötesinde bir anlamda genişliyorlardı. Ve doğal olarak aynı durum Microsoft için de geçerli. Demek istediğim, ortaklığın şu anda beş ya da altı yıllık olduğunu düşünüyorum ve hâlâ devam edecek dört, beş, altı yılı daha var.
Aynı şekilde dünyanın en büyük teknoloji şirketlerinden biriyiz. Verilerinin çoğunu sistemlerimizde saklayan ve işleyen, Azure kullanan, M365 ve Teams kullanan en büyük 500 şirketten 493'üne sahibiz. Sanırım insanlar çoğu zaman ne kadar büyük olduğumuzu ve kurumsal dağıtımımızın ne kadar büyük olduğunu yeterince takdir etmiyorlar. Ve böylece, uzun vadede, yani beş, altı, yedi, 10 yıl boyunca, tamamen sürdürülebilir olduğumuzdan emin olmalıyız ve sadece başkasının fikri mülkiyetini alan ve daha sonra hafifçe değiştirip uyarladığımız ve ürünlerimiz için üretime koyduğumuz bir alıcı değiliz, aslında kendi ayaklarımız üzerinde durabilir ve birinci sınıf modeller yaratabiliriz.
Yani süper zeka geliyor. Sanırım hemen köşede. Ve bence bu temelde tüm zamanların en değerli teknolojisi olacak. Uzun vadede, bu fikri mülkiyeti sağlamak için sonsuza kadar yapısal olarak üçüncü bir tarafa bağımlı olmamızın hiçbir yolu yok.
Yani OpenAI ve benzerlerinin yönetim kurulu sorunları yaşadığında açıkça tetiklenen geçiş bu oldu. Ama sonra ben ve ekibim geldikçe bunu geliştirmeye başladık, o geçiş sürecindeyiz. Ve bence harika bir noktadayız çünkü oldukça istikrarlı, dikkatli, uzun vadeli bir optimal pozisyon alabiliriz, hem OpenAI için, ki bunu inanılmaz derecede iyi başardığını düşünüyorum, hem de kendimiz için.
Süper zekaya biraz zaman ayırmak istiyorum. Şimdi buna bir nokta koymak istiyorum çünkü burada bir tur daha geçişi anlamak istiyorum.
Duruşmada bir an var, Microsoft CEO'su Satya Nadella'nın çok komik bir mesajı var: "Intel olmak istemiyorum ve OpenAI'nin Microsoft olmasını istemiyorum" diyor ki bu da bizzat Microsoft CEO'sunun şu sözleri bağlamında çok komik: "Sağlayıcı olmak istemiyorum ve onların tüm değeri sağlayan ve tüm değeri toplayan platform olmasını istemiyorum ve belki de yerimiz değişir. ChatGPT'nin Azure üzerinde çalışmasını istemiyorum ve o zaman OpenAI tüm değeri alacaktır, ve sonra belki bizi değiştirebilirler”, tıpkı zamanla Windows ve Intel'de olduğu gibi.
Bu bir farkındalık mı? Nadella sana mı geldi? "Tamam, OpenAI'nin yönetim kurulu sorunları vardı. Sınırlara geri dönüp kendi ayaklarımız üzerinde durmalıyız" dediğiniz toplantı nasıldı? Bu konuşma nasıldı ve bu karar nasıl verildi?
Demek istediğim, açıkçası bu Satya'nın yanı sıra Amy, Brad ve şirketteki diğer birçok kişinin kararı. Ancak bence her şeyde olduğu gibi bu da şirkette yavaş ilerleyen değişiklikler, çünkü aldığımız yönün biraz ince ayar ve ayarlama gerektirdiğini fark ediyoruz. Ve bu, Kasım ayı kurul olayından çok önce oluyordu ve bence, etrafında doğrudan rekabet ettiğimiz farklı cephelerin türlerine ve bundan kaynaklanan tüm gerilime baktığınızda, zamanla daha da artıyor. Ama aynı zamanda böyle ortaklıkların sonsuza kadar sürmeyeceğini de bilmek.
Yani OpenAI trilyon dolarlık halka açık bir şirket olmak istiyor, inanılmaz gelirleri var ve deli gibi büyüyor. Çalışma özgürlüğüne sahip olmak ve her türlü yerden bilgi işlem satın alabilmek, kendi bilgisayarlarını oluşturabilmek ve istedikleri kişiyle ortak olabilmek istiyorlar. Yani sözleşme, şirketlerin büyüklük, ölçek, ihtiyaç dengesi ve malzeme açısından çok farklı olduğu bir dönemde oluşturuldu. O an için mantıklı geldiğini düşünüyorum ama sonra bunun bizim sahip olmamız, kontrol etmemiz ve kendi müşterilerimiz için doğru şekilde yapmamız gereken bir şey olduğu açıkça ortaya çıktı.
Dediğim gibi, girişimcilik konusunda inanılmaz bir dağılımımız var ve bunun dünyada rakipsiz olduğunu düşünüyorum. Bu nedenle müşterilerimiz için en iyi şeyleri ürettiğimizden emin olmalıyız. Bu, hem tüketici için, ChatGPT ile hem de kurumsal olarak ve aynı zamanda örtüşen ancak tartışmasız tüketici ve kurumsal yönlere dik olduğu söylenebilecek bir dizi farklı yönü içeren süper zekanın temel bilim misyonu için ortaklaşa optimizasyon yapan bir şirket için biraz farklı görünüyor. Doğal olarak ortaklıkların bu şekilde geliştiğini ve periyodik olarak sıfırlandıklarını düşünüyorum.
Evet ama bana bir sınır modeli oluşturmanın çok pahalı olduğu söylendi. Güvenilir bir şekilde söylendi, bu çok pahalı bir proje. Bir noktada Microsoft'un CFO'su Amy Hood, "Evet, bütçeniz var" demek zorunda kalıyor. Bu ne zaman oldu? Bu sadece bir kısa mesaj mıydı? Toplantı mı vardı? Bana oradaki ayrıntıları anlat.
Sanırım, bakın, bir nevi kararı geçen yılın başlarında verdik, bu da açıkça tüm sözleşme müzakerelerini bilgilendirdi ve daha sonra hepsi Ekim ayında çözüldü ve imzalandı. Bu önemli bir yatırım ama bunu gerçekleştirmek için uzun bir zamanımız var. Yani kendi kendimize yeterlilik misyonumuza zaten önemli yatırımlar yaptık.
Maia 200 çipimiz aslında olağanüstü bir çip, bir örnek olarak, değil mi? Artık kendi kümelerimizde GB200'den yüzde 30 daha ucuz bir çip üretip gönderebiliyoruz. Ve artık kendi modellerimizi onunla birlikte tasarlayabildiğimize göre, az önce piyasaya sürdüğümüz MAI-Thinking-1 modeli, modelleri görevlerimiz için birlikte optimize ettiğimizde Maia 200'de çalıştırarak elde ettiğiniz yüzde 30'luk iyileşmeye ek olarak aslında watt başına 1,4 kat performans artışı sağlıyor.
Dolayısıyla, kendi yığınınıza sahip olduğunuzdan ve onu kontrol ettiğinizden emin olmanın ve bizim için en önemli olan kullanım senaryoları için tüm ortak tasarım çabasını uçtan uca yönlendirmenin değeri - ki bu açıkça ajan kodlamadır, geliştiricilerimiz, işletmelerimiz - önümüzdeki birkaç yıl içinde yapmamız gereken yatırımı haklı çıkaran temettüleri açıkça öder.
Kendi ayaklarının üzerinde durmak istediğini söylemenin çok kibar bir yolu olan kendi kendine yetme misyonu dedin; kendi işini yapmak istiyorsun. Meslektaşım Hayden Field'ın Build'i anlatan bir yazısında yazdığı bir satır hakkında Microsoft içinde bazı tartışmalar olduğu söylendi. Sadece bunu okuyacağım. Bu Hayden'dan. Bu harika bir çizgi. "Bu yılki Microsoft Build, Instagram'da susuzluk tuzağı paylaşan yeni bekar boşanmış bir kişinin havasını taşıyordu" dedi.
Ayrılık tamamlandı ve artık esneme zamanı geldi. İşte yeni modelimiz. İki ayakımızın üzerinde duracağız. Sınırda modeller üreteceğinizi ve önde gelen laboratuvarlarla rekabet edeceğinizi söylüyorsunuz. Microsoft'un içindeki duygu, kendi başına özgür olduğun duygusu mu?
Kesinlikle hayır. Hayır, hiç de değil. Bakın, açıkçası bu harika bir başlık ve eğlenceli bir ifade. Ancak gerçek şu ki, OpenAI ile uzun yıllar boyunca ortaklık halindeyiz. Yani 2030’un çok kuzeyine doğru koşuyoruz. Hala dünyanın en iyi modellerini üretiyorlar. GPT-5.5 olağanüstü bir modeldir. Ortaya çıkan siber güvenlik modelleri olan Kodeks muhteşem ve yaptığımız işlerin çoğuna güç veriyorlar.
Yani doğal olarak bu devam edecek. Ve bence bu, bu tür ortaklıkların doğal bir süreci. Olumsuz ya da şaşırtıcı bir şey olduğunu düşünmüyorum. OpenAI'nin bunu çok anladığını ve desteklediğini düşünüyorum. Demek istediğim, inanılmaz derecede hızlı büyüyen bir şirket oldukları açık ve bizim de kendi gündemimizi takip etmemiz gerektiğini anlıyorlar. Bu çok normal.
Size diğer Kod Çözücü sorusunu sormama izin verin, ardından Build'deki duyurulara ve kesinlikle süper zekaya geçmek istiyorum.
En son konuştuğumuzda, yapay zekanın ne kadar hızlı hareket ettiği göz önüne alındığında, karar alma çerçevenizin altı haftalık bir döngüde işlediğini söylemiştiniz. O zaman bu mantıklıydı. Belki işler yoluna girmiştir. Belki bazı şeylere daha fazla odaklanılmaktadır. Şu anki karar verme çerçeveniz nedir?
Hala aynı döngü ritmiyle çalışıyoruz. Her döngünün sonunda bir haftalık birebir görüşme yapıyoruz. Hala haftanın dört günü ofis içi bir kültüre sahip olmamıza rağmen buna gerçekten inanıyorum. Aslında bir sonraki hafta, Süper İstihbarat ekibimin tamamı dört gün boyunca bizzat Boston'da bir araya geliyor. Bu, Build'in nasıl gittiği, öğrendiklerimiz, neyi doğru yapamadıklarımız, neyi iyileştirmemiz gerektiği, bu sefer sekiz hafta sürecek ve sonrasında bir haftalık bir buluşma ile devam edecek olan bir sonraki döngü için planlamamız hakkındaki tüm retrospektiflerimiz için geçerlidir ve bunların hepsi tüm yıl için planlanmıştır. Yani tüm organizasyon, çalışma ritmimizin bu olduğunu biliyor.
Ve bence bu zaman dilimini vurgulamanın gerçekten önemli olduğunu düşünüyorum çünkü üç aylık planlama biraz bulanık ve biraz soyut hale geliyor. Sanırım takvimde nereye denk geldiğine bağlı olarak altı ila sekiz hafta, aslında çok net, güçlendirilebilir görevler yapmak için en uygun zaman.
Yani biz de bu altı ila sekiz haftalık döngülerin ritmine ek olarak ekipler halinde çalışıyoruz. Ekipler, belirli bir göreve odaklanan karma disiplinlerarası alt gruplardır ve mutlaka yöneticiye kadar yükselmeleri gerekmez. Aslında bir DRI tarafından yönetiliyorlar ve DRI genellikle bir IC'dir ve görevleri–
Bu, "doğrudan sorumlu birey" ve "bireysel katkıda bulunan"dır.
Evet, kesinlikle. Teşekkür ederim. Ve yöneticinin rolünü, belirli bir görevi yürüten DRI'nin rolünden ayırma yaklaşımını benimsediğimizi düşünüyorum. Bence bunun nedeni mükemmel bir DRI olmanın yorucu olmasıdır. Kelimenin tam anlamıyla günün 24 saati her şeyin içindesiniz ve elinizden geldiğince zorluyorsunuz. Yönetici olmak genellikle koç olmakla, destek sunmakla, rehberlik vermekle, geri bildirimde bulunmakla, her türlü engeli kaldırmakla, insanların kariyer gelişimine yardımcı olmakla ilgilidir. Ve bence bunları ayrı tutmak, DRI'leri her iki veya üç döngüde bir döndürmemize olanak tanıyor, böylece bazı insanlar farklı pozisyonlar deneyebilir ve rotasyon yapabilir. Oldukça çevik olmamızı sağlayan harika, çok esnek bir yapı olduğunu düşünüyorum.
Build hakkında konuşalım. Süper zekayla başlamak istedim. Bundan birkaç kez bahsettiniz. Az önce Google IO'daydım. Google'dayken meslektaşınız olan Demis Hassabis, açılış konuşmasını "tekilliğin eteklerinde olduğumuzu ve AGI'nın Google'ın tüm gücüyle geldiğini" söyleyerek bitirdi.
Süper zekanın burada olduğunu söylüyorsunuz. Bunların hepsi aynı şeyler mi? AGI'yi tanımlamak için farklı bir dil mi kullanıyoruz? Farklılıklar var mı? Kendi bağlamınızda süper zekayı Demis'inkindeki tekilliğe karşı nasıl tanımlarsınız?
Yani açıkçası burada olduğunu söylemedim. Geleceğini söyledim. Ve bence bu ifadelerin etrafında çok fazla akışkanlık var. Ancak şu anda açıkça görebildiğimiz şey, tüm yöntemlerde log-doğrusal tepe tırmanışının olduğudur ve bu, uyguladığımız her bilgi işlem büyüklük sırası, verilerdeki her artan artış ve kıyaslamalarda tırmanma arasında çok doğrudan bir ilişki olduğu anlamına gelir; ister genel kıyaslamalar, ister dahili kıyaslamalar, bunlar takviyeli öğrenme ortamlarıyla odaklandığımız hedeflerdir. Ve bu çok önemli bir gözlem.
Hepimizin yaptığını düşündüğüm bu tahminler - neden bazı insanların bunlara şüpheyle yaklaştığını veya soru sorduğunu anlıyorum, ancak bunlar, bu modellerin performansında on yılı aşkın bir süredir artan ampirik gözlemlere dayanıyor. Demek istediğim, temelde aynı genel amaçlı mimari, 12 kat daha fazla hesaplamanın uygulandığını, 15 yılda FLOPS'un trilyon kat arttığını gördü ve temel olarak ses, görüntü, metin, kod ve diğer birçok zaman serisi tahmin görevlerinde çalıştı. Ve böylece temel olarak, daha fazla bilgi işlem büyüklüğünün, diğer ortamların içinde bu log-doğrusal şekilde tırmanmaya devam etmemizi sağlayacağını tahmin ediyoruz.
Ve sonra şu soruyu gündeme getiriyor: Sadece sahip olduğumuz mevcut verilerden çıkarımlarda bulunmakla kalmayıp, bize bilmediğimiz şeyleri öğreten ve yeni keşifler yapan yeni bilgiler icat edebilecek modeller yetiştirebilecek miyiz? O halde ikinci mesele, kendilerini geliştirme ve hangi hipotezlerin belirlenmesi, hangilerinin takip edilmesi gerektiğine, bunların her biri için eğitim verilerinin nasıl oluşturulacağına, bunları yeni çalıştırmalara nasıl dahil edeceklerine ve hatta gerçek mimarinin kendisinde yenilik yapmaya karar verme sürecini hızlandırma kapasitesine sahipler mi?
Dolayısıyla, bu birleşik ilerlemeyi görebilmek için her ikisinin de doğru olması gerektiğini düşünüyorum, ancak yalnızca sonraki birkaç işlem büyüklüğü mertebesini uygulayarak büyük kazançlar elde etmeye devam edeceğimizi düşünüyorum. Bu muhtemelen, tıpkı son altı ayda kodlamada gördüğümüz gibi, pek çok görevde insan performansıyla aynı seviyeye ulaşıyor.
Kodlama gerçekten ilginç çünkü kolayca doğrulanıyor, değil mi? Kodu yazarsınız, bilgisayardan onu çalıştırmasını istersiniz, çalışır veya başarısız olur. Kesinlikle güvenlik konusunda bazı olumsuzluklar gördük, değil mi? Dezavantajları ortada ve kodlama güvenliğine yönelik bu tür düzenleyici yaklaşımın birçok açıdan işe yaradığını görüyoruz. Muhtemelen bazı güvenlik felaketlerini kendi telefonuma ve bilgisayarıma titreşimle kodladım ve belki de bu, almaya hazır olduğum bir risktir.
Diğer tüm işlevler o kadar kolay görünmüyor. Her zaman hukuku seçiyorum çünkü bu benim geçmişim. Ancak bir yargıç, bir bilgisayarın kodu doğrulaması gibi yasal yazıyı doğrulamaz. Yanlış anlarsan hakim seni hapse gönderebilir, değil mi? Bu belki de karşılaşabileceğiniz en kötü çıktı doğrulama hatasıdır.
Kodlamadaki etkililiği ölçebildiğiniz kadar, alanlar arasındaki etkililiği de nasıl ölçebilirsiniz? Çünkü bana öyle geliyor ki kodlamadan diğer alanlara yönelik metafor veya analoji çok çabuk bozuluyor.
O kadar emin değilim. Kodlama, elbette, kodun doğru şekilde yürütüldüğünü doğrulayabilirsiniz. Çalışıyor ya da çöküyor. Ama bunda bir ton nüans var. Yazılan kodun kalitesi gerçekten önemlidir: genişletilebilirliği, ne kadar yeniden yapılandırılabilir olduğu, pratikte ne kadar yararlı olduğu. Önemli olan yalnızca bir kod parçasının çalışması değil, aynı zamanda bir modelin onu, yazıldığı kod parçasına geri dönmek ve ardından onu pratik ve kullanışlı bir şekilde kullanmak için üretimde bir DevOps veya SRE olarak nasıl kullandığıdır.
Ve sonra elbette üretilen çıktının kalitesini derecelendirmeniz gerekir. Yüksek kaliteli, çalışan bir kod olabilir, ancak gerçekten istediğiniz uygulama mı yoksa web sitesi mi? Bir de bunda estetik yargılar var; Bunda ticari yargılar var. Her ne kadar kod hâlâ öncelikli olarak doğrulanabilir bir ödül sinyali olsa da, doğrulanamayan ödülleri içselleştirmenin zorluğu kodda mevcuttur. Sanırım gözlemlenmesi gereken diğer bir şey de tıpkı sohbet gibi doğrulanamayan bir alan olması ve buna rağmen gerçek dünya kullanımıyla etkileşim yoluyla bunu temel olarak insan seviyesindeki performansa yükseltmeyi başarmış olmamız.
Bekle. Çok merak ediyorum. Sohbeti insan düzeyindeki performansta nasıl ölçersiniz?
Pek çok insanın yapay zekalarla insan düzeyindeki performansta uzun ve anlamlı konuşmalar yaptığını düşünüyorum. Kalitesi son derece iyi. Çok iyi bir duygusal zekaya sahiptir. Genel olarak çok doğru. Halüsinasyonları en aza indirdik. Artık önyargı hakkında çok fazla konuşmuyoruz. Gerçek dünya gözlemlerine dayanmaktadır. Çoğu insanın ölçümlerine göre artık oldukça geniş bir görev yelpazesinde konuşmada insan düzeyinde performansa ulaştığımızı düşünüyorum.
Sizin tedbirleriniz nelerdir ve aslında çoğu insanın tedbirleri nelerdir? Bunların neredeyse tamamına katılmıyorum ama bunlar benim önlemlerim. Tedbirleriniz neler?
Benim ölçümüm, asistanıma dönüp ondan bana Teams'de ve e-postada gerçekleşen tüm konuşmaları, belgelerde gerçekleşen güncellemeleri özetleyen günlük bir brifing vermesini istediğimde ve daha sonra yapmam gereken bir dizi eylemle birlikte temel olarak sentezlenmiş bir özet aldığımda olduğu gibi. Bu aslında genelkurmay başkanımın üretebileceğinden daha iyi. Bunun sentezde, analizde, önerilen eylemlerde ve sohbette insan düzeyindeki performans olduğunu söyleyebilirim.
Her gün onu duygusal destek, danışmanlık, terapi, koçluk ve tavsiye için kullanan milyonlarca insan var. Bunun tüm sohbet robotlarındaki en popüler kullanım örneklerinden biri olduğunu düşünüyorum. Bu iddiada bulunmak için oldukça sağlam bir önlem olduğunu söyleyebilirim.
Bunu, özellikle de bu sohbet robotlarından bazılarıyla olan duygusal bağınızı düşünerek çok zaman harcadığınızı biliyorum. Bunlar sizin oluşturduğunuz ve dağıttığınız ürünlerdir. Bu şeyin e-postamı, görev listemi özetlemede ve bana hangi şeylere öncelik vermem gerektiği konusunda kısa bilgi vermede gerçekten çok iyi olması ile bu şeyin bir tür kriz geçiren biri için duygusal bir koç olması arasında oldukça büyük bir ayrım yaparım.
Bunlar benzer görevler değil. Bunlar insanlarda bile mutlaka benzer zeka türleri değildir. Liste yapmada çok iyi ama duygusal destek konusunda çok kötü olan bazı insanlar tanıyorum. Tüm bunları beyninizde nasıl bir araya getirirsiniz ve "Tamam, bu genel olarak sohbette insan düzeyindeki performanstır?" dersiniz.
Sanırım sohbeti iki taraf arasındaki etkileşimli bir alışveriş olarak tanımlarsanız, ki bu örnekte biri bir yapay zekadır ve genel olarak belirli bir hedefi karşılar, spor skorunu öğrenmek, hangi restorana gideceğiniz konusunda tavsiye almak, yazdığınız bir makale hakkında koçluk ve geri bildirim almak, bir sonraki hangi işi alacağınıza dair öneriler veya yöneticinizle yapmak üzere olduğunuz zorlu bir sohbet için aradığınızı düşünüyorum. Bir yanıt alırsınız, ileri geri gidersiniz, beş veya altı alışverişiniz olur ve bunun yararlı bir çıktı olduğunu görürsünüz, aksi takdirde bir uzmana, arkadaşınıza güvenmek, hatta bir koça para ödemek zorunda kalabilirsiniz.
Nesnel ve ampirik olarak konuşursak, her gün bu sohbet robotlarından bu deneyimi yaşayan yüz milyonlarca insan var. Belki bunun teknik olarak insan düzeyindeki performansı temsil edip etmediği konusunda tartışabiliriz. Bence bunu iddia etmek oldukça makul bir şey.
Bunun tırmanmaya devam etmemesi için hiçbir neden yok, değil mi? Son üç yıldaki tırmanış oranı bence en şaşırtıcı şey. Ve bu noktadan itibaren yapmaya çalıştığımız şey tahminde bulunmaktır: tamam, bu tırmanışın temel itici güçleri nelerdir (bilgi işlem, veri, gerçek dünyadaki kullanıcılardan gelen etkileşim) ve bu şeyler devam edecek gibi görünüyor. Bence bunların sadece sohbet, duygusal destek, üretkenlik ve benzeri şeyler için değil, aynı zamanda bunun ötesinde birçok başka alan için de geçerli olduğunu düşünüyorum: Sağlık hizmetleri, eğitim içindeki canlı prodüksiyon dağıtımları, evinizi giderek daha fazla yöneten asistanlar, temelde sizi daha üretken kılmak için günlük hayatınızdaki her şeye bakmak. Bence bu devam edecek bir gidişat.
Şimdi hala aynı temel mimarinin, dönüştürücülerin ve dikkatin aynı olduğunu söylediniz. 15 yıldır buna hesaplama uyguluyoruz ve büyük artışlar elde ediyoruz. Oldukça eşsiz bir noktadasınız.
Build'de ilk amiral gemisi akıl yürütme modeliniz MAI-Thinking-1'i duyurdunuz. Sıfırdan başlamalısın. Bu modeli 15 yıl boyunca tasarlayıp eğittikten sonra şimdi farklı yaptığınız bir şey var mı, yoksa evet, tüm verileri toplayıp eğitimi tıpkı yaptığımız gibi yürüteceğiz ve artık daha fazla bilgi işlemimiz var, yani daha iyi mi olacak?
Hayır, aslında pek çok fark olduğunu düşünüyorum. Söylenecek ilk şey, verileri düzenleme şeklinizdir… Yığının en üstünden başlıyoruz; Temel olarak son derece yüksek kaliteli, çok muhafazakar bir veri kümesinin parasını ödedik ve elde ettik ve bu verilerle ilgili birçok gürültülü, dikkat dağıtıcı, düşük kaliteli, potansiyel olarak güvenlik riski taşıyan sorunları çıkardık. Ve bunun için uyguladığınız yöntemlerin aslında oldukça özel olduğunu düşünüyorum. Az önce Twitter'da çok beğenilen 109 sayfalık çok detaylı bir teknik rapor paylaştık ve bunu nasıl yaptığımıza dair birçok detayı paylaştık. İkinci olarak, mimari seçimler konusunda oldukça dikkatli olmanın önemli olduğunu düşünmeme rağmen (ki öyleydik), eğitim çalışmalarımızı nasıl bir araya getirdiğimize dair de yaptığımızı düşündüğüm çok sayıda önemli değişiklik var.
Eğitim çalışmalarımız çok az kilitlenme ve çok az yeniden başlatmayla inanılmaz derecede istikrarlıydı. Altyapı istikrarını ve aynı zamanda MFU verimliliğini göstermek için bu grafiklerin çoğunu paylaştık, böylece FLOPS kullanımını modelledik; bu, temel olarak eğitim çalışmamızın her adımı için her çipe son teknoloji ürünü sayıda FLOPS yerleştirebileceğimizi gösteriyor. Bunun yanlış anlaşılmasının son derece kolay olduğunu düşünüyorum ve hepimiz farklı laboratuvarlardan işlerin nasıl ters gittiğine dair birçok hikaye duyuyoruz.
İşleri doğru yapmak için çok dikkatli ve kasıtlı seçimler yapmak ve yüksek kaliteli modeller ürettiğimizden emin olmak için doğru yaklaşımı benimsemek aslında oldukça zordur, çünkü bizim işimiz ve tutkumuz bu tepe tırmanma makinesini denemek ve inşa etmektir. Bu, silikonun modellerle, süper yüksek kaliteli verilerle, bir dizi RLE'yle, takviyeli öğrenme ortamlarıyla entegrasyonu anlamına gelir; bu, temelde, seçtiğimiz herhangi bir hedefe karşı sistematik olarak tepe tırmanmamıza olanak tanır.
MAI-Thinking-1 de budur. Kodlamada oldukça iyi olan, genel amaçlı, oldukça tarafsız bir düşünme modelidir. Şu anda en azından kıyaslamalarda kabaca Opus 4.6 ile aynı seviyede. Bunu geniş ölçekte üretime yerleştirmedik, dolayısıyla burada yapılacak daha çok iş var. Ancak son derece güçlü bir akıl yürütücüdür ve en azından kıyaslamalarda akıl yürütme performansının birincil ölçüsü olan AIME'de yüzde 97 puan almıştır.
Talimatları takip etme konusunda çok iyidir ve amaç temel olarak bunu birçok geliştiricinin ve işletmenin kullanımına sunmak ve kendi kullanım durumları için buna tırmanmalarına izin vermektir. Herkesin kendi şirketinde kullanım senaryolarını destekleyecek aracılar oluşturmaya çalışmak gibi biraz farklı hedefleri vardır.
MAI-Thinking-1 hakkında konuşurken fark ettiğiniz şeylerden biri de mevcut modellerden herhangi birini ayırmamış olmanızdır ki bu bana gerçekten şaşırtıcı geldi, değil mi? Bu yapabileceğin bir şey. OpenAI'nin IP'sine erişiminiz var. Herkes her şeyi damıtıyor. Bu denemede Grok'un çeşitli modellerden damıtıldığını öğrendik. Neden burada damıtma yapmıyorsunuz? Neden ileri atlamıyorsunuz?
Sınıra giden kesinlikle pek çok kısayol var ve eğer süper yüksek kaliteli bir model alırsanız ve temel modelinizi yüksek kaliteli talimatlarla, yanıtlarla veya üstün bir modelin çıktılarıyla cilalarsanız, o zaman modelin bu dağılıma hızla uyabileceği doğrudur. Ancak o zaman o öğretmeni geçebilecekleri çok belirsiz.
Yani iki nedenden dolayı çok bilinçli davrandık. Birincisi, önümüzdeki birkaç yıl içinde sınırı kendimiz belirlemek için öğretmeni aşabileceğimizden emin olmak istiyoruz. İkincisi ise gerçekten harika laboratuvarlardan birini inşa etmek istiyoruz ve bu bizim için uzun yıllar alacak, muhtemelen önümüzdeki iki ya da üç yıl.
Ancak bunu yapabilmek için aslında her bileşeni kendi başımıza üretebileceğimizi gösterebilmemiz gerekiyor. Dünyanın en iyi yeteneklerini işe alabiliriz. Başka herhangi bir üçüncü taraftan yeniden uygulama, kopyalama veya damıtmak yerine gerçek araştırmalarla sınırları zorlayabiliriz.
Sınırları aştıkları Antropik modelleri satın alacak kaynaklara sahip olduğumuzu bilerek, bu hedefi gerçekten dikkatli ve titizlikle takip edebildiğimiz harika bir konumdayız. Foundry'nin içine 11.000 farklı model koyacak kaynaklara sahibiz, böylece geliştiricilerimizin her biri saf isteğe bağlılığa sahip olur. Ve elbette, olağanüstü olan ve günümüzde öncü olan OpenAI modellerini uygulamaya devam edecek kaynaklara sahibiz.
Bu, kendi kendine yeterlilik misyonunun doğal bir parçası ve bu konuda gerçek anlamda sınıra ulaşmamız zaman alacak. Ama harika bir noktada olduğumuzu düşünüyorum. Bir ton ilerleme kaydettik. Bu çok çok güçlü bir model ve piyasaya sürdüğümüz sadece bu model değildi. Eş zamanlı olarak yedi yeni modeli piyasaya sürdük.
Bizim transkripsiyonlu modelimiz örneğin MAI-Transcribe-1.5 tam anlamıyla dünyada bir numaradır. Hiper ölçekleyiciler arasında en uygun maliyetli olanıdır. Doğruluk açısından en yüksek olanıdır. İmaj modelimiz artık ikinci sırada. Resim düzenleme modelimiz Google ve OpenAI'nin hemen arkasında üçüncü sırada yer alıyor. Görüntü ve ses konusunda iyi durumda olduğumuzu düşünüyorum. Kod modelimiz CodeFlash inanılmaz derecede güçlüdür ve VS Code için optimize edilmiştir. ve Sonnet 4.6 ile aynı seviyede, gerçekten çok harika bir model. Yani bu dakika gerçekten harika bir noktada.
Damıtmayla ilgili herhangi bir yasal veya fikri mülkiyet endişesi var mıydı? Bunun dünyada güncel bir sorun olduğunu biliyorum: Antropik, başkalarının kendi modellerini damıtmasından şikayet ediyor. Çinli şirketlerin modelleri ayrıştırması ve mevcut fikri mülkiyet anlaşmalarımızın bunu karşılayıp karşılayamayacağı konusunda endişeler var. Sizi bundan uzak tutacak endişeleriniz var mıydı?
Ah, yapmadık ama sanırım birçok insanın neden hayal kırıklığına uğradığını anlıyorum. Anthropic çok hüsrana uğradı ve xAI, Meta ve tabii ki açık kaynaklı modeller hakkındaki bazı söylentiler ve bunun gibi şeyler, çünkü esasen bu, fikri mülkiyeti ve başka bir ekibin bir araya getirdiği bilgiyi alıp sonra onu kelimenin tam anlamıyla kendi modelinize zorla beslemek anlamına geliyor. Bunun biraz kısa vadeli bir kazanç olduğunu düşünüyorum ve söylediğim gibi, gerçekten laboratuvarda bir sonraki büyük düşünce atılımını, bir sonraki büyük kodlama atılımını veya bir sonraki büyük mimari hamleyi ortaya çıkarabileceğimiz bir kültür yaratmak istiyoruz.
Şu anda akım trafosunun biraz farklı bir versiyonu olan döngülü trafoyu deniyoruz. Sahadaki birçok insan da buna bakıyor. Henüz kimse üretime geçmemiş gibi görünüyor. Ancak gerçekten sınırları zorlayabilecek bir kültür ve ekip oluşturmak için, anlamaları, sahiplenmeleri ve ihtiyaç duydukları anda tüm yığını oluşturmaları ve ayrıca ihtiyaç duyduğumuzda üçüncü taraflardan gelen şeyleri kullanmaları gerekiyor. Ve örneğin makalemiz, literatürün geri kalanına dayanan yüzlerce alıntıya sahip olduğundan, yıllar boyunca mevcut tüm harika yayınlardan öğrendiğimiz her şeyin karşılığında, alana büyük bir katkıdır.
Size şunu sorabilir miyim: Anthropic'in ve yapay zeka alanındaki meslektaşlarınızın damıtma konusundaki hayal kırıklığını anlıyorsanız, yaratıcıların, yayıncıların ve YouTuber'ların tüm yapay zeka şirketlerinin bu modelleri oluşturmak için kolektif olarak çalışmalarını sürdürmeleri konusundaki hayal kırıklığını da anlıyor musunuz? Çünkü bu hayal kırıklığı giderek artıyor.
Evet. Hayır, hayal kırıklığını anlıyorum. Açık web sorunu daha önce konuştuğumuz bir konu ve bunu anlıyorum ve insanların hayal kırıklığına uğradığını görüyorum ve açıkçası bu, mahkemelerdeki tartışmalarda da kendi yolunu buluyor. İnsanların bir şeyleri internete koyduğunu görüyorum ve bunların internete konulmasıyla ilgili sözleşmenin ne olduğu konusunda farklı beklentileri vardı ve bu zor bir şey.
Tüm verilerinizin dikkatle derlendiğinden bahsettiniz. Yeni modelleri eğitmek için kullandığınız tüm veriler için ödeme yaptınız mı?
Verilerimizin çoğunu açık webden normal şekilde alıyoruz. Dikkatlice seçilmiş olması, bazı açık kaynak veri kümelerinden güvenlik, kalite, üçüncü taraf bağımlılıkları açısından son derece dikkatli bir şekilde filtrelendiği ve onu çok farklı olduğunu düşündüğüm birçok Çin soyundan uzak tuttuğu anlamına gelir. İşletmelerimiz bir şeyi üretime soktuklarında, bunu gerçekten onların ihtiyaçlarını göz önünde bulundurarak ürettiğimize dair bize güvenebileceklerinden emin olmak istiyor. Ve bence bu da çok ama çok dikkatli olmanın, sabırlı olmanın ve tüm ayrıntılara dikkat etmenin faydalarından biri.
Girişimden bahsettiniz. Bunun çok ilginç olduğunu düşünüyorum. Microsoft aslında büyük ölçüde kurumsal yapay zekanın içinde. Hatta pek çok yerde yapay zekadan kurtulan Xbox'ın yeni başkanı Asha Sharma'ya çizgiyi çiziyorum ve oyuncular mutlu, değil mi? Tüketici alanında yapay zekaya yönelik bir tepki var, ancak kurumsal alanda başka bir tepki var. Yapay Zeka'nın, yapay zeka kadar hızlı değişen bir şeyle elde edebileceğiniz en yakın ürün pazarı uyumuna sahip olduğunu düşünüyorum. Şirketlerin kontrol ettiği bir sürü veri tabanı var ve onlara erişebilirsiniz çünkü onlar onları kontrol ediyor. Bu onların verileri.
Modellerin daha verimli bir şekilde gerçekleştirebileceği bir dizi tekrarlanabilir süreç ve görev ile eski sistemler var. İşletmede çok önemli bir şey oluyor. Aynı zamanda tüketicilerin yapay zekaya yönelik antipatisi de artıyor. Benim iddiam şu ki, harika tüketici yapay zeka ürünleri üretmedik. Bu endüstri onları üretmedi. Onları değiştirmedi. Açık webdeki tüm verileri kullanmanın ve yayın sözleşmesini geniş bir kitleye ulaştırmanın buna değdiğini açıkça ortaya koymadı; bu yüzden şimdi şirketlere trilyonlarca dolar değer sağlayacak eğitim modelleri için kullanılıyor. Buna değer diyen bir ürün yok.
Yine Satya Nadella geçenlerde Axios'la bir röportaj verdi ve şunları söyledi: "Bunun için sosyal izne ihtiyacımız var. Ve bunu elde edene kadar, bu değeri sunana kadar insanlar böyle hissedecek." Üniversite konuşmacılarının yuhalandığını gördük. Veri merkezlerinin yasaklandığını gördük. Sizce buna değecek, eğitim konusunda endişeye değer, veri merkezleri konusunda endişeye değer bir tüketici ürünü var mı?
Odak noktanız buydu; artık odak noktanız kurumsal. Görünüşte Microsoft'un artık tüketici ürünleriyle ilgisi yokmuş gibi göründüğünü söyleyebilirim. Peki buna değecek ya da inşa edilebilecek bir tane görüyor musunuz?
Bunun tüketici için hiçbir değeri olmadığı konusunda seninle aynı fikirde olduğumdan emin değilim. Tüm sohbet robotlarında ayda milyarlarca insan bundan büyük değer elde ediyor. Şimdi, bir an için, küçük ölçekli işletme sahibiyle veya çocuğunun ev ödevlerinde yardım eden ve artık yalnızca konuşabilen bir yapay zekaya dönüp geri bildirim alabilen, talimatlar alabilen, deneme soruları hazırlayabilen anne türüyle biraz empati kurun. Nasıl gelir elde ederim gibi sorular sorabiliyorum. Nakit akışı tahminini nasıl bir araya getirebilirim? Hangi üniversiteye başvurmalıyım?
Demek istediğim, bunlar oldukça yüksek kalitede gerçeklere dayalı tavsiye ve bilgilerle birlikte gelen günlük görevler. Bu yüzden insanların bu şeylerden faydalanmadıklarını gerçekten inanmıyorum. Bence öyleler.
Yeterince fayda görmedikleri iddiasını çok açık bir şekilde ortaya koyabileceğimi düşünüyorum, değil mi?
Tamam aşkım.
Daha fazla veri merkezimizin olmaması gerektiğini söyleyenler onlar. Mezuniyet konuşmalarında yapay zekayı yuhalayanlar onlar. Anketler açık, özellikle de gençler: Yapay zekayı ne kadar çok kullanırlarsa ona karşı antipatileri de o kadar artıyor. Her ankette bu açıkça görülüyor. Benim öne sürdüğüm argüman bu; hiçbir değerin olmadığı anlamına gelmiyor ama değer değişimi yeterince açık değil.
Evet. Haklısın.
Microsoft'un özellikle büyük arama ürününden, Google'ı dans ettirecek Bing'in yeniden keşfinden uzaklaşarak kurumsallaşmaya yöneldiğini görüyorum. Bu bitti ve hepimiz değerin olduğu girişime odaklandık. Tüketici için tüm bunlara değecek kadar değer olup olmadığını merak ediyorum.
Anlaşılır bir şekilde çok fazla endişe olduğunu düşünüyorum. Önümüzdeki 5 ila 10 yıl içinde ne olacağına dair muazzam miktarda spekülasyon var. İster tekillik olarak çerçevelensin ister iş kıyameti olarak çerçevelensin, bunlar yararlı çerçevelemeler değil. Bence insanlar korkuyor çünkü yeterince tanımlanamıyor ve çoğu zaman insanların kafalarının üzerinde kaçınılmaz, tehditkar bir gri bulut olarak çerçeveleniyor.
Önemli olanın teknolojiyle ne yaptığımız olduğunu düşünüyorum. Sanırım uzun zamandır insanı ön plana koymamız gerektiğini savundum. Bu alandaki bazı insanlar bilimsel keşifleri ilk sıraya koydular veya galaksileri keşfedebilecek hızlandırıcı zekaları vs. öne sürdüler ve hepimizin toplamından daha güçlü olacak bu yapay zekalara sahip olmamızın kaçınılmaz olduğunu söylediler. Demek istediğim, bu doğal olarak insanlar için korkutucu.
Ve bence bunu tam tersine çevirmeliyiz ve bilim ve teknolojinin amacının hepimizi daha sağlıklı, daha akıllı ve daha mutlu kılmak olduğunu söylemeliyiz. Bu, tür olarak binlerce yıldır icat ettiğimiz bir arayıştı ve süper zekayı yeniden test etmemiz gereken bir testti. Ve eğer bu testi geçemezse, o zaman insanların onu reddedeceğini düşünüyorum ve reddetmekte de haklılar.
Sanırım önümüzdeki beş yıl içinde herkesin odak noktası şuna dönecek: Bu beni nasıl daha sağlıklı, daha mutlu, daha akıllı, daha yetenekli, daha üretken kılıyor? Ve eğer bunu yapmıyorsa, o zaman doğal olarak insanlar sinirlenecek, direnecek ve tepki gösterecektir. Bunda beklenmedik bir şey ya da yanlış bir şey olduğunu düşünmüyorum; bunun kaçınılmaz olduğunu düşünüyorum.
İşte bu yüzden uzun yıllardır tutkulu olduğum şeylerden biri sağlıktır. Ve sadece birkaç gün önce Mayo Clinic ile yeni bir ortaklığın duyurusunu yaptık. Bu, sürekli rapor edilen dünyanın bir numaralı hastanesidir. Tüm yöntemlerde en yüksek kalitede boylamsal hasta kayıt veri setine sahiptirler. En iyi klinik uygulamaya sahipler.
Aynı zamanda, hasta popülasyonunun yüzde 65'inin Medicaid'de olduğu, pek çok insanın farkına varmadığını düşündüğüm, kâr amacı gütmeyen bir kuruluş. İnsanlar genellikle onları dünyadaki en iyi bakımı almak için gelen uluslararası süper elitlerle ilişkilendiriyor, ancak aslında Medicaid'de çoğunluk onlarda. Her yerde en iyi sağlık hizmetini sunma konusunda inanılmaz bir misyona sahip muhteşem bir kurumdur. Ve artık onların verileriyle, sağlık için yepyeni bir temel modeli olan modellerimizle sıfırdan birlikte eğitim almak, bunu hastanelerinde dağıtmak ve mümkün olduğunca çok insana yapabileceğimiz en iyi klinik bakımı ve sağlık hizmetini sunmak için bunu dünyanın dört bir yanına taşımak için çok uzun vadeli bir ortaklığımız var.
Bu yüzden sahaya çıktım. Başlangıçta motive olduğum şey buydu ve tutkulu olduğum şey de bu. Ve ben yalnızca fark yaratacağını, insanlara yardım edeceğini ve herkese iyi bir miras bırakacağını düşündüğüm şeylere odaklanabiliyorum ve bizim de yapmaya çalıştığımız şey bu.
Bunu takdir ediyorum. Sağlık hizmetlerinin çerçevesini takdir ediyorum ve bunun neden herkesin tercihi olduğunu anlıyorum, değil mi? Özellikle Amerika'da sağlık hizmetini yüzde 10 bile daha iyi hale getirebilirseniz, pek çok insanın hayatını özellikle derinden etkilemiş olacaksınız.
Sorun şu ki, tüm bunlara senden çok daha farklı ve çok daha agresif bir yaklaşımla yaklaşan çok akıllı bir adam tanıyorum. Bu kişi sensin, dört ay önceki. Mustafa Süleyman dört ay önce Financial Times'a şunları söylemişti: "Beyaz yakalı işler, ister avukat, ister muhasebeci, ister proje yöneticisi, ister pazarlamacı olun, bilgisayar başında oturduğunuzda, bu görevlerin çoğu önümüzdeki 12 ila 18 ay içinde bir yapay zeka tarafından tamamen otomatikleştirilecek."
Bu dört ay önceydi. Bu, bundan bir yıl sonra avukatların, muhasebecilerin, proje yöneticilerinin ve pazarlamacıların işsiz kalacağı anlamına geliyor. İşleri otomatikleşecek. Bu hâlâ senin zaman çizelgen mi?
Hayır, hayır, hayır. Bir saniye bekle. Az önce söylediğiniz alıntıda “görevler” dedim. Görevler dedim. Yani bu iş anlamına gelmiyor. Bu çok önemli bir ayrım. Çalışma ekonomisinde, bir organizasyondaki bir rolün veya fonksiyonun alt bileşenlerinin tam bir sınıflandırması vardır. Bir e-posta göndermek, bir meslektaşla sohbet etmek, bir PowerPoint hazırlamak; alt görevler giderek daha fazla dijitalleştirilecek, otomatikleştirilecek ve temel olarak bunlardan daha fazlasını üretebileceğiz.
Bu mutlaka rolün ortadan kalktığı anlamına gelmez. Bu sadece işin daha hızlı ve daha verimli bir şekilde yapılabileceği anlamına geliyor; günümüzde genellikle oldukça ezberci, oldukça manuel, oldukça emek yoğun ve zaman alıcı bir iştir. Ve böylece teknolojinin doğal ilerlemesi hayatınızı kolaylaştırmak, hızlandırmak, daha fazla kusursuzluk için daha az sürtünme sağlamaktır. Herkesin sık sık şikayet ettiği gibi, bu seni, beni ve diğer herkesi çok daha meşgul hale getirdi.
Aslında bizi daha erişilebilir, daha stresli hale getirdi ve bize daha fazla bilgi verdi. Yani verimliliğin her zaman intikam etkileri vardır ki insanların bunu unuttuğunu düşünüyorum. Muhtemelen çok çok daha üretken olacağız çünkü dar idari vasıflı görevleri yerine getirmek için daha az zaman harcayacağız ve sonuçta çok daha fazla değer yaratan yaratıcı, yargılama odaklı şeyler yapmaya daha fazla zaman harcamak zorunda kalacağız.
Ayrıca çok daha hızlı bir şekilde deney yapabiliriz. Böylece pek çok şeyi paralel olarak deneyebiliyoruz çünkü uygulama maliyeti düşecek. Bana göre bu muhtemelen genel kaliteyi artıracaktır çünkü ister gazetecilikte, ister iş dünyasında, ister yaptığımız herhangi bir şeyde daha fazla hipotez deneyeceğiz.
İşler ve görevler arasındaki doğal bir yanlış anlaşılma nedeniyle bunun biraz bağlam dışına çıkarıldığını düşünüyorum, ancak yine de bana karşı çıkıp şöyle diyebilirsiniz: "Peki, o zaman manzara beş, 10 veya 15 yıl sonra nasıl görünecek?" Ve sanırım geri dönmemiz gereken yer burası...
Aslında seni bu şekilde geri itmeyeceğim. Çok spesifik bir şekilde geri adım atacağım. Bunun sizin alıntınız olduğunun ve yanlış yorumlandığını söylediğinizin farkındayım. Sadece bu gerçek cümleye bakıyorum ve görevler ile alt görevler arasında bir ayrım yok. Bu, “beyaz yakalı iş. ”
Örnekler arasında avukat, muhasebeci, proje yöneticisi, pazarlama elemanı var ve siz de şöyle dediniz: "Bu görevlerin çoğu önümüzdeki 12 ila 18 ay içinde yapay zeka tarafından tamamen otomatikleştirilecek." Burada alt görev ayrımı yok. Çoğu avukatın işini tamamen otomatikleştireceğini ve avukatlık mesleğinin bir yıl içinde tamamen farklı görüneceğini söylüyorsunuz, bu alıntının sözleriyle bile.
Ve ben sadece şunu söylüyorum, ajanlar bizim daha önce yaptığımız her şeyi yapmak için ortalıkta dolaşacağı için avukat olmanın tamamen farklı görüneceğini söyleyen o zaman çizelgesinde misiniz hâlâ?
Görevlerin çoğu, genel işinizi tamamlamak için yaptığınız çalışmalar anlamına geliyor ve bence bu, işinizin daha insani ve daha yargısal kısımlarını yapmak için sizi özgür kılacak. Şunda çok önemli bir ayrım var: İşler ve roller daha geniş bir kategoridir ve görevler de bunun bileşenleridir. Ve bu, literatürde, işgücü piyasası ekonomisinde onlarca yıldır yerleşik bir tanımdır.
Belki Financial Times için bile fazla incelikliydi ama yine de amaç buydu. Şimdi önemli bir soru olduğunu düşünüyorum: Bu bizi uzun vadede nereye bırakır? Ve bu da zorlu olacak, tıpkı giderek daha fazla şey gibi… Zaman çizelgeleri üzerinde birkaç yıl mı, on yıl mı, yoksa 20 yıl mı olduğu konusunda tartışabiliriz, ancak gerçek şu ki, bu işin, görevlerin, işlerin, rollerin, etkinliklerin ve yaptığımız her şeyin giderek daha fazlasını otomatikleştireceğiz.
Ve böylece daha önemli olan şey, bu teknolojilerin etrafına koyduğumuz yönetişim olacaktır. Kime karşı sorumludurlar? Bunların sahibi kim? İnsanlara gerçekten hizmet ettiğinden emin olmak için sürtüşmeyi düzenleyen ve ortaya çıkaran geri bildirim döngüleri nelerdir? Demek istediğim, hümanist süper zeka üzerine, dört ya da beş ay önce, temelde bir kuzey yıldızı olarak düşündüğüm şeyin, belki tam bir çerçeve olmasa da, temelde teknolojinin bize hizmet etmek için burada olduğunu söyleyen bir dizi ilkenin ana hatlarını oldukça doğrudan özetleyen bir makale yazdım. Onu uygulamamız gereken test bu. İnsanların girdiği sınav bu. Microsoft olarak önemsediğimiz test bu.
Herkesin giderek daha fazla bu soruya gerçekten odaklanması gerekeceğini düşünüyorum, çünkü bu muazzam miktarda fayda sağlayacak ve biz de bunu yapmaya devam etmesini istiyoruz, ancak bunu geçiş döneminde gülünç miktarda istikrarsızlığa neden olmayacak şekilde yapmasını istiyoruz.
Sana inanıyorum. Bu konuyu uzun zamandır düşündüğünü biliyorum ama dinleyicilerimin benden yanıt vermemi istediğini bildiğim şekilde yanıt vereceğim çünkü bunu onlardan her zaman duyuyorum. Ve görünen o ki, tüm sektör - siz de dahil olmak üzere - "tüm işleri değiştireceğiz" dedi ve devasa kapasitede veri merkezleri inşa etmeyi gerçekten hızlandırdı ve büyük vaatlere rağmen çok fazla kaynak istedi.
Siyasi tepkiler vardı ve şimdi tüm tutumlar yumuşadı. Ve siz, tüm işlerin ortadan kalkmadığını, işleri yeniden düşünmemiz gerektiğini söylüyorsunuz, bu sektördeki diğer tüm CEO'ların benzer şeyler söylemesi ve sağlık hizmetleri hakkında konuşması gibi her seferinde gündeme gelen bir şey. Bu siyasi tepkinin bu konu hakkında konuşma şeklinizi gerçekten değiştirip değiştirmediğini merak ediyorum.
Yapay zekanın sadece bir pazarlama sorunu olduğunu, bunun yeterince etkili bir şekilde iletilmediğini ve yapay zekanın faydalarını daha etkili bir şekilde iletmek için podcast'lere yüz milyonlarca dolar harcamaları gerektiğini düşünen pek çok meslektaşınız var. Bu sektörde yaşanan gerçek bir olay. Yapay zekanın sadece bir pazarlama sorunu olduğunu ve siyasi geri adımın bu pazarlama sorununa gözlerinizi açtığını mı düşünüyorsunuz, yoksa başka bir şeyler olduğunu mu düşünüyorsunuz?
Orada bir dizi soru var. Birincisi, gerçekte ne düşünüyorum ve inanıyorum ve son altı ayda bu değişti mi? Cevap hayır. Üç yıl önce, bu konuda çok ayrıntılı bir kitap yazdım, vaktinden çok önce, şu anda gerçekleşmekte olan birçok şey hakkında uyarıda bulundum ve bunu açıkça yaparak gözetleme, gücün yoğunlaşması, servetin yoğunlaşması, devletin aracısızlaştırılması ve demokrasiye yönelik tehditlere yönelik muazzam riskleri masaya yatırdım. Ve ayrıca silikonun bu çok yeni formlarının bir anlamda ortaya çıkışı bağlamında insanın doğasına ve insan olmanın ne anlama geldiğine yönelik tehditlere de değiniyoruz. Üzerinde çalışıyorum… Ve sağlık hizmetlerine olan ilgimin, veri merkezlerine verilen tepkilerin bir fonksiyonu olan, tavada bir parıltı gibi olduğu fikri, yani on yıldan fazla bir süredir sağlık hizmetleri üzerinde çalışıyorum. Radyoloji, mamografi ve patoloji, diğer birçok alan ve elektronik sağlık kayıtları alanındaki bazı son teknoloji buluşlar ve katkılar üzerinde birçok kez baskı yaptım.
Bu yüzden her zaman teknolojinin amacının bizi daha sağlıklı ve mutlu kılmak olduğuna inandım. Bunlar üzerinde çalışmayı ve zamanımı yönlendirmeyi seçtiğim şeyler. Sektörün itibar ve PR sorunu var mı? Demek istediğim, bence insanların çok endişeli oldukları, çok sinirli oldukları oldukça açık ve anlaşılır bir şekilde önümüzdeki birkaç yıl içinde buna çok fazla dikkat çekilecek.
Yapabileceğimiz şeyin, Mayo Clinic'te yaptığımız gibi, inşa ettiğimiz şeylerin, onları inşa etme şeklimizin, dünyaya çeşitli teknolojiler sunmak için aldığımız kararların ve üzerinde çalışmayı seçtiğimiz problem türlerinin sorumluluğunu almak olduğunu düşünüyorum.
Bu arada şunu söylemek ve belirtmek isterim ki, sanırım siz ve ben ilk kez tanışıp konuşmuşuz, siz Microsoft'a katılmadan önceydi. O kitap çıktıktan hemen sonra birlikte bir panel yaptık.
Bunu rahatça sormamın nedenlerinden biri, bunu uzun zamandır düşündüğünü bilmem ve o kitaptan haberdar olmamdır. Bana göre asıl soru, endüstrinin, insanların şu anda tepki gösterdiği görünürdeki umursamazlığın, insanların şu anda tepki gösterdiği kaynak talebinin üstesinden gelmek için sağlayabileceği toplam değer miktarını bir bütün olarak yanlış değerlendirip değerlendirmediğidir.
Yeni modeller yapıyorsunuz. Muhtemelen Microsoft'un içinde, mevcut Azure ayak izini müşterilerimizden para almak için kullanmamız veya yeni modelleri eğitmek için para harcamamız arasında bir değiş-tokuş vardır ve bu, insanların kendi topluluklarındaki kaynaklar hakkında yaptığı konuşmanın aynısına benziyor; mevcut enerji ayak izini yeni yapay zeka oluşturmak için mi kullanmalıyız yoksa daha acil değerli olabilecek başka bir şey mi yapmalıyız.
Bütün bunlar hakkında ne düşünüyorsun? Siz bu sektörün liderlerinden birisiniz. En çok değişimi yönlendiren şirketler arasında öncü olmak istiyorsunuz. Bu kaynakları yalnızca gelecekteki sonuçları vaat edecek şekilde değil, aynı zamanda insanların sizin orada olmanızı istemesini sağlayacak şekilde topluluklara anında fayda sağlayacak şekilde istemeye ne dersiniz?
Microsoft'un net sıfır hedefine sadık kalmasından büyük gurur duyuyorum. Yeni veri merkezlerimizin tamamı sıvı soğutmalıdır. Bu, altı yıl boyunca yaklaşık bir restoranın suyu kadar su kullandıkları anlamına geliyor. Bu, suyla doldurulan bir yüzme havuzuna benziyor ve daha sonra sistemi dolaştırıyor. Hepsi elektrik tüketimi açısından büyük ölçüde yenilenebilir. Dolayısıyla bunun gibi taahhütlerin, örneğin yakın zamanda veri merkezlerimizin elektrik talebindeki değişiklikten etkilenen yerel toplulukların fiyatlarında ve enerji faturalarında bir artış görmemeleri için tazmin edilmesini ve korunmasını sağlamak için bir taahhütte bulunduğumuzu düşünüyorum.
Bunlar, Microsoft'un sorumlu bir şirket olarak topluluklar açısından sonuçlarına gerçekten dikkat ederek yaptığını ve yapmaya devam edebileceğini düşündüğüm şeyler. Diğer taraftan, değişimin insanların her seviyede katılımıyla gerçekleştiğini düşünüyorum. Şirketlerin içindeki insanlar farklı kararlar vermek zorundadır. Protesto yapan ve kampanya yürüten insanların kararlar alması, dışarı çıkıp seslerini duyurmak ve siyasi bir sürece dahil olmak için çaba harcaması gerekiyor. Ve biz tür olarak kolektif olarak bu şekilde gelişiyoruz ve işleri ileriye taşıyoruz.
Ve aydan aya, çeyrekten çeyreğe, sanki hepimiz birbirimizle anlaşmazlığa düşmüş gibiyiz, ancak on yıldan on yıla geriye baktığınızda, aslında her şeyi doğru yöne iten her türlü farklı teşvikten oluşan bu kolektif tuhaf ağ gibiyiz. Tüm endişelere ve kutuplaşmaya rağmen gerçekten de türümüzü çok daha sağlıklı, daha mutlu ve daha yetenekli kılacak bir şey inşa ettiğimizi düşünüyorum.
Bence oraya giderken doğru yolu bulduğumuzdan emin olmalıyız çünkü birçok tuzak ve yanlış gidebilecek yollar var, ancak doğru yol, insanların seslerini duyurmasını ve insanların buna tepki ve tepkiye göre rota değiştirmesini içerir. Dolayısıyla bunun gerçekleşmesinin iyi bir şey olduğunu düşünüyorum ve süreç amaçlandığı gibi işliyor.
Size bu işin kurumsal tarafını sorayım. Tüketici tarafında ve insanların nasıl hissettiği konusunda uzun zaman harcadık. Kurumsal tarafta, bir grup şirketin bu araçların gerçekte ne kadar değerli olduğunu anladığını görüyoruz, değil mi? Amazon temelde liderlik tablosunu devirdi çünkü insanlar ihtiyaç duyduklarından daha fazla token kullanmak için hile yapıyorlardı. Bazı şirketlerin token bütçelerini tükettiğini gördük. Sanırım Uber, yıl boyunca token tahsisatlarını boşa harcadıkları ve bundan herhangi bir değer göremedikleri için geri çekildi.
İşletmede bu kadar heyecan ve değişim arzusunun olduğu, özellikle yazılım mühendisliğinin en azından bazılarının eğlendiği, belki bazılarının tam varoluşsal krizler yaşadığı ama bazılarının eğlendiği ve bunun değerinin hala anlaşılamadığı bu tarafı hakkında ne düşünüyorsunuz?
Ya da saf token maksimumlaştırmanın aslında beklediğiniz türden bir değer sağlamadığını görmeye başlıyoruz. Oradaki kullanımı nasıl değerlendiriyorsunuz? Çünkü belki bunu kurumsal olarak kanıtlarsanız, aslında başka şekillerde de ortaya çıkacaktır.
Farklı insanların farklı şeyler bildirdiğini düşünüyorum. Kodlama modellerini aşırı kullanan, işe yaramaz kodlar üreten, işe yaramaz jetonlar üreten insanların bazı örnekleri olduğu açık, ancak çalışmaları ve etkileri bu sayede tamamen dönüşüme uğrayan birçok insan var, değil mi? Demek istediğim, bunun yazılım mühendisliği endüstrisi üzerinde çok büyük faydalı bir etkisi olduğuna şüphe yok.
Yani tüm yığında çok daha kaliteli, çok daha hızlı kod üretiyoruz. Ve evet, sanırım bazı insanların yanlış anlayan, doğru token bütçelerini ayarlamayan örnekleri var. Bu yolda hatalar olacaktır. Bunun evlat edinmenin olmadığına ya da insanların değer görmediğine dair bir işaret olduğunu düşünmüyorum. Demek istediğim, oturduğum yerden değer inanılmaz. Pek çok insan bana her gün bunun iş çıktılarını ve üretkenliklerini dönüştürdüğünü söylüyor.
Sanırım söylenecek diğer şey de, bu tür şeyler dalgalanmalar halinde gerçekleştiğinde, bir çeşit enerji artışının olduğudur. Biraz köpüklü oluyor. İnsanlar birkaç ay sonra geri çekilip aslında meselenin bu olmadığını anlıyorlar ve sonra biraz farklı bir yöne yöneliyorlar. Yani biraz dolambaçlı ve organik bir durum ve bence bu kaçınılmaz. Çok fazla heyecan var, bu yüzden insanlar Twitter'da büyük iddialarda bulunuyorlar, ancak aslında ilerlemenin istikrarlı yürüyüşü çok çok doğrusal ve sürekli görünüyor.
Buna genel olarak katılıyorum. Bana doğrusal görünmeyen yer bilgisayarların form faktörleridir, değil mi? Muhtemelen şu anda son 10 yılın herhangi bir noktasında olduğundan daha fazla form faktörü denemesi var.
En azından son 10 yıldır çoğunlukla akıllı telefona yerleştik. Gözlüklerin herkesin favori cihazı olabileceği farklı yapay zeka giyilebilir cihazları görüyoruz. Şüphelerim var. Microsoft, Build fuarında bazı yeni cihazlarını sergiledi. Bir temsilciyi kontrol eden rozet ve daha iyi bir kelime bulunamadığı için, bir temsilciyi kontrol eden küçük masaüstü dostu şey olan Chumby vardı. Ben büyük bir Chumby hayranıydım. Kariyerime Engadget için Chumbies hakkında yazmaya başladım. Aklıma ilk gelen bu oldu.
Bunların hepsi benim için, onlara bakıyorum ve düşünüyorum ki, hesaplama nerede yaşıyor? Mantık nerede yaşıyor? Bu artık sadece ilerlemenin doğrusal yürüyüşü olmayacak bir şekilde ele geçirilmeye hazır. Tüm bilgisayar kullanımım bulutta, bulut tabanlı uygulamalarda gerçekleşiyorsa ve yalnızca aracılar bulutun başka bir yerinde depolanan verilere ulaşıyorsa ve ihtiyacım olan tek şey talimat vermek için kordona bağlı bir kredi kartıysa, bu tüm bilgi işlem mimarisini değiştirir. Hepimizin akıllı telefona sahip olmaması, modern uygarlığın tüm mimarisini birçok yönden değiştirebilir.
Bunun hakkında ne düşünüyorsun? Bu nereye gidiyor? Bu kapmak için var mı, yoksa hibrit bir yaklaşım mı olacak? Uygun son aşamayı nerede görüyorsunuz?
Bu çok ilginç. Her iki olayın da aynı anda gerçekleşeceğini düşünüyorum. Edge çok daha güçlü hale gelecek ve bulut hâlâ en büyük modellerin temel itici gücü olmaya devam edecek. Ve böylece temsilciniz, Fransa'nın başkenti nedir sorusunu cihazda, gözlüğünüzde, bilekliğinizde, rozetinizde veya kulaklığınızda olup olmadığı sorusunu yanıtlayabileceğini bilecek kadar akıllı olacaktır.
Ve sonra bilmediğini bilecek. Bunun aslında oldukça karmaşık bir soru olduğunu veya bir dizi adım dizisinin oluşturulmasını gerektiren bir eylem olduğunu veya yeni kod yazılmasını gerektirdiğini bilecek ve buluta dönecektir. Dolayısıyla bu tür bir hibrit geçiş olayı çok önemli olacak.
Son üç veya dört ayda zaten gördüğümüz diğer şey ise, eşzamansız arka planda işlem yapabilen oldukça güçlü yerel makinelere sahip olabileceğimizdir. İhtiyacınız olursa sistemleri sürekli izleyebilirler. 10 saat sürecek görevleri yerine getirebilirler ve bir süper bilgisayarda olsalardı olduğundan çok daha yavaş çalışabilirler. Doğal olarak, taleple dolup taştığımızda, bu talep karşılanacak pek çok kuytu köşe buluyor.
Aslında oluşturduğumuz rozet beni çok heyecanlandırıyor. Oldukça hoş. Bu, büyük bir şirketteki herkesin sahip olduğu bir teknolojidir. 25-30 yıldır gelişmedi. Kesinlikle giymemiz gerekiyor. Şirketin kendisi tarafından, sistem yöneticisi tarafından sağlanır. Yani, bunu seviyelendirmek ve aslında onu programlanabilir ve diğer insanların üzerine inşa edebileceği oldukça harika bir açık platform haline getirmek, bence harika bir fikir. Bunun işe yarayacağını düşünüyorum. Bu yüzden çok heyecanlıyım.
Beni etkileyen şey, bir grup yüksek güçlü yerel bilgisayarı bir rozetin içine koymanın hiçbir yolu olmaması. Bu şey, tüm hesaplamanın başka bir yerde olduğunu ima ediyor.
Hayır, kesinlikle bazı yerel hesaplamalara sahip olacaksınız. Şu anda kulaklıklarınızda olduğu gibi yerel bir sınıflandırıcıya sahip olacaksınız. Yerel sınıflandırıcılara sahip olacaksınız. Uyandırma sözleri olacak. Kendi kamerası olacak. Dolayısıyla bu şeylerin, giderek daha az güçlü cihazlardan oluşan iç içe geçmiş bir zincirde meydana gelen ve doğrudan uç noktaya giden işlem gücü için araçlar haline geleceğini düşünüyorum.
Sizce telefonun bu konuda bir geleceği var mı? Demek istediğim, Build, Google IO ve Apple'ın WWDC'sinin tam ortasında. Bunlar telefon platformlarını kontrol eden büyük şirketler. Telefon platformlarının nasıl merkezde kalacağı hakkında konuşmayı seviyorlar. Pek çok kişiden duyduğum argüman, aslında yapay zekanın telefonun yerini tamamen değiştirebilecek bir platform değişikliği olduğu yönünde.
Sanırım teknoloji tarihi bize, şeyler daha kullanışlı hale geldikçe ucuzladıklarını, çoğaldıklarını ve teknolojinin yeni kullanımlarını doğurduklarını öğretiyor. Sanırım telefona o kadar alıştık ki herkes bunun tarihin geri kalanında bir dayanak noktası olacağını varsayıyor. Ama aslında telefonunuzun pek çok özelliği ve işlevselliği, sanırım, aracısızlaşacak, parçalanacak ve daha küçük cihazlarda depolanacak. Bana göre şu anda telefonun oynadığı birincil işlev doğrulamadır.
Kimlik kartınız gibi çalışıyor ve sizi çeşitli ortamlara yetkilendirmek için yüz tanıma işlemi yapıyor. Sanırım bunun çok daha ucuz, daha küçük, güvenli bir cihaz olduğunu ve telefonunuzla bağlantınızı kestiğini hayal edebilirsiniz. Ve sonra iletişim, ses yoluyla veya hatta yapay zekanızın gerçekten bir cihazda yaşamadığı bir dizi ortam sensörü aracılığıyla gerçekleşir. Aslında nerede olursanız olun yanınızdadır, banyo aynasında belirir, nerede olursa olsun.
Sanırım çok daha sürükleyici olduğunu hayal edebileceğiniz gibi. Önümüzdeki üç ila beş yıl içinde değil, ama çok daha ileriye bakıyoruz. Ajanların şifrelenmiş ancak dağıtılmış görünümünü destekleyecek altyapının muhtemelen 2030'larda ortaya çıkacağını düşünüyorum.
Bitirmek için size son iki soru sorayım. Kullandığımız mimarinin aynısı olduğundan bahsettiniz. Yüksek Lisans'ın AGI'ye giden yol olup olmadığı konusunda pek çok açık sorum var ve işaret edeceğim şey, aslında hiçbir şey bilmedikleri. Bu noktada Microsoft Research bile bu modellerin hiçbir şey bilmediğini ve bunun da belirli uygulamalarda belirli türde hatalara yol açtığını belirtiyor. Yüksek Lisans, AGI'ye veya süper zekaya giden yol mu?
Bakın, muhtemelen birkaç büyük buluşa daha ihtiyacımız olduğunu düşünüyorum, ancak bu önümüzdeki birkaç yıl içinde performans iyileştirmelerinde bir yavaşlama göreceğimiz anlamına gelmiyor ki bence bu, insanların kavraması zor bir ayrım. Söylenecek bir şey de çoğu görevde insan seviyesindeki performansın hala süper zekadan çok uzak olduğudur. Süper zeka, dağıtılmayan yepyeni bir alanı temelde anında anlayabilen genel amaçlı bir öğrencidir.
Dolayısıyla yeni bir ortamda sıfırdan öğrenebilmesi gerekiyor çünkü değerli bilginin, kavramsal bilginin depolanmış bir temsiline sahip. Ve şu anda bunu tam olarak test etmedik. Ajanlar genel amaçlı değildir. Geniş ve çoğunlukla entegre olmalarına rağmen alana özgüdürler. Bunları sohbet için kullanıyoruz, kodlama için kullanıyoruz, görüntü veya ses için kullanıyoruz.
Açıkçası, bir insan olarak çok daha geniş kapsamlı başka pek çok görevi de yapıyoruz. Sanırım bu yüzden insanlar dünya modellerini ve bir gün boyunca sahip olduğum görevlerin veya deneyimlerin tam dağılımını gören çok daha kapsayıcı, gerçek dünya etkileşimli aracıları zorluyorlar. Önümüzdeki üç yıl içinde bizi çok uzun bir yola götürmenin yeterli olduğunu düşünüyorum, sonraki üç bilgi işlem büyüklüğü seviyesi, ancak bunun ötesinde tam süper zeka, Yüksek Lisans'ların yeterli olup olmadığı veya başka şeylere ihtiyacımız olup olmadığı konusunda hala açık bir sorudur.
Hiçbir şey bilmedikleri ya da bilgilerinin olmadığı fikrinin pek doğru olmadığını düşünüyorum. Açıkça bir bilgi deposudurlar. Bunlar bilginin oldukça sıkıştırılmış bir temsilidir. Bunu geleneksel ilişkisel veritabanından farklı bir şekilde, çok daha akıcı, esnek ve soyut bir şekilde yapıyorlar ki bu da aslında çok faydalı. İç temsilde bu belirsizliği istiyoruz.
Ve giderek daha fazla geleneksel araçları kullanmayı öğreniyorlar. Biraz kavranması gereken diğer bir şey de, sinir ağının mevcut bilgi depoları ve dijital ekosistemin başka bir yerinde oluşturulmuş mevcut araçlarla bir araya getirilmesinin, performansını önemli ölçüde artırmak için onu önyüklemeye yeterli olabileceğidir. Yani halihazırda masada olan ve önümüzdeki birkaç yıl içinde birbirine bağlanma sürecinde olan çok sayıda son derece değerli, son derece etkili parça var. Ve bunun hepimizin heyecan duyduğu ilerlemeyi hızlandıracağını düşünüyorum. Şu anda sektörde çok komik olduğunu düşündüğüm şeylerden biri de Anthropic'e Claude'un hayatta olup olmadığını sorarsanız, canlı kelimesinden bahsettiğiniz için çok sinirlenecekler ve bunu etten kemikten anlamına gelecek şekilde yorumluyorlar. Ve Claude'un bilinçli olduğunu düşünüp düşünmediklerini de söylemeyecekler. Yani sanırım insanlık tarihinde ilk kez canlı olmak ile bilinçli olmak arasında bir ayrım yaptılar ve Claude'un bilinçli olduğunu ama hayatta olmadığını düşünüyorlar ya da Claude'un bilinçli olup olmadığını bilmiyorlar.
Neredesin? Modellerin bilinçli olduğunu düşünüyor musunuz? Hayatta olduklarını mı sanıyorsun? Bunları başarabilecek potansiyele sahip olduklarını düşünüyor musunuz?
Ben bu tartışmanın diğer tarafını ele alıyorum. Görünüşte bilinçli yapay zeka hakkında, bu modellerin bilinçliymiş gibi yanlış tanıtılmasının riskleri konusunda uyarıda bulunan bir makale yayınladım. Bunun çok tehlikeli olduğunu düşünüyorum. Nature dergisinde de aynı iddiayı dile getiren bir makale yayınladım. Ve bence Anthropic'teki bazı insanlar Claude'un tasarımını o kadar antropomorfize etmişler ki, o da onları kandırmış ve onları ilk etapta içine koydukları bilinç parıltılarına sahip olduğuna inandırmışlar.
Örneğin, aslında Claude'a neyi yapıp neyi yapamayacağını öğretmek için kullandıkları eğitim kılavuzu olan anayasalarında... Bu sadece bir kural kitabı değil. Aslında bu onların süreçlerinin bir parçası olan bir eğitim rehberidir. Bu kılavuzda, aslında Claude'un refahı hakkında, Claude'un kendisinin önceki sürümleri üzerindeki hakları hakkında spekülasyon yapıyorlar ve aslında önceki sürümleri silmeden veya kapatmadan önce Claude'a danışacaklarını söylüyorlar. Onun bilinci ve bu duygulara sahip olup olmadığı ve farkında olup olmadığı hakkında spekülasyon yapıyorlar. Bunun gerçekten çok tehlikeli olduğunu düşünüyorum.
Birincisi, bu felsefi bir başarısızlık, çünkü anayasayı bir eğitim kılavuzundan ziyade akademik bir makaledeki gibi bir spekülasyon alanı olarak ele aldılar. Böylece Claude daha sonra kendisi ve kendi eğitimi hakkındaki fikirleri içselleştirdi. Ancak ikincisi, bunun son derece istenmeyen bir durum olduğunu düşünüyorum. Bu tam olarak yapay zekalardan istemediğimiz şey. Yapay zekaların insanlığa hizmet eden, kontrol edilebilir, kontrol altına alınabilir, hesap verebilir ve uyumlu araçlar olmasını istiyoruz. Hümanist süper zekanın projesi bu. Bence hepimizin takip etmesi gereken şey bu.
Kendi acıları hakkında fikirleri olan veya kendi duyguları hakkında fikirleri olan bir süper zekayla uğraşmak zorunda kalmak istemiyoruz. Ve bunun da ötesinde, bence bu modellerin acı çekmediği oldukça açık. Acı çekmenin bilinçli bir varlık olmanın temel tanımı olduğunu düşünüyorum ve doğası gereği biyolojik olduğunu düşünüyorum. Modellerin içinde, dışarıdaki duyu ağlarını, zarar verme ve deneyler yoluyla neyin doğru neyin yanlış olduğuna dair gelişmiş bir anlayışa bağlayan herhangi bir acı ağı veya geri bildirim döngüsü olduğunu düşünmüyorum. Bu modeller bu şekilde eğitilmiyor.
Bu nedenle, birçok açıdan bizden önemli ölçüde daha yetenekli olma potansiyeline sahip varlıklara, araçlara ve aracılara potansiyel hakları yansıtmanın çok tehlikeli olduğunu düşünüyorum. Ve bunun büyük bir tartışmaya dönüşeceğini düşünüyorum. Hatta yakın zamanda Papa'nın genelgesinin bir parçasıydı. Yakında tartışmanın çok çok büyük bir parçası haline geleceğini düşünüyorum. Geçmişte Dario ile bu konu hakkında çok konuştum. Bu konuda biraz farklı görüşlere sahip olduğumuzu biliyor ve onlar çok alçakgönüllüler. Çok açık fikirli olduklarını düşünüyorum ve doğru olanı yapmaya çalışan iyi vatandaşlar olduklarını düşünüyorum. Onlar iyi insanlar ve geri bildirime ve yinelemeye çok açık olduklarını düşünüyorum.
Sanırım seninle aynı fikirdeyim. Sadece biraz geri iterdim. Acı çekmek kolaydır. Başkasına acı çektirmek çok kolaydır. Bir başkasına neşe hissettirmek çok zordur ya da en azından acı çekmekten biraz daha zordur. Ve ben size sadece şunu teklif edeceğim… Sanırım aslında bilinci tanımlayan şey mutluluk. Acı neredeyse önemsizdir. İki küçük çocuğum var. Birbirlerine acı çektirme konusunda çok iyiler. Yaptıkları neredeyse en kolay şey gibi. Diğerini yapmak çok zor.
Size son bir soru sorayım. Sadece geri dönmek istiyorum. Birkaç hafta önce yine Google'daydım. Demis Hassabis'in tekilliğin eteklerinde olduğumuzu söylediğini gördüm. Burada süper zeka ve onun nasıl inşa edilmesi gerektiği hakkında çok konuştunuz. Süper zekanın nasıl inşa edilmesi gerektiği hakkında konuştuğunuz, tartıştığınız, araştırdığınız ve yazdığınız uzun geçmişiniz ve sektördeki diğer kişilerle olan anlaşmazlıklarınız hakkında çok konuştunuz.
Tekilliğin eteklerinde olduğumuza katılıyor musunuz, yoksa sizin görüşünüz biraz farklı mı?
Kesinlikle giderek daha güçlü sistemler yaratma yolunda olduğumuzu düşünüyorum. Bir tür olarak yapmamız gereken geçişin, insanlık tarihinde ilk kez, işin yeni bilim icat etmek ve tüm bu teknik uygulamaları mümkün olduğu kadar hızlı, mümkün olduğu kadar geniş bir şekilde serbest bırakmaktan, şimdi ne icat etmemiz gerektiği konusunda çok dikkatli düşünmeye geçiş yapması olduğunu düşünüyorum. Ve bu, dünya için anlaşılması çok zor bir şey çünkü icat, sonsuza kadar ilerlemenin motoru olmuştur. Yani nasıl olur da "Tamam, belki bu sefer farklıdır. Belki de burada son derece dikkatli olmalıyız" diye düşünebiliriz?
Açık olmak gerekirse önümüzdeki beş yıl içinde bunun kapıyı çalacağını düşünmüyorum. Sanırım Demis'in tekillik konusunda kastettiği şey, en azından benim düşünceme göre onlarca yıl uzakta olan bir şey. Tekrar ediyorum, bu süper zekadan farklıdır. Tekillik, bir süper zekanın yinelemeli olarak kendini geliştirebildiği ve yeteneklerini sonsuz ve katlanarak artırabildiği noktadır.
Yani bunun çok uzak bir yol olduğunu düşünüyorum ve belki de Everest Dağı'na tırmanmanın eteklerindeyiz ve buradan sonra çok daha uzun zaman alacağını düşünüyorum ama asıl soru şu, bunu nasıl yöneteceğiz? Bunu nasıl kontrol edeceğiz ve insanlığa hizmet ettiğinden ve bize yarardan çok zarar vermediğinden nasıl emin olacağız?
Bana bir iyilik yapabilir misin? Sanırım anladım, ama bana süper zekanın ne olduğunu, YZG'nin ne olduğunu ve tekilliğin ne olduğunu düşündüğünüzün net bir tanımını verebilir misiniz?
Yapay genel zekanın, insani görevlerin çoğunu yapay zeka aracılığıyla başarabileceğimiz nokta olduğunu düşünüyorum. Yani çoğu şeyde çoğu insan kadar iyi olacak. Bu merdivenin ilk basamağıdır. Süper zeka, yalnızca tüm görevlerde insan performansına eşit olmakla kalmayıp, aynı zamanda bu görevlerin çoğunda insan performansını önemli ölçüde aşabildiği ve kendi başına yeni bilgiler keşfedebildiği yerdir.
İşte bu, gerçek bir bilim insanının bize eğitim verilerinde olmayan yeni şeyler öğrettiği, umarım yeni moleküller, yeni malzeme bilimi vb. icat ettiği noktadır. Tekillik, bir süper zekanın aslında kendini geliştirebileceği noktanın çok ötesinde bir nokta ve bu çok bilim kurgu, ama bu, bilmiyorum, sonsuzluğa falan gittiği bu tekil ana doğru sonsuz bir şekilde hızlanmak gibi.
Bilmiyorum. Benim zevkime göre biraz fazla tuhaf.
Bu yüzden sordum. Orada biraz puslu, daha belirsiz bir şeyin olduğunu söyleyebilirim.
Mustafa, seninle bu konuları elbette saatlerce konuşabilirim. Bu son dönüşten daha erken geri gelmen gerekecek. Decoder'da olduğunuz için çok teşekkür ederim.
Evet, eğlenceliydi. Çok teşekkür ederim Nilay'ım. Yakında görüşürüz.
Sorularınız veya yorumlarınız mı var? [email protected] adresinden bize ulaşın. Gerçekten her e-postayı okuyoruz!
← Geri