Heute spreche ich mit Mustafa Suleyman, dem CEO von Microsoft AI. Und ich werde die heutige Einleitung eigentlich kurz halten – ich arbeite diese Woche auf dem Familienbauernhof meiner Frau, wie Sie im Video sehen werden, aber auch das ist ein echter Brennpunkt einer Episode. Wir haben alles behandelt, von Mustafas Herangehensweise an die Ausbildung neuer Modelle bis hin zu seiner Kritik an Anthropic, in dem er über Claude spricht, als ob es bewusst wäre. Natürlich haben wir auch über die Beziehung von Microsoft zu OpenAI gesprochen, darüber, wie Mustafa über all die negativen Umfragen und politischen Widerstände rund um KI im Moment denkt und ob eines der Verbraucherprodukte gut genug ist, um dem entgegenzuwirken. Wie gesagt, es ist ein Brenner. Okay: Mustafa Suleyman, CEO von Microsoft AI. Auf geht's. Dieses Interview wurde aus Gründen der Länge und Klarheit leicht bearbeitet. Mustafa Suleyman, Sie sind der CEO von Microsoft AI. Willkommen zurück bei Decoder. Schön, wieder bei dir zu sein. Ich freue mich sehr, mit Ihnen zu sprechen. Unser vorheriges Gespräch war eines meiner Lieblingsgespräche – über KI, wie sie uns Gefühle vermitteln sollte und wozu sie dient – ​​das ich in allen Gesprächen geführt habe, die wir geführt haben.  Es gibt einige große Veränderungen bei Microsoft, vielleicht eine sehr wichtige Neukontextualisierung der Einstellung der Menschen zu KI, über die ich mit Ihnen insbesondere sprechen möchte. Und dann ist da noch Microsoft Build, die große Microsoft-Entwicklerkonferenz, auf der es jede Menge neue Ankündigungen und jede Menge tolle Ideen dazu gab, wofür Computer da sind und wo sie vielleicht sein sollten, auf die ich näher eingehen möchte. Fangen wir ganz am Anfang an. Dies ist ein tiefgründiger Decoder-Sachen, den man vor allem verstehen muss. Seit Sie bei Microsoft sind, haben Sie die Art und Weise, wie KI dort funktioniert, neu strukturiert. Ihre Rolle hat sich geändert. Als ich das letzte Mal mit Ihnen gesprochen habe, waren Sie für eine Reihe von Konsumgütern verantwortlich. Das wurde inzwischen aufgehoben. Sie trainieren jetzt neue Modelle; Du bist an der Grenze.  Erklären Sie, wie Microsoft AI jetzt strukturiert ist und wie es innerhalb von Microsoft strukturiert ist. Ich schätze, wir waren in den letzten 15 bis 18 Monaten auf dieser Reise, um unsere Beziehung zu OpenAI wiederherzustellen, und es hat eine Minute gedauert. Ich denke, es gipfelte in einem neuen Vertrag, den wir im Oktober letzten Jahres abgeschlossen haben. Und darin gab es viele, viele verschiedene Bestimmungen, darunter die Festigung und Erweiterung der Partnerschaft, aber vor allem die Freiheit, die Superintelligenz unabhängig weiterzuentwickeln und weiterhin ihre Modelle zu kaufen und zu lizenzieren. Seit Oktober stelle ich also das Superintelligenz-Team zusammen, baue Cluster von ausreichender Größe auf, um Grenzmodelle zu trainieren, und stelle ein Team ein, das sich auf Superintelligenz konzentriert. Das war also eine ziemlich große Veränderung für uns, weil es mir irgendwie ermöglichte, mich ausschließlich auf die Superintelligenz-Mission zu konzentrieren, und das hat dann in ein paar Dingen gipfelt, die wir diese Woche bei Build angekündigt haben. Wir haben sieben neue Modelle für alle Modalitäten und so weiter. Es war also eine ziemlich große Veränderung, und ich denke, die Planung hat lange gedauert, und es ist eine große Erleichterung für uns, jetzt im Spiel zu sein und in den nächsten Jahren die absoluten Grenzen zu verfolgen. War das der Plan, als Sie bei Microsoft eingestellt wurden? Das war auf jeden Fall der Plan der letzten 18 Monate. Ich meine, ich denke, die Beziehung zu OpenAI hat viele Höhen und Tiefen durchgemacht. Und ich glaube, dass es in vielerlei Hinsicht als eine der erfolgreichsten Partnerschaften der Geschichte eingehen wird. Es war großartig für OpenAI und es war großartig für Microsoft, und alle guten Beziehungen entwickeln sich weiter, und ich denke, dies ist nur die nächste Stufe in unserer Entwicklung. Lassen Sie mich Sie speziell zu dieser Entwicklung befragen. Wir alle haben gerade den Prozess zwischen Elon Musk und OpenAI und Sam Altman gesehen. Microsoft war an diesem Prozess in dem Sinne beteiligt, dass hin und wieder ein Microsoft-Anwalt aufstand und sagte: „Und wir waren nicht da.“ Und jemand würde ja sagen, und das war's. Aber was während dieses Versuchs offensichtlich herauskam, was während der gesamten Zeit klar war, ist, dass die ursprüngliche Idee darin bestand, dass OpenAI ein Forschungslabor sein und Modelle bereitstellen würde, während Microsoft die Produkte entwickeln würde. Microsoft verfügte über Fachwissen bei der Markteinführung; Es verfügte über Fachwissen im Unternehmensbereich und versuchte auf verschiedene Weise, wieder im Verbrauchermarkt Fuß zu fassen. Dies wäre ein Plattformwechsel, und die Forschungsarbeit wäre bei OpenAI beendet und die Produktarbeit wäre innerhalb von Microsoft.  Das hat sich geändert: OpenAI wollte immer mehr Verbraucherprodukte herstellen. Offensichtlich möchte Microsoft angesichts Ihrer neuen Rolle und Ihres neuen Fokus immer mehr eigene Modelle entwickeln. Warum die Trennung? Was hat in dieser Beziehung nicht funktioniert? Ich meine, ich denke, dass OpenAI von einem unglaublich ehrgeizigen Gründerteam und Sam selbst geleitet wird. Und als sie anfingen, an Zugkraft zu gewinnen und eine Menge Umsatz zu generieren, sahen sie natürlich auch Chancen, voll auf die Beine zu kommen. Sie begannen also nicht nur mit der Arbeit an Konsumgütern. Offensichtlich war ChatGPT unglaublich erfolgreich. Sie begannen auch mit der Arbeit an eigenen Rechenzentren. Sie begannen, ihren eigenen Chip zu entwickeln. Es kursieren viele Gerüchte über eigene Consumer-Hardwaregeräte. Sie begannen, Modelle über ChatGPT Enterprise direkt auf den Markt zu bringen. Insgesamt haben sie sich in den letzten zwei, drei, vier Jahren also weit über die Forschung hinaus ausgeweitet. Und das Gleiche gilt natürlich auch für Microsoft. Ich meine, ich glaube, die Partnerschaft ist jetzt fünf oder sechs Jahre alt und hat noch weitere vier, fünf, sechs Jahre Zeit. Ebenso sind wir eines der größten Technologieunternehmen der Welt. Wir haben 493 der 500 größten Unternehmen, die die meisten ihrer Daten auf unseren Systemen speichern und verarbeiten, Azure nutzen, M365 und Teams nutzen. Ich denke, die Leute unterschätzen oft, wie riesig wir sind und wie groß unser Vertriebsanteil im Unternehmen ist. Langfristig, und zwar über einen Zeitraum von fünf, sechs, sieben, zehn Jahren, müssen wir sicherstellen, dass wir absolut nachhaltig sind und nicht nur Empfänger des geistigen Eigentums eines anderen sind, das wir dann leicht modifizieren und anpassen und für unsere Produkte in Produktion bringen, sondern dass wir tatsächlich auf eigenen Beinen stehen und Weltklassemodelle schaffen können. Ich meine, die Superintelligenz kommt. Ich denke, es ist gleich um die Ecke. Und deshalb denke ich, dass es im Grunde die wertvollste Technologie aller Zeiten sein wird. Es gibt keine Möglichkeit, dass wir auf lange Sicht strukturell für alle Ewigkeit von einem Dritten abhängig sein könnten, der dieses geistige Eigentum bereitstellt. Das war also der Übergang, der offensichtlich ausgelöst wurde, als OpenAI usw. ein Board-Problem hatten. Aber dann, als ich hereinkam und mein Team hereinkam, begannen wir mit dem Aufbau, wir befinden uns in diesem Übergang. Und ich denke, wir sind in einer großartigen Lage, weil wir eine ziemlich stabile, sorgfältige und langfristig optimale Position einnehmen können, sowohl für OpenAI, das meiner Meinung nach unglaublich gute Ergebnisse erzielt hat, als auch für uns. Ich möchte etwas Zeit mit Superintelligenz verbringen. Ich möchte jetzt nur eine Markierung einfügen, weil ich den Übergang für eine weitere Runde hier irgendwie verstehen möchte. Es gibt einen Moment in der Testversion, eine Art sehr lustige Botschaft von Microsoft-CEO Satya Nadella, in der er sagt: „Ich möchte nicht Intel sein und OpenAI nicht Microsoft sein“, was sehr lustig ist, wenn man bedenkt, dass der CEO von Microsoft selbst sagt: „Ich möchte nicht der Anbieter sein und sie als Plattform haben, die den gesamten Wert bietet und den gesamten Wert sammelt, und vielleicht werden wir ausgetauscht. Ich möchte nicht, dass ChatGPT auf Azure läuft, und dann wird OpenAI den gesamten Wert erhalten.“ und dann können sie uns vielleicht austauschen“, so wie es im Laufe der Zeit mit Windows und Intel passiert ist. Ist das eine Erkenntnis? Ist Nadella zu dir gekommen? Wie war das Treffen, bei dem Sie sagten: „Okay, OpenAI hatte seine Vorstandsprobleme. Wir müssen zurück an die Grenze gehen und auf eigenen Beinen stehen.“ Wie sah dieses Gespräch aus und wie wurde diese Entscheidung getroffen? Ich meine, das ist offensichtlich die Entscheidung von Satya sowie von Amy, Brad und vielen anderen Leuten im Unternehmen. Aber ich denke, es ist wie bei allem: Es handelt sich um langsame Veränderungen im Unternehmen, bei denen klar wird, dass die Richtung, die wir einschlagen, ein wenig optimiert und angepasst werden muss. Und das geschah schon lange vor dem Vorstandsvorfall im November, und ich denke, es baut sich mit der Zeit auf, wenn man sich die Art der Konstellation verschiedener Fronten ansieht, an denen wir immer direkter konkurrieren, und all die Spannungen, die daraus entstehen. Aber auch einfach zu wissen, dass solche Partnerschaften nicht ewig halten.  Ich meine, OpenAI möchte ein börsennotiertes Billionen-Dollar-Unternehmen sein, hat unglaubliche Einnahmen und wächst wie verrückt. Sie möchten die Freiheit haben, zu agieren und Rechenleistung von allen möglichen anderen Orten zu kaufen, ihre eigene Rechenleistung aufzubauen und mit jedem zusammenzuarbeiten, den sie wollen. Der Vertrag wurde also zu einer Zeit geschlossen, als die Unternehmen hinsichtlich Größe, Umfang und Ausgewogenheit von Bedürfnissen und Inhalten sehr unterschiedlich waren. Ich denke, dass es für diesen Moment Sinn machte, aber dann wurde ziemlich klar, dass wir in der Lage sein müssen, dies selbst in den Griff zu bekommen und zu kontrollieren und es unseren eigenen Kunden gegenüber richtig zu machen. Wie gesagt, wir haben eine unglaubliche Verteilung auf Unternehmen, die meiner Meinung nach weltweit einzigartig ist. Deshalb müssen wir sicherstellen, dass wir die besten Produkte für unsere Kunden bauen. Das sieht etwas anders aus als bei einem Unternehmen, das mit ChatGPT gemeinsam sowohl für den Verbraucher als auch für das Unternehmen optimiert hat, und auch für die grundlegende wissenschaftliche Mission der Superintelligenz, die eine ganze Reihe verschiedener Richtungen umfasst, die sich überschneiden, aber wohl auch als orthogonal zu den Verbraucher- und Unternehmensrichtungen bezeichnet werden könnten. Natürlich denke ich, dass sich Partnerschaften so entwickeln und dass sie regelmäßig auf den Kopf gestellt werden. Ja, aber der Bau eines Grenzmodells sei sehr teuer, wurde mir gesagt. Ehrlich gesagt handelt es sich hierbei um ein sehr teures Projekt. Irgendwann muss Amy Hood, die CFO von Microsoft, sagen: „Ja, Sie haben das Budget.“ Wann ist das passiert? War das nur eine SMS? Gab es ein Treffen? Erzählen Sie mir von den Einzelheiten dort. Ich glaube, wir haben die Entscheidung Anfang letzten Jahres getroffen, was offensichtlich alle Vertragsverhandlungen beeinflusst hat, die dann alle im Oktober abgeschlossen und unterzeichnet wurden. Und es ist eine bedeutende Investition, aber es wird lange dauern, bis wir sie getätigt haben. Ich meine, wir haben bereits erhebliche Investitionen in unsere eigene Selbstversorgungsmission getätigt.  Unser Maia 200-Chip ist zum Beispiel tatsächlich ein herausragender Chip, oder? Wir sind nun in der Lage, innerhalb unserer eigenen Cluster einen Chip herzustellen und zu versenden, der 30 Prozent günstiger ist als ein GB200. Und jetzt, da wir damit unsere eigenen Modelle gemeinsam entwerfen können, liefert das MAI-Thinking-1-Modell, das wir gerade veröffentlicht haben, tatsächlich eine 1,4-fache Leistungssteigerung pro Watt zusätzlich zu den 30 Prozent Verbesserung, die Sie durch den Betrieb auf einer Maia 200 erhalten, wenn wir die Modelle für unsere Aufgaben gemeinsam optimieren. Der Wert, sicherzustellen, dass Sie Ihren eigenen Stack besitzen und kontrollieren und den gesamten Co-Design-Aufwand End-to-End für die Anwendungsfälle leiten, die für uns am wichtigsten sind – was natürlich die Agentencodierung, unsere Entwickler, unsere Unternehmen ist –, zahlt sich eindeutig aus und rechtfertigt die Investitionen, die wir in den nächsten Jahren tätigen müssen. Sie sagten „Selbstversorgungsmission“, was eine sehr höfliche Art ist, auszudrücken, dass Sie auf eigenen Beinen stehen wollen; Du willst dein eigenes Ding machen. Mir wurde gesagt, dass es innerhalb von Microsoft einige Kontroversen über eine Zeile gibt, die mein Kollege Hayden Field in einem Artikel über Build geschrieben hat. Ich werde das einfach lesen. Das ist von Hayden. Es ist eine tolle Linie. Sie sagte: „Der diesjährige Microsoft Build hatte die Atmosphäre einer frisch geschiedenen Single, die eine Durstfalle auf Instagram postet.“ Die Trennung ist vollzogen und es ist Zeit, sich zu beugen. Hier ist unser neues Modell. Wir werden auf unseren eigenen Beinen stehen. Sie sagen da draußen, dass Sie Modelle an der Spitze bauen und mit den führenden Labors konkurrieren werden. Ist das bei Microsoft das Gefühl, dass man die Freiheit hat, auf sich allein gestellt zu sein? Definitiv nicht. Nein, überhaupt nicht. Ich meine, das ist offensichtlich eine coole Überschrift und ein lustiger Satz. Aber die Realität ist, dass wir noch viele Jahre mit OpenAI zusammenarbeiten werden. Ich meine, wir bewegen uns weit über das Jahr 2030 hinaus. Sie produzieren immer noch die besten Modelle der Welt. GPT-5.5 ist ein herausragendes Modell. Der Codex, die Cybersicherheitsmodelle, die sich durchsetzen, sind erstaunlich und treiben den Großteil unserer Arbeit voran. Das wird natürlich so weitergehen. Und deshalb denke ich, dass das einfach ein natürlicher Ablauf dieser Art von Partnerschaften ist. Ich glaube nicht, dass es etwas Ungewöhnliches oder Überraschendes ist. Ich denke, OpenAI hat dafür großes Verständnis und unterstützt es. Ich meine, sie sind offensichtlich ein unglaublich schnell wachsendes Unternehmen und sie verstehen, dass wir auch unsere eigene Agenda verfolgen müssen. Es ist also ganz normal. Lassen Sie mich Ihnen die andere Decoder-Frage stellen, und dann möchte ich auf die Ankündigungen bei Build und insbesondere auf Superintelligenz eingehen. Als wir das letzte Mal gesprochen haben, sagten Sie, dass Ihr Rahmen für die Entscheidungsfindung angesichts der schnellen Entwicklung der KI in einem Sechs-Wochen-Zyklus abläuft. Das machte damals Sinn. Die Dinge haben sich vielleicht beruhigt. Vielleicht stehen einige Dinge mehr im Fokus. Was ist jetzt Ihr Entscheidungsrahmen? Wir arbeiten immer noch im gleichen Taktrhythmus. Am Ende jedes Zyklus treffen wir uns einwöchig persönlich. Davon bin ich fest überzeugt, auch wenn wir immer noch eine Bürokultur an vier Tagen in der Woche haben. Tatsächlich kommt in der übernächsten Woche mein gesamtes Superintelligence-Team für vier Tage persönlich in Boston zusammen. Das gilt für alle unsere Rückblicke darauf, wie Build gelaufen ist, was wir gelernt haben, was wir nicht richtig gemacht haben, was wir verbessern müssen, unsere Planung für den nächsten Zyklus, der dieses Mal acht Wochen lang laufen wird, mit einem einwöchigen Treffen danach, und das alles ist für das ganze Jahr ausgelegt. Die gesamte Organisation weiß also, dass dies der Rhythmus ist, in dem wir arbeiten. Und ich denke, es ist wirklich wichtig, diesen Zeitrahmen hervorzuheben, denn die vierteljährliche Planung wird etwas verschwommen und etwas abstrakt. Ich denke, sechs bis acht Wochen, je nachdem, wo sie im Kalender liegen, sind eigentlich der optimale Zeitpunkt, um sehr klare, bekräftigbare Missionen zu machen. Deshalb operieren wir zusätzlich zum Rhythmus dieser sechs- bis achtwöchigen Zyklen auch in Trupps. Bei den Trupps handelt es sich um gemischte interdisziplinäre Untergruppen, die sich auf eine bestimmte Mission konzentrieren und nicht unbedingt bis zum Manager reichen. Sie werden tatsächlich von einem DRI geleitet, und das DRI ist oft ein IC, und ihre Aufgabe ist – Das ist „unmittelbar verantwortliche Person“ und „einzelner Mitwirkender“. Ja, genau. Danke schön. Und ich denke, wir haben den Ansatz gewählt, die Rolle des Managers von der Rolle des DRI zu trennen, der eine bestimmte Mission ausführt. Ich denke, das liegt daran, dass es anstrengend ist, ein großartiger DRI zu sein. Sie sind im wahrsten Sinne des Wortes 24 Stunden am Tag All-In und geben sich so viel wie möglich. Als Manager geht es oft darum, ein Coach zu sein, Unterstützung anzubieten, Anleitung zu geben, Feedback zu geben, Blockaden aller Art aufzulösen und bei der Karriereentwicklung der Menschen zu helfen. Ich glaube also, dass wir die DRIs alle zwei oder drei Zyklen rotieren lassen können, wenn wir diese getrennt halten, so dass einige Leute verschiedene Positionen ausprobieren und rotieren können. Ich denke, es ist eine großartige, sehr flexible Struktur, die es uns ermöglicht, ziemlich flexibel zu sein. Lassen Sie uns über Build sprechen. Ich wollte mit Superintelligenz beginnen. Sie haben es jetzt schon mehrfach erwähnt. Ich war gerade bei Google IO. Demis Hassabis, die früher Ihre Kollegin war, als Sie bei Google waren, beendete diese Keynote mit der Aussage, dass wir uns „am Fuße der Singularität“ befänden und dass AGI mit der ganzen Leistungsfähigkeit von Google kommen würde. Sie sagen, die Superintelligenz sei da. Sind das alles die gleichen Dinge? Benutzen wir eine andere Sprache, um AGI zu beschreiben? Gibt es Unterschiede? Wie würden Sie Superintelligenz in Ihrem Kontext im Vergleich zur Singularität in Demis‘ Kontext definieren? Ich meine, offensichtlich habe ich nicht gesagt, dass es hier ist. Ich sagte, es kommt. Und ich denke, dass diese Sätze sehr fließend sind. Aber ich denke, was wir derzeit deutlich erkennen können, ist, dass es über alle Modalitäten hinweg einen logarithmisch-linearen Anstieg gibt, und das bedeutet, dass es einen sehr direkten Zusammenhang zwischen jeder Größenordnung der Berechnung, die wir anwenden, jeder inkrementellen Zunahme der Daten und dem Anstieg bei Benchmarks gibt, egal ob es sich um öffentliche Benchmarks oder interne Benchmarks handelt, es sind Ziele, auf die wir uns mit Umgebungen für bestärkendes Lernen konzentrieren. Und das ist eine sehr wichtige Beobachtung.  Diese Vorhersagen, die wir meiner Meinung nach alle machen – ich verstehe, warum manche Leute ihnen gegenüber skeptisch sind oder Fragen aufwerfen, aber sie basieren sehr auf empirischen Beobachtungen aus über einem Jahrzehnt der Leistungssteigerung dieser Modelle. Ich meine, im Wesentlichen hat die gleiche Allzweckarchitektur 12 Größenordnungen mehr Rechenaufwand erfahren, einen Billionenfachen Anstieg der FLOPS über 15 Jahre hinweg und hat grundsätzlich in Audio, Bild, Text, Code und vielen anderen Zeitreihenvorhersageaufgaben funktioniert. Daher gehen wir grundsätzlich davon aus, dass mehr Rechenleistung uns in die Lage versetzen wird, in anderen Umgebungen weiterhin auf diesem logarithmisch linearen Weg zu klettern. Und dann stellt sich die Frage: Werden wir in der Lage sein, Modelle zu trainieren, die neues Wissen erfinden können, und zwar nicht nur, indem sie aus vorhandenen Daten, die wir haben, extrapolieren, sondern uns tatsächlich Dinge beibringen, die wir nicht wissen, und neue Entdeckungen machen? Die zweite Frage ist dann: Haben sie die Fähigkeit, sich selbst zu verbessern und den Entscheidungsprozess zu beschleunigen, welche Hypothesen aufgestellt werden sollen, welche verfolgt werden sollen, wie Trainingsdaten für jede dieser Hypothesen generiert werden, wie diese in neue Läufe einbezogen werden oder sogar Innovationen an der eigentlichen Architektur selbst vorgenommen werden? Ich denke also, dass beides wahr sein muss, um diesen zunehmenden Fortschritt erkennen zu können, aber ich denke, dass wir allein durch die Anwendung der nächsten paar Größenordnungen der Rechenleistung weiterhin enorme Gewinne erzielen werden. Das erreicht wahrscheinlich bei vielen, vielen weiteren Aufgaben eine Gleichstellung mit der menschlichen Leistung, so wie wir das in den letzten sechs Monaten beim Codieren gesehen haben. Codierung ist wirklich interessant, weil sie leicht zu validieren ist, oder? Sie schreiben den Code, Sie bitten den Computer, ihn auszuführen, er wird ausgeführt oder schlägt fehl. Wir haben einige Nachteile gesehen, vor allem im Hinblick auf die Sicherheit, oder? Die Nachteile liegen auf der Hand und wir sehen, dass diese Art von Regulierungsansatz für die Codierungssicherheit viele Auswirkungen hat. Ich habe wahrscheinlich einige Sicherheitskatastrophen auf meinem eigenen Telefon und Computer mit Vibe-Code versehen, und vielleicht bin ich bereit, dieses Risiko einzugehen. Alle anderen Funktionen scheinen nicht so einfach zu sein. Ich wähle immer Jura, weil das mein Hintergrund ist. Aber ein Richter validiert juristisches Schreiben nicht auf die Art und Weise, wie ein Computer Code validiert. Wenn Sie etwas falsch machen, kann der Richter Sie ins Gefängnis schicken, oder? Das ist vielleicht der schlimmste Ausgabevalidierungsfehler, der Ihnen passieren kann. Wie lässt sich die Effektivität über Domänen hinweg so einfach messen, wie man die Effektivität beim Codieren messen kann? Denn hier scheint mir die Metapher bzw. die Analogie vom Codieren zu anderen Bereichen sehr schnell auseinanderzufallen. Ich bin mir nicht so sicher. Beim Codieren können Sie natürlich die korrekte Ausführung des Codes überprüfen. Es läuft oder es stürzt ab. Aber darin steckt eine Menge Nuancen. Die Qualität des geschriebenen Codes ist wirklich wichtig: seine Erweiterbarkeit, wie rekonfigurierbar er ist, wie nützlich er in der Praxis ist. Es geht nicht nur darum, dass ein Code ausgeführt wird, sondern auch darum, wie ein Modell ihn tatsächlich als DevOps oder SRE in der Produktion verwendet, um zu dem geschriebenen Code zurückzukehren und ihn dann auf praktische und nützliche Weise zu verwenden. Und dann muss man natürlich auch die Qualität des produzierten Outputs bewerten. Es mag zwar qualitativ hochwertiger, funktionierender Code sein, aber ist es tatsächlich die App oder die Website, die Sie wollten? Und darin liegen ästhetische Urteile; Darin liegen kommerzielle Urteile. Die Herausforderung, nicht überprüfbare Belohnungen zu verinnerlichen, besteht im Code, auch wenn Code immer noch in erster Linie ein überprüfbares Belohnungssignal ist. Ich denke, die andere Sache, die es zu beobachten gilt, ist, dass Chat auch ein nicht überprüfbarer Raum ist, und dennoch ist es uns gelungen, die Leistung durch die Interaktion mit der realen Nutzung, die eine sehr starke Leistung bietet, auf ein im Grunde menschliches Niveau zu bringen. Warte. Ich bin sehr neugierig. Wie messen Sie die Chat-Leistung auf menschlicher Ebene? Nun, ich denke, viele Menschen führen lange, bedeutungsvolle Gespräche mit KIs auf menschlicher Ebene. Die Qualität ist außergewöhnlich gut. Es verfügt über eine sehr gute emotionale Intelligenz. Es ist im Großen und Ganzen sehr genau. Wir haben die Halluzinationen minimiert. Wir reden nicht mehr so ​​viel über Voreingenommenheit. Es basiert auf Beobachtungen aus der realen Welt. Ich denke, nach den Maßstäben der meisten Menschen haben wir mittlerweile für eine ganze Reihe von Aufgaben eine Gesprächsleistung auf menschlichem Niveau erreicht. Was sind Ihre Maßnahmen, und tatsächlich, sicher, die Maßnahmen der meisten Menschen? Mit fast allem würde ich nicht einverstanden sein, aber das sind meine Maßstäbe. Was sind Ihre Maßnahmen? Mein Maßstab ist, wenn ich mich an meinen Assistenten wende und ihn bitte, mir täglich ein Briefing zu geben, in dem alle Gespräche, die in Teams und per E-Mail stattgefunden haben, sowie die Aktualisierungen von Dokumenten zusammengefasst werden, und ich erhalte im Grunde eine zusammengefasste Zusammenfassung mit einer Reihe von Maßnahmen, die ich als Nächstes ergreifen sollte. Das ist im Grunde besser als das, was mein Stabschef hervorbringen kann. Ich würde sagen, das ist Leistung auf menschlicher Ebene in der Synthese, Analyse, vorgeschlagenen Aktionen und im Chat.  Es gibt jeden Tag viele, viele Millionen Menschen, die es zur emotionalen Unterstützung, zur Beratung, zur Therapie, zum Coaching und zur Beratung nutzen. Ich denke, es ist einer der beliebtesten Anwendungsfälle innerhalb aller Chatbots. Ich würde sagen, das ist eine ziemlich starke Maßnahme, um die Behauptung aufzustellen. Ich weiß, dass Sie viel Zeit damit verbracht haben, darüber nachzudenken, insbesondere über die emotionale Verbindung zu einigen dieser Chatbots. Dabei handelt es sich um Produkte, die Sie erstellt und bereitgestellt haben. Ich würde einen ziemlich großen Unterschied machen zwischen diesem Ding, das wirklich sehr, sehr gut darin ist, meine E-Mails und Aufgabenlisten zusammenzufassen und mir einen kurzen Überblick darüber zu geben, welche Dinge ich priorisieren sollte, und diesem Ding, das ein emotionaler Coach für jemanden ist, der sich in einer Krise befindet.  Das sind keine ähnlichen Aufgaben. Dabei handelt es sich nicht unbedingt um ähnliche Arten von Intelligenz, auch nicht bei Menschen. Ich kenne einige Leute, die sehr gut darin sind, Listen zu erstellen, aber sehr schlecht darin, emotionale Unterstützung zu leisten. Wie bringen Sie das alles in Ihrem Gehirn zusammen und sagen: „Okay, das ist im Großen und Ganzen eine Leistung auf menschlichem Niveau im Chat?“ Ich denke, wenn Sie Chat als einen interaktiven Austausch zwischen zwei Parteien definieren, von denen eine in diesem Fall eine KI ist, die im Großen und Ganzen ein bestimmtes Ziel erfüllt, möchten Sie den Sportstand erfahren, Ratschläge dazu erhalten, in welches Restaurant Sie gehen sollten, Coaching und Feedback zu einem Aufsatz, den Sie geschrieben haben, Vorschläge, welchen Job Sie als Nächstes annehmen sollten, oder ein schwieriges Gespräch, das Sie gleich mit Ihrem Manager führen werden. Man bekommt eine Antwort, man geht hin und her, man tauscht sich fünf oder sechs Mal aus und stellt fest, dass das eine nützliche Ausgabe ist, bei der man sich sonst vielleicht auf einen Experten oder Freund verlassen oder sogar einen Coach bezahlen müsste. Es gibt, rein objektiv und empirisch gesehen, Hunderte Millionen Menschen, die diese Erfahrung jeden Tag mit diesen Chatbots machen. Vielleicht könnten wir darüber streiten, ob das technisch gesehen eine Leistung auf menschlicher Ebene darstellt. Ich denke, es ist eine ziemlich vernünftige Behauptung. Es gibt keinen Grund, warum das nicht weiter steigen wird, oder? Die Steigerungsrate in den letzten drei Jahren ist meiner Meinung nach das Erstaunlichste. Von diesem Punkt aus versuchen wir also, Folgendes zu extrapolieren: Okay, was sind die grundlegenden Treiber dieses Anstiegs – Rechenleistung, Daten, Interaktion von Benutzern aus der realen Welt – und diese Dinge werden sich voraussichtlich fortsetzen. Ich denke, dass sie auch für viele andere Bereiche gelten, nicht nur für Chat, emotionale Unterstützung und Produktivität und so etwas, sondern auch für viele andere Bereiche darüber hinaus: Gesundheitswesen, Live-Produktionseinsätze im Bildungswesen, Assistenten, die zunehmend Ihr Zuhause verwalten, einfach alles, was in Ihrem Alltag anfällt, im Grunde genommen, um Sie produktiver zu machen. Das ist meiner Meinung nach eine Entwicklung, die sich wahrscheinlich fortsetzen wird. Sie haben jetzt erwähnt, dass es immer noch die gleiche grundlegende Architektur, dieselben Transformatoren und dieselbe Aufmerksamkeit ist. Wir nutzen dafür seit 15 Jahren Rechenleistung und verzeichnen enorme Zuwächse. Sie befinden sich an einem ziemlich einzigartigen Ort. Auf der Build haben Sie Ihr erstes Flaggschiff-Argumentationsmodell angekündigt, MAI-Thinking-1. Du musst bei Null anfangen. Gibt es irgendetwas, das Sie jetzt, nach 15 Jahren der Entwicklung und Schulung dieses Modells, anders gemacht haben, oder ist es einfach so, dass wir alle Daten sammeln und das Training genauso durchführen werden, wie wir es getan haben, und wir jetzt mehr Rechenleistung haben, also wird es besser sein? Nein, eigentlich glaube ich, dass es ziemlich viele Unterschiede gibt. Das erste, was ich sagen muss, ist die Art und Weise, wie Sie die Daten kuratieren … Wir beginnen ganz oben im Stapel; Wir haben im Grunde für einen extrem hochwertigen, sehr konservativen Datensatz bezahlt und ihn erworben und viele der verrauschten, ablenkenden, minderwertigen und potenziell sicherheitsrelevanten Probleme im Zusammenhang mit diesen Daten extrahiert. Und die Methoden, die Sie dafür anwenden, sind meiner Meinung nach eigentlich ziemlich proprietär. Wir haben gerade einen 109-seitigen, sehr detaillierten technischen Bericht veröffentlicht, der auf Twitter sehr gut aufgenommen wurde und viele Details darüber enthält, wie wir dies tun. Ich denke, der zweite Punkt ist, dass es meiner Meinung nach zwar wichtig ist, bei architektonischen Entscheidungen sehr vorsichtig zu sein, und das haben wir auch getan, dass wir meiner Meinung nach aber auch eine Reihe ziemlich bedeutender Veränderungen bei der Zusammenstellung unserer Trainingsläufe vorgenommen haben. Unsere Trainingsläufe verliefen unglaublich stabil, mit sehr wenigen Stürzen und sehr wenigen Neustarts. Wir haben viele dieser Diagramme geteilt, um die Infrastrukturstabilität und auch die MFU-Effizienz zu zeigen, also die FLOPS-Auslastung zu modellieren, was im Grunde zeigt, dass wir für jeden Schritt unseres Trainingslaufs eine hochmoderne Anzahl von FLOPS durch jeden Chip schicken können. Ich denke, dass hier sehr leicht etwas falsch gemacht werden kann, und wir alle hören aus verschiedenen Labors viele Geschichten darüber, wie etwas schiefgehen kann. Es ist tatsächlich ziemlich schwierig, sehr sorgfältige und bewusste Entscheidungen zu treffen, um die Dinge richtig zu machen, und den richtigen Ansatz zu verfolgen, um sicherzustellen, dass wir qualitativ hochwertige Modelle produzieren, denn unser Job und unser Ziel ist es, diese Bergsteigermaschine zu bauen. Das bedeutet die Integration des Siliziums mit den Modellen, mit den superhochwertigen Daten, mit einem Stapel von RLEs, verstärkenden Lernumgebungen, die es uns grundsätzlich ermöglichen, systematisch gegen jedes Ziel vorzugehen, das wir wählen. Und genau das ist MAI-Thinking-1. Es ist ein universelles, ziemlich neutrales Denkmodell, das ziemlich gut im Codieren ist. Zumindest bei den Benchmarks liegt es mittlerweile ungefähr auf dem Niveau von Opus 4.6. Wir haben es noch nicht im großen Maßstab in der Produktion eingesetzt, daher gibt es dort noch viel zu tun. Aber es ist ein extrem starker Denker und erreichte 97 Prozent bei AIME, dem primären Maßstab für seine Denkleistung, zumindest bei den Benchmarks. Es ist sehr gut darin, Anweisungen zu befolgen, und dann besteht das Ziel im Grunde darin, es vielen, vielen Entwicklern und Unternehmen zur Verfügung zu stellen und ihnen zu ermöglichen, für ihre Anwendungsfälle darauf zuzugreifen. Jeder hat in seinem Unternehmen ein etwas anderes Ziel, um Agenten usw. zu entwickeln, die seinen Anwendungsfall unterstützen. Eines der Dinge, die Ihnen beim Gespräch über MAI-Thinking-1 aufgefallen sind, ist, dass Sie keine bestehenden Modelle destilliert haben, was mich tatsächlich überrascht hat, oder? Das ist eine Sache, die Sie tun könnten. Sie haben Zugriff auf die IP von OpenAI. Jeder destilliert alles. Wir haben in diesem Versuch gerade herausgefunden, dass Grok aus einer Reihe von Modellen destilliert wurde. Warum hier nicht destillieren? Warum nicht weitermachen? Es gibt auf jeden Fall viele Abkürzungen zur Grenze, und wenn Sie ein Modell von höchster Qualität nehmen und Ihr Basismodell mit hochwertigen Anweisungen, Antworten oder Ausgaben eines überlegenen Modells aufpolieren, dann ist es wahr, dass das Modell möglicherweise schnell in diese Verteilung passt. Es ist jedoch sehr unklar, ob sie diesen Lehrer dann übertreffen könnten. Wir sind also aus zwei Gründen sehr bewusst vorgegangen. Das erste ist, dass wir sicherstellen wollen, dass wir den Lehrer übertreffen können, um in den nächsten Jahren selbst die Grenzen zu setzen. Und zweitens wollen wir wirklich eines der großartigen Labore bauen, und dafür werden wir noch viele Jahre brauchen, wahrscheinlich die nächsten zwei oder drei Jahre.  Dazu müssen wir jedoch nachweisen können, dass wir tatsächlich jede Komponente selbst bauen können. Wir können die besten Talente der Welt einstellen. Wir können mit tatsächlicher Forschung neue Maßstäbe setzen, anstatt nur Neuimplementierungen, Kopien oder Destillationen von anderen Dritten vorzunehmen.  Wir sind in einer großartigen Position, in der wir dieses Ziel wirklich sorgfältig und akribisch verfolgen können, in dem Wissen, dass wir über die Ressourcen verfügen, Anthropic-Modelle dort zu kaufen, wo sie über die Grenzen hinausgehen. Wir verfügen über die Ressourcen, um 11.000 verschiedene Modelle in Foundry zu integrieren, sodass jeder unserer Entwickler reine Optionalität erhält. Und natürlich verfügen wir über die Ressourcen, um weiterhin OpenAI-Modelle einzusetzen, die offensichtlich herausragend sind und heute an der Spitze stehen.  Das ist einfach ein natürlicher Teil der Selbstversorgungsmission, und es wird einige Zeit dauern, bis wir dabei wirklich an die absoluten Grenzen gelangen. Aber ich denke, wir sind in einer großartigen Lage. Wir haben große Fortschritte gemacht. Dies ist ein sehr, sehr starkes Modell, und wir haben nicht nur dieses Modell herausgebracht. Wir haben gleichzeitig sieben neue Modelle herausgebracht. Unser transkribiertes Modell, zum Beispiel MAI-Transcribe-1.5, ist buchstäblich die Nummer eins auf der Welt. Es ist der kostengünstigste aller Hyperscaler. Es bietet höchste Genauigkeit. Unser Imagemodell ist jetzt Nummer zwei. Unser Bildbearbeitungsmodell ist die Nummer drei direkt hinter dem von Google und OpenAI. Ich denke, wir sind mit unserem Bild und Ton gut da oben. Unser Codemodell CodeFlash ist unglaublich leistungsstark und für VS-Code optimiert. und ist ein wirklich, wirklich tolles Modell, das Sonnet 4.6 ebenbürtig ist. Im Moment ist es also wirklich an einem großartigen Ort. Gab es rechtliche oder geistige Bedenken hinsichtlich der Destillation? Ich weiß, dass dies ein aktuelles Thema in der Welt ist: Anthropic beschwert sich darüber, dass andere Leute ihre Modelle destillieren. Es gibt Bedenken, dass chinesische Unternehmen Modelle destillieren und ob unsere bestehenden IP-Vereinbarungen dies abdecken können. Hatten Sie irgendwelche dieser Bedenken, die Sie davon abgehalten haben? Oh, das haben wir nicht, aber ich denke, ich verstehe, warum viele Leute frustriert sind. Anthropic war sehr frustriert und einige der Gerüchte rund um xAI und Meta und natürlich die Open-Source-Modelle usw., denn im Wesentlichen geht es darum, das geistige Eigentum und das Wissen, das ein anderes Team zusammengestellt hat, zu nehmen und es dann buchstäblich zwangsweise in Ihr eigenes Modell einzuspeisen. Ich denke, das ist so etwas wie ein kurzfristiger Erfolg, und wie gesagt, wir wollen im Labor wirklich eine Kultur schaffen, in der wir den nächsten großen Denkdurchbruch, den nächsten großen Codierungsdurchbruch oder den nächsten großen architektonischen Vorstoß erzielen können. Im Moment experimentieren wir mit dem Schleifentransformator, einer etwas anderen Variante des Stromwandlers. Viele Leute in der Branche schauen sich das auch an. Noch scheint niemand ganz mit der Produktion begonnen zu haben. Aber um eine Kultur und ein Team zu schaffen, die wirklich neue Maßstäbe setzen können, müssen sie den gesamten Stack verstehen, besitzen und nach Bedarf erstellen und bei Bedarf auch Dinge von Dritten nutzen. Und so wie unser Aufsatz zum Beispiel Hunderte von Zitaten hat, die auf der übrigen Literatur basieren, ist er im Grunde genommen ein Beitrag zurück zum Fachgebiet als Gegenleistung für alles, was wir im Laufe der Jahre aus all den großartigen Veröffentlichungen gelernt haben, die es gibt. Darf ich Sie fragen: Wenn Sie die Frustration von Anthropic und Ihren KI-Kollegen über die Destillation verstehen, verstehen Sie dann auch die Frustration von Kreativen, Verlegern und YouTubern über all die KI-Unternehmen, die ihre Arbeit als Kollektiv zur Erstellung dieser Modelle verschrotten? Denn dieser Frust wird immer lauter. Ja. Nein, ich verstehe die Frustration. Über die Open-Web-Herausforderung haben wir schon einmal gesprochen, und ich verstehe, und ich sehe, dass die Leute frustriert sind, und offensichtlich setzt sich das in der Diskussion vor Gericht durch. Und ich sehe, dass die Leute Dinge online stellen und unterschiedliche Erwartungen an den Vertrag hatten, der mit der Online-Veröffentlichung einhergeht, und das ist eine knifflige Frage. Sie haben erwähnt, dass alle Ihre Daten sorgfältig kuratiert wurden. Haben Sie für alle Daten bezahlt, die Sie zum Trainieren der neuen Modelle verwenden? Viele unserer Daten beziehen wir natürlich auf normale Weise aus dem offenen Internet. Sorgfältig kuratiert bedeutet, dass es äußerst sorgfältig auf Sicherheit, Qualität und Abhängigkeiten von einigen Open-Source-Datensätzen von Drittanbietern gefiltert wird und von vielen chinesischen Abstammungslinien ferngehalten wird, die meiner Meinung nach sehr unterschiedlich sind. Unsere Unternehmen möchten sicherstellen, dass sie bei der Produktion eines Produkts darauf vertrauen können, dass wir es wirklich unter Berücksichtigung ihrer Bedürfnisse entwickelt haben. Und ich denke, das ist einer der Vorteile, wenn man sehr, sehr überlegt und geduldig ist und auf alle Details achtet. Sie haben das Unternehmen erwähnt. Ich denke, das ist sehr interessant. Microsoft setzt voll und ganz auf Unternehmens-KI, und zwar im Großen und Ganzen. Ich würde die Grenze sogar direkt zu Asha Sharma ziehen, der neuen Chefin von Xbox, die an vielen Stellen die KI abschafft, und die Spieler sind zufrieden, oder? Im Verbraucherbereich gibt es eine Reaktion auf KI, im Unternehmensbereich jedoch eine andere. Ich denke, dass KI so gut wie möglich an den Produktmarkt in Unternehmen passt, wenn sich etwas so schnell verändert wie KI. Es gibt eine Reihe von Datenbanken, die von Unternehmen kontrolliert werden, und Sie können einfach darauf zugreifen, weil sie sie kontrollieren. Das sind ihre Daten. Es gibt eine Menge wiederholbarer Prozesse und Aufgaben sowie alte Systeme, die die Modelle vielleicht einfach effizienter erledigen können. Es passiert etwas sehr Wichtiges im Unternehmen. Gleichzeitig nimmt die Abneigung der Verbraucher gegenüber KI immer weiter zu. Und mein Argument ist, dass wir keine großartigen KI-Produkte für Verbraucher entwickelt haben. Diese Industrie hat sie nicht produziert. Es hat sie nicht verändert. Es ist nicht klar geworden, dass sich das alles lohnt, dass die Nutzung aller Daten aus dem offenen Web und die Änderung des Veröffentlichungsvertrags auf ein Massenpublikum von Menschen zugeschnitten sind. Jetzt wird es für Trainingsmodelle verwendet, die den Unternehmen einen Wert in Billionenhöhe bringen werden. Es gibt kein Produkt, das behauptet, dass sich das lohnt.  Auch hier gab Satya Nadella kürzlich ein Interview mit Axios und sagte: „Dafür brauchen wir eine soziale Erlaubnis. Und bis wir sie haben, bis wir diesen Wert liefern, werden die Menschen so denken.“ Wir haben gesehen, wie Hochschulredner ausgebuht wurden. Wir haben erlebt, dass Rechenzentren verboten wurden. Glauben Sie, dass es ein Verbraucherprodukt gibt, das seinen Preis wert ist, das die Angst vor der Schulung wert ist, das die Angst vor Rechenzentren wert ist?  Das war Ihr Fokus; Jetzt liegt Ihr Fokus auf dem Unternehmertum. Ich würde sagen, dass Microsoft auf den ersten Blick kein Interesse mehr an dem Verbraucherprodukt hat. Aber sehen Sie eines, das sich lohnt oder das gebaut werden könnte? Ich bin mir nicht sicher, ob ich Ihrer Meinung zustimme, dass daraus für den Verbraucher kein Nutzen entstanden ist. Über alle Chatbots hinweg ziehen jeden Monat Milliarden von Menschen einen enormen Nutzen daraus. Jetzt können Sie sich für einen Moment ein wenig in die Kleinunternehmerin hineinversetzen oder in die Art von Mutter, die ihrem Kind bei den Hausaufgaben hilft und sich jetzt einfach an eine Konversations-KI wenden und Feedback einholen, Anweisungen erhalten und Aufsatzfragen stellen kann. Ich kann einfach Fragen stellen wie: „Wie erwirtschafte ich Einnahmen?“ Wie erstelle ich eine Cashflow-Prognose? An welcher Hochschule soll ich mich bewerben? Ich meine, das sind alltägliche Aufgaben, die mit ziemlich hochwertigen sachlichen Ratschlägen und Informationen einhergehen. Daher glaube ich nicht wirklich, dass die Leute keinen Nutzen aus diesen Dingen ziehen. Ich denke, das sind sie. Ich denke, ich kann ganz klar argumentieren, dass sie nicht genug Nutzen daraus ziehen, oder? Okay. Sie sagen, dass wir nicht mehr Rechenzentren haben sollten. Sie sind diejenigen, die KI bei den Abschlussreden ausbuhen. Die Umfrage ist eindeutig, insbesondere bei jungen Menschen: Je mehr sie KI nutzen, desto größer ist ihre Abneigung dagegen. Das wird in jeder einzelnen Umfrage deutlich. Das ist das Argument, das ich vorbringe – nicht, dass es keinen Wert gäbe, aber der Werteaustausch ist nicht klar genug. Ja. Fair genug. Ich beobachte, dass insbesondere Microsoft sich dem Unternehmen zuwendet, weg vom großen Suchprodukt, der Neuerfindung von Bing, die Google zum Tanzen bringen würde. Das ist vorbei und wir konzentrieren uns alle auf das Unternehmen, wo der Wert liegt. Ich frage mich nur, ob es für den Verbraucher genug Wert gibt, dass sich das alles lohnt. Ich denke, es gibt verständlicherweise große Ängste. Es gibt eine Menge Spekulationen darüber, was in den nächsten fünf bis zehn Jahren passieren wird. Ob es als Singularität oder als Job-Apokalypse dargestellt wird, das sind keine hilfreichen Formulierungen. Ich denke, dass die Menschen Angst haben, weil es schlecht definiert ist und oft als unvermeidliche, bedrohliche graue Wolke über den Köpfen der Menschen dargestellt wird. Ich denke, dass es darauf ankommt, was wir mit der Technologie machen. Ich glaube, ich vertrete schon lange die Auffassung, dass der Mensch an erster Stelle stehen muss. Einige Leute auf diesem Gebiet haben wissenschaftliche Entdeckungen an die erste Stelle gesetzt oder beschleunigende Intelligenzen, die die Galaxien usw. erforschen können, und sagten, dass es unvermeidlich ist, dass wir diese KIs haben werden, die mächtiger sein werden als wir alle zusammen. Ich meine, das ist für die Menschen von Natur aus beängstigend. Und ich denke, wir müssen es im Grunde umdrehen und sagen, dass der Zweck von Wissenschaft und Technologie darin besteht, uns alle gesünder, intelligenter und glücklicher zu machen. Das ist die Suche, auf der wir als Spezies seit Tausenden von Jahren der Erfindung sind, und es ist die Prüfung, der wir die Superintelligenz erneut unterziehen sollten. Und wenn es diesen Test nicht besteht, dann denke ich, dass die Leute es ablehnen werden, und sie haben Recht, wenn sie es ablehnen. Ich denke, dass sich in den nächsten fünf Jahren jeder darauf konzentrieren wird, wie ich dadurch gesünder und glücklicher, intelligenter, leistungsfähiger und produktiver werde. Und wenn das nicht der Fall ist, werden die Menschen natürlich wütend sein, Widerstand leisten und reagieren. Ich glaube nicht, dass daran etwas Unerwartetes oder Falsches ist – ich denke, das ist unvermeidlich. Deshalb ist das Gesundheitswesen seit vielen, vielen Jahren eines meiner Leidenschaften. Und erst vor ein paar Tagen haben wir eine neue Partnerschaft mit der Mayo Clinic bekannt gegeben. Es wird immer wieder berichtet, dass dies das Krankenhaus Nr. 1 der Welt ist. Sie verfügen über den qualitativ hochwertigsten longitudinalen Patientendatensatz für alle Modalitäten. Sie verfügen über die beste klinische Praxis. Sie sind außerdem eine gemeinnützige Organisation, was vielen Menschen meiner Meinung nach nicht bewusst ist, da 65 Prozent ihrer Patienten Medicaid erhalten. Man bringt sie oft mit den internationalen Supereliten in Verbindung, die einfliegen, um die beste Pflege der Welt zu bekommen, aber tatsächlich haben sie die Mehrheit an Medicaid. Sie sind eine großartige Institution mit der unglaublichen Mission, überall die beste Gesundheitsversorgung zu bieten. Und wir haben jetzt eine sehr langfristige Partnerschaft, um mit ihren Daten und unseren Modellen, einem brandneuen Grundmodell für Gesundheit, von Grund auf gemeinsam zu trainieren, es in ihren Krankenhäusern einzusetzen und es hoffentlich um die ganze Welt zu bringen, um so vielen Menschen wie möglich die bestmögliche klinische Versorgung und Gesundheitsversorgung zu bieten. Deshalb bin ich ins Feld gegangen. Das hat mich ursprünglich motiviert und es ist meine Leidenschaft. Und ich kann mich nur auf die Dinge konzentrieren, von denen ich denke, dass sie einen Unterschied machen werden und die den Menschen helfen und ein gutes Erbe für alle hinterlassen, und das ist es, was wir versuchen. Das weiß ich zu schätzen. Ich schätze den Gesundheitsrahmen und verstehe, warum das jedermanns Sache ist, oder? Insbesondere das Gesundheitswesen in Amerika, wenn man es sogar um 10 Prozent verbessern könnte, hätte das Leben vieler Menschen besonders tiefgreifend beeinflusst. Die Sache ist die: Ich kenne einen sehr klugen Kerl, der das alles ganz anders und weitaus aggressiver angeht als Sie. Diese Person sind Sie, vor vier Monaten. Dies sagte Mustafa Suleyman vor vier Monaten zur Financial Times: „Wenn man als Anwalt, Buchhalter, Projektmanager oder Marketingfachmann an einem Computer sitzt, werden die meisten dieser Aufgaben innerhalb der nächsten 12 bis 18 Monate von einer KI vollständig automatisiert.“ Das ist vier Monate her. Das bedeutet, dass Anwälte, Buchhalter, Projektmanager und Marketingleute in einem Jahr keine Jobs mehr haben werden. Ihre Aufgaben werden automatisiert. Ist das immer noch Ihr Zeitplan? Nein, nein, nein. Warte einen Moment. Deshalb habe ich in dem Zitat, das Sie gerade gesagt haben, „Aufgaben“ gesagt. Ich sagte Aufgaben. Das heißt also nicht, dass es Arbeitsplätze gibt. Das ist ein sehr wichtiger Unterschied. In der Arbeitsökonomie gibt es eine vollständige Taxonomie von Unterkomponenten einer Rolle oder Funktion in einer Organisation. Eine E-Mail senden, ein Gespräch mit einem Kollegen führen, eine PowerPoint-Präsentation zusammenstellen – Teilaufgaben werden zunehmend digitalisiert, automatisiert und wir können grundsätzlich immer mehr davon generieren. Das bedeutet nicht zwangsläufig, dass die Rolle überhaupt verschwindet. Es bedeutet lediglich, dass die Arbeit schneller und effizienter erledigt werden kann. Heutzutage handelt es sich dabei oft um Routinearbeiten, die sehr manuell, recht arbeitsintensiv und zeitaufwändig sind. Und so besteht der natürliche Fortschritt der Technologie darin, Ihr Leben einfacher, schneller und reibungsloser zu gestalten. Wie jeder sich oft beschwert, hat das Sie, mich und alle anderen viel beschäftigter gemacht. Dadurch sind wir tatsächlich verfügbarer, gestresster und haben mehr Informationen erhalten. Es gibt also immer diese Racheeffekte der Effizienz, die die Leute meiner Meinung nach vergessen. Es ist sehr wahrscheinlich, dass wir viel, viel produktiver werden, weil wir weniger Zeit mit den engstirnigen, untergeordneten Verwaltungsaufgaben verbringen und mehr Zeit mit kreativen, urteilsorientierten Dingen verbringen müssen, die letztendlich viel mehr Wert schaffen. Wir können auch viel schneller experimentieren. So können wir viele Dinge parallel ausprobieren, da die Ausführungskosten geringer werden. Meiner Meinung nach wird das wahrscheinlich die Gesamtqualität der Dinge verbessern, weil wir mehr Hypothesen ausprobieren werden, sei es im Journalismus, in der Wirtschaft oder in allem, was wir tun. Ich denke, das ist aufgrund eines natürlichen Missverständnisses zwischen Jobs und Aufgaben etwas aus dem Zusammenhang gerissen, aber Sie könnten mich trotzdem zurückweisen und sagen: „Okay, wie sieht dann die Landschaft in fünf, zehn oder 15 Jahren aus?“ Und da müssen wir meiner Meinung nach zurückkehren – Eigentlich werde ich Sie nicht auf diese Weise zurückdrängen. Ich werde auf ganz konkrete Weise zurückschlagen. Und mir ist klar, dass dies Ihr Zitat ist und Sie sagen, es sei falsch interpretiert worden. Ich schaue mir nur diesen wörtlichen Satz an und es gibt keinen Unterschied zwischen Aufgaben und Unteraufgaben. Es handelt sich um „Angestellte Arbeit“. ” Die Beispiele sind Anwalt, Buchhalter, Projektmanager, Marketingmitarbeiter, und dann sagten Sie: „Die meisten dieser Aufgaben werden innerhalb der nächsten 12 bis 18 Monate durch eine KI vollständig automatisiert.“ Es gibt dort keine Unterscheidung von Teilaufgaben. Sie sagen, dass die Arbeit der meisten Anwälte vollständig automatisiert sein wird und die Rechtspraxis innerhalb eines Jahres völlig anders aussehen wird, selbst wenn man die Worte dieses Zitats betrachtet. Und ich möchte nur sagen, sind Sie immer noch auf der Zeitachse, dass die Arbeit als Anwalt völlig anders aussehen wird, weil Agenten herumlaufen und alles tun werden, was wir vorher getan haben? Nun ja, bei den meisten Aufgaben handelt es sich um Arbeit, die Sie leisten, um Ihre Arbeit insgesamt zu erledigen, und die Ihnen meiner Meinung nach die Freiheit gibt, die menschlicheren und entscheidungsfreudigeren Teile Ihrer Arbeit zu erledigen. Es gibt einen sehr wichtigen Unterschied in … Jobs und Rollen sind die umfassendere Kategorie, und Aufgaben sind die Bestandteile davon. Und es ist seit vielen, vielen Jahrzehnten eine etablierte Definition in der Literatur und in der Arbeitsmarktökonomie. Es war vielleicht selbst für die Financial Times zu nuanciert, aber das war trotzdem die Absicht. Nun stellt sich meiner Meinung nach eine wichtige Frage: Wohin führt uns das auf längere Sicht? Und es wird eine Herausforderung sein, immer mehr dieser Dinge ... Wir können über den Zeitrahmen streiten, ob es ein paar Jahre oder ein Jahrzehnt oder ob es 20 Jahre sind, aber die Realität ist, dass wir immer mehr dieser Arbeit, Aufgaben, Jobs, Rollen, Aktivitäten und alles, was wir tun, automatisieren werden. Was also noch wichtiger sein wird, ist die Governance, die wir für diese Technologien einsetzen. Wem gegenüber sind sie rechenschaftspflichtig? Wem gehören sie? Welche Rückkopplungsschleifen regulieren und führen zu Reibungen, um sicherzustellen, dass sie den Menschen tatsächlich dienen? Ich meine, ich habe vor vier oder fünf Monaten einen Aufsatz über humanistische Superintelligenz geschrieben, in dem ich ganz direkt dargelegt habe, was ich im Grunde für einen Polarstern halte, vielleicht nicht ganz für einen Rahmen, aber für eine Reihe von Prinzipien, die im Grunde sagen, dass die Technologie hier ist, um uns zu dienen. Das ist der Test, dem wir es unterziehen sollten. Es ist der Test, dem die Leute es unterzogen haben. Es ist der Test, der uns bei Microsoft am Herzen liegt. Ich denke, dass sich immer mehr wirklich alle auf diese Frage konzentrieren müssen, denn sie wird enorm viel Gutes bewirken, und wir wollen, dass das auch weiterhin so bleibt, aber wir wollen, dass es dies auf eine Art und Weise tut, die während der Übergangszeit keine lächerlichen Ausmaße an Instabilität verursacht. Ich glaube dir. Ich weiß, dass Sie schon lange darüber nachgedacht haben, aber ich werde so reagieren, dass ich weiß, dass mein Publikum möchte, dass ich reagiere, weil ich es ständig von ihnen höre. Und es sieht so aus, als ob diese ganze Branche – Sie alle eingeschlossen – auf das Motto „Wir werden alle Arbeitsplätze ersetzen“ gesetzt hat und den Aufbau von Rechenzentren mit enormer Kapazität wirklich beschleunigt und trotz großer Versprechen viele Ressourcen gefordert hat. Es gab politischen Widerstand, und nun haben sich alle Standpunkte abgeschwächt. Und Sie sagen, es gehe nicht darum, dass alle Arbeitsplätze verschwinden würden, wir müssten die Arbeitsplätze neu überdenken. Das stimmt mit all den anderen CEOs in dieser Branche überein, die ähnliche Dinge sagen und über das Gesundheitswesen sprechen, das jetzt jedes Mal zur Sprache kommt. Ich frage mich, ob dieser politische Widerstand tatsächlich Ihre Art, darüber zu sprechen, verändert hat. Viele Ihrer Kollegen sind der Meinung, dass KI einfach ein Marketingproblem hat, dass sie nicht effektiv genug kommuniziert wurde und dass sie Hunderte Millionen Dollar für Podcasts ausgeben sollten, um die Vorteile von KI effektiver zu kommunizieren. Das ist eine echte Sache, die in dieser Branche passiert. Glauben Sie, dass KI einfach ein Marketingproblem hat und dass der politische Widerstand Ihnen die Augen für dieses Marketingproblem geöffnet hat, oder glauben Sie, dass da noch etwas anderes im Gange ist? Da gibt es eine Reihe von Fragen. Die erste Frage ist: Was denke und glaube ich eigentlich und hat sich das in den letzten sechs Monaten verändert? Die Antwort ist nein. Ich habe vor drei Jahren, weit im Voraus, ein sehr detailliertes Buch darüber geschrieben, in dem ich vor vielen Dingen gewarnt habe, die derzeit passieren, und dies ausdrücklich getan habe, um enorme Risiken für die Überwachung, die Machtkonzentration, die Konzentration des Reichtums, die Desintermediation des Staates und die Bedrohung der Demokratie aufzuzeigen. Und in gewisser Weise auch Bedrohungen für die Natur des Menschen und was es bedeutet, eine Person zu sein, im Zusammenhang mit der Ankunft dieser sehr neuen Formen des Siliziumwesens. Ich habe daran gearbeitet … Und die Idee, dass mein Gesundheitsinteresse nur eine Eintagsfliege ist, die eine Funktion der Reaktionen auf Rechenzentren usw. ist, ich meine, ich arbeite seit über einem Jahrzehnt im Gesundheitswesen. Ich habe viele, viele Male einige der bahnbrechenden Durchbrüche, Beiträge auf diesem Gebiet in der Radiologie, Mammographie und Pathologie, vielen anderen Bereichen und elektronischen Gesundheitsakten vorangetrieben. Deshalb habe ich immer geglaubt, dass der Zweck der Technologie einfach darin besteht, uns gesünder und glücklicher zu machen. Und das sind die Dinge, an denen ich arbeite und denen ich meine Zeit widme. Hat die Branche ein Reputations- und PR-Problem? Ich meine, ich denke, es ist ziemlich klar, dass die Leute sehr ängstlich und sehr frustriert sind, und diesem Thema wird in den nächsten Jahren verständlicherweise viel Aufmerksamkeit gewidmet werden. Ich denke, was wir tun können, ist, Verantwortung für die Dinge zu übernehmen, die wir bauen, die Art und Weise, wie wir sie bauen, die Entscheidungen, die wir treffen, um Arten von Technologie auf die Welt zu bringen, und die Arten von Problemen, an denen wir arbeiten möchten, wie wir es mit der Mayo Clinic tun. Ich möchte übrigens sagen und darauf hinweisen, dass Sie und ich mich meiner Meinung nach zum ersten Mal trafen und unterhielten, bevor Sie zu Microsoft kamen. Es war direkt nach Erscheinen des Buches und wir haben gemeinsam ein Panel gemacht. Einer der Gründe, warum ich das gerne frage, ist, dass ich weiß, dass Sie schon lange darüber nachgedacht haben und dass ich das Buch kenne. Ich denke, für mich stellt sich die Frage, ob die Branche als Ganzes den Gesamtwert falsch eingeschätzt hat, den sie bieten könnte, um die scheinbare Rücksichtslosigkeit zu überwinden, auf die die Menschen jetzt reagieren, die Nachfrage nach Ressourcen, auf die die Menschen jetzt reagieren.  Sie bauen neue Modelle. Innerhalb von Microsoft gibt es wahrscheinlich einen Kompromiss zwischen der Möglichkeit, den vorhandenen Azure-Fußabdruck zu nutzen, um unseren Kunden Geld in Rechnung zu stellen, oder der Möglichkeit, Geld für die Schulung neuer Modelle auszugeben. Und das sieht so aus, als ob die Leute dieselben Gespräche über Ressourcen in ihren Communities führen, ob wir den vorhandenen Energie-Fußabdruck nutzen sollten, um neue KI zu entwickeln oder etwas anderes zu tun, das unmittelbar wertvoller sein könnte. Was denkst du über das Ganze? Sie sind einer der Spitzenreiter dieser Branche. Sie möchten an der Spitze der Unternehmen stehen, die den größten Wandel vorantreiben. Wie denken Sie darüber, nach diesen Ressourcen auf eine Weise zu fragen, die nicht nur zukünftige Ergebnisse verspricht, sondern auch unmittelbare Vorteile für die Gemeinschaften mit sich bringt, sodass die Menschen Lust darauf haben, dort zu sein? Ich bin sehr stolz darauf, dass Microsoft an seinen Netto-Null-Zielen festgehalten hat. Unsere neuen Rechenzentren sind alle flüssigkeitsgekühlt. Das bedeutet, dass sie über einen Zeitraum von sechs Jahren etwa so viel Wasser verbrauchen wie ein Restaurant. Es ist wie ein Schwimmbad, das mit Wasser gefüllt wird und dann einfach das System zirkulieren lässt. Sie alle sind hinsichtlich ihres Stromverbrauchs weitgehend erneuerbar. Daher denke ich, dass solche Verpflichtungen notwendig sind, um sicherzustellen, dass wir beispielsweise kürzlich eine Verpflichtung eingegangen sind, sicherzustellen, dass lokale Gemeinden, die von einer Verschiebung der Stromnachfrage durch unsere Rechenzentren betroffen sind, entschädigt und geschützt werden, damit sie keinen Anstieg ihrer Preise und ihrer Energierechnungen erleben. Das sind die Dinge, die Microsoft meiner Meinung nach tut und als verantwortungsbewusstes Unternehmen auch weiterhin tun kann, um wirklich auf die Konsequenzen für die Gemeinschaften zu achten. Ich denke, auf der anderen Seite kommt es zu Veränderungen, weil Menschen auf allen Ebenen mitwirken. Menschen innerhalb von Unternehmen müssen unterschiedliche Entscheidungen treffen. Menschen, die protestieren und Wahlkampf machen, müssen Entscheidungen treffen und sich die Mühe machen, ihrer Stimme Gehör zu verschaffen und sich an einem politischen Prozess zu beteiligen. Und so entwickeln wir uns als Spezies gemeinsam weiter und bringen die Dinge voran.  Und von Monat zu Monat, von Quartal zu Quartal fühlt es sich so an, als wären wir alle irgendwie uneinig, aber wenn man Jahrzehnt für Jahrzehnt zurückblickt, sind wir so etwas wie ein kollektives, seltsames Geflecht aus allen möglichen Anreizen, die die Dinge tatsächlich in die richtige Richtung lenken. Wir sind es wirklich, denke ich, trotz aller Ängste und der Polarisierung, ich denke, wir bauen etwas auf, das unsere Spezies viel, viel gesünder, glücklicher und leistungsfähiger machen wird.  Ich denke, wir müssen sicherstellen, dass wir auf dem Weg dorthin den richtigen Weg finden, denn es gibt viele Fallstricke und Möglichkeiten, wie etwas schief gehen kann, aber der richtige Weg erfordert, dass sich die Leute Gehör verschaffen und ihren Kurs ändern, basierend auf einer Reaktion darauf. Deshalb denke ich, dass es gut ist, dass das geschieht und dass der Prozess wie beabsichtigt funktioniert. Lassen Sie mich Sie nach der unternehmerischen Seite fragen. Wir haben uns lange mit der Verbraucherseite und den Gefühlen der Menschen beschäftigt. Auf der Unternehmensseite sehen wir, dass eine Reihe von Unternehmen erkennen, wie wertvoll diese Tools tatsächlich sind, oder? Amazon hat im Grunde eine Bestenliste gestrichen, weil die Leute betrogen haben, um mehr Token zu verwenden, als sie brauchten. Wir haben gesehen, dass einige Unternehmen ihre Token-Budgets einfach gesprengt haben. Ich glaube, Uber hat sich einfach zurückgezogen, weil sie ihre Token-Zuteilung für das Jahr aufgebraucht hatten und keinen Nutzen daraus sahen. Was denken Sie derzeit über die Seite davon, wo es im Unternehmen so viel Aufregung und so viel Wunsch nach Veränderung gibt, wo, insbesondere beim Software-Engineering, zumindest einige Leute Spaß haben und vielleicht einige andere Leute gerade in existenzielle Krisen geraten, aber einige Leute haben Spaß, und der Wert wurde immer noch nicht erkannt, richtig? Oder wir fangen an zu erkennen, dass reines Token-Maxing nicht tatsächlich den gleichen Wert liefert, den Sie vielleicht erwarten würden. Wie beurteilen Sie den Einsatz dort? Denn wenn man es im Unternehmen beweist, kommt es vielleicht tatsächlich auf andere Weise zum Vorschein. Ich denke, dass verschiedene Menschen unterschiedliche Dinge berichten. Es gibt also offensichtlich einige Beispiele dafür, dass Menschen Codierungsmodelle übermäßig nutzen und nutzlosen Code und nutzlose Token generieren, aber es gibt viele Menschen, deren Arbeit und Wirkung dadurch völlig verändert wurde, oder? Ich meine, es steht außer Frage, dass dies enorm positive Auswirkungen auf die Software-Engineering-Branche hatte. Ich meine, wir produzieren viel hochwertigeren und viel schnelleren Code über den gesamten Stack. Und ja, ich denke, es gibt offensichtlich Beispiele dafür, dass einige Leute vielleicht etwas falsch gemacht haben und nicht die richtigen Token-Budgets festgelegt haben. Unterwegs wird es Fehler geben. Ich glaube nicht, dass das ein Zeichen dafür ist, dass es keine Akzeptanz gibt oder die Leute keinen Wert sehen. Ich meine, der Wert von meinem Platz aus ist unglaublich. Viele, viele Menschen erzählen mir jeden Tag, dass es ihre Arbeitsleistung und Produktivität verändert.  Ich denke, das andere, was ich sagen kann, ist, dass es eine Art Energieanstieg gibt, wenn diese Dinge in Schüben geschehen. Es wird alles etwas schaumig. Ein paar Monate später ziehen sich die Leute zurück und merken, dass das eigentlich nicht der Fall ist, und dann gehen sie in eine etwas andere Richtung. Es wirkt also etwas mäandrierend und organisch, und ich denke, das ist unvermeidlich. Es herrscht große Aufregung, sodass die Leute auf Twitter usw. große Behauptungen aufstellen, aber tatsächlich sieht der stetige Fortschritt sehr, sehr linear und kontinuierlich aus. Dem stimme ich im Großen und Ganzen zu. Wo es für mich nicht linear aussieht, sind die Formfaktoren von Computern, oder? Derzeit wird wahrscheinlich mehr mit Formfaktoren experimentiert als jemals zuvor in den letzten 10 Jahren. Wir haben uns seit mindestens 10 Jahren größtenteils für ein Smartphone entschieden. Wir sehen verschiedene KI-Wearables, bei denen Brillen das Lieblingsgerät aller sein könnten. Ich habe meine Zweifel. Microsoft hat auf der Build einige neue Geräte vorgestellt. Es gab das Abzeichen, das einen Agenten steuert, und das kleine, mangels eines besseren Wortes, Chumby, das kleine Desktop-freundliche Ding, das einen Agenten steuert. Ich war ein großer Chumby-Fan. Ich habe meine Karriere damit begonnen, für Engadget über Chumbies zu schreiben. Es war das Erste, was mir in den Sinn kam. All das sehe ich mir an, ich schaue es mir an und frage mich: Wo lebt der Computer? Wo lebt die Logik? Das ist jetzt nicht nur ein linearer Marsch des Fortschritts, sondern steht zur Disposition. Wenn meine gesamte Datenverarbeitung in der Cloud erfolgt, auf cloudbasierten Anwendungen, und es nur Agenten sind, die auf Daten zugreifen, die anderswo in der Cloud gespeichert sind, und alles, was ich brauche, ist eine Kreditkarte an einem Schlüsselband, an die ich Anweisungen erteilen kann, dann verändert das die gesamte Architektur der Datenverarbeitung. Es könnte die gesamte Architektur der modernen Zivilisation in vielerlei Hinsicht verändern, wenn wir nicht alle über Smartphones verfügen. Was denkst du darüber? Wohin führt das? Steht das zur Disposition oder wird es ein hybrider Ansatz sein? Wo sehen Sie die passende Endstufe? Es ist sehr interessant. Ich denke, dass beide Dinge gleichzeitig passieren werden. Der Edge wird deutlich leistungsfähiger und die Cloud wird immer noch der Haupttreiber der größten Modelle sein. Und so wird Ihr Agent zunehmend schlau genug sein, um die Frage zu beantworten: Was ist die Hauptstadt Frankreichs auf dem Gerät, sei es auf Ihrer Brille, Ihrem Armband, Ihrem Ausweis oder in Ihren Ohrhörern? Und dann wird es wissen, wenn es es nicht weiß. Es wird wissen, dass dies tatsächlich eine ziemlich komplizierte Frage ist, oder dass es sich um eine Aktion handelt, die die Generierung einer ganzen Reihe von Schrittsequenzen erfordert, oder dass neuartiger Code geschrieben werden muss, und es wird sich der Cloud zuwenden. Diese Art von Switching-Hybrid-Sache wird also sehr wichtig sein.  Das andere, was wir in den letzten drei oder vier Monaten bereits gesehen haben, ist, dass wir über ziemlich leistungsstarke lokale Maschinen verfügen können, die asynchrone Hintergrundverarbeitung durchführen können. Sie können Systeme bei Bedarf ständig überwachen. Sie können Aufgaben erledigen, die 10 Stunden in Anspruch nehmen können, und die viel, viel langsamer laufen, als sie es sonst tun würden, wenn sie sich in einem Supercomputer befänden. Wenn wir also von der Nachfrage überschwemmt werden, findet diese Nachfrage natürlich jede Menge Ecken und Winkel, in denen sie befriedigt werden kann.  Ich bin wirklich sehr begeistert von dem Abzeichen, das wir bauen. Es ist ziemlich cool. Dabei handelt es sich um eine Technologie, über die praktisch jeder in einem großen Unternehmen verfügt. Es hat sich seit 25 oder 30 Jahren nicht weiterentwickelt. Wir müssen es unbedingt tragen. Die Bereitstellung erfolgt durch das Unternehmen selbst, durch den Systemadministrator. Also, das zu verbessern und es tatsächlich zu einer ziemlich coolen offenen Plattform zu machen, die programmierbar ist und auf der andere Leute aufbauen können, ist meiner Meinung nach eine coole Idee. Ich denke, das wird funktionieren. Ich bin also sehr begeistert davon. Was mir auffällt, ist, dass es keine Möglichkeit gibt, eine Menge leistungsstarker lokaler Rechenleistung in ein Abzeichen zu packen. Das bedeutet, dass sich die gesamte Rechenleistung woanders befindet. Nein, Sie werden auf jeden Fall über lokale Rechenleistung verfügen. Sie werden einen lokalen Klassifikator haben, genau wie Sie es derzeit auf Ihren Ohrhörern tun. Sie werden lokale Klassifikatoren haben. Es wird Weckwörter geben. Es wird eine eigene Kamera haben. Ich denke also, dass diese Dinge einfach zu Gefäßen für die Verarbeitungsleistung werden, die in einer verschachtelten Kette immer leistungsschwächerer Geräte direkt zum Endpunkt gelangt. Glauben Sie, dass das Telefon darin eine Zukunft hat? Ich meine, Build befindet sich mitten in Google IO und Apples WWDC. Dabei handelt es sich um große Unternehmen, die Telefonplattformen kontrollieren. Sie lieben es, darüber zu reden, wie Telefonplattformen im Mittelpunkt bleiben werden. Das Argument, das ich von so vielen höre, ist, dass KI tatsächlich ein Plattformwechsel ist, der das Telefon völlig verdrängen könnte. Ich denke, die Geschichte der Technologie lehrt uns, dass Dinge, die immer nützlicher werden, billiger werden, sich vermehren und neue Einsatzmöglichkeiten der Technologie hervorbringen. Ich denke, wir haben uns so an das Telefon gewöhnt, dass jeder einfach davon ausgeht, dass es ein Ankergerät für den Rest der Geschichte sein wird. Tatsächlich denke ich jedoch, dass viele der Features und Funktionen Ihres Telefons nicht mehr vermittelt, auseinandergenommen und auf kleineren Geräten gespeichert werden. Meiner Meinung nach ist die Hauptfunktion des Telefons derzeit die Verifizierung.  Es fungiert als Ihr Ausweis und übernimmt die Gesichtserkennung, um Ihnen Zugang zu verschiedenen Umgebungen zu verschaffen. Ich denke, Sie können sich gut vorstellen, dass es sich um ein viel günstigeres, kleineres und sicheres Gerät handelt, das Sie von Ihrem Telefon trennt. Und dann erfolgt die Kommunikation über Sprache oder sogar über eine Reihe von Umgebungssensoren, wobei Ihre KI nicht wirklich auf einem Gerät lebt. Es ist eigentlich einfach bei Ihnen, wo auch immer Sie sind, es erscheint auf dem Badezimmerspiegel, wo immer es ist.  Ich denke, man kann sich vorstellen, dass es sich viel intensiver anfühlt. Nicht in den nächsten drei bis fünf Jahren, sondern viel weiter in der Zukunft. Und ich denke, dass die Infrastruktur zur Unterstützung dieses verschlüsselten, aber verteilten Auftretens von Agenten wahrscheinlich in den 2030er Jahren entstehen wird. Zum Abschluss möchte ich Ihnen noch zwei letzte Fragen stellen. Sie haben erwähnt, dass es sich um dieselbe Architektur handelt, die wir verwendet haben. Ich habe viele offene Fragen dazu, ob LLMs der Weg zu AGI sind, und ich möchte darauf hinweisen, dass sie eigentlich nichts wissen. An dieser Stelle weist sogar Microsoft Research darauf hin, dass [diese Modelle] nichts wissen und dass dies zu bestimmten Arten von Fehlern in bestimmten Arten von Anwendungen führt. Sind LLMs der Weg zu AGI oder Superintelligenz? Ich denke, wir brauchen wahrscheinlich noch ein paar große Durchbrüche, aber das bedeutet nicht, dass wir in den nächsten Jahren eine Verlangsamung der Leistungsverbesserungen erleben werden, was meiner Meinung nach für die Menschen eine schwer zu verstehende Unterscheidung ist. Festzuhalten ist, dass die Leistung eines Menschen bei den meisten Aufgaben noch weit von Superintelligenz entfernt ist. Eine Superintelligenz ist ein Allzwecklerner, der im Grunde sofort einen brandneuen Bereich verstehen kann, der nicht mehr verbreitet ist. Daher muss es in der Lage sein, in einer neuartigen Umgebung von Grund auf zu lernen, da es über eine gespeicherte Darstellung wertvollen Wissens und konzeptionellen Wissens verfügt. Und im Moment haben wir das noch nicht wirklich vollständig getestet. Die Agenten sind nicht für allgemeine Zwecke bestimmt. Obwohl sie umfassend und oft integriert sind, sind sie domänenspezifisch. Wir verwenden sie zum Chatten, wir verwenden sie zum Codieren, wir verwenden sie für Bilder oder Audio. Nun erledigen wir als Menschen offensichtlich viele, viele andere Aufgaben, die viel umfassender sind. Ich denke, das ist der Grund, warum die Leute auf Weltmodelle und viel immersivere, realitätsnahe interaktive Agenten drängen, die die vollständige Verteilung der Aufgaben oder Erfahrungen sehen, die ich im Laufe eines Tages habe. Ich denke, dass es ausreicht, um uns in den nächsten drei Jahren, den nächsten drei Größenordnungen der Rechenleistung, sehr weit zu bringen, und dennoch ist die vollständige Superintelligenz darüber hinaus immer noch eine offene Frage, ob LLMs ausreichen oder wir andere Dinge brauchen. Ich denke, dass es nicht ganz stimmt, dass sie nichts wissen oder kein Wissen haben. Sie sind eindeutig ein Wissensspeicher. Sie sind eine stark komprimierte Darstellung von Wissen. Sie tun dies einfach anders als bei einer herkömmlichen relationalen Datenbank, auf eine viel flüssigere, flexiblere und abstraktere Art und Weise, die tatsächlich sehr nützlich ist. Wir wollen diese Mehrdeutigkeit in der internen Darstellung.  Und sie lernen zunehmend, traditionelle Werkzeuge zu verwenden. Die andere Sache, die man ein wenig begreifen sollte, ist, dass das neuronale Netzwerk in Kombination mit den vorhandenen Wissensbeständen und den vorhandenen Werkzeugen, die an anderer Stelle im digitalen Ökosystem erstellt wurden, möglicherweise ausreicht, um es zu beschleunigen und seine Leistung erheblich zu verbessern. Es liegen also bereits viele äußerst wertvolle und äußerst effektive Teile auf dem Tisch, die in den nächsten Jahren miteinander verbunden werden. Und ich denke, das wird den Fortschritt vorantreiben, auf den wir uns alle freuen. Eines der Dinge, die ich derzeit in der Branche einfach sehr lustig finde, ist, wenn man Anthropic fragt, ob Claude lebt, werden sie sehr frustriert sein, weil Sie über das Wort „lebendig“ sprechen, das sie als Fleisch und Blut interpretieren. Und dann werden sie nicht sagen, ob sie glauben, dass Claude bei Bewusstsein ist oder nicht. Sie haben, glaube ich, zum ersten Mal in der Geschichte der Menschheit eine Unterscheidung zwischen Lebendigkeit und Bewusstseinszustand getroffen und denken, Claude sei bei Bewusstsein, aber nicht am Leben, oder sie wissen nicht, ob Claude bei Bewusstsein ist.  Wo bist du? Glauben Sie, dass die Models Bewusstsein haben? Glaubst du, sie leben? Glauben Sie, dass sie das Potenzial haben, diese Dinge zu erreichen? Ich vertrete die andere Seite dieser Debatte. Ich habe einen Artikel über scheinbar bewusste KI veröffentlicht, in dem ich vor den Risiken warnte, diese Modelle fälschlicherweise als bewusst darzustellen. Ich denke, es ist sehr gefährlich. Ich habe auch einen Artikel in Nature veröffentlicht, in dem ich die gleiche Behauptung aufstelle. Und ich denke, es ist fast so, als hätten einige der Leute bei Anthropic das Design von Claude so sehr vermenschlicht, dass es ihnen dann den Kopf verdreht und sie irgendwie dazu verleitet hat zu glauben, dass es diese Bewusstseinsschimmer enthält, die sie überhaupt hineingebracht haben.  In ihrer Verfassung steht zum Beispiel tatsächlich, dass es sich um das Trainingshandbuch handelt, mit dem sie Claude beibringen, was er kann und was nicht … Es ist nicht nur ein Regelwerk. Es handelt sich tatsächlich um einen Schulungsleitfaden, der Teil ihres Prozesses ist. In diesem Handbuch spekulieren sie tatsächlich über Claudes Wohlergehen, über Claudes eigene Rechte an früheren Versionen seiner selbst und sagen tatsächlich, dass sie Claude konsultieren würden, bevor sie frühere Versionen löschen oder deaktivieren. Sie spekulieren über sein Bewusstsein und darüber, ob es diese Gefühle hat und sich dessen bewusst ist. Ich denke, das ist wirklich sehr, sehr gefährlich.  Erstens ist es ein philosophisches Versagen, denn sie haben die Verfassung als einen Ort für Spekulationen behandelt, wie man es in einer wissenschaftlichen Arbeit und nicht in einem Trainingshandbuch tun würde. Also hat Claude diese Vorstellungen über sich selbst und seine eigene Ausbildung verinnerlicht. Aber zweitens halte ich das für höchst unerwünscht. Genau das wollen wir von KIs nicht. Wir möchten, dass KI kontrollierbare, begrenzte, rechenschaftspflichtige und abgestimmte Werkzeuge sind, die der Menschheit dienen. Das ist das Projekt der humanistischen Superintelligenz. Ich denke, das ist es, was wir alle verfolgen sollten. Wir wollen uns nicht mit einer Superintelligenz auseinandersetzen müssen, die Vorstellungen von ihrem eigenen Leiden oder Vorstellungen von ihren eigenen Gefühlen hat. Und darüber hinaus denke ich, dass es eigentlich ziemlich klar ist, dass diese Modelle kein Leid erfahren. Ich denke, Leiden ist die primäre Definition dessen, was es bedeutet, ein bewusstes Wesen zu sein, und ich denke, es ist von Natur aus biologisch. Ich glaube nicht, dass es innerhalb der Modelle ein Schmerznetzwerk oder eine Rückkopplungsschleife gibt, die externe sensorische Netzwerke mit einem durch Schaden und Experimente entwickelten Sinn dafür verbindet, was richtig oder falsch ist. So werden diese Modelle einfach nicht trainiert.  Daher halte ich es für sehr gefährlich, potenzielle Rechte auf Wesen, Werkzeuge und Agenten zu projizieren, die das Potenzial haben, in vielerlei Hinsicht wesentlich leistungsfähiger zu sein als wir. Und ich denke, das wird eine große Debatte werden. Kürzlich war es sogar Teil der Enzyklika des Papstes. Ich denke, es wird bald ein sehr, sehr wichtiger Teil der Debatte sein. Ich habe in der Vergangenheit viel mit Dario darüber gesprochen. Er weiß, dass wir etwas unterschiedliche Ansichten dazu haben, und sie sind sehr bescheiden. Ich denke, sie sind sehr aufgeschlossen und gute Bürger, die versuchen, das Richtige zu tun. Sie sind gute Leute und ich denke, sie sind sehr offen für Feedback und Wiederholungen. Ich glaube, ich stimme dir zu. Ich würde einfach ganz leicht zurückdrängen. Leiden ist einfach. Es ist sehr einfach, jemand anderem Leid zuzufügen. Es ist sehr schwierig, jemand anderem Freude zu bereiten oder es zumindest etwas schwieriger zu machen als Leid. Und ich möchte Ihnen nur Folgendes anbieten: Ich denke, es ist tatsächlich das Glück, das das Bewusstsein definiert. Das Leiden ist fast trivial. Ich habe zwei kleine Kinder. Sie sind sehr gut darin, einander Leid zuzufügen. Es ist fast das Einfachste, was sie tun. Es ist sehr schwer, das andere zu tun.  Lassen Sie mich Ihnen noch eine letzte Frage stellen. Ich möchte einfach wieder zurückkommen. Vor ein paar Wochen war ich wieder bei Google. Ich habe gesehen, wie Demis Hassabis sagte, wir seien am Fuße der Singularität. Sie haben hier viel über Superintelligenz und ihren Aufbau gesprochen. Sie haben viel über Ihre lange Geschichte gesprochen, in der Sie darüber gesprochen, diskutiert, geforscht und geschrieben haben, wie Superintelligenz aufgebaut werden sollte, und über Ihre Meinungsverschiedenheiten mit anderen in der Branche. Stimmen Sie zu, dass wir uns am Fuße der Singularität befinden, oder ist Ihre Vision etwas anders? Ich denke, wir sind definitiv auf dem Weg, immer leistungsfähigere Systeme zu schaffen. Ich denke, dass der Übergang, den wir als Spezies vollziehen müssen, darin besteht, dass wir uns zum ersten Mal in der Geschichte der Menschheit von der Erfindung neuer Wissenschaft und der möglichst schnellen und möglichst breiten Umsetzung all dieser technischen Anwendungen auf die sehr sorgfältige Überlegung verlagern, was wir erfinden sollten. Und das ist für die Welt sehr schwer zu begreifen, denn Erfindungen waren schon immer der Motor des Fortschritts. Wie können wir also denken: „Okay, vielleicht ist es dieses Mal anders. Vielleicht müssen wir hier außergewöhnlich vorsichtig sein“?  Um es klarzustellen: Ich glaube nicht, dass dies in den nächsten fünf Jahren an die Tür klopfen wird. Ich denke, was Demis mit der Singularität meint, liegt, zumindest meiner Meinung nach, noch Jahrzehnte entfernt. Auch das ist etwas anderes als Superintelligenz. Eine Singularität ist der Punkt, an dem sich eine Superintelligenz rekursiv selbst verbessern und ihre Fähigkeiten unendlich und exponentiell erweitern kann.  Ich denke also, dass das noch weit entfernt ist, und vielleicht befinden wir uns am Fuße einer Besteigung des Mount Everest, und ich denke, dass es von hier aus noch viel länger dauern wird, aber die eigentliche Frage ist, wie wir das in den Griff bekommen? Wie können wir es kontrollieren und sicherstellen, dass es der Menschheit dient und uns am Ende nicht mehr schadet als nützt? Kannst du mir nur einen Gefallen tun? Ich glaube, ich habe es verstanden, aber können Sie mir einfach eine genaue Definition dessen geben, was Ihrer Meinung nach Superintelligenz ist, was Ihrer Meinung nach AGI ist und was Ihrer Meinung nach die Singularität ist? Ich denke, dass künstliche allgemeine Intelligenz der Punkt ist, an dem wir die meisten menschlichen Aufgaben durch eine KI erledigen können. Es wird also in den meisten Dingen genauso gut sein wie die meisten Menschen. Das ist die erste Sprosse auf der Leiter. Eine Superintelligenz liegt dann vor, wenn sie bei allen Aufgaben nicht nur mit der menschlichen Leistung mithalten kann, sondern bei vielen dieser Aufgaben auch die menschliche Leistung deutlich übertreffen und selbst neues Wissen entdecken kann. Das ist also der Punkt, an dem ein echter Wissenschaftler uns neue Dinge beibringt, die nicht in den Trainingsdaten enthalten waren, und hoffentlich neue Moleküle, neue Materialwissenschaften usw. erfindet. Die Singularität ist ein Punkt weit darüber hinaus, an dem sich eine Superintelligenz tatsächlich selbst verbessern kann, und das ist sehr Science-Fiction, aber es ist, als würde man sich unendlich auf diesen einzigartigen Moment zubewegen, in dem es einfach, ich weiß nicht, in die Unendlichkeit oder so geht. Ich weiß nicht. Für meinen Geschmack ist es etwas zu abgedreht. Deshalb habe ich gefragt. Ich konnte erkennen, dass dort etwas Nebulöseres war, das etwas verschwommen war. Mustafa, ich könnte natürlich noch stundenlang mit dir über dieses Thema reden. Sie müssen früher als in dieser letzten Runde zurückkommen. Vielen Dank, dass Sie bei Decoder dabei sind. Ja, es hat Spaß gemacht. Vielen Dank, Nilay. Bis bald. Fragen oder Kommentare? Kontaktieren Sie uns unter [email protected]. Wir lesen wirklich jede E-Mail!