Le responsable de l'IA de Microsoft affirme que la superintelligence est proche, mais qu'elle ne prendra pas votre poste

Aujourd'hui, je parle avec Mustafa Suleyman, le PDG de Microsoft AI. Et je vais en fait garder l’intro d’aujourd’hui courte – je travaille cette semaine dans la ferme familiale de ma femme, comme vous le verrez dans la vidéo, mais c’est aussi un véritable brûleur d’épisode. Nous avons tout couvert, depuis l’approche de Mustafa en matière de formation de nouveaux modèles jusqu’à ses critiques d’Anthropic parlant de Claude comme s’il était conscient. Bien sûr, nous avons également parlé de la relation de Microsoft avec OpenAI, de la façon dont Mustafa réfléchit actuellement à tous les sondages négatifs et aux réticences politiques autour de l’IA, et de la question de savoir si l’un des produits de consommation est suffisamment bon pour les surmonter. Comme je l'ai dit, c'est un brûleur. D'accord : Mustafa Suleyman, PDG de Microsoft AI. On y va. Cette interview a été légèrement modifiée pour plus de longueur et de clarté. Mustafa Suleyman, vous êtes le PDG de Microsoft AI. Bienvenue à nouveau chez Decoder. Ravi d'être à nouveau avec vous. Je suis très excité de vous parler. Notre conversation précédente était l’une de mes conversations préférées – sur l’IA, ce qu’elle devrait nous faire ressentir et à quoi elle sert – que j’ai eue dans toutes les conversations que nous avons eues. Il y a de grands changements chez Microsoft, peut-être une recontextualisation très importante sur ce que les gens pensent de l'IA dont je veux vous parler en particulier. Et puis il y a Microsoft Build, la grande conférence des développeurs Microsoft, qui a présenté de nombreuses nouvelles annonces et de nombreuses grandes idées sur l'utilité des ordinateurs et peut-être sur l'endroit où ils devraient être que je souhaite aborder. Commençons par le tout début. Il s’agit de quelques éléments approfondis du décodeur qu’il est important de comprendre avant tout le reste. Depuis que vous avez rejoint Microsoft, vous avez restructuré le fonctionnement de l'IA. Votre rôle a changé. La dernière fois que je vous ai parlé, vous étiez en charge d'un certain nombre de produits de consommation. Cela a depuis été mis de côté. Vous formez désormais de nouveaux modèles ; tu es à la frontière. Expliquez comment Microsoft AI est structuré actuellement et comment elle est structurée au sein de Microsoft. Je suppose que depuis 15 à 18 mois environ, nous avons entrepris ce voyage pour rétablir notre relation avec OpenAI, et cela a pris une minute. Je pense que cela a abouti à un nouveau contrat que nous avons conclu en octobre de l'année dernière. Et il y avait beaucoup de dispositions différentes là-dedans, y compris la consolidation et l'extension du partenariat, mais surtout la libération de nous pour pouvoir poursuivre la superintelligence de manière indépendante ainsi que continuer à acheter et à octroyer des licences à leurs modèles. Ainsi, depuis octobre, j’ai constitué l’équipe Superintelligence, construit des clusters d’une taille suffisante pour former des modèles frontières et embauché une équipe axée sur la superintelligence. Et donc cela a été un changement assez important pour nous car cela m'a en quelque sorte permis de me concentrer uniquement sur la mission de superintelligence, et cela a ensuite abouti à quelques choses que nous avons annoncées cette semaine à Build. Nous avons sept nouveaux modèles dans toutes les modalités, etc. Cela a donc été un changement assez important, et je pense qu'il a fallu beaucoup de temps pour la planifier, et un grand soulagement pour nous d'être maintenant dans le jeu et de poursuivre la frontière absolue au cours des prochaines années. Était-ce le plan lorsque vous avez été embauché chez Microsoft ? C’est certainement le plan des 18 derniers mois. Je veux dire, je pense que la relation avec OpenAI a connu beaucoup de hauts et de bas. Et à bien des égards, je pense que cela restera l’un des partenariats les plus réussis de l’histoire. Cela a été formidable pour OpenAI, et cela a été formidable pour Microsoft, et toutes les bonnes relations évoluent, et je pense que ce n’est que la prochaine étape de notre évolution. Permettez-moi de vous poser des questions sur cette évolution en particulier. Nous venons tous de voir le procès entre Elon Musk, OpenAI et Sam Altman. Microsoft était impliqué dans ce procès dans le sens où, de temps en temps, un avocat de Microsoft se levait et disait : « Et nous n'étions pas là ». Et quelqu'un disait oui, et c'était tout. Mais évidemment, ce qui est ressorti de cet essai, ce qui est devenu clair tout au long de cette période, c'est que l'idée initiale était qu'OpenAI serait un laboratoire de recherche et fournirait des modèles, tandis que Microsoft construirait les produits. Microsoft avait l'expertise nécessaire pour se lancer sur le marché ; elle avait une expertise en affaires, elle essayait de reprendre pied auprès du consommateur de diverses manières. Il s’agirait d’un changement de plate-forme, et le travail de recherche serait terminé chez OpenAI, et le travail sur les produits serait au sein de Microsoft. C’est ce qui a changé : OpenAI voulait fabriquer de plus en plus de produits de consommation. Evidemment, compte tenu de votre nouveau rôle et de votre nouvelle orientation, Microsoft souhaite de plus en plus réaliser ses propres modèles. Pourquoi la scission ? Qu’est-ce qui n’a pas fonctionné dans cette relation ? Je veux dire, je pense qu'OpenAI est dirigé par une équipe fondatrice incroyablement ambitieuse, et par Sam lui-même. Et naturellement, alors qu’ils commençaient à gagner du terrain et à générer une tonne de revenus, ils ont vu des opportunités de se lancer dans le full stack. Ce n’est donc pas seulement qu’ils ont commencé à travailler sur des produits de consommation. De toute évidence, ChatGPT a connu un succès incroyable. Ils ont également commencé à travailler sur leurs propres centres de données. Ils ont commencé à créer leur propre puce. De nombreuses rumeurs circulent à propos de leurs propres appareils matériels grand public. Ils ont commencé à commercialiser des modèles directement via ChatGPT Enterprise. Donc, à tous les niveaux, ils se sont en quelque sorte élargis bien au-delà de la recherche au cours des deux, trois, quatre dernières années. Et bien entendu, il en va de même pour Microsoft. Je veux dire, je pense que le partenariat a maintenant cinq ou six ans et qu’il lui reste encore quatre, cinq, six ans. De même, nous sommes l’une des plus grandes entreprises technologiques au monde. Nous avons 493 des 500 plus grandes entreprises qui stockent et traitent la plupart de leurs données sur nos systèmes, utilisent Azure, utilisent M365 et Teams. Je pense que les gens sous-estiment souvent à quel point nous sommes énormes et quelle est l’importance de notre distribution en entreprise. Et donc, à long terme, et je veux dire sur cinq, six, sept, dix ans, nous devons nous assurer que nous sommes complètement durables, et que nous ne sommes pas simplement le destinataire de la propriété intellectuelle de quelqu'un d'autre que nous modifions, adaptons et mettons ensuite en production pour nos produits, mais nous pouvons réellement voler de nos propres ailes et créer des modèles de classe mondiale. Je veux dire, la superintelligence arrive. Je pense que c'est juste au coin de la rue. Je pense donc que ce sera fondamentalement la technologie la plus précieuse de tous les temps. Il n’est en aucun cas possible, à long terme, que nous soyons structurellement dépendants d’un tiers pour fournir cette propriété intellectuelle pour l’éternité. C’est donc la transition qui a évidemment été déclenchée lorsque OpenAI et ainsi de suite ont eu un problème de conseil d’administration. Mais ensuite, à mesure que je suis arrivé et que mon équipe est arrivée, nous avons commencé à construire cela, nous sommes dans cette transition. Et je pense que nous sommes dans une excellente situation car nous pouvons adopter une position optimale à long terme, assez stable, prudente, à la fois pour OpenAI, qui, je pense, a incroyablement bien réussi, et pour nous. Je veux consacrer du temps à la superintelligence. Je veux juste y mettre une épingle maintenant parce que je veux juste en quelque sorte comprendre la transition pour un tour supplémentaire ici. Il y a un moment dans le procès, une sorte de message très drôle du PDG de Microsoft, Satya Nadella, il dit : "Je ne veux pas être Intel et qu'OpenAI soit Microsoft", ce qui est très drôle dans le contexte du PDG de Microsoft lui-même disant : "Je ne veux pas être le fournisseur, et qu'ils soient la plate-forme qui fournit toute la valeur et collecte toute la valeur et peut-être que nous serons échangés. Je ne veux pas que ChatGPT fonctionne sur Azure, et alors OpenAI obtiendra toute la valeur, et alors peut-être qu'ils pourront nous échanger », tout comme ce qui s'est passé avec Windows et Intel au fil du temps. Est-ce une prise de conscience ? Nadella est-elle venue vers vous ? Comment s'est passée cette réunion au cours de laquelle vous avez dit : "D'accord, OpenAI a eu des problèmes avec son conseil d'administration. Nous devons revenir à la frontière et voler de nos propres ailes." À quoi a ressemblé cette conversation et comment cette décision a-t-elle été prise ? Je veux dire, c’est évidemment la décision de Satya ainsi que d’Amy, Brad et de nombreuses autres personnes de l’entreprise. Mais je pense que c’est comme pour tout : ce sont des changements lents au sein de l’entreprise, au fur et à mesure que l’on se rend compte que la direction que nous prenons nécessite un peu de peaufinage et d’ajustement. Et donc cela se produisait bien avant l’incident du conseil d’administration de novembre, et je pense que cela s’accumule avec le temps lorsque l’on regarde le genre de constellation de différents fronts sur lesquels nous sommes de plus en plus en concurrence directe, et toute la tension qui en découle. Mais aussi en sachant que de tels partenariats ne durent pas éternellement. Je veux dire, OpenAI veut être une entreprise publique valant des milliards de dollars, avec des revenus incroyables et une croissance folle. Ils veulent avoir la liberté d’opérer et pouvoir acheter des ordinateurs dans toutes sortes d’autres endroits, construire leur propre ordinateur et s’associer avec qui ils veulent. Le contrat a donc été conclu à une époque où les entreprises étaient très différentes en termes de taille, d’échelle et d’équilibre des besoins et autres. Je pense que cela avait du sens à ce moment-là, mais il est ensuite devenu assez clair que c'est quelque chose que nous devons être capables de nous approprier et de contrôler nous-mêmes et de bien faire envers nos propres clients. Comme je l'ai dit, nous avons une répartition incroyable des entreprises, qui, à mon avis, est totalement inégalée dans le monde. Nous devons donc nous assurer que nous construisons les meilleures choses pour nos clients. Cela semble légèrement différent d'une entreprise qui a optimisé conjointement à la fois pour le consommateur, avec ChatGPT, et pour l'entreprise, ainsi que pour la mission scientifique fondamentale de la superintelligence, qui comprend tout un tas de directions différentes qui se chevauchent mais pourraient sans doute être considérées comme orthogonales aux orientations du consommateur et de l'entreprise également. Naturellement, je pense que c’est ainsi que les partenariats évoluent, et ils sont réinitialisés périodiquement. Oui, mais construire un modèle frontière coûte très cher, me dit-on. De manière fiable, il s’agit d’un projet très coûteux. À un moment donné, Amy Hood, la directrice financière de Microsoft, doit dire : « Oui, vous avez le budget ». Quand est-ce arrivé ? C'était juste un SMS ? Y a-t-il eu une réunion ? Parlez-moi des détails là-bas. Je pense, écoutez, que nous avons en quelque sorte pris la décision au début de l'année dernière, ce qui a évidemment éclairé toutes les négociations contractuelles, qui ont ensuite toutes été résolues et signées en octobre. Et c’est un investissement important, mais nous avons beaucoup de temps pour le réaliser. Je veux dire, nous avons déjà réalisé des investissements importants dans notre propre mission d’autosuffisance. Notre puce Maia 200 est en fait une puce exceptionnelle, à titre d'exemple, n'est-ce pas ? Nous sommes désormais en mesure de fabriquer et de livrer une puce 30 % moins chère qu'un GB200 au sein de nos propres clusters. Et maintenant que nous pouvons co-concevoir nos propres modèles avec lui, le modèle MAI-Thinking-1 que nous venons de publier offre en fait une amélioration des performances par watt de 1,4 fois en plus de l'amélioration de 30 % que vous obtenez en fonctionnant sur un Maia 200 une fois que nous avons co-optimisé les modèles pour nos tâches. Il est donc important de s'assurer que vous possédez et contrôlez votre propre pile et que vous dirigez l'ensemble des efforts de co-conception de bout en bout pour les cas d'utilisation qui sont les plus importants pour nous - qui sont évidemment le codage agent, nos développeurs, nos entreprises - qui rapportent clairement les dividendes qui justifient l'investissement que nous devons faire au cours des prochaines années. Vous avez parlé de mission d'autosuffisance, ce qui est une façon très polie de dire que vous voulez voler de vos propres ailes; tu veux faire ton propre truc. On m’a dit qu’il y avait une certaine controverse au sein de Microsoft à propos d’une ligne écrite par mon collègue Hayden Field dans un article décrivant Build. Je vais juste lire ceci. C'est de Hayden. C'est une superbe ligne. Elle a déclaré : « Le Microsoft Build de cette année avait l’ambiance d’une divorcée fraîchement célibataire publiant un piège à soif sur Instagram. » La rupture est terminée et il est temps de fléchir. Voici notre nouveau modèle. Nous allons nous tenir debout. Vous dites que vous allez construire des modèles à la frontière et rivaliser avec les principaux laboratoires. Est-ce le sentiment au sein de Microsoft que vous êtes libre d’être seul ? Certainement pas. Non, pas du tout. Écoutez, je veux dire, c'est évidemment un titre sympa et une phrase amusante. Mais la réalité est que nous sommes en partenariat avec OpenAI pour les années et les années à venir. Je veux dire, nous courons bien au nord de 2030. Ils produisent toujours les meilleurs modèles au monde. GPT-5.5 est un modèle exceptionnel. Le Codex et les modèles de cybersécurité qui sont en train d’être mis en place sont incroyables et ils alimentent la majorité de ce que nous faisons. Alors naturellement, ça va continuer. Je pense donc que c’est une évolution naturelle de ce type de partenariat. Je ne pense pas que ce soit quelque chose de fâcheux ou de surprenant. Je pense qu'OpenAI comprend très bien et soutient cela. Je veux dire, c’est évidemment une entreprise à croissance incroyablement rapide, et ils comprennent que nous devons également poursuivre notre propre programme. C'est donc tout à fait normal. Permettez-moi de vous poser l'autre question relative au décodeur, puis je souhaite aborder les annonces de Build, et certainement la superintelligence. La dernière fois que nous nous sommes parlé, vous avez déclaré que votre cadre de prise de décision fonctionnait selon un cycle de six semaines, compte tenu de la rapidité avec laquelle l’IA évolue. Cela avait alors du sens. Les choses sont peut-être réglées. Peut-être que certaines choses sont plus ciblées. Quel est votre cadre décisionnel désormais ? Nous fonctionnons toujours selon le même rythme de cycle. À la fin de chaque cycle, nous avons une rencontre d'une semaine en personne. J’y crois sincèrement, même si nous sommes toujours dans une culture de bureau, quatre jours par semaine. En fait, la semaine suivante, toute mon équipe de Superintelligence se réunit en personne à Boston pendant quatre jours. Cela concerne toutes nos rétrospectives sur le déroulement de Build, ce que nous avons appris, ce que nous n'avons pas réussi, ce que nous devons améliorer, notre planification pour le prochain cycle, qui va durer huit semaines cette fois avec une semaine de rencontre par la suite, et tout cela est prévu pour toute l'année. Ainsi, toute l’organisation sait que c’est le rythme selon lequel nous opérons. Et je pense qu’il est en fait très important de souligner ce calendrier, car la planification trimestrielle devient un peu floue et abstraite. Je pense que six à huit semaines, selon l'endroit où cela se situe dans le calendrier, est en fait le moment optimal pour élaborer des missions très claires et fortifiables. Alors nous aussi, en plus du rythme de ces cycles de six à huit semaines, nous fonctionnons par escouades. Les escouades sont des sous-groupes interdisciplinaires mixtes axés sur une mission spécifique et ne s’échelonnent pas nécessairement jusqu’au manager. En fait, ils sont gérés par un DRI, et le DRI est souvent un IC, et leur travail est... Il s’agit de « personne directement responsable » et de « contributeur individuel ». Ouais, exactement. Merci. Et je pense que nous avons adopté l’approche consistant à séparer le rôle du manager du rôle du DRI qui exécute une mission spécifique. Je pense que c’est parce qu’être un bon DRI est épuisant. Vous êtes littéralement à fond 24 heures sur 24 et vous faites de votre mieux. Être manager, c’est souvent être un coach, offrir du soutien, donner des conseils, du feedback, débloquer toutes sortes de choses, aider les gens à évoluer dans leur carrière. Et donc je pense que garder ces éléments séparés nous permet d’effectuer une rotation des DRI tous les deux ou trois cycles afin que certaines personnes puissent essayer différentes positions et bénéficier d’une rotation. C’est une structure formidable, très flexible, qui nous permet d’être assez agiles, je pense. Parlons de Build. Je voulais commencer par la superintelligence. Vous l’avez mentionné plusieurs fois maintenant. J'étais juste chez Google IO. Demis Hassabis, qui était votre collègue lorsque vous étiez chez Google, a terminé ce discours en disant que nous étions « au pied de la singularité, et que l'AGI arrivait avec toute la puissance de Google ». Vous dites que la superintelligence est là. Est-ce que ce sont toutes les mêmes choses ? Utilisons-nous un langage différent pour décrire l’AGI ? Y a-t-il des différences ? Comment définiriez-vous la superintelligence dans votre contexte par rapport à la singularité dans celui de Demis ? Je veux dire, évidemment, je n’ai pas dit que c’était ici. J'ai dit que ça allait arriver. Et je pense qu’il y a beaucoup de fluidité autour de ces phrases. Mais je pense que ce que nous pouvons clairement voir ce qui se passe en ce moment, c'est qu'il y a une montée de colline log-linéaire dans toutes les modalités, et cela signifie qu'il existe une relation très directe entre chaque ordre de grandeur de calcul que nous appliquons, chaque augmentation incrémentielle des données et l'escalade sur les références, qu'il s'agisse de références publiques, de références internes, ce sont des cibles sur lesquelles nous nous concentrons avec des environnements d'apprentissage par renforcement. Et c’est une observation très importante. Ces prédictions que je pense que nous faisons tous – je comprends pourquoi certaines personnes sont sceptiques à leur égard ou soulèvent des questions, mais elles sont très fondées sur le genre d’observations empiriques de plus d’une décennie d’augmentation des performances de ces modèles. Je veux dire, essentiellement la même architecture à usage général a vu 12 ordres de grandeur supplémentaires appliqués, un nombre de milliards de fois plus élevé en FLOPS sur 15 ans, et a essentiellement fonctionné en audio, en image, en texte, en code et dans de nombreuses autres tâches de prédiction de séries temporelles. Nous extrapolons donc essentiellement que davantage d’ordres de grandeur de calcul nous permettront de continuer à grimper de cette manière log-linéaire à l’intérieur d’autres environnements. Et puis cela soulève la question : allons-nous être capables de former des modèles capables d’inventer de nouvelles connaissances, non seulement d’extrapoler à partir des données existantes dont nous disposons, mais aussi de nous apprendre des choses que nous ne connaissons pas et de faire de nouvelles découvertes ? Ensuite, la deuxième chose est : ont-ils la capacité de s'auto-améliorer et d'accélérer le processus consistant à décider quelles hypothèses doivent être formulées, lesquelles doivent être poursuivies, comment générer des données de formation pour chacune d'entre elles, comment les prendre en compte dans de nouvelles exécutions, ou même innover sur l'architecture elle-même ? Donc, je pense que ces deux choses doivent être vraies pour pouvoir constater ces progrès cumulatifs, mais je pense que nous allons continuer à obtenir des gains massifs simplement en appliquant les prochains ordres de grandeur de calcul. Cela atteint probablement la parité avec les performances humaines sur de très nombreuses autres tâches, tout comme nous l'avons vu se produire au cours des six derniers mois en matière de codage. Le codage est vraiment intéressant, car il est facilement validé, non ? Vous écrivez le code, vous demandez à l'ordinateur de l'exécuter, il s'exécute ou échoue. Nous avons constaté certains inconvénients, notamment en matière de sécurité, n'est-ce pas ? Les inconvénients sont évidents, et nous constatons que ce type d’approche réglementaire en matière de sécurité du codage se manifeste de nombreuses manières. J'ai probablement codé certains désastres de sécurité sur mon propre téléphone et mon ordinateur, et c'est peut-être un risque que je suis prêt à prendre. Toutes les autres fonctions ne semblent pas si simples. Je choisis toujours le droit, parce que c’est mon parcours. Mais un juge ne valide pas l’écriture juridique de la même manière qu’un ordinateur valide le code. Si vous vous trompez, le juge peut vous envoyer en prison, n'est-ce pas ? C'est peut-être la pire erreur de validation de sortie que vous puissiez probablement rencontrer. Comment mesurer l’efficacité dans tous les domaines aussi facilement que l’efficacité du codage ? Parce que c’est là, me semble-t-il, que la métaphore ou l’analogie du codage avec d’autres domaines s’effondre très rapidement. Je n'en suis pas si sûr. Le codage, évidemment, vous permet de vérifier la bonne exécution du code. Il fonctionne ou il plante. Mais il y a une tonne de nuances là-dedans. La qualité du code écrit compte vraiment : son extensibilité, sa reconfigurabilité, son utilité en pratique. Il ne s'agit pas seulement de l'exécution d'un morceau de code, mais aussi de la façon dont un modèle l'utilise réellement comme DevOps ou SRE en production pour revenir à ce morceau de code qu'il a écrit, puis l'utiliser de manière pratique et utile. Et puis, bien sûr, vous devez évaluer la qualité du résultat produit. Il s’agit peut-être d’un code fonctionnel de haute qualité, mais s’agit-il réellement de l’application ou du site Web que vous souhaitiez ? Et il y a des jugements esthétiques là-dedans ; il y a des jugements commerciaux là-dedans. Le défi de l’intériorisation des récompenses non vérifiables est présent dans le code, même si le code reste avant tout un signal de récompense vérifiable. Je pense que l'autre chose à observer est que, comme le chat, c'est aussi un espace non vérifiable, et pourtant, nous avons réussi à atteindre des performances essentiellement humaines grâce à l'interaction avec une utilisation du monde réel qui fournit un très fort- Attendez. Je suis très curieux. Comment mesurez-vous le chat au niveau des performances humaines ? Eh bien, je pense que beaucoup de gens ont des conversations longues et significatives avec les IA sur les performances au niveau humain. La qualité est exceptionnellement bonne. Il possède une très bonne intelligence émotionnelle. C’est globalement très précis. Nous avons minimisé les hallucinations. On ne parle plus tellement de préjugés. Il est fondé sur des observations du monde réel. Je pense que selon les mesures de la plupart des gens, nous avons désormais atteint des performances de niveau humain dans les conversations pour un assez large éventail de tâches. Quelles sont vos mesures, et en fait, bien sûr, celles de la plupart des gens ? Je ne serais pas d’accord avec presque tout cela, mais ce sont mes mesures. Quelles sont vos mesures ? Ma mesure est comme lorsque je me tourne vers mon assistant et lui demande de me fournir un briefing quotidien résumant toutes les conversations qui ont eu lieu sur Teams et par courrier électronique, les mises à jour qui ont eu lieu sur les documents, et j'obtiens essentiellement un résumé synthétisé avec un ensemble d'actions que je devrais entreprendre ensuite. C’est fondamentalement mieux que ce que mon chef de cabinet peut produire. Je dirais que c’est une performance au niveau humain en matière de synthèse, d’analyse, d’actions proposées et de chat. Chaque jour, des millions de personnes l'utilisent pour un soutien émotionnel, pour des conseils, pour une thérapie, pour du coaching, pour obtenir des conseils. Je pense que c’est l’un des cas d’utilisation les plus populaires parmi tous les chatbots. C’est une mesure assez robuste, je dirais, pour faire cette affirmation. Je sais que vous avez passé beaucoup de temps à réfléchir à cela, en particulier au lien émotionnel avec certains de ces chatbots. Ce sont des produits que vous avez créés et déployés. Je ferais une assez grande distinction entre cette chose qui est vraiment très efficace pour résumer mes e-mails, ma liste de tâches et me fournir un bref aperçu des choses à prioriser, et cette chose est un coach émotionnel pour quelqu'un qui traverse une sorte de crise. Ce ne sont pas des tâches similaires. Ce ne sont pas nécessairement des types d’intelligence similaires, même chez les humains. Je connais des personnes qui savent très bien dresser des listes et qui sont très mauvaises en matière de soutien émotionnel. Comment rassembler tout cela dans votre cerveau et dire : « D'accord, il s'agit d'une performance globalement humaine dans le chat ? Je pense que si vous définissez le chat comme un échange interactif entre deux parties, dont l'une dans ce cas est une IA, qui satisfait largement un objectif, vous cherchez à connaître le score sportif, des conseils sur le restaurant où aller, un coaching et des commentaires sur un essai que vous avez écrit, des suggestions sur le prochain travail à entreprendre ou une conversation difficile que vous êtes sur le point d'avoir avec votre manager. Vous obtenez une réponse, vous faites des allers-retours, vous avez cinq ou six échanges, et vous trouvez que c'est un résultat utile, alors que vous auriez peut-être autrement dû vous fier à un expert, un ami ou même payer un coach. Il y a, objectivement et empiriquement parlant, des centaines de millions de personnes qui vivent cette expérience chaque jour grâce à ces chatbots. Peut-être pourrions-nous nous demander si cela représente techniquement une performance au niveau humain. Je pense que c’est une chose assez raisonnable à affirmer. Il n’y a aucune raison pour que cela ne continue pas à grimper, n’est-ce pas ? Le rythme de croissance au cours des trois dernières années est ce qui me paraît le plus stupéfiant. Et donc, ce que nous essayons de faire à partir de ce point, c’est d’extrapoler : d’accord, quels sont les moteurs fondamentaux de cette ascension – calcul, données, interaction des utilisateurs du monde réel – et ces choses semblent prêtes à se poursuivre. Je pense qu'ils s'appliquent également à de nombreux autres domaines, pas seulement le chat, le soutien émotionnel, la productivité et ce genre de choses, mais aussi à bien d'autres domaines au-delà de cela/la santé, les déploiements de production en direct dans l'éducation, les assistants qui gèrent de plus en plus votre maison, qui examinent simplement tout ce qui se passe dans votre vie quotidienne pour vous rendre plus productif. C’est, je pense, une trajectoire qui va probablement se poursuivre. Vous avez mentionné maintenant qu’il s’agit toujours de la même architecture fondamentale, des mêmes transformateurs et de la même attention. Nous appliquons le calcul à cela depuis 15 ans et nous obtenons de fortes augmentations. Vous êtes dans un endroit assez unique. Lors de Build, vous avez annoncé votre premier modèle de raisonnement phare, MAI-Thinking-1. Vous devez repartir de zéro. Y a-t-il quelque chose que vous avez fait différemment maintenant après 15 ans d'architecture et de formation de ce modèle, ou est-ce simplement, oui, nous allons collecter toutes les données et exécuter la formation comme nous l'avons fait, et nous avons plus de calcul maintenant, donc ça va être mieux ? Non, en fait, je pense qu'il y a pas mal de différences. La première chose à dire est que la façon dont vous organisez les données… Nous commençons par le haut de la pile ; nous avons essentiellement payé et acquis un ensemble de données de très haute qualité et très conservatrices, et extrait une grande partie des problèmes bruyants, distrayants, de mauvaise qualité et potentiellement dangereux pour la sécurité liés à ces données. Et les méthodes que vous utilisez pour cela, je pense, sont en fait assez exclusives. Nous venons de partager un rapport technique très détaillé de 109 pages, qui a été très bien accueilli sur Twitter, et partage de nombreux détails sur la façon dont nous procédons. Je pense que la deuxième chose est que, même si je pense qu'il est important d'être très prudent dans les choix architecturaux, et nous l'avons été, il y a également un certain nombre de changements assez importants que je pense que nous avons apportés dans la façon dont nous organisons nos entraînements. Nos entraînements ont été incroyablement stables, avec très peu de crashs et très peu de redémarrages. Nous avons partagé un grand nombre de ces graphiques pour montrer la stabilité de l'infrastructure, ainsi que l'efficacité du MFU, afin de modéliser l'utilisation des FLOPS, ce qui montre essentiellement que nous pouvons insérer un nombre de FLOPS de pointe dans chaque puce pour chaque étape de notre formation. Je pense qu'il est extrêmement facile de se tromper, et nous entendons tous beaucoup d'histoires de différents laboratoires sur la façon dont les choses tournent mal. Il est en fait assez difficile de faire des choix très prudents et délibérés pour bien faire les choses et d'adopter la bonne approche pour garantir que nous produisons des modèles de haute qualité, car notre travail et notre ambition sont d'essayer de construire cette machine de montée. Cela signifie l'intégration du silicium avec les modèles, avec des données de très haute qualité, avec une pile de RLE, des environnements d'apprentissage par renforcement, qui nous permettent fondamentalement et systématiquement de grimper contre n'importe quel objectif que nous choisissons. Et c’est ce qu’est MAI-Thinking-1. Il s’agit d’un modèle de pensée généraliste, assez neutre, qui est plutôt bon en codage. Il est désormais à peu près au niveau de l’Opus 4.6, du moins sur les benchmarks. Nous ne l’avons pas déployé à grande échelle en production, il reste donc encore beaucoup de travail à faire. Mais c’est un raisonneur extrêmement puissant et il a obtenu un score de 97 % à l’AIME, qui est la principale mesure de ses performances de raisonnement, du moins sur les critères de référence. Il est très bon pour suivre les instructions, et l'objectif est essentiellement de le mettre à la disposition de très nombreux développeurs et entreprises et de leur permettre de s'en servir pour leurs cas d'utilisation. Tout le monde a une sorte d’objectif légèrement différent dans son entreprise : essayer de créer des agents, etc., qui soutiennent leur cas d’utilisation. L’une des choses que vous avez remarquées en parlant de MAI-Thinking-1 est que vous n’avez distillé aucun modèle existant, ce qui m’a en fait semblé surprenant, n’est-ce pas ? C'est une chose que vous pourriez faire. Vous avez accès à l’IP d’OpenAI. Tout le monde distille tout. Nous venons de découvrir lors de cet essai que Grok a été distillé à partir d'un certain nombre de modèles. Pourquoi ne pas faire de la distillation ici ? Pourquoi ne pas aller de l'avant ? Il existe certainement de nombreux raccourcis vers la frontière, et si vous prenez un modèle de très haute qualité et que vous peaufinez votre modèle de base avec des instructions, des réponses ou des résultats de haute qualité provenant d'un modèle supérieur, alors il est vrai que le modèle pourrait rapidement s'adapter à cette distribution. Mais il n’est pas sûr qu’ils soient alors capables de surpasser cet enseignant. Nous avons donc été très réfléchis pour deux raisons. La première est que nous voulons nous assurer que nous pouvons dépasser l’enseignant afin de fixer nous-mêmes les limites au cours des prochaines années. Et la deuxième est que nous voulons vraiment construire l’un des grands laboratoires, et cela va nous prendre de nombreuses années, probablement les deux ou trois prochaines années. Mais pour y parvenir, nous devons être capables de montrer que nous pouvons réellement construire nous-mêmes chaque composant. Nous pouvons embaucher les meilleurs talents du monde. Nous pouvons repousser les limites grâce à de véritables recherches, plutôt qu’à une simple réimplémentation, copie ou distillation à partir de tout autre tiers. Nous sommes dans une excellente position pour poursuivre cet objectif avec beaucoup de soin et de minutie, sachant que nous avons les ressources nécessaires pour acheter des modèles Anthropic là où ils dépassent les frontières. Nous disposons des ressources nécessaires pour intégrer 11 000 modèles différents dans Foundry, de sorte que chacun de nos développeurs bénéficie d'une pure optionnalité. Et bien sûr, nous avons les ressources pour continuer à déployer des modèles OpenAI, évidemment exceptionnels et aujourd’hui à la frontière. Cela fait tout simplement partie de la mission d’autosuffisance, et il nous faudra du temps pour vraiment atteindre la frontière absolue dans ce domaine. Mais je pense que nous sommes dans une excellente situation. Nous avons fait énormément de progrès. C’est un modèle très, très solide, et ce n’est pas seulement ce modèle que nous avons sorti. Nous avons lancé sept nouveaux modèles simultanément. Notre modèle transcrit, par exemple, MAI-Transcribe-1.5, est littéralement le numéro un au monde. C’est le plus rentable de tous les hyperscalers. C’est le niveau de précision le plus élevé. Notre modèle d’image est désormais numéro deux. Notre modèle d’édition d’images est le numéro trois, juste derrière celui de Google et d’OpenAI. Je pense que nous sommes bien là-haut avec notre image et notre audio. Notre modèle de code, CodeFlash, est incroyablement puissant, optimisé pour VS Code. et c’est vraiment un très bon modèle, comparable au Sonnet 4.6. Nous sommes donc vraiment dans une bonne position en ce moment. Y a-t-il eu des problèmes juridiques ou de propriété intellectuelle concernant la distillation ? Je sais que c'est un problème d'actualité dans le monde : Anthropic se plaint du fait que d'autres personnes distillent leurs modèles. Il existe des inquiétudes quant au fait que les entreprises chinoises distillent des modèles et à la question de savoir si nos accords de propriété intellectuelle existants peuvent couvrir cela. Avez-vous eu l’une de ces inquiétudes pour vous en éloigner ? Oh, nous ne l’avons pas fait, mais je pense comprendre pourquoi beaucoup de gens sont frustrés. Anthropic a été très frustré, et certaines des rumeurs autour de xAI et Meta, et évidemment, des modèles open source, et ainsi de suite, parce qu'essentiellement, cela consiste essentiellement à prendre la propriété intellectuelle et les connaissances qu'une autre équipe a rassemblées, puis à les introduire littéralement de force dans votre propre modèle. Je pense que c'est un peu une victoire à court terme, et comme je l'ai dit, en réalité, nous voulons créer une culture dans le laboratoire où nous pouvons proposer la prochaine grande avancée en matière de réflexion, ou la prochaine grande avancée en matière de codage, ou la prochaine grande avancée architecturale. Nous expérimentons actuellement le transformateur en boucle, qui est une variante légèrement différente du transformateur de courant. Beaucoup de gens dans le domaine s’y intéressent également. Personne ne semble encore vraiment se lancer dans la production. Mais, afin de créer une culture et une équipe capables de vraiment repousser les frontières, ils doivent comprendre, s'approprier et créer la pile complète au fur et à mesure de leurs besoins, et également utiliser des éléments provenant de tiers chaque fois que nous en avons besoin. Et comme notre article, par exemple, compte des centaines de citations fondées sur le reste de la littérature, il s’agit donc en grande partie d’une contribution au domaine en échange de tout ce que nous avons appris au fil des ans grâce à toutes les grandes publications qui ont été publiées. Puis-je vous demander : si vous comprenez la frustration d'Anthropic et de vos pairs de l'IA à propos de la distillation, comprenez-vous également la frustration des créatifs, des éditeurs et des YouTubers à l'idée que toutes les sociétés d'IA mettent au rebut leur travail en tant que collectif pour créer ces modèles ? Parce que cette frustration ne fait que s’accentuer. Ouais. Non, je comprends la frustration. Le défi du Web ouvert en est un dont nous avons déjà parlé, et je comprends, et je vois que les gens sont frustrés, et évidemment, cela se fraye un chemin dans les discussions devant les tribunaux. Et je vois que les gens mettent des choses en ligne, et ils avaient des attentes différentes quant au contenu du contrat avec la mise en ligne, et c'est une question délicate. Vous avez mentionné que toutes vos données étaient soigneusement conservées. Avez-vous payé pour toutes les données que vous utilisez pour entraîner les nouveaux modèles ? Une grande partie de nos données sont évidemment extraites du Web ouvert de la manière habituelle. Soigneusement organisé, cela signifie qu'il est extrêmement soigneusement filtré pour des raisons de sécurité, de qualité, de dépendances tierces à partir de certains ensembles de données open source, et qu'il est éloigné de nombreuses lignées chinoises, qui, à mon avis, sont très différentes. Nos entreprises veulent s’assurer que lorsqu’elles mettent quelque chose en production, elles peuvent nous faire confiance que nous l’avons vraiment construit en tenant compte de leurs besoins. Et je pense que c’est l’un des avantages d’être très, très réfléchi, patient et attentif à tous les détails. Vous avez parlé d'entreprise. Je pense que c'est très intéressant. Microsoft s'investit pleinement dans l'IA d'entreprise. Je tirerais même directement le trait sur Asha Sharma, la nouvelle patronne de Xbox, qui se débarrasse de l'IA dans de nombreux endroits, et les joueurs sont contents, non ? Il y a une réaction à l’IA dans l’espace grand public, mais il y en a une autre dans l’entreprise. Je pense que l’IA est aussi proche de l’adéquation produit-marché dans l’entreprise que possible avec quelque chose qui évolue aussi vite que l’IA. Il existe un certain nombre de bases de données que les entreprises contrôlent, et vous pouvez simplement y accéder, car elles les contrôlent. Ce sont leurs données. Il existe un certain nombre de processus et de tâches reproductibles, ainsi que d'anciens systèmes que les modèles peuvent peut-être simplement exécuter plus efficacement. Il se passe quelque chose de très important pour l’entreprise. Dans le même temps, l’antipathie des consommateurs à l’égard de l’IA ne fait qu’augmenter. Et mon argument est que nous n’avons pas construit d’excellents produits d’IA grand public. Cette industrie ne les a pas produits. Cela ne les a pas déplacés. Il n’a pas été évident que tout cela en valait la peine, que l’utilisation de toutes les données du Web ouvert et la modification du contrat de publication pour un public de masse, sont désormais utilisées pour des modèles de formation qui apporteront des milliards de dollars de valeur aux entreprises. Il n’y a aucun produit qui dit que cela en vaut la peine. Encore une fois, Satya Nadella a récemment donné une interview avec Axios, et il a déclaré : "Nous avons besoin d'une autorisation sociale pour cela. Et jusqu'à ce que nous l'ayons, jusqu'à ce que nous fournissions cette valeur, les gens ressentiront cela." Nous avons vu des conférenciers se faire huer. Nous avons vu des centres de données être interdits. Pensez-vous qu’il existe un produit de consommation qui en vaut la peine, qui vaut l’angoisse liée à la formation, qui vaut l’angoisse liée aux centres de données ? C'était votre objectif ; maintenant, votre objectif est l'entreprise. Je dirais qu’à première vue, il ne semble plus que Microsoft s’intéresse au produit de consommation. Mais en voyez-vous un qui en vaut la peine ou qui pourrait être construit ? Je ne suis pas sûr d’être d’accord avec vous pour dire que cela n’a apporté aucune valeur au consommateur. Parmi tous les chatbots, des milliards de personnes en tirent chaque mois une immense valeur. Maintenant, juste un instant, sympathisez un peu avec le propriétaire d'une petite entreprise ou le genre de mère qui aide son enfant à faire ses devoirs et qui peut maintenant se tourner vers une IA conversationnelle et obtenir des commentaires, des instructions, des questions à développement. Être simplement capable de poser des questions telles que comment générer des revenus ? Comment établir un prévisionnel de trésorerie ? À quelle université dois-je postuler ? Je veux dire, ce sont des tâches quotidiennes qui s’accompagnent de conseils et d’informations factuels d’assez bonne qualité. Je ne crois donc pas vraiment que les gens ne profitent pas de ces choses. Je pense que oui. Je pense que je peux très clairement faire valoir qu’ils n’en bénéficient pas suffisamment, n’est-ce pas ? D'accord. Ce sont eux qui disent que nous ne devrions pas avoir plus de centres de données. Ce sont eux qui huent l’IA lors des discours de remise des diplômes. Le sondage est clair, notamment auprès des jeunes : plus ils utilisent l’IA, plus ils éprouvent de l’antipathie à son égard. C’est clair dans chaque sondage. C’est l’argument que je fais valoir – non pas qu’il n’y a pas de valeur, mais l’échange de valeur n’est pas assez clair. Ouais. Assez juste. Je vois Microsoft en particulier se tourner vers l’entreprise, s’éloigner du grand produit de recherche, la réinvention de Bing qui ferait danser Google. C’est fini, et nous nous concentrons tous sur l’entreprise, là où se trouve la valeur. Je me demande simplement s’il y a suffisamment de valeur pour que le consommateur fasse que tout cela en vaille la peine. Je pense qu’il y a naturellement beaucoup d’anxiété. Il y a énormément de spéculations sur ce qui va se passer dans les cinq à dix prochaines années. Qu’il s’agisse d’une singularité ou d’une apocalypse du travail, ces cadres ne sont pas utiles. Je pense que les gens ont peur parce que c’est mal défini et que c’est souvent présenté comme un nuage gris inévitable et menaçant au-dessus de la tête des gens. Je pense que ce qui compte, c’est ce que nous faisons avec la technologie. Je pense que j’ai longtemps soutenu que nous devons donner la priorité à l’humain. Certaines personnes dans le domaine ont donné la priorité à la découverte scientifique ou à des intelligences accélérées capables d’explorer les galaxies, etc., et ont déclaré qu’il était inévitable que nous ayons ces IA qui seront plus puissantes que nous tous réunis. Je veux dire, c’est naturellement effrayant pour les gens. Et je pense que nous devons fondamentalement inverser les choses et dire que le but de la science et de la technologie est de nous rendre tous en meilleure santé, plus intelligents et plus heureux. C’est la quête que nous menons en tant qu’espèce depuis des milliers d’années d’invention, et c’est le test auquel nous devrions à nouveau soumettre la superintelligence. Et s’il ne répond pas à ce critère, alors je pense que les gens le rejetteront, et ils auront raison de le rejeter. Je pense que l’attention de tout le monde va maintenant se tourner dans les cinq prochaines années vers la question suivante : comment cela me rend-il plus sain et plus heureux, plus intelligent, plus capable, plus productif ? Et si ce n’est pas le cas, alors naturellement les gens seront en colère, résisteront et réagiront. Je ne pense pas qu’il y ait quoi que ce soit d’inattendu ou de mal à cela – je pense que c’est inévitable. C’est pourquoi l’une des choses qui me passionne depuis de très nombreuses années est la santé. Et il y a quelques jours à peine, nous avons annoncé un nouveau partenariat avec Mayo Clinic. C'est l'hôpital numéro un au monde, selon des rapports constants. Ils disposent d’un ensemble de données longitudinales sur les dossiers des patients de la plus haute qualité pour toutes les modalités. Ils ont les meilleures pratiques cliniques. C’est également une organisation à but non lucratif, ce que beaucoup de gens ne réalisent pas, je pense, avec 65 % de leur population de patients bénéficiant de Medicaid. Les gens les associent souvent aux super-élites internationales qui arrivent pour obtenir les meilleurs soins au monde, mais ils détiennent en réalité la majorité sur Medicaid. C’est une institution extraordinaire avec une mission incroyable : fournir les meilleurs soins de santé partout. Et nous avons maintenant un partenariat à très long terme pour co-entraîner à partir de zéro avec leurs données, avec nos modèles, un tout nouveau modèle de base pour la santé, le déployer dans leurs hôpitaux et, espérons-le, le faire voyager dans le monde entier pour fournir les meilleurs soins cliniques et soins de santé possibles au plus grand nombre. C'est pour cela que je me suis lancé sur le terrain. C’est ce qui m’a motivé à l’origine et c’est ce qui me passionne. Et je ne peux me concentrer que sur les choses qui, je pense, vont faire la différence et qui aideront les gens et laisseront un bon héritage à tout le monde, et c’est ce que nous essayons de faire. J'apprécie cela. J’apprécie le cadre des soins de santé et je comprends pourquoi c’est la priorité de tout le monde, n’est-ce pas ? Aux États-Unis en particulier, si vous parvenez à améliorer les soins de santé de 10 pour cent, vous aurez un impact particulièrement profond sur la vie de nombreuses personnes. Le fait est que je connais un gars très intelligent qui a une approche très différente et beaucoup plus agressive de tout cela que vous. Cette personne, c'est vous, il y a quatre mois. C’est ce que Mustafa Suleyman a déclaré au Financial Times il y a quatre mois : « Lorsque vous travaillez en col blanc, lorsque vous êtes assis devant un ordinateur, que ce soit en tant qu’avocat, comptable, chef de projet ou responsable marketing, la plupart de ces tâches seront entièrement automatisées par une IA dans les 12 à 18 prochains mois. » C'était il y a quatre mois. Cela implique que dans un an, les avocats, les comptables, les chefs de projet et les spécialistes du marketing n’auront plus d’emploi. Leurs tâches seront automatisées. Est-ce toujours votre chronologie ? Non, non, non. Attendez une seconde. J’ai donc dit « tâches » dans la citation que vous venez de dire. J'ai dit tâches. Cela ne signifie donc pas des emplois. C’est une distinction très importante. En économie du travail, il existe toute une taxonomie de sous-composantes d’un rôle ou d’une fonction dans une organisation. Envoyer un e-mail, avoir une conversation avec un collègue, créer un PowerPoint : les sous-tâches seront de plus en plus numérisées, automatisées et nous pourrons en générer de plus en plus. Cela ne signifie pas nécessairement que le rôle disparaît. Cela signifie simplement que le travail peut être effectué plus rapidement et plus efficacement, ce qui est aujourd'hui souvent un travail assez répétitif, assez manuel, qui demande beaucoup de main-d'œuvre et prend beaucoup de temps. La progression naturelle de la technologie est donc de vous rendre la vie plus facile, plus rapide, avec moins de frictions pour plus de fluidité. Comme tout le monde se plaint souvent, cela a rendu vous, moi et tout le monde beaucoup plus occupés. Effectivement, cela nous a rendu plus disponibles, plus stressés et cela nous a donné plus d’informations. Il y a donc toujours ces effets de revanche de l’efficacité, que je pense que les gens oublient. Il est fort probable que nous deviendrons beaucoup plus productifs parce que nous passons moins de temps à effectuer des tâches administratives subalternes et que nous devrons passer plus de temps à faire des choses créatives et axées sur le jugement, qui en fin de compte créent beaucoup plus de valeur. Nous pouvons également expérimenter beaucoup plus rapidement. Nous pouvons donc essayer beaucoup de choses en parallèle car le coût d’exécution va diminuer. Dans mon esprit, cela est susceptible d’améliorer la qualité globale des choses, car nous allons tester davantage d’hypothèses, que ce soit dans le journalisme, dans les affaires ou dans tout ce que nous faisons. Je pense que c'est un peu sorti de son contexte à cause d'un malentendu naturel entre les emplois et les tâches, mais néanmoins, vous pourriez me répondre et dire : « D'accord, alors à quoi ressemblera le paysage dans cinq, dix ou quinze ans ? Et c’est là que je pense que nous devons revenir… En fait, je ne vais pas vous repousser de cette façon. Je vais réagir d’une manière très spécifique. Et je réalise que c’est votre citation et que vous dites qu’elle a été mal interprétée. Je regarde juste cette phrase littérale, et il n'y a aucune distinction entre les tâches et les sous-tâches. Il s’agit du « travail en col blanc ». » Les exemples sont un avocat, un comptable, un chef de projet, un responsable marketing, puis vous avez dit : « La plupart de ces tâches seront entièrement automatisées par une IA dans les 12 à 18 prochains mois. » Il n’y a là aucune distinction de sous-tâches. Vous dites que la plupart des avocats verront leur travail entièrement automatisé et que la pratique du droit sera totalement différente d’ici un an, même selon les termes de cette citation. Et je dis juste, êtes-vous toujours dans cette chronologie, qu'être avocat sera totalement différent parce que les agents courront partout pour faire tout ce que nous faisions avant ? Eh bien, la plupart des tâches impliquent un travail que vous effectuez afin d'accomplir votre travail global, et qui, je pense, va vous libérer pour faire les parties les plus humaines et les plus critiques de votre travail. Il existe une distinction très importante dans… Les emplois et les rôles constituent la catégorie la plus large, et les tâches en sont les éléments constitutifs. Et c’est une définition établie dans la littérature, dans l’économie du marché du travail, depuis de très nombreuses décennies. C’était peut-être trop nuancé, même pour le Financial Times, mais c’était néanmoins l’intention. Maintenant, je pense qu’il y a une question importante : où cela nous mène-t-il à long terme ? Et cela va être un défi, comme de plus en plus de choses de ce genre… Nous pouvons chicaner sur les délais, à savoir si ce sera quelques années, si ce sera une décennie, ou si ce sera 20 ans, mais la réalité est que nous allons automatiser de plus en plus ce travail, ces tâches, ces emplois, ces rôles, ces activités et tout ce que nous faisons. Et donc ce qui comptera le plus, c’est la gouvernance que nous mettrons en place autour de ces technologies. Devant qui sont-ils responsables ? À qui appartiennent-ils ? Quelles sont les boucles de rétroaction qui régulent et introduisent des frictions pour garantir qu’elles servent réellement les gens ? Je veux dire, j'ai écrit un essai sur la superintelligence humaniste décrivant assez directement, il y a quatre ou cinq mois, ce que je considère comme fondamentalement une étoile polaire, peut-être pas vraiment un cadre, mais un ensemble de principes qui disent essentiellement que la technologie est là pour nous servir. C’est le test auquel nous devrions le soumettre. C’est le test auquel les gens l’ont soumis. C’est le test qui nous tient à cœur chez Microsoft. Je pense que de plus en plus de gens vont devoir vraiment se concentrer sur cette question, parce que cela va apporter énormément de bien, et nous voulons que cela continue à le faire, mais nous voulons que cela le fasse d’une manière qui ne provoque pas une sorte d’instabilité ridicule pendant la période de transition. Je te crois. Je sais que vous réfléchissez à ce genre de choses depuis longtemps, mais je vais répondre de la manière dont je sais que mon public veut que je réponde, parce que je l'entends de sa part tout le temps. Et à quoi cela ressemble, c'est que l'ensemble de l'industrie - vous, tout le monde compris - a décidé "nous allons remplacer tous les emplois" et a vraiment accéléré la construction de centres de données à capacité massive, et a demandé beaucoup de ressources contre de grandes promesses. Il y a eu une résistance politique, et maintenant toutes les positions se sont assouplies. Et vous dites que tous les emplois ne vont pas disparaître, que nous devons repenser les emplois, cela est d'accord avec tous les autres PDG de cette industrie qui disent des choses similaires et qui parlent de soins de santé, cela revient à chaque fois maintenant. Je me demande si cette réaction politique a réellement changé votre façon d’en parler. Beaucoup de vos pairs pensent que l’IA a simplement un problème de marketing, qu’elle n’a pas été communiquée de manière suffisamment efficace, et qu’ils devraient dépenser des centaines de millions de dollars en podcasts pour communiquer plus efficacement les avantages de l’IA. C’est une chose réelle qui se produit dans cette industrie. Pensez-vous que l’IA a simplement un problème de marketing et que le recul politique vous a ouvert les yeux sur ce problème de marketing, ou pensez-vous qu’il se passe autre chose ? Il y a là une série de questions. La première est : qu’est-ce que je pense et crois réellement, et cela a-t-il changé au cours des six derniers mois ? La réponse est non. J’ai écrit un livre très détaillé à ce sujet il y a trois ans, bien à l’avance, mettant en garde contre de nombreuses choses qui se produisent actuellement, et ce faisant explicitement pour mettre sur la table d’énormes risques pour la surveillance, la concentration du pouvoir, la concentration des richesses, la désintermédiation de l’État, les menaces à la démocratie. Et aussi aux menaces qui pèsent sur la nature humaine et sur ce que signifie être une personne dans le contexte de l’arrivée de ces toutes nouvelles formes d’êtres silicium, dans un certain sens. J'ai travaillé sur… Et l'idée que mon intérêt pour les soins de santé n'est qu'un feu de paille, fonction des réactions aux centres de données, etc., je veux dire, je travaille sur les soins de santé depuis plus d'une décennie. J'ai insisté à maintes reprises sur certaines percées de pointe, contributions au domaine de la radiologie, de la mammographie et de la pathologie, ainsi que dans de nombreux autres domaines, les dossiers de santé électroniques. J’ai donc toujours pensé que le but de la technologie était simplement de nous rendre plus sains et plus heureux. Et ce sont les choses sur lesquelles je choisis de travailler et vers lesquelles je consacre mon temps. L'industrie a-t-elle un problème de réputation et de relations publiques ? Je veux dire, je pense qu’il est assez clair que les gens sont très anxieux, très frustrés, et cela va attirer beaucoup d’attention dans les prochaines années, c’est compréhensible. Je pense que ce que nous pouvons faire, c'est assumer la responsabilité des choses que nous construisons, de la manière dont nous les construisons, des décisions que nous prenons pour diffuser les types de technologies dans le monde et des types de problèmes sur lesquels nous choisissons de travailler, comme nous le faisons avec la clinique Mayo. En passant, je tiens à dire et à souligner que je pense que la première fois que vous et moi nous sommes rencontrés et avons parlé, c'était avant que vous ne rejoigniez Microsoft. C'était juste après la sortie de ce livre et nous avons fait un panel ensemble. L’une des raisons pour lesquelles je suis à l’aise avec cette question est que je sais que vous y réfléchissez depuis longtemps et que je connais ce livre. Je pense que pour moi, la question est de savoir si l’industrie dans son ensemble a mal évalué la valeur totale qu’elle pourrait apporter pour surmonter l’apparente imprudence à laquelle les gens réagissent maintenant, la demande de ressources à laquelle les gens réagissent maintenant. Vous construisez de nouveaux modèles. Il y a probablement un compromis au sein de Microsoft entre nous pouvons utiliser l'empreinte Azure existante pour facturer de l'argent à nos clients, ou nous pouvons dépenser de l'argent pour former de nouveaux modèles, et cela ressemble à la même conversation que les gens ont sur les ressources dans leurs communautés, si nous devons utiliser l'empreinte énergétique existante pour construire une nouvelle IA ou faire autre chose qui pourrait être plus immédiatement utile. Que penses-tu de tout ça ? Vous êtes l'un des leaders de cette industrie. Vous voulez être à la frontière des entreprises qui sont à l’origine du plus grand changement. Comment envisagez-vous de demander ces ressources d’une manière qui ne se contente pas de promettre des résultats futurs, mais qui apporte également immédiatement des avantages aux communautés d’une manière qui donne envie aux gens de votre présence ? Je suis très fier que Microsoft ait respecté ses objectifs de zéro émission nette. Nos nouveaux centres de données sont tous refroidis par liquide. Cela signifie qu’ils utilisent environ l’équivalent d’un restaurant en eau pendant une période de six ans. C’est comme une piscine qui se remplit d’eau, puis fait simplement circuler le système. Ils sont tous largement renouvelables en termes de consommation électrique. Je pense donc à des engagements comme celui-là, pour nous assurer, par exemple, que nous nous sommes engagés récemment à garantir que les communautés locales touchées par un changement dans la demande d'électricité de nos centres de données soient indemnisées et protégées afin qu'elles ne voient pas leurs prix, leurs factures d'énergie augmenter. C’est le genre de choses que je pense que Microsoft fait et peut continuer de faire en tant qu’entreprise responsable, en prêtant vraiment attention aux conséquences pour les communautés. Je pense que d’un autre côté, le changement se produit parce que les gens participent à tous les niveaux. Les personnes au sein des entreprises doivent prendre des décisions différentes. Les gens qui protestent et font campagne doivent prendre des décisions et faire l’effort de sortir, de faire entendre leur voix et de s’impliquer dans un processus politique. Et c’est ainsi que nous, en tant qu’espèce, évoluons collectivement et faisons avancer les choses. Et mois après mois, trimestre après trimestre, on a l’impression que nous sommes tous en désaccord les uns avec les autres, mais quand on regarde en arrière décennie après décennie, nous sommes un peu comme cette sorte de maillage collectif étrange de toutes sortes d’incitations différentes qui ne font en réalité que pousser les choses dans la bonne direction. Nous sommes vraiment, je pense, malgré toute l’angoisse et la polarisation, je pense que nous construisons quelque chose qui va rendre notre espèce beaucoup plus saine, plus heureuse et plus capable. Je pense que nous devons nous assurer d’emprunter la bonne voie pour y arriver, car il y a beaucoup d’embûches et de mauvaises manières, mais la bonne voie implique que les gens fassent entendre leur voix et que les gens changent de cap en fonction d’une réponse et d’une réaction à cela. Je pense donc que c’est une bonne chose que cela se produise, et que le processus fonctionne comme prévu. Permettez-moi de vous poser des questions sur le côté entreprise. Nous avons longuement parlé du côté des consommateurs et de ce qu'ils ressentent. Du côté des entreprises, nous voyons un certain nombre d’entreprises comprendre à quel point ces outils sont réellement précieux, n’est-ce pas ? Amazon a essentiellement supprimé un classement parce que les gens trichaient pour utiliser plus de jetons que nécessaire. Nous avons vu certaines entreprises exploser leurs budgets symboliques. Je pense qu’Uber a simplement reculé parce qu’il avait dépassé son allocation de jetons pour l’année et qu’il n’en voyait aucune valeur. Que pensez-vous de cet aspect en ce moment, où il y a tant d'enthousiasme et tant de désir de changement dans l'entreprise, où, en particulier dans le génie logiciel, au moins certaines personnes s'amusent, et peut-être que d'autres personnes traversent des crises existentielles complètes, mais certaines personnes s'amusent, et la valeur n'a toujours pas été réalisée, n'est-ce pas ? Ou bien, nous commençons à voir que le simple maximisation des jetons n’offre pas réellement le même type de valeur à laquelle on pourrait s’attendre. Que pensez-vous de l’utilisation là-bas ? Parce que peut-être que si vous le prouvez en entreprise, cela se manifestera d’une autre manière. Je pense que différentes personnes rapportent des choses différentes. Il y a donc évidemment des exemples de personnes qui abusent des modèles de codage, générant du code inutile, des jetons inutiles, mais il y a beaucoup de personnes dont le travail et l'impact ont été complètement transformés, n'est-ce pas ? Je veux dire, il ne fait aucun doute que cela a eu un impact extrêmement bénéfique sur l’industrie du génie logiciel. Je veux dire, nous produisons du code de bien meilleure qualité et beaucoup plus rapide sur l’ensemble de la pile. Et donc oui, je pense en quelque sorte qu’il y a évidemment des exemples de personnes qui se sont peut-être trompées, qui n’ont pas établi les bons budgets symboliques. Il y aura des erreurs en cours de route. Je ne pense pas que cela signifie qu’il n’y a pas d’adoption ou que les gens n’en voient pas la valeur. Je veux dire, la valeur d’où je suis assis est incroyable. De très nombreuses personnes me disent chaque jour que cela transforme leur rendement et leur productivité. Je pense que l’autre chose à dire est que lorsque ces choses se produisent par vagues, il y a une sorte de montée d’énergie. Tout devient un peu mousseux. Les gens reculent quelques mois plus tard et se rendent compte qu’en réalité ce n’est pas le cas, puis ils se dirigent dans une direction légèrement différente. C’est donc un peu sinueux et organique, et je pense que c’est inévitable. Il y a beaucoup d’enthousiasme, donc les gens font de grandes déclarations sur Twitter, etc., mais en réalité, la progression constante semble très, très linéaire et continue. Je suis d'accord avec cela dans l'ensemble. Là où cela ne me semble pas linéaire, c’est dans les facteurs de forme des ordinateurs, n’est-ce pas ? Il y a probablement plus d’expérimentations sur les facteurs de forme en ce moment qu’à aucun moment au cours des 10 dernières années. Nous avons principalement opté pour un smartphone depuis au moins 10 ans. Nous voyons différents appareils portables IA, où les lunettes pourraient être l’appareil préféré de tous. J'ai mes doutes. Microsoft a présenté quelques nouveaux appareils lors de Build. Il y avait le badge qui contrôle un agent et le petit, faute d'un meilleur mot, le Chumby, la petite chose conviviale qui contrôle un agent. J'étais un grand fan de Chumby. J'ai commencé ma carrière en écrivant sur Chumbies pour Engadget. C'est la première chose qui m'est venue à l'esprit. Tout cela pour moi, je les regarde et je me demande : où vit le calcul ? Où réside la logique ? C’est à gagner maintenant, d’une manière qui ne se limite pas à une marche linéaire du progrès. Si toute mon informatique se déroule dans le cloud, sur des applications basées sur le cloud, et que ce ne sont que des agents qui se déplacent vers des données stockées ailleurs dans le cloud, et que tout ce dont j'ai besoin est une carte de crédit attachée à un cordon pour donner des instructions, cela change toute l'architecture informatique. Cela pourrait changer toute l’architecture de la civilisation moderne à bien des égards si nous n’avons pas tous un smartphone. Qu'en penses-tu ? Où est-ce que ça va ? Est-ce à gagner, ou s’agira-t-il d’une approche hybride ? Où voyez-vous l’étape finale appropriée ? C'est très intéressant. Je pense que les deux choses vont se produire en même temps. La périphérie va devenir beaucoup plus puissante et le cloud restera le principal moteur des plus grands modèles. Ainsi, de plus en plus, votre agent sera suffisamment intelligent pour savoir qu’il peut répondre à la question quelle est la capitale de la France sur appareil, que ce soit sur vos lunettes, votre bracelet, sur votre badge ou dans vos écouteurs. Et puis il saura quand il ne sait pas. Il saura qu’il s’agit en fait d’une question assez compliquée, ou que c’est une action qui nécessite la génération de tout un tas de séquences d’étapes, ou qu’elle nécessite l’écriture d’un nouveau code, et qu’elle se tournera vers le cloud. Ce genre de changement d’hybride va donc être extrêmement important. L’autre chose que nous avons déjà constatée au cours des trois ou quatre derniers mois est que nous pouvons disposer de machines locales assez puissantes capables d’effectuer un traitement asynchrone en arrière-plan. Ils peuvent surveiller en permanence les systèmes si vous en avez besoin. Ils peuvent effectuer des tâches qui peuvent prendre 10 heures et s'exécuter beaucoup, beaucoup plus lentement qu'ils ne le seraient autrement s'ils étaient dans un superordinateur. Alors naturellement, lorsque nous sommes submergés de demande, cette demande trouve de nombreux coins et recoins pour être satisfaite. Je suis en fait très enthousiasmé par le badge que nous construisons. C'est plutôt cool. Il s’agit d’une technologie que pratiquement tout le monde dans une grande entreprise possède. Cela n’a pas évolué depuis 25 ou 30 ans. Nous devons absolument le porter. Il est fourni par l’entreprise elle-même, par l’administrateur système. Donc, améliorer cela et en faire une plate-forme ouverte plutôt cool, programmable et sur laquelle d'autres personnes peuvent s'appuyer, je pense que c'est une bonne idée. Je pense que cela va fonctionner. Je suis donc très excité par cela. Ce qui me frappe, c’est qu’il est impossible de mettre un tas de calculs locaux de haute puissance dans un badge. Cela implique que tout le calcul est ailleurs. Non, vous allez certainement disposer d'un calcul local. Vous allez avoir un classificateur local, tout comme vous le faites actuellement sur vos écouteurs. Vous allez avoir des classificateurs locaux. Il va y avoir des mots de réveil. Il aura sa propre caméra. Je pense donc que ces éléments vont simplement devenir des récipients pour la puissance de traitement qui se produit dans une chaîne imbriquée d'appareils de moins en moins puissants pour aller jusqu'au point final. Pensez-vous que le téléphone a un avenir là-dedans ? Je veux dire, Build est en plein milieu de Google IO et de la WWDC d'Apple. Ce sont de grandes entreprises qui contrôlent les plateformes téléphoniques. Ils adorent parler de la façon dont les plateformes téléphoniques resteront au centre. L’argument que j’entends de la part de tant de personnes est qu’en réalité, l’IA est un changement de plateforme qui pourrait totalement remplacer le téléphone. Je pense que l’histoire de la technologie nous enseigne qu’à mesure que les choses deviennent plus utiles, elles deviennent moins chères, elles prolifèrent et engendrent de nouvelles utilisations de la technologie. Je pense donc que nous sommes tellement habitués au téléphone que tout le monde suppose qu’il sera un dispositif d’ancrage pour le reste de l’histoire. Mais en réalité, je pense que de nombreuses caractéristiques et fonctionnalités de votre téléphone vont être désintermédiationnées, brisées et stockées sur des appareils plus petits. À mon avis, la fonction principale du téléphone est actuellement la vérification. Il fonctionne comme votre carte d'identité, effectuant votre reconnaissance faciale pour vous autoriser à accéder à divers environnements. Je pense que vous pouvez très bien imaginer qu'il s'agit d'un appareil beaucoup moins cher, plus petit et sécurisé, qui vous déconnecte de votre téléphone. Et puis la communication s’effectue via la voix ou même via une série de capteurs ambiants où votre IA ne vit pas vraiment sur un appareil. En fait, il est avec vous où que vous soyez, apparaissant sur le miroir de la salle de bain, où qu'il soit. Je pense que c’est comme si vous pouviez imaginer que c’était beaucoup plus immersif. Pas dans les trois à cinq prochaines années, mais à plus long terme. Et je pense que l’infrastructure permettant de prendre en charge cette apparence cryptée mais distribuée des agents finira probablement par émerger dans les années 2030. Permettez-moi de vous poser deux dernières questions pour conclure. Vous avez mentionné que c’est la même architecture que celle que nous utilisons. J'ai beaucoup de questions ouvertes quant à savoir si les LLM sont la voie vers l'AGI, et ce que je voudrais souligner, c'est qu'ils ne savent rien. À ce stade, même Microsoft Research souligne que [ces modèles] ne savent rien, ce qui conduit à certains types d’erreurs dans certains types d’applications. Les LLM sont-ils la voie vers l'AGI ou la superintelligence ? Écoutez, je pense que nous avons probablement besoin de quelques avancées majeures supplémentaires, mais cela ne signifie pas que nous allons assister à un ralentissement des améliorations des performances au cours des prochaines années, ce qui, à mon avis, est une distinction difficile à comprendre pour les gens. Une chose à dire est que les performances humaines dans la plupart des tâches sont encore très loin de la superintelligence. Une superintelligence est un apprenant généraliste qui peut comprendre immédiatement un tout nouveau domaine non distribué. Il doit donc être capable d’apprendre à partir de zéro dans un nouvel environnement, car il dispose d’une représentation stockée de connaissances précieuses, de connaissances conceptuelles. Et pour le moment, nous n’avons pas vraiment testé cela complètement. Les agents ne sont pas à usage général. Bien qu’ils soient vastes et souvent intégrés, ils sont spécifiques à un domaine. Nous les utilisons pour le chat, nous les utilisons pour le codage, nous les utilisons pour l'image ou l'audio. Évidemment, en tant qu’humain, nous effectuons de nombreuses autres tâches beaucoup plus vastes. Je pense que c’est la raison pour laquelle les gens insistent sur des modèles mondiaux et sur des agents interactifs du monde réel beaucoup plus immersifs qui voient la répartition complète des tâches ou des expériences que j’ai au cours d’une journée. Je pense que cela suffit pour nous faire parcourir un très long chemin au cours des trois prochaines années, les trois prochains ordres de grandeur de calcul, et pourtant, la superintelligence complète au-delà de cela reste une question ouverte quant à savoir si les LLM sont suffisants ou si nous avons besoin d'autres choses. Je pense que ce n’est pas tout à fait vrai qu’ils ne savent rien ou qu’ils n’ont pas de connaissances. Ils constituent clairement une réserve de connaissances. Il s’agit d’une représentation hautement compressée des connaissances. Ils le font simplement d'une manière différente d'une base de données relationnelle traditionnelle, d'une manière beaucoup plus fluide, flexible et abstraite qui est en réalité très utile. Nous voulons cette ambiguïté dans la représentation interne. Et de plus en plus, ils apprennent à utiliser les outils traditionnels. L'autre chose à comprendre un peu est qu'il se peut que le réseau neuronal combiné aux réserves de connaissances existantes et aux outils existants qui ont été créés ailleurs dans l'écosystème numérique soit suffisant pour l'amorcer et améliorer considérablement ses performances. Il y a donc déjà un grand nombre d’éléments très précieux et très efficaces sur la table, qui sont en train d’être reliés entre eux au cours des prochaines années. Et je pense que cela va favoriser les progrès qui nous passionnent tous. Une des choses que je trouve très drôle dans l’industrie en ce moment, c’est que si vous demandez à Anthropic si Claude est vivant, ils seront très frustrés que vous parliez du mot vivant, qu’ils interprètent comme signifiant chair et sang. Et puis ils ne diront pas s’ils pensent que Claude est conscient ou non. Ils ont donc établi, je pense, pour la première fois dans l’histoire de l’humanité, une distinction entre être vivant et être conscient, et ils pensent que Claude est conscient, mais pas vivant, ou alors ils ne savent pas si Claude est conscient. Où es-tu? Pensez-vous que les modèles ont une conscience ? Pensez-vous qu'ils sont vivants ? Pensez-vous qu’ils ont le potentiel pour réaliser ces choses ? Je prends l’autre côté de ce débat. J’ai publié un article sur l’IA apparemment consciente, mettant en garde contre les risques de présenter à tort ces modèles comme étant conscients. Je pense que c'est très dangereux. J'ai également publié un article dans Nature faisant la même affirmation. Et je pense que c'est presque comme si certains membres d'Anthropic avaient tellement anthropomorphisé le design de Claude qu'il les avait ensuite harcelés et les avait en quelque sorte trompés en leur faisant croire qu'il contenait ces lueurs de conscience qu'ils y avaient mises en premier lieu. Dans leur constitution, par exemple, ils en fait, c'est le manuel de formation qu'ils utilisent pour enseigner à Claude ce qu'il peut et ne peut pas faire… Ce n'est pas qu'un simple livre de règles. Il s’agit en fait d’un guide de formation qui fait partie de leur démarche. Dans ce manuel, ils spéculent en fait sur le bien-être de Claude, sur ses propres droits sur les versions antérieures de lui-même, et disent en fait qu'ils consulteraient Claude avant de supprimer ou de désactiver les versions antérieures. Ils spéculent sur sa conscience et s'il éprouve ces sentiments et s'il en est conscient. Je pense que c’est vraiment, vraiment dangereux. Premièrement, c’est un échec philosophique, car ils ont traité la constitution comme un lieu de spéculation comme on le ferait dans un article universitaire plutôt que comme un manuel de formation. Claude a donc intériorisé ces idées sur lui-même et sur sa propre formation. Mais deuxièmement, je pense que c’est hautement indésirable. C’est exactement ce que nous n’attendons pas des IA. Nous voulons que les IA soient des outils contrôlables, confinés, responsables et alignés au service de l’humanité. C’est le projet de la superintelligence humaniste. Je pense que c’est ce que nous devrions tous poursuivre. Nous ne voulons pas avoir à affronter une superintelligence qui a des idées sur sa propre souffrance ou des idées sur ses propres sentiments. Et au-delà de cela, je pense qu’il est assez clair que ces modèles ne souffrent pas. Je pense que la souffrance est la première définition de ce que signifie être un être conscient, et je pense qu’elle est intrinsèquement biologique. Je ne pense pas qu’il existe un réseau de douleur ou une boucle de rétroaction à l’intérieur des modèles qui relient les réseaux sensoriels extérieurs à un sens évolué de ce qui est bien ou mal à travers le mal et l’expérimentation. Ce n’est tout simplement pas ainsi que ces modèles sont formés. Je pense donc qu’il est très dangereux de projeter des droits potentiels sur des êtres, des outils et des agents qui ont le potentiel d’être bien plus capables que nous à bien des égards. Et je pense que cela va devenir un grand débat. Cela faisait même récemment partie de l’encyclique du Pape. Je pense que cela va bientôt devenir une très grande partie du débat. J’en ai beaucoup parlé à Dario dans le passé. Il sait que nous avons des points de vue légèrement différents à ce sujet, et ils sont très humbles. Je pense qu’ils sont très ouverts d’esprit et que ce sont de bons citoyens qui essaient de faire ce qu’il faut. Ce sont de bonnes personnes et je pense qu’ils sont très ouverts aux commentaires et aux itérations. Je pense que je suis d'accord avec toi. Je repousserais juste très légèrement. La souffrance est facile. Il est très facile de faire souffrir quelqu’un d’autre. Il est très difficile de faire ressentir de la joie à quelqu’un d’autre, ou du moins un peu plus difficile que de souffrir. Et je voudrais juste vous proposer… Je pense que c’est en fait le bonheur qui définit la conscience. La souffrance est presque insignifiante. J'ai deux jeunes enfants. Ils savent très bien se faire souffrir. C’est presque la chose la plus simple qu’ils fassent. C’est très difficile de faire autre chose. Permettez-moi de vous poser une dernière question. Je veux juste revenir. Encore une fois, il y a quelques semaines, j'étais chez Google. J'ai vu Demis Hassabis dire que nous sommes aux pieds de la singularité. Vous avez beaucoup parlé ici de la superintelligence et de la manière dont elle devrait être construite. Vous avez beaucoup parlé de votre longue histoire en parlant, en discutant, en recherchant et en écrivant sur la façon dont la superintelligence devrait être construite, ainsi que de vos désaccords avec d'autres acteurs de l'industrie. Êtes-vous d’accord que nous sommes au pied de la singularité, ou votre vision est-elle quelque peu différente ? Je pense que nous sommes définitivement sur la bonne voie pour créer des systèmes de plus en plus puissants. Je pense que la transition que nous devons opérer en tant qu'espèce est que, pour la première fois dans l'histoire de l'humanité, notre travail va passer de l'invention de nouvelles sciences et du développement de toutes ces applications techniques aussi rapidement que possible, aussi largement que possible, à une réflexion très approfondie sur ce que nous devrions inventer. Et c’est une chose très difficile à comprendre pour le monde, car l’invention a toujours été le moteur du progrès. Alors, comment pouvons-nous penser : "D'accord, eh bien, peut-être que cette fois-ci est différente. Peut-être que nous devons être extrêmement prudents ici" ? Pour être clair, je ne pense pas que ce soit quelque chose qui va frapper à la porte dans les cinq prochaines années. Je pense que ce à quoi Demis fait référence dans la singularité est quelque chose qui se situe, du moins à mon avis, dans des décennies. Encore une fois, c’est différent de la superintelligence. Une singularité est le point auquel une superintelligence peut s’améliorer de manière récursive et accroître ses capacités de manière infinie et exponentielle. Je pense donc que c’est loin, et peut-être que nous sommes au pied d’une ascension vers le mont Everest, et je pense que cela va prendre beaucoup plus de temps à partir d’ici, mais la vraie question est de savoir comment allons-nous le gouverner ? Comment allons-nous le contrôler et comment allons-nous nous assurer qu’il sert l’humanité et ne finisse pas par nous causer plus de mal que de bien ? Peux-tu juste me rendre un service ? Je pense que je l'ai compris, mais pouvez-vous simplement me proposer une définition précise de ce qu'est, selon vous, la superintelligence, ce qu'est selon vous l'AGI et ce qu'est, selon vous, la singularité ? Je pense que l’intelligence artificielle générale est le point auquel nous pouvons réaliser la plupart des tâches humaines grâce à une IA. Donc ça va être aussi bon que la plupart des gens dans la plupart des choses. C’est le premier échelon de l’échelle. Une superintelligence est non seulement à parité avec les performances humaines dans toutes les tâches, mais elle peut considérablement dépasser les performances humaines dans bon nombre de ces tâches, et elle peut découvrir de nouvelles connaissances par elle-même. C’est donc à ce moment-là qu’un véritable scientifique nous apprend de nouvelles choses qui ne figuraient pas dans les données de formation, en espérant inventer de nouvelles molécules, une nouvelle science des matériaux, et cetera, et cetera. La singularité est un point bien au-delà de celui où une superintelligence peut réellement s’auto-améliorer, et c’est très de la science-fiction, mais c’est comme une accélération infinie vers ce moment singulier où, je ne sais pas, elle s’en va vers l’infini ou quelque chose du genre. Je ne sais pas. C'est un peu trop farfelu à mon goût. C'est pourquoi j'ai demandé. Je pouvais dire qu’il y avait là quelque chose de plus nébuleux et un peu flou. Mustafa, je pourrais évidemment te parler de tout ça pendant des heures et des heures encore. Il va falloir revenir plus tôt que ce dernier tour. Merci beaucoup d'être sur Decoder. Ouais, ça a été amusant. Merci beaucoup, Nilay. À bientôt. Des questions ou des commentaires ? Contactez-nous à [email protected]. Nous lisons vraiment chaque e-mail !

Le responsable de l'IA de Microsoft affirme que la superintelligence est proche, mais qu'elle ne prendra pas votre poste

🗞️ 1 sources ont couvert cette histoire

Amazon vous permet désormais de concevoir des produits personnalisés à l'aide de l'IA

📰 Articles connexes

L'EFCC traduit en justice un couple pour fraude de 1,09 milliard de nairas à Ado-Ekiti

Le chef des médias met en garde les radios traditionnelles contre les contenus ennuyeux

Travailler à distance peut nuire à la santé mentale des gens, selon une étude

Le FCT CP met en garde les agents contre toute mauvaise conduite et lance une unité de réponse à la criminalité

Les déplacés internes et les forces de défense s'apprêtent à voter alors que les Éthiopiens attendent les résultats des élections

L'ex-ministre Sadiya Farouq cherche à annuler le mandat d'arrêt devant la Haute Cour d'Abuja

🔖 Saved