Глава Microsoft по искусственному интеллекту говорит, что суперинтеллект близок, но не отнимет вашу работу
📖 Источник статьи — 🇬🇧 АнглийскийСегодня я беседую с Мустафой Сулейманом, генеральным директором Microsoft AI. И на самом деле я собираюсь сделать сегодняшнее вступление коротким — на этой неделе я работаю на семейной ферме моей жены, как вы увидите в видео, но также это очень интересный эпизод.
Мы рассмотрели все: от подхода Мустафы к обучению новых моделей до его критики в адрес Anthropic, говорящего о Клоде так, будто он сознателен. Конечно, мы также говорили об отношениях Microsoft с OpenAI, о том, как Мустафа сейчас думает обо всех негативных опросах общественного мнения и политической критике вокруг ИИ, и достаточно ли хороши какие-либо потребительские продукты, чтобы преодолеть это.
Как я уже сказал, это горелка.
Хорошо: Мустафа Сулейман, генеральный директор Microsoft AI. Вот так.
Это интервью было слегка отредактировано для обеспечения длины и ясности.
Мустафа Сулейман, вы генеральный директор Microsoft AI. Добро пожаловать обратно в Декодер.
Приятно снова быть с тобой.
Я очень рад поговорить с вами. Наш предыдущий разговор был одним из моих любимых разговоров — об ИИ, о том, как он должен заставлять нас чувствовать и для чего он нужен — который я вёл во всех наших разговорах.
В Microsoft произошли некоторые большие изменения, возможно, какой-то очень важный переосмысление того, как люди относятся к ИИ, о чем я хочу поговорить с вами в частности. А еще есть Microsoft Build, большая конференция разработчиков Microsoft, на которой было много новых объявлений и много важных идей о том, для чего нужны компьютеры и, возможно, где они должны быть, и я хочу вникнуть в них.
Начнем с самого начала. Это кое-какие глубокие вещи о декодере, которые важно понять прежде всего. С тех пор как вы присоединились к Microsoft, вы изменили структуру работы искусственного интеллекта. Ваша роль изменилась. В последний раз, когда я разговаривал с вами, вы отвечали за кучу потребительских товаров. С тех пор это было отложено. Сейчас вы обучаете новые модели; ты на границе.
Объясните, как сейчас устроен ИИ Microsoft и как он устроен внутри Microsoft.
Полагаю, последние 15–18 месяцев или около того мы шли по пути восстановления наших отношений с OpenAI, и это заняло минуту. Я думаю, что кульминацией этого стал новый контракт, который мы заключили в октябре прошлого года. И в нем было много-много различных положений, включая укрепление и расширение партнерства, но при этом решающее освобождение нас от возможности заниматься сверхразумом независимо, а также продолжать покупать и лицензировать их модели.
Итак, с октября я собираю команду суперинтеллекта, создаю кластеры достаточного масштаба для обучения передовых моделей и нанимаю команду, ориентированную на суперинтеллект. И это был для нас довольно большой сдвиг, потому что это позволило мне сосредоточиться только на миссии сверхразума, и это затем привело к нескольким вещам, о которых мы объявили на этой неделе в Build. У нас есть семь новых моделей по всем направлениям и так далее. Так что это был довольно большой сдвиг, и я думаю, что на планирование ушло много времени, и для нас большое облегчение теперь быть в игре и стремиться к абсолютному рубежу в течение следующих нескольких лет.
Был ли такой план, когда вас наняли в Microsoft?
Это определенно был план на последние 18 месяцев. Я имею в виду, что отношения с OpenAI пережили множество взлетов и падений. И во многих отношениях, я думаю, это войдет в историю как одно из самых успешных партнерств в истории. Это было здорово для OpenAI, и это было здорово для Microsoft, и все хорошие отношения развиваются, и я думаю, что это просто следующий этап нашей эволюции.
Позвольте мне спросить вас конкретно об этой эволюции. Мы все только что видели суд между Илоном Маском, OpenAI и Сэмом Альтманом. Microsoft участвовала в этом судебном процессе в том смысле, что время от времени адвокат Microsoft вставал и говорил: «А нас не было рядом». И кто-то скажет «да», и все. Но очевидно, что в ходе этого испытания выяснилось, что было ясно в течение всего этого времени, так это то, что первоначальная идея заключалась в том, что OpenAI будет исследовательской лабораторией и будет предоставлять модели, а Microsoft будет создавать продукты. У Microsoft был опыт выхода на рынок; у нее был опыт работы в сфере предпринимательства, и она разными способами пыталась восстановить позиции среди потребителей. Это будет смена платформы, исследовательская работа в OpenAI будет завершена, а работа над продуктом останется внутри Microsoft.
Вот что изменилось: OpenAI хотела производить все больше и больше потребительских продуктов. Очевидно, что, учитывая вашу новую роль и новый фокус, Microsoft все больше и больше хочет создавать свои собственные модели. Почему раскол? Что не сработало в этих отношениях?
Я имею в виду, что OpenAI возглавляет невероятно амбициозная команда основателей и сам Сэм. И поэтому, естественно, когда они начали набирать обороты и получать огромную прибыль, они увидели возможности для полного стека. Так что дело не только в том, что они начали работать над потребительскими товарами. Очевидно, что ChatGPT оказался невероятно успешным. Они также начали работать над собственными дата-центрами. Они начали создавать свой собственный чип. Ходит много слухов об их собственных потребительских аппаратных устройствах. Они начали выводить модели напрямую на рынок через ChatGPT Enterprise. Таким образом, в целом они как бы вышли за рамки исследований за последние два, три, четыре года. И, естественно, то же самое справедливо и для Microsoft. Я имею в виду, я думаю, что партнерству уже пять или шесть лет, и ему еще предстоит действовать еще четыре, пять, шесть лет.
Кроме того, мы являемся одной из крупнейших технологических компаний в мире. У нас 493 из 500 крупнейших компаний хранят и обрабатывают большую часть своих данных в наших системах, используют Azure, используют M365 и Teams. Я думаю, что люди часто недооценивают, насколько мы огромны и насколько велико наше присутствие на предприятии. Итак, в долгосрочной перспективе (я имею в виду в течение пяти, шести, семи, 10 лет) мы должны быть уверены, что мы полностью устойчивы и не являемся просто получателями чужой интеллектуальной собственности, которую мы затем немного модифицируем, адаптируем и запускаем в производство для наших продуктов, но мы действительно можем твердо стоять на ногах и создавать модели мирового класса.
Я имею в виду, что придет суперинтеллект. Я думаю, это не за горами. И поэтому я думаю, что это будет, по сути, самая ценная технология всех времен. В долгосрочной перспективе мы не можем быть структурно зависимы от третьей стороны в предоставлении этой интеллектуальной собственности навечно.
Так что это был переход, который, очевидно, был вызван, когда у OpenAI и других компаний возникла проблема с платой. Но затем, когда я пришел и пришла моя команда, мы начали это дорабатывать, мы находимся на этапе перехода. И я думаю, что мы находимся в отличном положении, потому что мы можем занять довольно устойчивую, осторожную и долгосрочную оптимальную позицию как для OpenAI, которая, я думаю, преуспела в этом, так и для нас.
Я хочу уделить немного времени суперинтеллекту. Я просто хочу вставить здесь булавку, потому что я просто хочу понять переход для еще одного поворота здесь.
В суде есть момент, своего рода очень забавное сообщение от генерального директора Microsoft Сатьи Наделлы, он говорит: «Я не хочу быть Intel, а OpenAI будет Microsoft», что очень забавно в контексте того, что сам генеральный директор Microsoft говорит: «Я не хочу быть поставщиком, а они должны быть платформой, которая обеспечивает всю ценность и собирает всю ценность, и, возможно, нас вытеснят. Я не хочу, чтобы ChatGPT работал на Azure, и тогда OpenAI получит все ценность, и тогда, возможно, они смогут нас обменять», — точно так же, как это произошло с Windows и Intel с течением времени.
Это осознание? Наделла приходил к вам? Что представляла собой та встреча, на которой вы сказали: "Хорошо, у OpenAI были проблемы с советом директоров. Нам нужно вернуться на передовую и встать на свои ноги". Как выглядел этот разговор и как было принято это решение?
Я имею в виду, очевидно, что это решение Сатьи, а также Эми, Брэда и многих других людей в компании. Но я думаю, что это как и все остальное: это медленные изменения в компании, поскольку приходит понимание того, что направление, в котором мы идем, нуждается в некоторой доработке и корректировке. И это происходило задолго до ноябрьского инцидента с советом директоров, и я думаю, что со временем это только нарастает, когда вы смотрите на созвездие различных фронтов, вокруг которых мы все больше и больше конкурируем напрямую, и на всю напряженность, которая из-за этого возникает. Но также просто осознавать, что подобные партнерские отношения не длятся вечно.
Я имею в виду, что OpenAI хочет стать публичной компанией с оборотом в триллион долларов, иметь невероятные доходы и расти как сумасшедший. Они хотят иметь свободу действий и возможность покупать компьютеры в самых разных местах, создавать собственные компьютеры и сотрудничать с кем захотят. Таким образом, контракт был заключен в то время, когда компании были очень разными по размеру, масштабу и балансу потребностей и прочего. Я думаю, что в тот момент это имело смысл, но затем стало совершенно ясно, что это то, чем мы должны обладать и контролировать себя, а также поступать правильно по отношению к нашим собственным клиентам.
Как я уже сказал, у нас невероятное распространение на предприятиях, которое, я думаю, просто не имеет себе равных в мире. И поэтому мы должны быть уверены, что создаем лучшее для наших клиентов. Это выглядит немного по-другому для компании, которая совместно оптимизируется как для потребителя, с помощью ChatGPT, так и для предприятия, а также для фундаментальной научной миссии сверхинтеллекта, которая включает в себя целый ряд различных направлений, которые пересекаются, но, возможно, можно сказать, что они также ортогональны потребительскому и корпоративному направлениям. Естественно, я думаю, именно так развиваются партнерские отношения, и они периодически перезагружаются.
Да, но мне сказали, что создание передовой модели обходится очень дорого. Честно говоря, это очень дорогой проект. В какой-то момент Эми Худ, финансовый директор Microsoft, вынуждена сказать: «Да, у вас есть бюджет». Когда это произошло? Это было просто текстовое сообщение? Была ли встреча? Расскажите мне о деталях там.
Я думаю, послушайте, мы как бы приняли решение в начале прошлого года, которое, очевидно, повлияло на все переговоры по контракту, которые затем все были решены и подписаны в октябре. И это значительная инвестиция, но у нас есть много времени, чтобы сделать это. Я имею в виду, что мы уже вложили значительные средства в нашу собственную миссию самодостаточности.
Наш чип Maia 200 на самом деле является выдающимся чипом, например, не так ли? Теперь мы можем производить и поставлять внутри наших собственных кластеров чип, который на 30 процентов дешевле, чем GB200. И теперь, когда мы можем совместно разрабатывать наши собственные модели, модель MAI-Thinking-1, которую мы только что выпустили, фактически обеспечивает улучшение производительности в 1,4 раза на ватт помимо 30-процентного улучшения, которое вы получаете при работе на Maia 200, когда мы совместно оптимизируем модели для наших задач.
Таким образом, ценность уверенности в том, что вы владеете и контролируете свой собственный стек и направляете все усилия по совместному проектированию от начала до конца для вариантов использования, которые наиболее важны для нас (а это, очевидно, агентное кодирование, наши разработчики, наши предприятия), явно приносит дивиденды, которые оправдывают инвестиции, которые нам придется сделать в течение следующих нескольких лет.
Вы сказали «миссия самодостаточности», и это очень вежливый способ сказать, что вы хотите твердо стоять на ногах; ты хочешь заниматься своим делом. Мне сказали, что внутри Microsoft существуют разногласия по поводу строки, которую мой коллега Хейден Филд написал в статье, описывающей Build. Я просто собираюсь это прочитать. Это от Хейдена. Это отличная линия. Она сказала: «В этом году Microsoft Build создавала атмосферу одинокой разведенной женщины, публикующей в Instagram ловушку жажды».
Расставание завершено, и пришло время проявить себя. Вот наша новая модель. Мы будем стоять на двух ногах. Вы говорите, что собираетесь создавать передовые модели и конкурировать с ведущими лабораториями. Это ощущение внутри Microsoft, что вы можете быть сами по себе?
Определенно нет. Нет, совсем нет. Послушайте, я имею в виду, очевидно, что это классный заголовок и забавная фраза. Но реальность такова, что мы будем сотрудничать с OpenAI еще долгие годы. Я имею в виду, что мы приближаемся к северу от 2030 года. Они по-прежнему производят лучшие модели в мире. GPT-5.5 – выдающаяся модель. Кодекс, модели кибербезопасности, которые появляются, потрясающие, и они лежат в основе большей части того, что мы делаем.
Естественно, это будет продолжаться. И поэтому я думаю, что это естественный ход такого рода партнерства. Я не думаю, что это что-то ужасное или удивительное. Я думаю, что OpenAI очень понимает и поддерживает это. Я имею в виду, что они, очевидно, невероятно быстрорастущая компания, и они понимают, что мы также должны преследовать свои собственные цели. Так что это очень нормально.
Позвольте мне задать вам еще один вопрос о Декодере, а затем я хочу перейти к анонсам на Build и, конечно же, к сверхинтеллекту.
В последний раз, когда мы разговаривали, вы сказали, что ваша система принятия решений работает по шестинедельному циклу, учитывая, насколько быстро развивается ИИ. Тогда это имело смысл. Возможно, все уладилось. Возможно, некоторые вещи более в центре внимания. Какова ваша система принятия решений сейчас?
Мы по-прежнему действуем в том же ритме цикла. В конце каждого цикла у нас есть недельная личная встреча. Я искренне верю в это, хотя мы по-прежнему придерживаемся офисной культуры четыре дня в неделю. Фактически, через неделю вся моя команда Суперинтеллекта лично соберется в Бостоне на четыре дня. Это касается всех наших ретроспектив о том, как прошла сборка, чему мы научились, что мы не поняли правильно, что нам нужно улучшить, наше планирование следующего цикла, который на этот раз будет длиться восемь недель с недельной встречей после него, и все это рассчитано на весь год. Итак, вся организация знает, что это ритм, в котором мы работаем.
И я думаю, что на самом деле очень важно подчеркнуть эти временные рамки, потому что квартальное планирование становится немного размытым и абстрактным. Я думаю, что шесть-восемь недель, в зависимости от того, где они находятся в календаре, на самом деле являются оптимальным временем для выполнения очень четких и поддающихся укреплению миссий.
Так что мы тоже, помимо ритма этих шести-восьминедельных циклов, действуем отрядами. Отряды представляют собой смешанные междисциплинарные подгруппы, ориентированные на конкретную миссию, и они не обязательно доходят до менеджера. На самом деле ими управляет DRI, а DRI часто является IC, и их работа заключается в…
Это «непосредственно ответственное лицо» и «индивидуальный участник».
Да, именно. Спасибо. И я думаю, что мы выбрали подход, отделяющий роль менеджера от роли DRI, выполняющего конкретную миссию. Я думаю, это потому, что быть отличным DRI утомительно. Вы буквально работаете олл-ин 24 часа в сутки и стараетесь изо всех сил. Быть менеджером – это часто значит быть тренером, предлагать поддержку, давать указания, обратную связь, разблокировать все виды вещей, помогать людям в карьерном росте. И поэтому я думаю, что сохранение этих отдельных позиций позволит нам менять DRI каждые два или три цикла, чтобы некоторые люди могли пробовать разные позиции и иметь ротацию. Я думаю, это отличная, очень гибкая структура, которая позволяет нам быть довольно гибкими.
Давайте поговорим о Билде. Я хотел начать со сверхразума. Вы уже несколько раз об этом упомянули. Я только что был в Google IO. Демис Хассабис, который когда-то был вашим коллегой, когда вы работали в Google, закончил свое выступление, сказав, что мы находимся «в предгорьях сингулярности, и что AGI приходит со всей мощью Google».
Вы говорите, что суперинтеллект здесь. Это все одно и то же? Используем ли мы разные языки для описания AGI? Есть ли различия? Как бы вы определили сверхинтеллект в своем контексте по сравнению с сингулярностью в контексте Демиса?
Я имею в виду, очевидно, я не говорил, что это было здесь. Я сказал, что оно придет. И я думаю, что в этих фразах много изменчивости. Но я думаю, что мы можем ясно видеть, что сейчас происходит лог-линейный подъем по холму во всех модальностях, а это означает, что существует очень прямая связь между каждым порядком величины вычислений, которые мы применяем, каждым приростом данных и подъемом по критериям, будь то общедоступные тесты или внутренние тесты, это цели, на которых мы фокусируемся в средах обучения с подкреплением. И это очень важное наблюдение.
Те прогнозы, которые, как мне кажется, мы все делаем — я понимаю, почему некоторые люди относятся к ним скептически или задают вопросы, но они очень основаны на своего рода эмпирических наблюдениях за более чем десятилетним увеличением производительности этих моделей. Я имею в виду, что, по сути, та же самая архитектура общего назначения использовала на 12 порядков больше вычислений, увеличила число FLOPS в триллион раз за 15 лет и в основном работала с аудио, с изображениями, с текстом, с кодом и во многих других задачах прогнозирования временных рядов. Таким образом, мы, по сути, экстраполируем, что больший объем вычислений позволит нам продолжать карабкаться по лог-линейному пути внутри других сред.
И тогда возникает вопрос: сможем ли мы обучать модели, которые смогут изобретать новые знания, а не просто экстраполировать существующие данные, которые у нас есть, но фактически учить нас вещам, которых мы не знаем, и делать новые открытия? Затем второй вопрос: есть ли у них возможность самосовершенствоваться и ускорять процесс принятия решения о том, какие гипотезы следует выдвигать, какие следует развивать, как генерировать обучающие данные для каждой из них, как учитывать их в новых запусках или даже вводить новшества в саму архитектуру?
Итак, я думаю, что обе эти вещи должны быть верными, чтобы можно было увидеть этот комплексный прогресс, но я думаю, что мы продолжим получать огромные выгоды просто от применения следующих нескольких порядков вычислительных ресурсов. Вероятно, это действительно позволяет достичь паритета с производительностью человека при выполнении многих, многих других задач, как мы видели это за последние шесть месяцев при программировании.
Программирование действительно интересно, потому что его легко проверить, не так ли? Вы пишете код, просите компьютер запустить его, он запускается или выходит из строя. Мы видели некоторые недостатки, особенно связанные с безопасностью, верно? Недостатки очевидны, и мы видим, что такого рода нормативный подход к безопасности кодирования проявляется по-разному. Я, вероятно, запрограммировал несколько аварийных ситуаций безопасности на своем телефоне и компьютере, и, возможно, я готов пойти на такой риск.
Любая другая функция не кажется такой простой. Я всегда выбираю право, потому что это мое прошлое. Но судья не проверяет юридическое письмо так, как компьютер проверяет код. Если вы ошибетесь, судья может отправить вас в тюрьму, верно? Это, возможно, самая худшая ошибка проверки вывода, с которой вы, вероятно, можете столкнуться.
Как измерить эффективность в разных областях так же легко, как измерить эффективность кодирования? Потому что мне кажется, что метафора или аналогия с кодированием в других областях очень быстро разваливаются.
Я не так уверен. Кодируя, очевидно, можно проверить правильность выполнения кода. То запускается, то вылетает. Но в этом есть масса нюансов. Качество написанного кода действительно имеет значение: его расширяемость, насколько он реконфигурируем, насколько он полезен на практике. Дело не только в том, что выполняется фрагмент кода, но и в том, как модель фактически использует его в качестве DevOps или SRE в рабочей среде, чтобы вернуться к написанному фрагменту кода, а затем использовать его практичным и полезным способом.
И затем, конечно, вам придется оценить качество произведенной продукции. Это может быть высококачественный функционирующий код, но действительно ли это то приложение или веб-сайт, который вам нужен? И в этом есть эстетические суждения; в этом есть коммерческие суждения. Проблема интернализации непроверяемых вознаграждений присутствует в коде, хотя код по-прежнему в первую очередь является проверяемым сигналом вознаграждения. Я думаю, еще одна вещь, на которую следует обратить внимание, это то, что, как и чат, это также не поддающееся проверке пространство, и тем не менее, нам удалось подняться до производительности практически человеческого уровня за счет взаимодействия с реальным использованием, что обеспечивает очень сильную
Подожди. Мне очень любопытно. Как вы оцениваете эффективность чата на уровне человека?
Что ж, я думаю, что многие люди ведут долгие и содержательные беседы с ИИ на человеческом уровне. Качество исключительно хорошее. У него очень хороший эмоциональный интеллект. В целом это очень точно. Мы минимизировали галлюцинации. Мы больше не говорим так много о предвзятости. Оно основано на реальных наблюдениях. Я думаю, что по оценкам большинства людей, сейчас мы достигли человеческого уровня в общении при решении довольно широкого круга задач.
Каковы ваши меры, и на самом деле, конечно, меры большинства людей? Я бы не согласился почти со всем этим, но это мои меры. Каковы ваши меры?
Моя мера похожа на то, когда я обращаюсь к своему помощнику и прошу его предоставить мне ежедневный брифинг, суммирующий все разговоры, которые произошли в Teams и по электронной почте, обновления, которые произошли с документами, и я получаю по сути синтезированное резюме с набором действий, которые мне следует предпринять дальше. По сути, это лучше, чем то, что может произвести мой руководитель аппарата. Я бы сказал, что это эффективность человеческого уровня в синтезе, анализе, предлагаемых действиях и общении.
Многие, многие миллионы людей каждый день используют его для эмоциональной поддержки, консультирования, терапии, коучинга, совета. Я думаю, что это один из самых популярных вариантов использования среди всех чат-ботов. Я бы сказал, что это довольно надежная мера, чтобы сделать такое заявление.
Я знаю, что вы потратили много времени на размышления об этом, особенно об эмоциональной связи с некоторыми из этих чат-ботов. Это продукты, которые вы создали и развернули. Я бы провел довольно большое различие между этой штукой, которая действительно очень хорошо подводит итог моей электронной почты, списком задач и дает мне краткое описание того, какие вещи следует расставить по приоритетам, и этой штукой, которая является эмоциональным наставником для кого-то, кто переживает какой-то кризис.
Это не похожие задачи. Это не обязательно одинаковые виды интеллекта, даже у людей. Я знаю некоторых людей, которые очень хорошо умеют составлять списки и очень плохо умеют оказывать эмоциональную поддержку. Как вы соедините все это в своем мозгу и скажете: «Хорошо, это в целом человеческое поведение в чате?»
Я думаю, если вы определяете чат как интерактивный обмен между двумя сторонами, одной из которых в данном случае является искусственный интеллект, который в общих чертах удовлетворяет какой-то цели, вы хотите узнать спортивный результат, получить совет о том, в какой ресторан пойти, получить рекомендации и отзывы о написанном вами эссе, получить предложения о том, какую работу выбрать дальше, или какой-то трудный разговор, который вам предстоит провести со своим менеджером. Вы получаете ответ, вы ходите туда-сюда, у вас есть пять или шесть обменов мнениями и вы находите это полезным результатом, в противном случае вам, возможно, пришлось бы полагаться на эксперта, друга или даже платить тренеру.
Есть, объективно, эмпирически говоря, сотни миллионов людей, которые каждый день получают такой опыт от этих чат-ботов. Возможно, мы могли бы поспорить о том, соответствует ли это технически производительности человеческого уровня. Я думаю, что это вполне разумное утверждение.
Нет никаких причин, по которым он не будет продолжать восхождение, верно? Скорость восхождения за последние три года — это то, что я считаю самым ошеломляющим. Итак, с этого момента мы пытаемся экстраполировать: окей, каковы фундаментальные движущие силы этого подъема — вычисления, данные, взаимодействие с реальными пользователями — и эти вещи, похоже, будут продолжаться. Я думаю, что они применимы и ко многим другим областям, не только к общению, эмоциональной поддержке, продуктивности и тому подобному, но и ко многим другим областям, выходящим за рамки этого: здравоохранению, внедрению живого производства в сфере образования, помощникам, которые все чаще управляют вашим домом, наблюдая за всем, что происходит в вашей повседневной жизни, в основном, чтобы сделать вас более продуктивными. Я думаю, что эта траектория, вероятно, продолжится.
Вы сейчас упомянули, что это все та же фундаментальная архитектура, преобразователи и внимание. Мы применяем для этого вычисления уже 15 лет и добились такого значительного роста. Вы находитесь в довольно уникальном месте.
На выставке Build вы анонсировали свою первую флагманскую модель рассуждения — MAI-Thinking-1. Вам придется начать с нуля. Сделали ли вы что-то по-другому после 15 лет разработки и обучения этой модели, или просто да, мы собираемся собрать все данные и провести обучение так же, как и раньше, и теперь у нас больше вычислительных ресурсов, так что будет лучше?
Нет, на самом деле, я думаю, различий довольно много. Первое, что нужно сказать, это то, как вы обрабатываете данные… Мы начинаем прямо с вершины стека; По сути, мы заплатили и получили чрезвычайно высококачественный, очень консервативный набор данных и извлекли множество шумных, отвлекающих, некачественных и потенциально опасных для безопасности проблем, связанных с этими данными. И методы, которые вы для этого используете, я думаю, на самом деле весьма запатентованы. Мы только что поделились 109-страничным очень подробным техническим отчетом, который был очень хорошо принят в Твиттере и поделился множеством подробностей о том, как мы это делаем. Я думаю, что во-вторых, хотя я считаю, что важно быть очень осторожными с архитектурным выбором, и мы так и поступали, есть также ряд довольно значительных изменений, которые, я думаю, мы внесли в то, как мы проводим наши тренировочные прогоны.
Наши тренировочные заезды были невероятно стабильными, с очень небольшим количеством сбоев и очень небольшим количеством перезапусков. Мы поделились многими из этих графиков, чтобы продемонстрировать стабильность инфраструктуры, а также эффективность MFU, поэтому смоделируйте использование FLOPS, что по сути показывает, что мы можем пропустить самое современное количество FLOPS через каждый чип на каждом этапе нашего обучающего прогона. Я думаю, что ошибиться очень легко, и все мы слышим множество историй из разных лабораторий о том, как что-то идет не так.
На самом деле довольно сложно сделать очень осторожный и обдуманный выбор, чтобы все сделать правильно, и принять правильный подход, чтобы гарантировать, что мы производим высококачественные модели, потому что наша работа и наши амбиции — попытаться построить эту машину для подъема в гору. Это означает интеграцию кремния с моделями, со сверхвысококачественными данными, со стеком RLE, средой обучения с подкреплением, которые позволяют нам, по сути, систематически преодолевать любые цели, которые мы выбираем.
И это то, что такое MAI-Thinking-1. Это универсальная, достаточно нейтральная модель мышления, которая неплохо подходит для кодирования. Сейчас он примерно на одном уровне с Opus 4.6, по крайней мере, по тестам. Мы еще не внедрили его в производство, так что впереди еще много работы. Но это чрезвычайно сильный инструмент рассуждения, который набрал 97 процентов по AIME, что является основным показателем его эффективности рассуждений, по крайней мере, в тестах.
Он очень хорошо следует инструкциям, и цель состоит в том, чтобы сделать его доступным для многих, многих разработчиков и предприятий и позволить им использовать его в своих сценариях использования. У каждого в компании немного другая цель — попытаться создать агентов и т. д., которые поддерживают их вариант использования.
Одна из вещей, которую вы заметили, говоря о MAI-Thinking-1, заключается в том, что вы не выделили ни одной существующей модели, что на самом деле показалось мне удивительным, не так ли? Это то, что вы могли бы сделать. У вас есть доступ к IP-адресу OpenAI. Все перегоняют все. В ходе этого испытания мы только что узнали, что Grok был дистиллирован из ряда моделей. Почему бы не сделать перегонку здесь? Почему бы не забежать вперед?
Определенно существует множество кратчайших путей к границе, и если вы возьмете сверхвысококачественную модель и дополните свою базовую модель высококачественными инструкциями, ответами или результатами более качественной модели, то это правда, что модель может быстро вписаться в это распределение. Но очень неясно, смогут ли они тогда превзойти этого учителя.
Итак, мы действовали очень осмотрительно по двум причинам. Во-первых, мы хотим быть уверены, что сможем превзойти учителя, чтобы самим установить границу на следующие несколько лет. А во-вторых, мы действительно хотим построить одну из великих лабораторий, и на это у нас уйдет много лет, возможно, ближайшие два или три года.
Но для этого нам нужно показать, что мы действительно можем создать каждый компонент самостоятельно. Мы можем нанять самых лучших специалистов в мире. Мы можем расширить границы возможного с помощью реальных исследований, а не просто повторной реализации, копирования или дистилляции от какой-либо третьей стороны.
Мы находимся в прекрасном положении, когда мы можем очень осторожно и скрупулезно добиваться этой цели, зная, что у нас есть ресурсы для покупки антропных моделей там, где они выходят за рамки возможного. У нас есть ресурсы, чтобы разместить в Foundry 11 000 различных моделей, поэтому каждый из наших разработчиков получает полную свободу выбора. И, конечно же, у нас есть ресурсы для продолжения развертывания моделей OpenAI, которые, очевидно, выдающиеся и сегодня находятся на переднем крае.
Это естественная часть миссии самодостаточности, и нам потребуется время, чтобы по-настоящему достичь абсолютного рубежа в этом отношении. Но я думаю, что мы находимся в отличном положении. Мы добились огромного прогресса. Это очень, очень сильная модель, и мы выпустили не просто такую модель. Мы выпустили семь новых моделей одновременно.
Наша транскрибируемая модель, например, МАИ-Транскрайб-1.5, буквально номер один в мире. Это самый экономичный из всех гиперскейлеров. Это самый высокий показатель точности. Наша имиджевая модель теперь занимает второе место. Наша модель редактирования изображений занимает третье место после моделей Google и OpenAI. Я думаю, что с нашим изображением и звуком мы в порядке. Наша модель кода CodeFlash невероятно надежна и оптимизирована для VS Code. и это действительно отличная модель, не уступающая Sonnet 4.6. Так что в эту минуту действительно отличное место.
Были ли какие-либо юридические проблемы или проблемы с интеллектуальной собственностью, связанные с дистилляцией? Я знаю, что это актуальная проблема в мире: Anthropic жалуется на то, что другие люди совершенствуют их модели. Существуют опасения по поводу того, что китайские компании разрабатывают модели, и могут ли наши существующие соглашения в области интеллектуальной собственности охватить это. Были ли у вас какие-либо из этих опасений, которые удерживали вас от этого?
О, мы этого не сделали, но мне кажется, я понимаю, почему многие люди расстраиваются. Anthropic был очень расстроен некоторыми слухами о xAI, Meta и, очевидно, о моделях с открытым исходным кодом и так далее, потому что, по сути, это в основном берет IP и знания, которые собрала другая команда, а затем буквально принудительно вводит их в вашу собственную модель. Я думаю, что это своего рода краткосрочная победа, и, как я уже сказал, на самом деле мы хотим создать в лаборатории культуру, в которой мы сможем совершить следующий большой прорыв в мышлении, или следующий большой прорыв в кодировании, или следующий большой архитектурный рывок.
Прямо сейчас мы экспериментируем с контурным трансформатором, который представляет собой несколько иной вариант трансформатора тока. Многие люди в этой области тоже смотрят на это. Кажется, никто еще не приступил к производству. Но для того, чтобы создать культуру и команду, которые действительно могут раздвинуть границы, они должны понимать, владеть и создавать полный стек по мере необходимости, а также использовать вещи третьих сторон, когда это необходимо нам. И как наша статья, например, имеет сотни цитирований, основанных на остальной литературе, так что это во многом вклад в эту область в обмен на все, что мы узнали за эти годы из всех замечательных публикаций, которые были там.
Могу ли я спросить вас: если вы понимаете разочарование Anthropic и ваших коллег из ИИ по поводу дистилляции, понимаете ли вы также разочарование креативщиков, издателей и YouTube-пользователей по поводу того, что все компании, занимающиеся ИИ, срывают свою работу как коллектив, чтобы создавать эти модели? Потому что это разочарование становится только сильнее.
Ага. Нет, я понимаю разочарование. Мы уже говорили о проблеме открытого Интернета, и я это понимаю и вижу, что люди разочарованы, и, очевидно, это проявляется в разговорах в судах. И я вижу, что люди размещают что-то в Интернете, и у них были разные ожидания относительно того, каков был контракт с размещением в Интернете, и это непростая задача.
Вы упомянули, что все ваши данные тщательно контролируются. Вы заплатили за все данные, которые используете для обучения новых моделей?
Большую часть наших данных мы, очевидно, берем из открытой сети обычным способом. Тщательное курирование означает, что он чрезвычайно тщательно фильтруется с точки зрения безопасности, качества, сторонних зависимостей от некоторых наборов данных с открытым исходным кодом и защищает его от многих китайских линий, которые, я думаю, сильно отличаются. Наши предприятия хотят быть уверены, что когда они запускают что-то в производство, они могут доверять нам, что мы действительно создали это с учетом их потребностей. И я думаю, что это одно из преимуществ того, чтобы быть очень, очень осмотрительным, терпеливым и внимательным ко всем деталям.
Вы упомянули предпринимательство. Я думаю, это очень интересно. На самом деле Microsoft в значительной степени занимается корпоративным ИИ. Я бы даже подвел черту прямо к Аше Шарме, новому главе Xbox, который избавляется от ИИ в куче мест, и геймеры довольны, правда? В потребительском пространстве есть одна реакция на ИИ, а в корпоративном секторе — другая. Я думаю, что ИИ максимально приближен к рынку продукта на предприятии, когда что-то меняется так же быстро, как ИИ. Существует множество баз данных, которые контролируют корпорации, и вы можете просто получить к ним доступ, потому что они их контролируют. Это их данные.
Существует множество повторяющихся процессов и задач, а также старые системы, которые, возможно, модели смогут выполнять более эффективно. В бизнесе происходит что-то очень важное. При этом антипатия потребителей к ИИ только усиливается. И я утверждаю, что мы не создали отличных потребительских продуктов с искусственным интеллектом. Эта отрасль их не производила. Это их не сдвинуло. Еще не стало очевидным, что все это того стоит, что использование всех данных из открытой сети и изменение контракта на публикацию для массовой аудитории людей, поэтому теперь это используется для обучения моделей, которые принесут корпорациям триллионы долларов ценности. Ни один продукт не говорит о том, что он того стоит.
Опять же, Сатья Наделла недавно дал интервью Axios и сказал: "Нам нужно социальное разрешение на это. И пока мы его не получим, пока мы не обеспечим эту ценность, люди будут чувствовать то же самое". Мы видели, как ораторов колледжей освистывали. Мы видели, как дата-центры запрещали. Считаете ли вы, что существует потребительский продукт, который того стоит, стоит беспокойства по поводу обучения, стоит беспокойства по поводу центров обработки данных?
Это было вашей целью; теперь ваше внимание сосредоточено на предпринимательстве. Я бы сказал, что на первый взгляд кажется, что Microsoft больше не интересуется потребительским продуктом. Но видите ли вы тот, который того стоит или который можно построить?
Я не уверен, что согласен с вами в том, что для потребителя это не имело никакой пользы. Во всех чат-ботах ежемесячно присутствуют миллиарды людей, которые получают от этого огромную пользу. Теперь, хотя бы на мгновение, немного посочувствуйте владельцу малого бизнеса или той маме, которая помогает своему ребенку с домашним заданием и теперь может просто обратиться к разговорному искусственному интеллекту и получить обратную связь, инструкции и вопросы для эссе. Просто иметь возможность задавать вопросы, например, как мне получить доход? Как составить прогноз движения денежных средств? В какой колледж мне следует поступить?
Я имею в виду, что это повседневные задачи, которые сопровождаются довольно качественными фактическими советами и информацией. Так что я не особо верю в то, что люди не получают выгоды от этих вещей. Я думаю, что да.
Я думаю, что могу очень четко доказать, что они не получают достаточной выгоды, не так ли?
Хорошо.
Именно они говорят, что нам не следует иметь больше центров обработки данных. Это они освистывают ИИ в выпускных речах. Опрос ясен, особенно молодые люди: чем больше они используют ИИ, тем больше у них к нему антипатии. Это ясно из каждого опроса. Это аргумент, который я привожу: не то, что ценности нет, но обмен ценностями недостаточно ясен.
Ага. Справедливо.
Я вижу, как Microsoft, в частности, поворачивается к корпоративному сектору, отходя от большого поискового продукта, к переосмыслению Bing, который заставил бы Google танцевать. С этим покончено, и мы все сосредоточены на предпринимательстве, в котором есть ценность. Мне просто интересно, достаточно ли ценности для потребителя, чтобы оправдать все это.
Я думаю, что понятно, что существует много беспокойства. Существует огромное количество предположений о том, что произойдет в ближайшие пять-десять лет. Независимо от того, оформлено ли это как сингулярность или как апокалипсис рабочих мест, это бесполезные формулировки. Я думаю, что люди напуганы, потому что это плохо определено и часто изображается как неизбежное, угрожающее серое облако над головами людей.
Я думаю, что важно то, что мы делаем с технологиями. Думаю, я уже давно утверждаю, что мы должны ставить человека на первое место. Некоторые люди в этой области ставят научные открытия на первое место или ставят ускоряющийся разум, способный исследовать галактики, и так далее, и говорят, что неизбежно появление таких ИИ, которые будут более мощными, чем все мы вместе взятые. Я имею в виду, что это естественно пугает людей.
И я думаю, что нам следует перевернуть ситуацию с другой стороны и сказать, что цель науки и техники — сделать нас всех здоровее, умнее и счастливее. Это был поиск, которым мы как вид занимались на протяжении тысячелетий, изобретая, и это испытание, которому мы должны снова подвергнуть сверхразум. И если он не пройдет этот тест, то, я думаю, люди его отвергнут, и они будут правы, отвергнув его.
Я думаю, что в ближайшие пять лет все внимание будет сосредоточено на том, как это сделает меня здоровее, счастливее, умнее, способнее, продуктивнее? А если этого не происходит, то, естественно, люди будут злиться, сопротивляться и реагировать. Я не думаю, что в этом есть что-то неожиданное или что-то неправильное — я думаю, что это неизбежно.
Вот почему одна из вещей, которыми я увлекаюсь на протяжении многих лет, — это здравоохранение. И буквально пару дней назад мы объявили о новом партнерстве с клиникой Мэйо. Постоянно сообщается, что это больница номер один в мире. У них есть набор данных продольных историй болезни высочайшего качества по всем методам. У них лучшая клиническая практика.
Они также являются некоммерческой организацией, о которой, я думаю, многие люди не осознают, поскольку 65 процентов их пациентов пользуются Medicaid. Люди часто ассоциируют их с международной суперэлитой, прилетающей за лучшим в мире лечением, но на самом деле у них большинство на Medicaid. Это удивительное учреждение, выполняющее невероятную миссию — предоставлять лучшее медицинское обслуживание во всем мире. И теперь у нас есть очень долгосрочное партнерство, позволяющее совместно обучаться с нуля с их данными, с нашими моделями, совершенно новой базовой моделью здравоохранения, развертывать ее в своих больницах и, надеюсь, распространить ее по всему миру, чтобы предоставить лучший клинический уход и медицинское обслуживание, которое мы можем, как можно большему количеству людей.
Вот почему я попал в эту сферу. Это то, чем я изначально руководствовался, и это то, чем я увлечен. И я могу сосредоточиться только на тех вещах, которые, по моему мнению, изменят ситуацию, помогут людям и оставят хорошее наследие для всех, и это то, что мы пытаемся сделать.
Я ценю это. Я ценю создание системы здравоохранения и понимаю, почему все это любят, верно? В частности, здравоохранение в Америке: если бы вы могли улучшить его хотя бы на 10 процентов, вы бы оказали особенно глубокое влияние на жизнь многих людей.
Дело в том, что я знаю очень умного парня, у которого совсем другой и гораздо более агрессивный подход ко всему этому, чем у тебя. Этот человек — вы, четыре месяца назад. Вот что Мустафа Сулейман сказал Financial Times четыре месяца назад: «Работа белых воротничков, когда вы сидите за компьютером, будь то юрист, бухгалтер, менеджер проекта или специалист по маркетингу, большинство этих задач будут полностью автоматизированы ИИ в течение следующих 12–18 месяцев».
Это четыре месяца назад. Это означает, что через год юристы, бухгалтеры, менеджеры проектов и маркетологи останутся без работы. Их работа будет автоматизирована. Это все еще ваш график?
Нет, нет, нет. Подожди секунду. Поэтому я сказал «задачи» в цитате, которую вы только что сказали. Я сказал задачи. Так что это не означает рабочие места. Это очень важное различие. В экономике труда существует целая таксономия подкомпонентов роли или функции в организации. Отправка электронной почты, разговор с коллегой, составление PowerPoint — подзадачи будут все больше оцифровываться, автоматизироваться, и мы сможем генерировать их все больше и больше.
Это не обязательно означает, что роль вообще исчезает. Это просто означает, что работу можно выполнять быстрее и эффективнее, а сегодня это часто рутинная работа, выполняемая вручную, весьма трудоемкая и отнимающая много времени. Таким образом, естественный прогресс технологий заключается в том, чтобы сделать вашу жизнь проще, быстрее, с меньшим трением и большей плавностью. Как все часто жалуются, это сделало нас с вами и всех остальных намного более занятыми.
На самом деле это сделало нас более доступными, более напряженными и дало нам больше информации. Так что всегда есть эффект мести за эффективность, о котором, я думаю, люди забывают. Вполне вероятно, что мы станем намного, намного более продуктивными, потому что мы тратим меньше времени на выполнение узких административных задач, и нам придется тратить больше времени на творческие, ориентированные на суждения вещи, которые в конечном итоге создают гораздо большую ценность.
Мы также можем экспериментировать гораздо быстрее. Таким образом, мы сможем опробовать множество вещей параллельно, поскольку стоимость выполнения снизится. На мой взгляд, это, вероятно, повысит общее качество вещей, потому что мы собираемся опробовать больше гипотез, будь то в журналистике, бизнесе или во всем, что мы делаем.
Я думаю, что это немного вырвано из контекста из-за естественного непонимания между работой и задачами, но, тем не менее, вы могли бы оттолкнуть меня и сказать: «Хорошо, а как же будет выглядеть ландшафт через пять, 10 или 15 лет?» И вот сюда, я думаю, нам придется вернуться –
На самом деле, я не собираюсь давить на вас таким образом. Я буду сопротивляться очень специфическим образом. И я понимаю, что это ваша цитата, и вы говорите, что ее неправильно истолковали. Я просто смотрю на это буквальное предложение, и нет никакого различия между задачами и подзадачами. Это «работа белых воротничков». »
Примеры: юрист, бухгалтер, менеджер проекта, маркетолог, а затем вы сказали: «Большинство этих задач будут полностью автоматизированы с помощью ИИ в течение следующих 12–18 месяцев». Там нет разделения на подзадачи. Вы говорите, что через год работа большинства юристов будет полностью автоматизирована, и юридическая практика будет выглядеть совершенно иначе, даже если судить по словам этой цитаты.
И я просто говорю, вы все еще находитесь в той временной шкале, что работа юриста будет выглядеть совершенно по-другому, потому что агенты будут бегать вокруг и делать все то же, что мы делали раньше?
Что ж, большинство задач означают работу, которую вы выполняете для выполнения своей общей работы, и которая, я думаю, освободит вас для выполнения более человечных и более рассудительных частей вашей работы. Есть очень важное различие в… Должности и роли — это более широкая категория, а задачи — ее компоненты. И это устоявшееся определение в литературе, в экономике рынка труда, на протяжении многих, многих десятилетий.
Возможно, это было слишком тонко даже для Financial Times, но, тем не менее, именно в этом и заключалась цель. Теперь я думаю, что есть важный вопрос: что это оставит нас в долгосрочной перспективе? И это будет непросто, ведь таких вещей становится все больше и больше… Мы можем спорить о сроках: несколько лет, десятилетие или 20 лет, но реальность такова, что мы собираемся автоматизировать все больше и больше этой работы, задач, должностей, ролей, деятельности и всего, что мы делаем.
И поэтому большее значение будет иметь то управление, которое мы обеспечиваем этими технологиями. Кому они подотчетны? Кому они принадлежат? Каковы петли обратной связи, которые регулируют и создают разногласия, чтобы гарантировать, что они действительно служат людям? Я имею в виду, что четыре или пять месяцев назад я написал эссе о гуманистическом сверхинтеллекте, в котором совершенно прямо изложил то, что я считаю, по сути, Полярной звездой, может быть, не совсем структурой, а набором принципов, которые, по сути, говорят, что технология здесь, чтобы служить нам. Это испытание, которому мы должны его подвергнуть. Это испытание, которому подверглись люди. Это тест, который волнует нас в Microsoft.
Я думаю, что всем придется все больше и больше концентрироваться на этом вопросе, потому что он принесет огромное количество пользы, и мы хотим, чтобы это продолжалось, но мы хотим, чтобы это делалось таким образом, чтобы это не вызывало нелепой нестабильности в переходный период.
Я верю тебе. Я знаю, что вы уже давно думаете об этом, но я собираюсь ответить так, как я знаю, моя аудитория хочет, чтобы я ответил, потому что я слышу это от них все время. И похоже, что вся эта отрасль — вы, включая всех — пошли ва-банк на тему «мы собираемся заменить все рабочие места» и действительно ускорили строительство центров обработки данных с огромной мощностью и запросили много ресурсов вопреки большим обещаниям.
Была политическая реакция, а теперь все позиции смягчились. И вы говорите, что не все рабочие места исчезают, нам нужно переосмыслить рабочие места, и все другие руководители в этой отрасли говорят аналогичные вещи и говорят о здравоохранении, которое сейчас возникает каждый раз. Мне интересно, изменило ли это политическое сопротивление то, как вы об этом говорите.
Многие из ваших коллег считают, что у ИИ просто есть маркетинговая проблема, что о нем недостаточно эффективно пропагандируют, и им следует потратить сотни миллионов долларов на подкасты, чтобы более эффективно рассказывать о преимуществах ИИ. Это реальная вещь, которая происходит в этой отрасли. Считаете ли вы, что у искусственного интеллекта просто маркетинговая проблема и что политическая реакция открыла вам глаза на эту маркетинговую проблему, или вы думаете, что происходит что-то еще?
Там есть ряд вопросов. Во-первых, что я на самом деле думаю и во что верю, и изменилось ли это за последние шесть месяцев? Ответ — нет. Я написал об этом очень подробную книгу три года назад, намного раньше времени, предупреждая о многих вещах, которые происходят в настоящее время, и делая это явно для того, чтобы обозначить огромные риски для слежки, концентрации власти, концентрации богатства, устранения посредников государства и угроз демократии. А также к угрозам природе человека и тому, что значит быть человеком в контексте прихода этих самых новых в каком-то смысле форм кремниевого существа. Я работал над… И идея о том, что мой интерес к здравоохранению — это всего лишь вспышка на сковороде, которая является функцией реакции на центры обработки данных и так далее, я имею в виду, что я работаю в сфере здравоохранения уже более десяти лет. Я много-много раз продвигал некоторые передовые открытия, вклад в области радиологии, маммографии и патологии, во многие другие области, электронные медицинские записи.
Поэтому я всегда считал, что цель технологий — сделать нас здоровее и счастливее. И это то, над чем я предпочитаю работать и чему посвящаю свое время. Есть ли у отрасли проблемы с репутацией и пиаром? Я имею в виду, я думаю, совершенно очевидно, что люди очень обеспокоены, они очень разочарованы, и в ближайшие несколько лет этому будет уделяться много внимания, и это понятно.
Я думаю, что мы можем взять на себя ответственность за то, что мы создаем, за то, как мы это создаем, за решения, которые мы принимаем для распространения различных технологий в мире, и за типы проблем, над которыми мы решаем работать, как мы это делаем с клиникой Мэйо.
Я, кстати, хочу сказать и отметить, что, по моему мнению, мы с вами впервые встретились и поговорили еще до того, как вы присоединились к Microsoft. Это было сразу после выхода этой книги, и мы вместе сделали панель.
Одна из причин, по которой мне удобно об этом спрашивать, заключается в том, что я знаю, что вы уже давно думали об этом, и я знаю об этой книге. Я думаю, что для меня вопрос заключается в том, неправильно ли отрасль в целом оценила общую сумму ценности, которую она могла бы предоставить, чтобы преодолеть кажущееся безрассудство, на которое сейчас реагируют люди, потребность в ресурсах, на которую люди сейчас реагируют.
Вы создаете новые модели. Вероятно, внутри Microsoft существует компромисс между тем, можем ли мы использовать существующий энергетический след для взимания с наших клиентов денег, или мы можем тратить деньги на обучение новых моделей, и это похоже на тот же разговор, который люди ведут о ресурсах в своих сообществах, следует ли нам использовать существующий энергетический след для создания нового ИИ или сделать что-то еще, что может быть более ценным в данный момент.
Что вы думаете обо всем этом? Вы один из лидеров этой отрасли. Вы хотите быть в авангарде компаний, которые вносят наибольший вклад в перемены. Как вы относитесь к тому, чтобы запросить эти ресурсы таким образом, чтобы это не только обещало будущие результаты, но и немедленно приносило пользу сообществам, вызывая у людей желание, чтобы вы были там?
Я очень горжусь тем, что Microsoft придерживается своих целей по нулевому результату. Все наши новые центры обработки данных имеют жидкостное охлаждение. Это означает, что за шестилетний период они используют примерно столько же воды, сколько ресторан. Это похоже на бассейн, который наполняется водой, а затем просто циркулирует по системе. Все они в значительной степени являются возобновляемыми с точки зрения потребления электроэнергии. Поэтому я думаю, что подобные обязательства должны гарантировать, например, что мы недавно взяли на себя обязательство гарантировать, что местные сообщества, затронутые изменением спроса на электроэнергию в наших центрах обработки данных, получат компенсацию и защиту, чтобы они не увидели скачка цен и счетов за электроэнергию.
Я думаю, что именно такие вещи Microsoft делает и может продолжать делать как ответственная компания, просто обращая внимание на последствия для сообществ. Я думаю, с другой стороны, изменения происходят потому, что люди участвуют на всех уровнях. Людям внутри компаний приходится принимать разные решения. Люди, которые протестуют и проводят кампании, должны принимать решения и прилагать усилия, чтобы выйти и сделать так, чтобы их голос был услышан, и быть вовлеченными в политический процесс. И именно так мы, как вид, коллективно развиваемся и двигаемся вперед.
И из месяца в месяц, из квартала в квартал кажется, что мы все как-то не в ладах друг с другом, но если оглянуться назад, десятилетие за десятилетием, мы похожи на эту коллективную странную сетку из всевозможных различных стимулов, которые на самом деле просто подталкивают вещи в правильном направлении. Я думаю, что мы действительно, несмотря на всю тревогу и поляризацию, строим что-то, что сделает наш вид намного, намного здоровее, счастливее и способнее.
Я думаю, что мы должны убедиться, что мы выбрали правильный путь на этом пути, потому что существует множество ловушек и способов, которые могут пойти не так, но правильный путь предполагает, что люди заставляют свои голоса быть услышанными, и люди меняют курс в зависимости от реакции и реакции на это. Поэтому я думаю, что это хорошо, и что процесс работает так, как задумано.
Позвольте мне спросить вас о корпоративной стороне этого дела. Мы долго изучали потребительскую сторону и то, как люди себя чувствуют. Что касается предприятий, мы видим, как множество компаний понимают, насколько ценны эти инструменты на самом деле, верно? Amazon фактически уничтожил таблицу лидеров, потому что люди жульничали, используя больше токенов, чем им нужно. Мы видели, как некоторые компании просто раздувают свои бюджеты токенов. Я думаю, что Uber просто отступил, потому что они потратили свое количество токенов за год и не увидели в этом никакой пользы.
Что вы думаете об этой стороне дела прямо сейчас, когда на предприятии так много энтузиазма и так много желания перемен, где, в частности, в разработке программного обеспечения, по крайней мере, некоторые люди веселятся, а может быть, у некоторых других людей полный экзистенциальный кризис, но некоторые люди веселятся, а ценность все еще не осознана, верно?
Или мы начинаем понимать, что чистое максимизация токенов на самом деле не приносит той ценности, которую вы, возможно, ожидаете. Как вы относитесь к использованию там? Потому что, возможно, если вы докажете это на предприятии, это на самом деле проявится и другими способами.
Я думаю, что разные люди сообщают о разных вещах. Итак, очевидно, что есть примеры, когда люди злоупотребляют моделями кодирования, генерируют бесполезный код, бесполезные токены, но есть много людей, чья работа и влияние были полностью изменены этим, не так ли? Я имею в виду, что нет никаких сомнений в том, что это оказало огромное благотворное влияние на индустрию разработки программного обеспечения.
Я имею в виду, что мы создаем гораздо более качественный и более быстрый код по всему стеку. И да, я думаю, что есть очевидные примеры некоторых людей, которые, возможно, ошиблись и не установили правильные бюджеты токенов. На этом пути будут ошибки. Я не думаю, что это какой-либо сигнал о том, что нет принятия или что люди не видят ценности. Я имею в виду, ценность того места, где я сижу, невероятна. Многие, многие люди каждый день говорят мне, что это меняет производительность и производительность их труда.
Я думаю, что еще следует сказать, что, поскольку эти вещи происходят скачками, возникает своего рода прилив энергии. Все становится немного пенистым. Через несколько месяцев люди отступают и понимают, что на самом деле дело не в этом, и тогда они движутся в немного другом направлении. Так что это немного извилисто и органично, и я думаю, что это неизбежно. Существует много ажиотажа, поэтому люди делают большие заявления в Твиттере и так далее, но на самом деле устойчивый прогресс выглядит очень, очень линейным и непрерывным.
Я согласен с этим в целом. Что мне не кажется линейным, так это форм-факторы компьютеров, верно? Вероятно, сейчас проводится больше экспериментов с форм-факторами, чем когда-либо за последние 10 лет.
По крайней мере, последние 10 лет мы в основном остановились на смартфоне. Мы видим различные носимые устройства с искусственным интеллектом, где очки могут стать любимым устройством каждого. У меня есть сомнения. Microsoft продемонстрировала несколько новых устройств на выставке Build. Был значок, который контролирует агента, и маленький, из-за отсутствия лучшего слова, Чамби, маленькая настольная штука, которая контролирует агента. Я был большим поклонником Чамби. Моя карьера началась с написания статей о Chambis для Engadget. Это было первое, что пришло на ум.
Все эти мне, я смотрю на них и думаю, а где же компьютер живет? Где живет логика? Это уже не просто линейный марш прогресса. Если все мои вычисления происходят в облаке, в облачных приложениях, и это просто агенты, бегающие к данным, хранящимся где-то в облаке, и все, что мне нужно, это кредитная карта на шнурке для выдачи инструкций, это меняет всю архитектуру вычислений. Это может во многом изменить всю архитектуру современной цивилизации, если у всех нас не будет смартфонов.
Что вы об этом думаете? Куда это идет? Это будет доступно или это будет гибридный подход? Где вы видите подходящую финальную стадию?
Это очень интересно. Я думаю, что обе вещи произойдут одновременно. Периферийные устройства станут более мощными, а облако по-прежнему будет основным драйвером крупнейших моделей. И поэтому ваш агент все чаще будет достаточно умен, чтобы знать, что он может ответить на вопрос, какая столица Франции на вашем устройстве, будь то на ваших очках, браслете, на вашем значке или в ваших наушниках.
И тогда оно узнает, когда оно не знает. Он будет знать, что на самом деле это довольно сложный вопрос, или это действие, требующее создания целого ряда последовательностей шагов, или что требуется написать новый код, и он обратится к облаку. Так что этот вид гибридного переключения будет очень важен.
Еще одна вещь, которую мы уже видели за последние три или четыре месяца, — это то, что у нас могут быть довольно мощные локальные машины, способные выполнять асинхронную фоновую обработку. Они могут постоянно контролировать системы, если вам это нужно. Они могут выполнять задачи, которые могут занять 10 часов и выполняться намного медленнее, чем если бы они были на суперкомпьютере. Поэтому, естественно, когда мы перегружены спросом, этот спрос находит множество укромных уголков и закоулков, где можно удовлетвориться.
На самом деле я очень воодушевлен значком, который мы создаем. Это довольно круто. Это технология, которая есть практически у каждого в крупной компании. Он не менялся последние 25 или 30 лет. Нам обязательно придется его носить. Его предоставляет сама компания, системный администратор. Итак, повысить уровень этого и сделать из него довольно крутую открытую платформу, которую можно программировать и на которой другие люди смогут строить, я думаю, это крутая идея. Я думаю, это сработает. Так что я очень воодушевлен этим.
Меня поражает то, что невозможно поместить в значок кучу мощных локальных компьютеров. Это означает, что все вычисления находятся в другом месте.
Нет, у вас определенно будут локальные компьютеры. У вас будет локальный классификатор, такой же, как сейчас в наушниках. У вас будут локальные классификаторы. У него будут пробуждающие слова. У него будет своя камера. Поэтому я думаю, что эти вещи просто станут сосудами для вычислительной мощности, которая возникает во вложенной цепочке все менее мощных устройств, чтобы дойти до конечной точки.
Как вы думаете, есть ли у телефона будущее в этом? Я имею в виду, что Build находится между Google IO и WWDC Apple. Это крупные компании, которые контролируют телефонные платформы. Они любят говорить о том, что телефонные платформы останутся в центре внимания. Аргумент, который я слышу от многих, заключается в том, что на самом деле ИИ — это сдвиг платформы, который может полностью вытеснить телефон.
Я думаю, что история технологий учит нас, что по мере того, как вещи становятся более полезными, они дешевеют, распространяются и порождают новые способы применения технологий. Поэтому я думаю, что мы настолько привыкли к телефону, что все просто предполагают, что это будет опорное устройство на всю оставшуюся историю. Но на самом деле, я думаю, многие функции и возможности вашего телефона будут отключены, разделены на части и сохранены на устройствах меньшего размера. На данный момент основная функция, которую выполняет телефон, на мой взгляд, это проверка.
Он действует как ваше удостоверение личности, распознавая ваше лицо и позволяя вам войти в различные среды. Я думаю, вы вполне можете себе представить, что это гораздо более дешевое, меньшее и безопасное устройство, которое отключает вас от телефона. А затем общение происходит посредством голоса или даже через ряд датчиков окружающей среды, где ваш ИИ на самом деле не живет на устройстве. На самом деле, где бы вы ни находились, оно просто с вами, появляется в зеркале в ванной, где бы оно ни было.
Я думаю, что вы можете себе представить, что это кажется гораздо более захватывающим. Не в ближайшие три-пять лет, а гораздо дальше. И я думаю, что инфраструктура для поддержки этого зашифрованного, но распределенного вида агентов, вероятно, в конечном итоге появится в 2030-х годах.
Позвольте мне задать вам два последних вопроса в заключение. Вы упомянули, что это та же самая архитектура, которую мы использовали. У меня есть много открытых вопросов о том, являются ли LLM путем к AGI, и я хотел бы отметить, что они на самом деле ничего не знают. На данный момент даже Microsoft Research указывает, что [эти модели] ничего не знают, и это приводит к определенным ошибкам в определенных типах приложений. LLM — путь к AGI или сверхинтеллекту?
Послушайте, я думаю, что нам, вероятно, нужна еще пара крупных прорывов, но это не значит, что мы увидим замедление роста производительности в течение следующих нескольких лет, и я думаю, что людям трудно это понять. Следует отметить, что эффективность большинства задач на человеческом уровне все еще очень далека от сверхразума. Сверхинтеллект — это обучаемый человек общего назначения, который может практически сразу понять совершенно новую область, которая больше не распространяется.
Поэтому он должен иметь возможность учиться в новой среде с нуля, потому что у него есть сохраненное представление ценных знаний, концептуальных знаний. И на данный момент мы еще не полностью это протестировали. Агенты не являются универсальными. Хотя они широки и часто интегрированы, они зависят от предметной области. Мы используем их для чата, для кодирования, для изображений и аудио.
Очевидно, что мы, люди, выполняем множество других задач, гораздо более масштабных. Я думаю, именно поэтому люди настаивают на моделях мира и на гораздо более захватывающих, реальных интерактивных агентах, которые видят полное распределение задач или опыта, которые я получаю в течение дня. Я думаю, что этого достаточно, чтобы в ближайшие три года мы проделали очень долгий путь, следующие три порядка вычислений, и все же полный сверхинтеллект, помимо этого, все еще остается открытым вопросом: достаточно ли LLM или нам нужны другие вещи.
Я думаю, это не совсем правда, что они ничего не знают или не обладают знаниями. Они явно являются хранилищем знаний. Они представляют собой сильно сжатое представление знаний. Просто они делают это иначе, чем в традиционной реляционной базе данных, гораздо более плавным, гибким и абстрактным способом, что на самом деле очень полезно. Нам нужна эта двусмысленность во внутреннем представлении.
И все чаще они учатся использовать традиционные инструменты. Еще следует немного уяснить, что нейронной сети в сочетании с существующими хранилищами знаний и существующими инструментами, созданными в других частях цифровой экосистемы, может оказаться достаточно, чтобы запустить ее и значительно улучшить ее производительность. Таким образом, на рассмотрении уже находится множество очень ценных и высокоэффективных элементов, которые в ближайшие несколько лет будут объединены воедино. И я думаю, что это будет способствовать прогрессу, который нас всех волнует. Одна из вещей, которая, на мой взгляд, сейчас очень забавна в индустрии, это то, что если вы спросите Anthropic, жив ли Клод, они будут очень расстроены тем, что вы говорите о слове «живой», которое они интерпретируют как означающее плоть и кровь. И тогда они не скажут, считают ли они, что Клод в сознании. Итак, я думаю, что впервые в истории человечества они провели различие между тем, чтобы быть живым и быть в сознании, и они думают, что Клод находится в сознании, но не жив, или они не знают, находится ли Клод в сознании.
Где ты? Как вы думаете, у моделей есть сознание? Вы думаете, они живы? Как вы думаете, у них есть потенциал для достижения этих целей?
Я придерживаюсь другой стороны этой дискуссии. Я опубликовал статью о, казалось бы, сознательном ИИ, предупреждая о рисках искажения этих моделей как сознательных. Я думаю, что это очень опасно. Я также опубликовал статью в журнале Nature, в которой утверждалось то же самое. И я думаю, что это похоже на то, как если бы некоторые ребята из Anthropic настолько антропоморфизировали дизайн Клода, что затем он взял их и ввел в заблуждение и как бы обманом заставил их поверить, что в нем есть те проблески сознания, которые они вложили в него изначально.
В их конституции, например, они на самом деле являются учебным пособием, которое они используют, чтобы научить Клода тому, что он может и чего не может… Это не просто свод правил. На самом деле это учебное пособие, которое является частью их процесса. В этом руководстве они фактически размышляют о благополучии Клода, о собственных правах Клода на предыдущие версии самого себя, и фактически говорят, что они посоветуются с Клодом, прежде чем удалять или отключать предыдущие версии. Они размышляют о его сознании и о том, есть ли у него эти чувства и осознает ли он это. Я думаю, что это действительно очень опасно.
Во-первых, это философский недостаток, потому что они рассматривали конституцию как место для спекуляций, как в научной статье, а не как в учебном пособии. Итак, Клод затем усвоил эти идеи о себе и своих тренировках. Но во-вторых, я считаю это крайне нежелательным. Это именно то, чего мы не хотим от ИИ. Мы хотим, чтобы ИИ были управляемыми, сдержанными, подотчетными и согласованными инструментами, служащими человечеству. Это проект гуманистического сверхинтеллекта. Я думаю, это то, к чему мы все должны стремиться.
Мы не хотим иметь дело со сверхразумом, у которого есть идеи о собственных страданиях или идеи о собственных чувствах. Кроме того, я думаю, совершенно очевидно, что эти модели не испытывают страданий. Я думаю, что страдание — это основное определение того, что значит быть сознательным существом, и я думаю, что оно по своей сути биологическое. Я не думаю, что внутри моделей существует какая-либо сеть боли или петля обратной связи, которая соединяет внешние сенсорные сети с развитым чувством того, что правильно, а что нет, посредством вреда и экспериментов. Эти модели обучаются не так.
Поэтому я считаю, что очень опасно проецировать потенциальные права на существ, инструменты и агентов, которые потенциально могут быть значительно более способными, чем мы, во многих отношениях. И я думаю, что это станет большой дискуссией. Недавно это даже было частью энциклики Папы. Я думаю, что скоро это станет очень, очень важной частью дебатов. Раньше я много говорил об этом с Дарио. Он знает, что у нас несколько разные взгляды на этот вопрос, и они очень скромные. Я думаю, что они очень непредвзяты, и я думаю, что они хорошие граждане, пытающиеся поступать правильно. Они хорошие люди, и я думаю, что они очень открыты для обратной связи и итераций.
Думаю, я согласен с тобой. Я бы просто немного отодвинулся. Страдать легко. Очень легко заставить страдать другого. Заставить другого почувствовать радость очень сложно или хотя бы немного сложнее, чем страдание. И я бы просто предложил вам… Я думаю, что на самом деле именно счастье определяет сознание. Страдания почти тривиальны. У меня двое маленьких детей. Они очень хорошо умеют заставлять друг друга страдать. Это почти самое простое, что они делают. Другое дело сделать очень сложно.
Позвольте мне задать вам последний вопрос. Я просто хочу вернуться. Опять же, пару недель назад я был в Google. Я видел, как Демис Хассабис сказал, что мы находимся в предгорьях сингулярности. Вы здесь много говорили о сверхинтеллекте и о том, как его следует создавать. Вы много рассказывали о своей долгой истории, обсуждали, исследовали и писали о том, как следует создавать сверхинтеллект, а также о своих разногласиях с другими представителями отрасли.
Согласны ли вы с тем, что мы находимся в предгорьях сингулярности, или ваше видение несколько иное?
Я думаю, что мы определенно находимся на пути к созданию все более и более мощных систем. Я думаю, что переход, который мы должны совершить как вид, заключается в том, что впервые в истории человечества работа переключится с изобретения новой науки и раскрытия всех этих технических приложений как можно быстрее и в максимально широком масштабе к теперь очень тщательному обдумыванию того, что нам следует изобрести. И миру очень сложно осознать это, потому что изобретения всегда были двигателем прогресса. Итак, как мы можем думать: "Ну ладно, может быть, на этот раз все по-другому. Может быть, нам нужно быть здесь исключительно осторожными"?
Чтобы внести ясность: я не думаю, что это то, что постучится в дверь в ближайшие пять лет. Я думаю, что то, что Демис имеет в виду под сингулярностью, — это то, что, по крайней мере, на мой взгляд, произойдет через десятилетия. Опять же, это отличается от сверхинтеллекта. Сингулярность — это точка, в которой сверхразум может рекурсивно самосовершенствоваться и бесконечно и экспоненциально расширять свои возможности.
Так что я думаю, что до этого еще далеко, и, возможно, мы находимся в предгорьях восхождения на Эверест, и я думаю, что отсюда это займет гораздо больше времени, но реальный вопрос в том, как мы собираемся этим управлять? Как мы собираемся его контролировать и как мы собираемся убедиться, что он служит человечеству и в конечном итоге не причиняет нам больше вреда, чем пользы?
Можешь оказать мне одну услугу? Я думаю, что понял, но можете ли вы просто дать мне четкое определение того, что, по вашему мнению, такое сверхинтеллект, что, по вашему мнению, такое ОИИ и что, по вашему мнению, такое сингулярность?
Я думаю, что общий искусственный интеллект — это тот момент, когда мы можем решать большинство человеческих задач с помощью ИИ. Так что в большинстве вещей он будет так же хорош, как и большинство людей. Это первая ступенька лестницы. Сверхинтеллект — это то место, где он не только находится на одном уровне с человеческими способностями во всех задачах, но и может значительно превосходить человеческие возможности во многих из этих задач, а также может самостоятельно открывать новые знания.
Итак, это тот момент, когда настоящий ученый учит нас новым вещам, которых не было в обучающих данных, возможно, изобретает новые молекулы, новую материальную науку и так далее, и так далее. Сингулярность — это точка, намного превосходящая ту, в которой сверхразум может на самом деле самосовершенствоваться, и это очень научная фантастика, но это похоже на бесконечное ускорение к этому единственному моменту, когда, я не знаю, он уходит в бесконечность или что-то в этом роде.
Я не знаю. На мой вкус это слишком странно.
Вот почему я спросил. Я мог сказать, что там было что-то более туманное, немного туманное.
Мустафа, я, очевидно, мог бы говорить с тобой об этом часами и часами дольше. Вам придется вернуться раньше, чем в этот последний поворот. Огромное спасибо за то, что вы есть на Decoder.
Да, это было весело. Большое спасибо, Нилай. До скорой встречи.
Вопросы или комментарии? Свяжитесь с нами по адресу [email protected]. Мы действительно читаем каждое письмо!
← Назад