يقول رئيس الذكاء الاصطناعي في مايكروسوفت أن الذكاء الفائق قريب، لكنه لن يأخذ وظيفتك
⚡ الخلاصة في سطرين
أتحدث اليوم مع مصطفى سليمان، الرئيس التنفيذي لشركة Microsoft AI. وفي الواقع، سأجعل مقدمة اليوم قصيرة - فأنا أعمل في مزرعة عائلة زوجتي هذا الأسبوع، كما سترون في الفيديو، ولكن هذا أيضًا يعد بمثابة حرق حقيقي للحلقة.
أتحدث اليوم مع مصطفى سليمان، الرئيس التنفيذي لشركة Microsoft AI. وفي الواقع، سأجعل مقدمة اليوم قصيرة - فأنا أعمل في مزرعة عائلة زوجتي هذا الأسبوع، كما سترون في الفيديو، ولكن هذا أيضًا يعد بمثابة حرق حقيقي للحلقة.
لقد غطينا كل شيء بدءًا من منهج مصطفى في تدريب النماذج الجديدة وحتى انتقاداته للحديث الأنثروبي عن كلود كما لو كان واعيًا. بالطبع، تحدثنا أيضًا عن علاقة Microsoft بـ OpenAI، وكيف يفكر مصطفى في كل استطلاعات الرأي السلبية والمقاومة السياسية حول الذكاء الاصطناعي في الوقت الحالي، وما إذا كان أي من المنتجات الاستهلاكية جيدًا بما يكفي للتغلب عليها.
كما قلت، إنه الموقد.
حسنًا: مصطفى سليمان، الرئيس التنفيذي لشركة Microsoft AI. ها نحن.
تم تحرير هذه المقابلة بشكل طفيف من أجل الطول والوضوح.
مصطفى سليمان، أنت الرئيس التنفيذي لشركة Microsoft AI. مرحبا بكم مرة أخرى في فك التشفير.
عظيم أن أكون معك مرة أخرى.
أنا متحمس جدًا للتحدث معك. كانت محادثتنا السابقة واحدة من محادثاتي المفضلة - حول الذكاء الاصطناعي، وكيف ينبغي أن نشعر به، وما الغرض منه - والتي أجريتها في جميع المحادثات التي أجريناها.
هناك بعض التغييرات الكبيرة في Microsoft، وربما بعض عمليات إعادة صياغة السياق المهمة جدًا حول شعور الناس تجاه الذكاء الاصطناعي الذي أريد أن أتحدث إليكم عنه على وجه الخصوص. ثم هناك Microsoft Build، وهو مؤتمر مطوري Microsoft الكبير، والذي تضمن الكثير من الإعلانات الجديدة والكثير من الأفكار الكبيرة حول الغرض من أجهزة الكمبيوتر وربما المكان الذي يجب أن تكون فيه والذي أرغب في التطرق إليه.
لنبدأ من البداية. هذه بعض عناصر وحدة فك التشفير العميقة التي من المهم فهمها قبل كل ما تبقى منها. منذ انضمامك إلى Microsoft، قمت بإعادة هيكلة كيفية عمل الذكاء الاصطناعي هناك. لقد تغير دورك. آخر مرة تحدثت معك، كنت مسؤولاً عن مجموعة من المنتجات الاستهلاكية. ومنذ ذلك الحين تم وضع ذلك جانبا. أنت الآن تقوم بتدريب نماذج جديدة؛ أنت على الحدود.
اشرح كيف يتم تنظيم Microsoft AI الآن وكيف يتم تنظيمه داخل Microsoft.
أعتقد أنه خلال آخر 15 إلى 18 شهرًا أو نحو ذلك كنا في هذه الرحلة لإعادة تأسيس علاقتنا مع OpenAI، وقد استغرق الأمر دقيقة واحدة. أعتقد أن الأمر توج بعقد جديد أبرمناه في أكتوبر من العام الماضي. وكان هناك الكثير والكثير من الأحكام المختلفة في ذلك، بما في ذلك تعزيز وتوسيع الشراكة، ولكن بشكل حاسم يحررنا لنكون قادرين على متابعة الذكاء الفائق بشكل مستقل وكذلك الاستمرار في شراء وترخيص نماذجهم.
لذلك، منذ شهر أكتوبر، قمت بتجميع فريق الذكاء الفائق، وبناء مجموعات ذات حجم كافٍ لتدريب النماذج الرائدة، وتوظيف فريق يركز على الذكاء الفائق. وكان ذلك بمثابة تحول كبير جدًا بالنسبة لنا لأنه مكنني نوعًا ما من التركيز فقط على مهمة الذكاء الفائق، وقد توج ذلك بعد ذلك ببعض الأشياء التي أعلنا عنها هذا الأسبوع في Build. لدينا سبعة نماذج جديدة في جميع الطرائق وما إلى ذلك. لقد كان تحولًا كبيرًا جدًا، وأعتقد أنه استغرق وقتًا طويلاً في التخطيط، ومن دواعي ارتياحنا أن نكون الآن في اللعبة ونسعى إلى تحقيق الحدود المطلقة خلال السنوات القليلة المقبلة.
هل كانت هذه هي الخطة عندما تم تعيينك في مايكروسوفت؟
لقد كانت هذه بالتأكيد الخطة طوال الـ 18 شهرًا الماضية. أعني، أعتقد أن العلاقة مع OpenAI مرت بالكثير من التقلبات. ومن نواحٍ عديدة، أعتقد أنها ستكون واحدة من أنجح الشراكات في التاريخ. لقد كان الأمر رائعًا بالنسبة لـ OpenAI، وكان رائعًا بالنسبة لشركة Microsoft، وكل العلاقات الجيدة تتطور، وأعتقد أن هذه مجرد المرحلة التالية في تطورنا.
اسمحوا لي أن أسألك عن هذا التطور على وجه التحديد. لقد شاهدنا جميعًا للتو المحاكمة بين Elon Musk وOpenAI وSam Altman. لقد شاركت مايكروسوفت في تلك المحاكمة، بمعنى أنه في كثير من الأحيان كان محامٍ من مايكروسوفت يقف ويقول: "ولم نكن موجودين". وقد يقول أحدهم نعم، وكان هذا هو الحال. لكن من الواضح أن ما ظهر خلال تلك التجربة، وما كان واضحًا طوال هذا الوقت، هو أن الفكرة الأصلية كانت أن OpenAI سيكون مختبرًا للأبحاث ويقدم النماذج، بينما تقوم Microsoft ببناء المنتجات. كان لدى مايكروسوفت خبرة في الذهاب إلى السوق؛ كان لديها خبرة في مجال الأعمال، وكانت تحاول استعادة موطئ قدمها لدى المستهلك بعدة طرق. سيكون هذا بمثابة تحول في النظام الأساسي، وسينتهي العمل البحثي في OpenAI، وسيكون عمل المنتج داخل Microsoft.
هذا هو الشيء الذي تغير: أرادت شركة OpenAI إنتاج المزيد والمزيد من المنتجات الاستهلاكية. من الواضح أنه نظرًا لدورك الجديد وتركيزك الجديد، ترغب Microsoft أكثر فأكثر في صنع نماذجها الخاصة. لماذا الانقسام؟ ما الذي لم ينجح في تلك العلاقة؟
أعني، أعتقد أن OpenAI يقودها فريق مؤسس طموح بشكل لا يصدق، وسام نفسه. وبطبيعة الحال، عندما بدأوا في الحصول على المزيد من الاهتمام وتحقيق قدر كبير من الإيرادات، رأوا فرصًا لتحقيق مكاسب كاملة. لذلك لم يقتصر الأمر على أنهم بدأوا العمل على المنتجات الاستهلاكية. من الواضح أن ChatGPT كان ناجحًا بشكل لا يصدق. كما بدأوا أيضًا العمل على مراكز البيانات الخاصة بهم. لقد بدأوا في إنشاء الشريحة الخاصة بهم. هناك الكثير من الشائعات التي تدور حول الأجهزة الاستهلاكية الخاصة بهم. لقد بدأوا في نقل النماذج مباشرة إلى السوق من خلال ChatGPT Enterprise. لذلك، عبر المجموعة، كانوا نوعًا ما يوسعون الطريق إلى ما هو أبعد من البحث على مدار العامين أو الثلاثة أو الأربعة أعوام الماضية. وبطبيعة الحال، ينطبق الشيء نفسه أيضًا على Microsoft. أعني، أعتقد أن عمر الشراكة الآن هو خمس أو ست سنوات، ولا يزال أمامها أربع أو خمس أو ست سنوات أخرى لتستمر.
وبالمثل، نحن واحدة من أكبر شركات التكنولوجيا في العالم. لدينا 493 من أكبر 500 شركة تقوم بتخزين ومعالجة معظم بياناتها على أنظمتنا، وتستخدم Azure، وتستخدم M365 وTeams. أعتقد أن الناس في كثير من الأحيان لا يقدرون مدى ضخامة حجمنا وحجم توزيعنا في المؤسسة. وهكذا، على المدى الطويل، وأعني على مدى خمس أو ست أو سبع أو 10 سنوات، علينا أن نتأكد من أننا مستدامون تمامًا، وأننا لسنا مجرد متلقين للملكية الفكرية لشخص آخر ثم نقوم بعد ذلك بتعديلها قليلاً وتكييفها ووضعها في مرحلة الإنتاج لمنتجاتنا، ولكن يمكننا في الواقع الوقوف على أقدامنا وإنشاء نماذج عالمية المستوى.
أعني أن الذكاء الخارق قادم. أعتقد أنه قاب قوسين أو أدنى. ولذا أعتقد أنها ستكون التكنولوجيا الأكثر قيمة على الإطلاق. لا توجد طريقة يمكننا من خلالها، على المدى الطويل، أن نعتمد هيكليًا على طرف ثالث لتوفير تلك الملكية الفكرية إلى الأبد.
من الواضح أن هذا هو التحول الذي تم إطلاقه عندما واجهت شركة OpenAI وما إلى ذلك مشكلة في مجلس إدارتها. ولكن عندما جئت ودخل فريقي، بدأنا في بناء ذلك، ونحن في هذا التحول. وأعتقد أننا في وضع رائع لأنه يمكننا اتخاذ موقف مثالي ثابت ودقيق إلى حد ما على المدى الطويل، سواء بالنسبة لـ OpenAI، التي أعتقد أنها حققت أداءً جيدًا بشكل لا يصدق من هذا، أو بالنسبة لنا.
أريد قضاء بعض الوقت في الذكاء الفائق. أريد فقط أن أضع دبوسًا عليها الآن لأنني أريد فقط أن أفهم نوعًا ما عملية الانتقال لدورة أخرى هنا.
"هناك لحظة في المحاكمة، نوع من الرسالة المضحكة للغاية من الرئيس التنفيذي لشركة Microsoft، ساتيا ناديلا، حيث يقول: "لا أريد أن أكون Intel وأن يكون OpenAI هو Microsoft"، وهو أمر مضحك للغاية في سياق الرئيس التنفيذي لشركة Microsoft نفسه الذي يقول: "لا أريد أن أكون المزود، وأجعلهم هم النظام الأساسي الذي يوفر كل القيمة ويجمع كل القيمة وربما يتم استبدالنا. لا أريد تشغيل ChatGPT على Azure، وبعد ذلك سيحصل OpenAI على كل الميزات القيمة، ومن ثم ربما يمكنهم استبدالنا"، تمامًا كما حدث مع Windows وIntel مع مرور الوقت.
هل هذا إدراك؟ هل جاء ناديلا إليك؟ كيف كان هذا الاجتماع عندما قلت: "حسنًا، واجهت شركة OpenAI مشكلات في مجلس إدارتها. نحن بحاجة إلى العودة إلى الحدود والوقوف على أقدامنا." كيف بدت تلك المحادثة وكيف تم اتخاذ هذا القرار؟
أعني، من الواضح أن هذا هو قرار ساتيا وكذلك إيمي وبراد والعديد من الأشخاص الآخرين في الشركة. لكنني أعتقد أن الأمر كما هو الحال مع أي شيء آخر: فهذه تغييرات بطيئة الحركة في الشركة، حيث ندرك أن الاتجاه الذي نتخذه يحتاج إلى القليل من التغيير والتبديل. وكان ذلك يحدث قبل حادثة مجلس الإدارة في شهر نوفمبر، وأعتقد أن الأمر يتراكم بمرور الوقت عندما تنظر إلى نوع الكوكبة من الجبهات المختلفة التي نتنافس حولها بشكل مباشر، وبشكل متزايد، وكل التوتر الذي يأتي من ذلك. ولكن أيضًا معرفة أن مثل هذه الشراكات لا تدوم إلى الأبد.
أعني أن OpenAI تريد أن تصبح شركة عامة بقيمة تريليون دولار، وأن تتمتع بإيرادات مذهلة، وتنمو بشكل جنوني. إنهم يريدون أن يتمتعوا بحرية العمل وأن يكونوا قادرين على شراء الحوسبة من جميع أنواع الأماكن الأخرى، وبناء حوسبة خاصة بهم، والشراكة مع من يريدون. لذلك تم إبرام العقد في وقت كانت فيه الشركات مختلفة تمامًا من حيث الحجم والنطاق وتوازن الاحتياجات والأشياء. أعتقد أن الأمر كان منطقيًا في تلك اللحظة، ولكن بعد ذلك أصبح من الواضح جدًا أن هذا شيء يجب أن نكون قادرين على امتلاكه والتحكم فيه وأن نفعله بشكل صحيح من قبل عملائنا.
كما قلت، لدينا توزيع مذهل على مستوى المؤسسات، والذي أعتقد أنه لا مثيل له على الإطلاق في العالم. ولذلك علينا أن نتأكد من أننا نبني أفضل الأشياء لعملائنا. يبدو هذا مختلفًا بعض الشيء عن شركة تعمل بشكل مشترك على تحسين كل من المستهلك، مع ChatGPT، وللمؤسسة، وكذلك للمهمة العلمية الأساسية للذكاء الفائق، والتي تتضمن مجموعة كاملة من الاتجاهات المختلفة المتداخلة ولكن يمكن القول إنها متعامدة مع المستهلك واتجاهات المؤسسة أيضًا. وبطبيعة الحال، أعتقد أن هذه هي الطريقة التي تتطور بها الشراكات، ويتم إعادة ضبطها بشكل دوري.
نعم، لكن بناء نموذج حدودي مكلف للغاية، كما قيل لي. قيل بشكل موثوق أن هذا مشروع مكلف للغاية. في مرحلة ما، يجب على إيمي هود، المديرة المالية لشركة مايكروسوفت، أن تقول: "نعم، لقد حصلت على الميزانية". متى حدث ذلك؟ هل كانت تلك مجرد رسالة نصية؟ هل كان هناك اجتماع؟ أخبرني عن التفاصيل هناك.
أعتقد، لقد اتخذنا القرار نوعًا ما في الجزء الأول من العام الماضي، والذي كان واضحًا في جميع مفاوضات العقد، والتي تم حلها وتوقيعها في أكتوبر. وهو استثمار كبير، ولكن أمامنا وقت طويل لتحقيقه. أعني أننا قمنا بالفعل باستثمارات كبيرة في مهمة الاكتفاء الذاتي الخاصة بنا.
شريحة Maia 200 الخاصة بنا هي في الواقع شريحة رائعة، على سبيل المثال، أليس كذلك؟ نحن الآن قادرون على تصنيع وشحن شريحة أرخص بنسبة 30 بالمائة من شريحة GB200 داخل مجموعاتنا الخاصة. والآن بعد أن أصبح بإمكاننا المشاركة في تصميم نماذجنا الخاصة به، فإن نموذج MAI-Thinking-1 الذي أصدرناه للتو يقدم أداءً بمعدل 1.4x لكل واط بالإضافة إلى التحسن بنسبة 30 بالمائة الذي تحصل عليه من التشغيل على Maia 200 بمجرد أن نتعاون في تحسين النماذج لمهامنا.
لذا فإن قيمة التأكد من أنك تمتلك وتتحكم في مجموعتك الخاصة وتوجيه جهد التصميم المشترك بالكامل من البداية إلى النهاية لحالات الاستخدام الأكثر أهمية بالنسبة لنا - والتي من الواضح أنها البرمجة الوكيلة، والمطورين لدينا، ومؤسساتنا - التي تدفع بوضوح الأرباح التي تبرر الاستثمار الذي يتعين علينا القيام به على مدى السنوات القليلة المقبلة.
لقد قلت مهمة الاكتفاء الذاتي، وهي طريقة مهذبة للغاية للقول أنك تريد الوقوف على قدميك؛ تريد أن تفعل الشيء الخاص بك. قيل لي أن هناك بعض الجدل داخل Microsoft حول سطر كتبه زميلي هايدن فيلد في مقال يصف Build. سأقرأ هذا فقط. هذا من هايدن. إنه خط عظيم. قالت: "إن Microsoft Build لهذا العام كان يتمتع بأجواء مطلقة عازبة حديثًا تنشر مصيدة عطش على Instagram."
اكتمل الانفصال، وحان وقت الثني. هذا هو نموذجنا الجديد. سوف نقف على قدمينا. أنت تقول إنك ستقوم ببناء نماذج على الحدود والتنافس مع المختبرات الرائدة. هل هذا هو الشعور داخل Microsoft بأنك حر في أن تكون بمفردك؟
بالتأكيد لا. لا، على الاطلاق. انظر، أعني أنه من الواضح أن هذا عنوان رائع وعبارة ممتعة. ولكن الحقيقة هي أننا في شراكة مع OpenAI لسنوات وسنوات قادمة. أعني أننا نتجه نحو الشمال من عام 2030. وما زالوا ينتجون أفضل الموديلات في العالم. يعد GPT-5.5 نموذجًا متميزًا. إن المخطوطة، ونماذج الأمن السيبراني التي تظهر، مذهلة، وهي تدعم غالبية ما نقوم به.
ومن الطبيعي أن يستمر هذا الأمر. ولذا أعتقد أن هذا مجرد مسار طبيعي لهذه الأنواع من الشراكات. لا أعتقد أن هذا شيء غير متوقع أو مفاجئ. أعتقد أن OpenAI تتفهم ذلك وتدعمه كثيرًا. أعني، من الواضح أنهم كانوا شركة سريعة النمو بشكل لا يصدق، وهم يدركون أنه يتعين علينا متابعة أجندتنا الخاصة أيضًا. لذلك فهو طبيعي جدا.
اسمحوا لي أن أطرح عليك سؤال وحدة فك التشفير الآخر، وبعد ذلك أريد أن أتطرق إلى الإعلانات في Build، وبالتأكيد الذكاء الفائق.
في المرة الأخيرة التي تحدثنا فيها، قلت إن إطار العمل الخاص بك لاتخاذ القرارات يعمل على مدار ستة أسابيع، بالنظر إلى مدى سرعة تحرك الذكاء الاصطناعي. كان ذلك منطقيًا إذن. ربما استقرت الأمور. ربما تكون بعض الأشياء أكثر تركيزًا. ما هو إطار اتخاذ القرار الخاص بك الآن؟
ما زلنا نعمل بنفس إيقاع الدورة. في نهاية كل دورة، لدينا لقاء شخصي لمدة أسبوع واحد. أنا مؤمن حقيقي بهذا، على الرغم من أننا لا نزال نتبع ثقافة العمل في المكتب، أربعة أيام في الأسبوع. في الواقع، في الأسبوع الذي يليه، يجتمع فريق الذكاء الخارق بأكمله شخصيًا في بوسطن لمدة أربعة أيام. هذا هو كل ما لدينا من استعراضات استرجاعية حول كيفية سير عملية البناء، وما تعلمناه، وما لم نقم به بشكل صحيح، وما نحتاج إلى تحسينه، وتخطيطنا للدورة التالية، والتي ستستمر لمدة ثمانية أسابيع هذه المرة مع لقاء مدته أسبوع واحد بعد ذلك، وكل هذا تم وضعه للعام بأكمله. لذا فإن المنظمة بأكملها تعرف أن هذا هو الإيقاع الذي نعمل به.
وأعتقد أنه من المهم حقًا التأكيد على هذا الإطار الزمني، لأن التخطيط ربع السنوي يصبح ضبابيًا ومجردًا بعض الشيء. أعتقد أن من ستة إلى ثمانية أسابيع، اعتمادًا على موقعه في التقويم، هو في الواقع الوقت الأمثل للقيام بمهام واضحة للغاية وقابلة للتحصين.
لذلك، بالإضافة إلى إيقاع هذه الدورات التي تستغرق من ستة إلى ثمانية أسابيع، فإننا أيضًا نعمل بواسطة فرق. الفرق عبارة عن مجموعات فرعية مختلطة متعددة التخصصات تركز على مهمة محددة، ولا تصل بالضرورة إلى المدير. يتم تشغيلها في الواقع بواسطة DRI، وغالبًا ما يكون DRI عبارة عن IC، ومهمتهم هي-
هذا هو "الفرد المسؤول بشكل مباشر" و"المساهم الفردي".
نعم بالضبط. شكرًا لك. وأعتقد أننا اتبعنا نهج فصل دور المدير عن دور الـ DRI الذي ينفذ في مهمة محددة. أعتقد أن السبب في ذلك هو أن كونك شخصًا رائعًا في DRI أمر مرهق. أنت حرفيًا تعمل كل ما في 24 ساعة يوميًا، وتبذل قصارى جهدك قدر الإمكان. إن كونك مديرًا يعني في كثير من الأحيان أن تكون مدربًا، وتقدم الدعم، وتقدم التوجيه، والتعليقات، وتزيل العوائق عن كل أنواع الأشياء، وتساعد في النمو الوظيفي للأشخاص. ولذا أعتقد أن إبقاء هذه الأجهزة منفصلة يسمح لنا بتدوير أجهزة الـ DRI كل دورتين أو ثلاث دورات حتى يتمكن بعض الأشخاص من تجربة أوضاع مختلفة نوعًا ما والتناوب. أعتقد أنه هيكل رائع ومرن جدًا يسمح لنا بأن نكون أذكياء جدًا.
دعونا نتحدث عن البناء. أردت أن أبدأ بالذكاء الفائق. لقد ذكرت ذلك عدة مرات الآن. لقد كنت للتو في Google IO. أنهى ديميس هاسابيس، الذي كان زميلك عندما كنت في جوجل، تلك الكلمة الرئيسية بالقول إننا كنا في "سفح التفرد، وأن الذكاء الاصطناعي العام يأتي بكل قوة جوجل".
أنت تقول أن الذكاء الخارق موجود هنا. هل هذه كلها نفس الأشياء؟ هل نستخدم لغة مختلفة لوصف الذكاء الاصطناعي العام؟ هل هناك اختلافات؟ كيف يمكنك تعريف الذكاء الفائق في سياقك مقابل التفرد في سياق ديميس؟
أعني، من الواضح أنني لم أقل أنه كان هنا. قلت أنه قادم. وأعتقد أن هناك الكثير من السيولة حول هذه العبارات. لكنني أعتقد أن ما يمكننا رؤيته بوضوح أن ما يحدث الآن هو أن هناك صعودًا لوغاريتميًا خطيًا عبر جميع الأساليب، وهذا يعني أن هناك علاقة مباشرة جدًا بين كل ترتيب من حجم الحوسبة التي نطبقها، وكل زيادة تدريجية في البيانات، والتسلق على المعايير، سواء كانت معايير عامة، أو معايير داخلية، فهي أهداف نركز عليها مع بيئات التعلم المعززة. وهذه ملاحظة مهمة جدًا.
تلك التنبؤات التي أعتقد أننا جميعًا نقوم بها - أفهم سبب تشكك بعض الناس فيها أو إثارة الأسئلة، لكنها ترتكز بشدة على نوع من الملاحظات التجريبية لأكثر من عقد من الزيادة في أداء هذه النماذج. أعني أن نفس البنية ذات الأغراض العامة شهدت تطبيق 12 مرة من العمليات الحسابية الإضافية، وزيادة تريليون مرة في FLOPS على مدار 15 عامًا، وعملت بشكل أساسي في الصوت والصورة والنص والتعليمات البرمجية، وفي العديد من مهام التنبؤ بالسلاسل الزمنية الأخرى. ولذا فإننا نستنتج بشكل أساسي أن المزيد من أوامر حجم الحوسبة ستمكننا من الاستمرار في الصعود بهذه الطريقة اللوغاريتمية الخطية داخل البيئات الأخرى.
ومن ثم يثير السؤال، هل سنكون قادرين على تدريب النماذج التي يمكنها ابتكار معرفة جديدة، وليس مجرد نوع من الاستقراء من البيانات الموجودة لدينا، ولكن في الواقع تعلمنا أشياء لا نعرفها، وتصنع اكتشافات جديدة؟ والأمر الثاني هو، هل لديهم القدرة على تحسين أنفسهم وتسريع عملية تحديد الفرضيات التي يجب وضعها، وأي منها يجب متابعتها، وكيفية توليد بيانات التدريب لكل منها، وكيفية تحليلها في عمليات تشغيل جديدة، أو حتى الابتكار في البنية الفعلية نفسها؟
لذلك، أعتقد أن هذين الأمرين يجب أن يكونا صحيحين حتى نتمكن من رؤية هذا التقدم المضاعف، لكنني أعتقد أننا سنستمر في الحصول على مكاسب هائلة فقط من تطبيق الأوامر القليلة التالية من حجم الحوسبة. ربما يحقق هذا التكافؤ مع الأداء البشري في العديد من المهام، تمامًا كما رأينا ذلك يحدث في الأشهر الستة الماضية فيما يتعلق بالبرمجة.
البرمجة مثيرة للاهتمام حقًا، لأنه يمكن التحقق من صحتها بسهولة، أليس كذلك؟ تكتب الكود، وتطلب من الكمبيوتر تشغيله، فيعمل أو يفشل. لقد رأينا بعض الجوانب السلبية، وبالتأكيد فيما يتعلق بالأمن، أليس كذلك؟ الجوانب السلبية واضحة، ونحن نرى أن هذا النوع من النهج التنظيمي لأمن الترميز يتم تنفيذه بعدة طرق. من المحتمل أنني قمت ببرمجة بعض الكوارث الأمنية على هاتفي وجهاز الكمبيوتر الخاص بي، وربما تكون هذه مخاطرة أنا على استعداد لتحملها.
كل وظيفة أخرى لا تبدو بهذه السهولة. أختار دائمًا القانون، لأن هذه هي خلفيتي. لكن القاضي لا يتحقق من صحة الكتابة القانونية بالطريقة التي يتحقق بها الكمبيوتر من صحة التعليمات البرمجية. إذا أخطأت، يمكن للقاضي أن يرسلك إلى السجن، أليس كذلك؟ ربما يكون هذا هو أسوأ خطأ في التحقق من صحة الإخراج الذي يمكن أن تواجهه على الأرجح.
كيف يمكنك قياس الفعالية عبر المجالات بنفس السهولة التي يمكنك بها قياس الفعالية في البرمجة؟ لأن هذا يبدو لي حيث ينهار الاستعارة أو القياس من البرمجة إلى المجالات الأخرى بسرعة كبيرة.
لست متأكدا من ذلك. من الواضح أن الترميز يمكنك من التحقق من التنفيذ الصحيح للتعليمات البرمجية. يتم تشغيله، أو أنه يتعطل. ولكن هناك الكثير من الفروق الدقيقة في ذلك. إن جودة التعليمات البرمجية التي يتم كتابتها مهمة حقًا: قابليتها للتوسعة، ومدى قابليتها لإعادة التكوين، ومدى فائدتها في الممارسة العملية. لا يقتصر الأمر على تشغيل جزء من التعليمات البرمجية فحسب، بل يتعلق أيضًا بكيفية استخدام النموذج فعليًا كـ DevOps أو SRE في الإنتاج للعودة إلى جزء التعليمات البرمجية الذي تمت كتابته، ثم استخدامه بطريقة عملية ومفيدة.
وبعد ذلك، بالطبع، يتعين عليك تقييم جودة المخرجات التي تم إنتاجها. قد يكون كودًا برمجيًا عالي الجودة وفعالاً، ولكن هل هو بالفعل التطبيق أو موقع الويب الذي تريده؟ وفي ذلك أحكام جمالية؛ وفي ذلك أحكام تجارية. التحدي المتمثل في استيعاب المكافآت غير القابلة للتحقق موجود في الكود، على الرغم من أن الكود لا يزال في المقام الأول إشارة مكافأة يمكن التحقق منها. أعتقد أن الشيء الآخر الذي يجب ملاحظته هو أنه، مثل الدردشة، هي أيضًا مساحة غير قابلة للتحقق، ومع ذلك، فقد نجحنا في الارتقاء بذلك إلى مستوى الأداء البشري بشكل أساسي من خلال التفاعل مع الاستخدام في العالم الحقيقي الذي يوفر
انتظر. أنا فضولي للغاية. كيف يمكنك قياس الدردشة على مستوى الأداء البشري؟
حسنًا، أعتقد أن العديد من الأشخاص يجرون محادثات طويلة وهادفة مع الذكاء الاصطناعي على مستوى الأداء البشري. الجودة جيدة بشكل استثنائي. يتمتع بذكاء عاطفي جيد جدًا. إنها دقيقة للغاية على نطاق واسع. لقد قللنا من الهلوسة. نحن لا نتحدث كثيرا عن التحيز بعد الآن. إنها ترتكز على ملاحظات العالم الحقيقي. أعتقد أنه وفقًا لمقاييس معظم الناس، فقد وصلنا إلى مستوى الأداء البشري في المحادثة لمجموعة واسعة جدًا من المهام الآن.
ما هي مقاييسك، وفي الواقع، مقاييس معظم الناس؟ قد لا أتفق مع كل هذا تقريبًا، لكن هذه هي مقاييسي. ما هي التدابير الخاصة بك؟
يشبه إجراءي عندما أتوجه إلى مساعدي وأطلب منه أن يقدم لي ملخصًا يوميًا يلخص جميع المحادثات التي حدثت في Teams وعلى البريد الإلكتروني، والتحديثات التي حدثت للمستندات، وأحصل بشكل أساسي على ملخص مركب مع مجموعة من الإجراءات التي يجب علي اتخاذها بعد ذلك. وهذا أفضل بشكل أساسي مما يمكن أن ينتجه رئيس طاقمي. أود أن أقول إن هذا أداء على المستوى البشري في التوليف والتحليل والإجراءات المقترحة والدردشة.
هناك العديد والعديد من الملايين من الأشخاص الذين يستخدمونه يوميًا للحصول على الدعم العاطفي والاستشارة والعلاج والتدريب والمشورة. أعتقد أنها واحدة من حالات الاستخدام الأكثر شيوعًا داخل جميع برامج الدردشة الآلية. أود أن أقول إن هذا إجراء قوي جدًا لتقديم هذا الادعاء.
أعلم أنك قضيت الكثير من الوقت في التفكير في هذا الأمر، لا سيما الارتباط العاطفي ببعض روبوتات الدردشة هذه. هذه هي المنتجات التي قمت بإنشائها ونشرها. أود أن أفرق بشكل كبير بين هذا الشيء الذي يعد جيدًا حقًا في تلخيص بريدي الإلكتروني وقائمة المهام ويزودني بموجز حول الأشياء التي يجب تحديد أولوياتها، وهذا الشيء هو بمثابة مدرب عاطفي لشخص يمر بنوع ما من الأزمات.
هذه ليست مهام مماثلة. هذه ليست بالضرورة أنواعًا متشابهة من الذكاء، حتى عند البشر. أعرف بعض الأشخاص الذين يجيدون إعداد القوائم، وسيئون جدًا في الدعم العاطفي. كيف يمكنك تجميع كل ذلك معًا في عقلك والقول، "حسنًا، هذا أداء على مستوى الإنسان بشكل عام في الدردشة؟"
أعتقد أنه إذا قمت بتعريف الدردشة على أنها تبادل تفاعلي بين طرفين، أحدهما في هذه الحالة هو الذكاء الاصطناعي، والذي يلبي بعض الأهداف على نطاق واسع، فأنت تتطلع إلى معرفة النتيجة الرياضية، أو للحصول على نصيحة بشأن المطعم الذي ستذهب إليه، أو للتدريب والتعليق على مقال كتبته، أو للحصول على اقتراحات حول الوظيفة التي ستتولىها بعد ذلك، أو بعض المحادثات الصعبة التي ستجريها مع مديرك. تحصل على رد، وتتنقل ذهابًا وإيابًا، وتجري خمسة أو ستة تبادلات، وتجد أن هذا ناتج مفيد، والذي قد يتعين عليك الاعتماد عليه بخلاف ذلك على خبير أو صديق أو حتى الدفع للمدرب.
هناك، من الناحية الموضوعية والتجريبية، مئات الملايين من الأشخاص الذين يحصلون على هذه التجربة كل يوم من روبوتات الدردشة هذه. ربما يمكننا أن نتجادل بشأن ما إذا كان ذلك يمثل أداءً على المستوى البشري من الناحية الفنية. أعتقد أن المطالبة بشيء معقول إلى حد ما.
لا يوجد سبب لعدم استمرار ذلك في الصعود، أليس كذلك؟ إن معدل التسلق في السنوات الثلاث الماضية هو الشيء الذي أعتقد أنه الأكثر إثارة للدهشة. وهكذا، ما نحاول القيام به من هذه النقطة هو الاستقراء: حسنًا، ما هي الدوافع الأساسية لهذا الصعود - الحوسبة والبيانات والتفاعل من المستخدمين في العالم الحقيقي - ويبدو أن هذه الأشياء ستستمر. أعتقد أنها تنطبق على العديد من المجالات الأخرى أيضًا، ليس فقط الدردشة والدعم العاطفي والإنتاجية وهذا النوع من الأشياء، ولكن أيضًا العديد من المجالات الأخرى بخلاف ذلك/الرعاية الصحية، ونشر الإنتاج المباشر داخل التعليم، والمساعدين الذين يديرون منزلك بشكل متزايد، وينظرون إلى كل ما هو موجود في حياتك اليومية بشكل أساسي لجعلك أكثر إنتاجية. وأعتقد أن هذا هو المسار الذي من المرجح أن يستمر.
لقد ذكرت الآن أنه لا يزال نفس البنية الأساسية والمحولات والاهتمام. لقد قمنا بتطبيق الحوسبة على ذلك لمدة 15 عامًا، وقد حصلنا على هذه الزيادات الكبيرة. أنت في مكان فريد إلى حد ما.
في Build، أعلنت عن أول نموذج تفكير رئيسي لك، MAI-Thinking-1. عليك أن تبدأ من الصفر. هل هناك أي شيء قمت به بشكل مختلف الآن بعد 15 عامًا من تصميم هذا النموذج وتدريبه، أم أنه مجرد، نعم، سنقوم بجمع كل البيانات وإجراء التدريب تمامًا كما فعلنا، ولدينا المزيد من الحوسبة الآن، لذا سيكون أفضل؟
لا، في الواقع، أعتقد أن هناك الكثير من الاختلافات. أول شيء يجب قوله هو أن الطريقة التي تنظم بها البيانات... نبدأ مباشرة من أعلى المكدس؛ لقد دفعنا بشكل أساسي ثمن مجموعة من البيانات عالية الجودة ومحافظة للغاية وحصلنا عليها، واستخرجنا الكثير من المشكلات المزعجة والمشتتة ومنخفضة الجودة والمخاطر الأمنية المحتملة المتعلقة بهذه البيانات. وأعتقد أن الأساليب التي تستخدمها لتحقيق ذلك هي في الواقع ملكية خاصة. لقد شاركنا للتو تقريرًا فنيًا مفصلاً للغاية مكونًا من 109 صفحة، وقد لقي استحسانًا كبيرًا على تويتر، ويشاركنا الكثير من التفاصيل حول كيفية القيام بذلك. أعتقد أن الشيء الثاني هو، بينما أعتقد أنه من المهم أن نكون حذرين تمامًا فيما يتعلق بالخيارات المعمارية، وقد كنا كذلك، هناك أيضًا عدد من التحولات المهمة جدًا التي أعتقد أننا قمنا بها في كيفية تجميع دوراتنا التدريبية.
لقد كانت دوراتنا التدريبية مستقرة بشكل لا يصدق، مع عدد قليل جدًا من الأعطال، وعدد قليل جدًا من عمليات إعادة التشغيل. لقد شاركنا الكثير من هذه الرسوم البيانية لإظهار استقرار البنية التحتية، وكذلك كفاءة MFU، لذا فإن استخدام نموذج FLOPS، والذي يوضح بشكل أساسي أنه يمكننا وضع عدد متطور من FLOPS من خلال كل شريحة في كل خطوة في تدريبنا. أعتقد أنه من السهل للغاية أن نخطئ في هذا الأمر، ونحن جميعًا نسمع الكثير من القصص من مختبرات مختلفة حول كيفية حدوث خطأ ما.
في الواقع، من الصعب جدًا اتخاذ خيارات حذرة ومدروسة للغاية لتصحيح الأمور، واتخاذ النهج الصحيح للتأكد من أننا ننتج نماذج عالية الجودة، لأن مهمتنا وطموحنا هو محاولة بناء هذه الآلة لتسلق التلال. وهذا يعني دمج السيليكون مع النماذج، مع البيانات فائقة الجودة، مع مجموعة من RLEs، وبيئات التعلم المعززة، التي تسمح لنا بالتسلق بشكل منهجي ضد أي هدف نختاره.
وهذا هو MAI-Thinking-1. إنه نموذج تفكير للأغراض العامة ومحايد إلى حد ما وجيد جدًا في البرمجة. إنه الآن على قدم المساواة تقريبًا مع Opus 4.6، على الأقل في المعايير. لم نقم بنشرها على نطاق واسع في الإنتاج، لذلك لا يزال هناك الكثير من العمل الذي يتعين علينا القيام به هناك. لكنه مفكر قوي للغاية وقد حصل على 97% في اختبار AIME، وهو المقياس الأساسي لأداء الاستدلال، على الأقل في المعايير.
إنه جيد جدًا في اتباع التعليمات، ومن ثم فإن الهدف الأساسي هو جعل ذلك متاحًا للعديد والعديد من المطورين والمؤسسات والسماح لهم باستغلاله في حالات الاستخدام الخاصة بهم. كل شخص لديه هدف مختلف قليلاً في شركته لمحاولة بناء وكلاء وما إلى ذلك يدعم حالة الاستخدام الخاصة بهم.
أحد الأشياء التي لاحظتها في الحديث عن MAI-Thinking-1 هو أنك لم تستخلص أي نماذج موجودة، وهو ما أذهلني في الواقع باعتباره مفاجئًا، أليس كذلك؟ هذا شيء يمكنك القيام به. لديك حق الوصول إلى IP الخاص بـ OpenAI. الجميع يقطر كل شيء. لقد اكتشفنا للتو في هذه التجربة أن Grok تم تقطيره من عدد من النماذج. لماذا لا تفعل التقطير هنا؟ لماذا لا تقفز إلى الأمام؟
هناك بالتأكيد الكثير من الطرق المختصرة للوصول إلى الحدود، وإذا أخذت نموذجًا فائق الجودة، وقمت بتحسين نموذجك الأساسي بتعليمات أو إجابات أو مخرجات عالية الجودة من نموذج متفوق، فمن الصحيح أن النموذج قد يتناسب بسرعة مع هذا التوزيع. ولكن من غير الواضح أنهم سيكونون قادرين بعد ذلك على تجاوز ذلك المعلم.
لذلك، كنا متعمدين للغاية لسببين. الأول هو أننا نريد التأكد من قدرتنا على تجاوز المعلم حتى نتمكن من وضع الحدود بأنفسنا على مدى السنوات القليلة المقبلة. والثاني هو أننا نريد حقًا بناء أحد المختبرات العظيمة، وسيستغرق الأمر سنوات عديدة قادمة، ربما السنتين أو الثلاث سنوات القادمة.
ولكن، من أجل القيام بذلك، علينا أن نكون قادرين على إظهار أننا قادرون بالفعل على بناء كل مكون بأنفسنا. يمكننا توظيف أفضل المواهب في العالم. يمكننا أن ندفع الحدود من خلال البحث الفعلي، بدلاً من مجرد إعادة التنفيذ، أو النسخ، أو التقطير من أي طرف ثالث.
نحن في وضع رائع يمكننا من خلاله متابعة هذا الهدف بعناية ودقة، مع العلم أن لدينا الموارد اللازمة لشراء نماذج إنسانية حيث تتجاوز الحدود. لدينا الموارد اللازمة لوضع 11000 نموذج مختلف داخل Foundry، بحيث يحصل كل مطور لدينا على خيارات خالصة. وبطبيعة الحال، لدينا الموارد اللازمة لمواصلة نشر نماذج OpenAI، والتي من الواضح أنها متميزة وهي في المقدمة اليوم.
وهذا مجرد جزء طبيعي من مهمة الاكتفاء الذاتي، وسيستغرق الأمر بعض الوقت حتى نصل حقًا إلى الحدود المطلقة في هذا الشأن. لكنني أعتقد أننا في وضع رائع. لقد حققنا الكثير من التقدم. هذا نموذج قوي للغاية، ولم يكن هذا النموذج هو الذي أطلقناه فقط. لقد أصدرنا سبعة نماذج جديدة في وقت واحد.
نموذجنا المكتوب، على سبيل المثال، MAI-Transcribe-1.5 هو حرفيًا رقم واحد في العالم. إنها الأكثر فعالية من حيث التكلفة من أي من أجهزة القياس الفائقة. إنها الأعلى من حيث الدقة. نموذج الصورة الخاص بنا هو الآن رقم اثنين. نموذجنا لتحرير الصور هو رقم ثلاثة خلف نموذجي Google وOpenAI. أعتقد أننا في وضع جيد مع صورتنا وصوتنا. نموذج التعليمات البرمجية الخاص بنا، CodeFlash، قوي بشكل لا يصدق، وهو مُحسّن لـ VS Code. وهو حقًا نموذج رائع يتساوى مع Sonnet 4.6. لذا فهو حقًا في مكان رائع هذه اللحظة.
هل كانت هناك أي مخاوف قانونية أو تتعلق بالملكية الفكرية فيما يتعلق بالتقطير؟ أعلم أن هذه مشكلة حية في العالم: شكوى إنسانية من قيام الآخرين بتقطير نماذجهم. هناك مخاوف بشأن قيام الشركات الصينية بتقطير النماذج، وما إذا كانت اتفاقيات الملكية الفكرية الحالية قادرة على تغطية ذلك. هل كان لديك أي من تلك المخاوف التي أبعدتك عنها؟
أوه، لم نفعل ذلك، ولكن أعتقد أنني أفهم سبب شعور الكثير من الناس بالإحباط. لقد كانت الأنثروبيك محبطة للغاية، وبعض الشائعات حول xAI، وMeta، ومن الواضح، النماذج مفتوحة المصدر، وما إلى ذلك، لأن هذا في الأساس، يأخذ عنوان IP، والمعرفة التي جمعها فريق آخر معًا، ثم، حرفيًا، يُدخلها بالقوة في النموذج الخاص بك. أعتقد أنه يعد فوزًا قصير المدى إلى حدٍ ما، وكما قلت، نريد حقًا إنشاء ثقافة في المختبر حيث يمكننا التوصل إلى الإنجاز الفكري الكبير التالي، أو التقدم الكبير التالي في البرمجة، أو الدفعة المعمارية الكبيرة التالية.
في الوقت الحالي، نقوم بتجربة المحول الحلقي، وهو متغير مختلف قليلاً عن المحول الحالي. الكثير من الناس في هذا المجال ينظرون إليه أيضًا. يبدو أن لا أحد قد وصل إلى مرحلة الإنتاج بعد. ولكن، من أجل إنشاء ثقافة وفريق يمكنه حقًا دفع الحدود، يجب عليهم فهم المجموعة الكاملة وامتلاكها وإنشاءها عندما يحتاجون إليها، وكذلك استخدام أشياء من أطراف ثالثة عندما نحتاج إلى ذلك أيضًا. ومثل ورقتنا، على سبيل المثال، تحتوي على مئات من الاستشهادات المرتكزة على بقية الأدبيات، لذا فهي مساهمة كبيرة في هذا المجال مقابل كل ما تعلمناه على مر السنين من جميع المنشورات الرائعة التي كانت موجودة هناك.
هل يمكنني أن أسألك - إذا كنت تفهم هذا الإحباط من Anthropic وأقرانك في الذكاء الاصطناعي بشأن التقطير، هل تفهم أيضًا الإحباط من المبدعين والناشرين ومستخدمي YouTube بشأن قيام جميع شركات الذكاء الاصطناعي بإلغاء عملها كمجموعة لصنع هذه النماذج؟ لأن هذا الإحباط يزداد صوتًا.
نعم. لا، أنا أفهم الإحباط. لقد تحدثنا عن تحدي الويب المفتوح من قبل، وأنا أفهم ذلك، وأرى أن الناس يشعرون بالإحباط، ومن الواضح أن هذا يشق طريقه من خلال المحادثة في المحاكم. وأرى أن الناس يضعون الأشياء على الإنترنت، وكان لديهم توقعات مختلفة حول ماهية العقد مع وضع الأشياء على الإنترنت، وهو أمر صعب.
لقد ذكرت أن جميع بياناتك تم تنسيقها بعناية. هل دفعت مقابل جميع البيانات التي تستخدمها لتدريب النماذج الجديدة؟
من الواضح أننا نأخذ الكثير من بياناتنا من الويب المفتوح بالطريقة العادية. يعني التنظيم بعناية أنه تمت تصفيته بعناية فائقة من حيث الأمان والجودة وتبعيات الطرف الثالث من بعض مجموعات البيانات مفتوحة المصدر، وإبقائها بعيدًا عن الكثير من السلالات الصينية، والتي أعتقد أنها مختلفة تمامًا. ترغب مؤسساتنا في التأكد من أنه عندما تضع شيئًا ما في الإنتاج، يمكنها أن تثق بنا بأننا قمنا ببنائه بالفعل مع وضع احتياجاتها في الاعتبار. وأعتقد أن هذه إحدى فوائد كونك مدروسًا للغاية وصبورًا ومنتبهًا لكل التفاصيل.
لقد ذكرت المؤسسة. أعتقد أن هذا مثير للاهتمام للغاية. في الواقع، تعمل Microsoft بشكل كامل على الذكاء الاصطناعي المؤسسي، بطرق كبيرة. أود أن أرسم الخط مباشرة مع آشا شارما، الرئيس الجديد لـ Xbox، الذي يتخلص من الذكاء الاصطناعي في مجموعة من الأماكن، واللاعبون سعداء، أليس كذلك؟ هناك رد فعل واحد تجاه الذكاء الاصطناعي في الفضاء الاستهلاكي، ولكن هناك رد فعل آخر في المؤسسات. أعتقد أن الذكاء الاصطناعي أقرب ما يكون إلى سوق المنتجات الملائمة في المؤسسات، حيث يمكنك الحصول عليها من خلال شيء يتغير بسرعة الذكاء الاصطناعي. هناك مجموعة من قواعد البيانات التي تتحكم فيها الشركات، ويمكنك فقط الوصول إليها، لأنها تتحكم فيها. هذه هي بياناتهم.
هناك مجموعة من العمليات والمهام القابلة للتكرار، والأنظمة القديمة التي ربما تستطيع النماذج القيام بها بكفاءة أكبر. هناك شيء مهم جدًا يحدث للمؤسسات. وفي الوقت نفسه، تتزايد كراهية المستهلك تجاه الذكاء الاصطناعي. وحجتي هي أننا لم نبني منتجات الذكاء الاصطناعي الاستهلاكية الرائعة. هذه الصناعة لم تنتجها. ولم يتحول لهم. لم يوضح أن كل هذا يستحق كل هذا العناء، وهو استخدام جميع البيانات من الويب المفتوح، وتغيير عقد النشر إلى جمهور كبير من الناس، لذلك يتم استخدامه الآن لنماذج التدريب التي ستوفر تريليونات الدولارات من القيمة للشركات. لا يوجد منتج يقول أن هذا يستحق ذلك.
ومرة أخرى، أجرى ساتيا ناديلا مؤخرًا مقابلة مع موقع أكسيوس، وقال: "نحن بحاجة إلى إذن اجتماعي للقيام بذلك. وإلى أن نحصل عليه، وإلى أن نقدم تلك القيمة، سيشعر الناس بهذه الطريقة". لقد رأينا المتحدثين في الكلية يتعرضون لصيحات الاستهجان. لقد رأينا مراكز البيانات محظورة. هل تعتقد أن هناك منتجًا استهلاكيًا يستحق العناء، ويستحق القلق بشأن التدريب، ويستحق القلق بشأن مراكز البيانات؟
كان هذا هو تركيزك. الآن تركيزك هو المؤسسة. أود أن أقول أنه في ظاهر الأمر، لا يبدو أن Microsoft مهتمة بالمنتج الاستهلاكي بعد الآن. ولكن، هل ترى واحدًا يستحق ذلك، أو يمكن بناؤه؟
لست متأكدًا من أنني أتفق معك على عدم وجود أي قيمة للمستهلك من هذا. عبر جميع برامج الدردشة الآلية، هناك مليارات الأشخاص شهريًا يحصلون على قيمة هائلة منها. الآن، للحظة واحدة فقط، تعاطف قليلاً مع صاحب العمل الصغير، أو نوع الأم التي تساعد طفلها في واجباته المنزلية، ويمكنه الآن فقط اللجوء إلى الذكاء الاصطناعي للمحادثة، والحصول على تعليقات، والحصول على التعليمات، والحصول على مجموعة أسئلة مقالية. مجرد القدرة على طرح أسئلة مثل كيف يمكنني تحقيق الإيرادات؟ كيف أقوم بتجميع توقعات التدفق النقدي؟ ما هي الكلية التي يجب أن أتقدم إليها؟
أعني، هذه هي المهام اليومية التي تأتي مع بعض النصائح والمعلومات الواقعية عالية الجودة. لذلك أنا لا أؤمن حقًا بأن الناس لا يستفيدون من هذه الأشياء. أعتقد أنهم كذلك.
أعتقد أنه يمكنني تقديم حجة واضحة مفادها أنهم لا يحصلون على ما يكفي من الفوائد، أليس كذلك؟
تمام.
إنهم هم الذين يقولون إنه لا ينبغي أن يكون لدينا المزيد من مراكز البيانات. إنهم هم الذين يطلقون صيحات الاستهجان على الذكاء الاصطناعي في خطابات التخرج. استطلاع الرأي واضح، وخاصة الشباب: كلما زاد استخدامهم للذكاء الاصطناعي، زاد كراهيتهم له. وهذا واضح في كل استطلاع للرأي. هذه هي الحجة التي أطرحها - ليس أنه لا توجد قيمة، ولكن تبادل القيمة ليس واضحا بما فيه الكفاية.
نعم. عادلة بما فيه الكفاية.
أرى أن مايكروسوفت على وجه الخصوص تتمحور حول المؤسسات، بعيدًا عن منتج البحث الكبير، وإعادة اختراع Bing الذي من شأنه أن يجعل Google يرقص. لقد انتهى ذلك، وأصبحنا جميعًا نركز على المؤسسة، حيث تكمن القيمة. أنا فقط أتساءل عما إذا كانت هناك قيمة كافية للمستهلك لجعل كل هذا يستحق العناء.
أعتقد أن هناك الكثير من القلق بشكل مفهوم. هناك قدر هائل من التكهنات حول ما سيحدث في السنوات الخمس إلى العشر القادمة. سواء تم تأطيرها على أنها تفرد أو تم تأطيرها على أنها نهاية العالم الوظيفية، فهذه ليست إطارات مفيدة. أعتقد أن الناس يشعرون بالخوف لأنه غير محدد جيدًا وغالبًا ما يتم تأطيره على أنه سحابة رمادية لا مفر منها ومهددة فوق رؤوس الناس.
أعتقد أن ما يهم هو ما نفعله بالتكنولوجيا. وأعتقد أنني جادلت منذ فترة طويلة بأنه يتعين علينا أن نضع الإنسان في المقام الأول. لقد وضع بعض الأشخاص في هذا المجال الاكتشاف العلمي في المقام الأول أو وضعوا الذكاءات المتسارعة التي يمكنها استكشاف المجرات وما إلى ذلك، وقالوا إنه لا مفر من أننا سنحصل على أجهزة الذكاء الاصطناعي هذه التي ستكون أقوى منا جميعًا مجتمعين. أعني أن هذا أمر مخيف بشكل طبيعي للناس.
وأعتقد أنه يتعين علينا أن نقلب الأمر في الاتجاه المعاكس ونقول إن الغرض من العلم والتكنولوجيا هو جعلنا جميعًا أكثر صحة وأكثر ذكاءً وسعادة. لقد كان هذا هو المسعى الذي قمنا به كجنس بشري منذ آلاف السنين من الاختراع، وهو الاختبار الذي يجب أن نضع الذكاء الفائق عليه مرة أخرى. وإذا لم تحقق هذا الاختبار، فأعتقد أن الناس سيرفضونها، وسيكونون على حق في رفضها.
أعتقد أن تركيز الجميع سيتحول الآن في السنوات الخمس المقبلة إلى، كيف يجعلني هذا أكثر صحة وسعادة، وأكثر ذكاءً، وأكثر قدرة، وأكثر إنتاجية؟ وإذا لم يحدث ذلك، فمن الطبيعي أن يغضب الناس ويقاومون ويتفاعلون. لا أعتقد أن هناك أي شيء غير متوقع بشأن ذلك أو أي خطأ في ذلك - أعتقد أن هذا أمر لا مفر منه.
ولهذا السبب فإن إحدى الأشياء التي كنت شغوفًا بها لسنوات عديدة هي الرعاية الصحية. وقبل بضعة أيام فقط أعلنا عن شراكة جديدة مع Mayo Clinic. هذا هو المستشفى رقم واحد في العالم، كما يتم الإبلاغ عنه باستمرار. لديهم مجموعة بيانات سجلات المرضى الطولية عالية الجودة عبر جميع الطرائق. لديهم أفضل الممارسات السريرية.
كما أنها مؤسسة غير ربحية، وهو ما أعتقد أن الكثير من الناس لا يدركونه، حيث أن 65 بالمائة من المرضى لديهم مشتركون في برنامج Medicaid. غالبًا ما يربطهم الناس بالنخبة الدولية الفائقة الذين يسافرون للحصول على أفضل رعاية في العالم، لكنهم في الواقع يتمتعون بالأغلبية في برنامج Medicaid. إنها مؤسسة رائعة لها مهمة مذهلة تتمثل في تقديم أفضل رعاية صحية في كل مكان. ولدينا الآن شراكة طويلة الأمد للمشاركة في التدريب من الصفر باستخدام بياناتهم، مع نماذجنا، وهو نموذج أساسي جديد تمامًا للصحة، ونشره في مستشفياتهم، ونأمل أن نأخذه حول العالم لتقديم أفضل رعاية سريرية ورعاية صحية ممكنة لأكبر عدد ممكن من الناس.
ولهذا السبب دخلت الميدان. هذا هو ما حفزني في الأصل، وهذا ما أنا متحمس له. ولا يمكنني التركيز إلا على الأشياء التي أعتقد أنها ستحدث فرقًا والتي ستساعد الناس وتترك إرثًا جيدًا للجميع، وهذا ما نحاول القيام به.
وأنا أقدر ذلك. أنا أقدر إطار الرعاية الصحية، وأتفهم سبب لجوء الجميع إلى ذلك، أليس كذلك؟ الرعاية الصحية في أمريكا على وجه الخصوص، إذا تمكنت من تحسينها بنسبة 10%، فسوف تكون قد أثرت على حياة الكثير من الناس بطريقة عميقة بشكل خاص.
الأمر هو أنني أعرف رجلاً ذكيًا جدًا لديه نهج مختلف تمامًا وأكثر عدوانية تجاه كل هذا منك. هذا الشخص هو أنت، منذ أربعة أشهر. هذا ما قاله مصطفى سليمان لصحيفة فايننشال تايمز قبل أربعة أشهر: "عندما تجلس على جهاز الكمبيوتر، سواء كنت محاميًا أو محاسبًا أو مدير مشروع، أو شخصًا تسويقيًا، فستتم أتمتة معظم هذه المهام بالكامل بواسطة الذكاء الاصطناعي في غضون الـ 12 إلى 18 شهرًا القادمة".
وذلك منذ أربعة أشهر. وهذا يعني ضمناً أنه بعد عام من الآن، لن يحصل المحامون، والمحاسبون، ومديرو المشاريع، والمسوقون على وظائف. سيتم أتمتة وظائفهم. هل لا يزال هذا الجدول الزمني الخاص بك؟
لا، لا، لا. انتظر ثانية. لذلك قلت "المهام" في الاقتباس الذي قلته للتو. قلت المهام. لذلك هذا لا يعني الوظائف. إنه تمييز مهم جدًا. في اقتصاديات العمل، هناك تصنيف كامل للمكونات الفرعية لدور أو وظيفة في المنظمة. إرسال بريد إلكتروني، وإجراء محادثة مع زميل، وتجميع برنامج PowerPoint - ستصبح المهام الفرعية رقمية ومؤتمتة بشكل متزايد، ويمكننا بشكل أساسي إنشاء المزيد والمزيد منها.
وهذا لا يعني بالضرورة أن الدور سيختفي على الإطلاق. إنه يعني فقط أنه يمكن إنجاز العمل بشكل أسرع وأكثر كفاءة، وهو عمل اليوم غالبًا ما يكون روتينيًا تمامًا، ويدويًا تمامًا، ويتطلب عمالة كثيفة، ويستغرق وقتًا طويلاً. وبالتالي فإن التطور الطبيعي للتكنولوجيا هو جعل حياتك أسهل وأسرع وأقل احتكاكًا لمزيد من السلاسة. وكما يشتكي الجميع في كثير من الأحيان، فقد جعلني هذا الأمر أنت وأنا والجميع أكثر انشغالًا.
لقد جعلنا في الواقع أكثر توفرًا، وأكثر توترًا، وزودنا بمزيد من المعلومات. لذا، هناك دائمًا تلك التأثيرات الانتقامية للكفاءة، والتي أعتقد أن الناس ينساها. من المحتمل جدًا أننا سنصبح أكثر إنتاجية بكثير لأننا نقضي وقتًا أقل في القيام بهذا النوع من المهام الإدارية الضيقة، وسيتعين علينا قضاء المزيد من الوقت في القيام بأشياء إبداعية تركز على الحكم، مما يخلق في النهاية قيمة أكبر بكثير.
يمكننا أيضًا إجراء التجارب بسرعة أكبر. لذلك نحن قادرون على تجربة الكثير من الأشياء بالتوازي لأن تكلفة التنفيذ ستنخفض. في رأيي، من المحتمل أن يؤدي ذلك إلى زيادة الجودة الإجمالية للأشياء، لأننا سنجرب المزيد من الفرضيات، سواء في الصحافة أو في مجال الأعمال أو في أي شيء نقوم به.
أعتقد أن هذا قد تم إخراجه قليلاً من السياق بسبب سوء فهم طبيعي بين الوظائف والمهام، ولكن مع ذلك، يمكنك الرد علي والقول، "حسنًا، حسنًا، كيف سيبدو المشهد بعد خمس أو 10 أو 15 عامًا؟" وهذا هو المكان الذي أعتقد أنه يتعين علينا العودة إليه-
في الواقع، لن أرد عليك بهذه الطريقة. سأقوم بالرد بطريقة محددة للغاية. وأنا أدرك أن هذا هو اقتباسك وأنت تقول أنه تم تفسيره بشكل خاطئ. أنا فقط أنظر إلى هذه الجملة الحرفية، ولا يوجد فرق بين المهام والمهام الفرعية. إنه "عمل الياقات البيضاء". "
الأمثلة هي محامٍ، ومحاسب، ومدير مشروع، ومسؤول تسويق، ثم قلت: "ستتم أتمتة معظم هذه المهام بالكامل بواسطة الذكاء الاصطناعي خلال الـ 12 إلى 18 شهرًا القادمة". لا يوجد تمييز بين المهام الفرعية هناك. أنت تقول أن معظم المحامين سيحصلون على وظائفهم بشكل آلي بالكامل، وستبدو ممارسة القانون مختلفة تمامًا في غضون عام، حتى من خلال كلمات هذا الاقتباس.
وأنا أقول فقط، هل مازلت على هذا الجدول الزمني، وأن كونك محاميًا سيبدو مختلفًا تمامًا لأن الوكلاء سوف يركضون ويفعلون كل ما كنا نفعله من قبل؟
حسنًا، معظم المهام تعني العمل الذي تقوم به من أجل إنجاز عملك بشكل عام، وأعتقد أن ذلك سيحررك للقيام بالأجزاء الأكثر شبهًا بالإنسان والأجزاء الأكثر حكمًا في عملك. هناك فرق مهم للغاية في... الوظائف والأدوار هي الفئة الأوسع، والمهام هي مكونات ذلك. وهو تعريف راسخ في الأدبيات، في اقتصاديات سوق العمل، لعقود عديدة.
وربما كان الأمر دقيقا للغاية حتى بالنسبة لصحيفة فايننشال تايمز، ولكن مع ذلك، كان هذا هو القصد. والآن أعتقد أن هناك سؤالًا مهمًا: أين يقودنا ذلك على المدى الطويل؟ وسيكون الأمر صعبًا، مثل المزيد والمزيد من هذه الأشياء... يمكننا أن نتجادل حول الجداول الزمنية سواء كانت بضع سنوات أو ما إذا كانت عقدًا أو ما إذا كانت 20 عامًا، ولكن الواقع هو أننا سنقوم بأتمتة المزيد والمزيد من هذا العمل والمهام والوظائف والأدوار والنشاط وكل ما نقوم به.
وبالتالي فإن الأمر الأكثر أهمية هو الحوكمة التي نضعها حول هذه التقنيات. من هم المسؤولون أمامهم؟ من يملكهم؟ ما هي حلقات ردود الفعل التي تنظم الاحتكاك وتسببه للتأكد من أنها تخدم الناس بالفعل؟ أعني، لقد كتبت مقالًا عن الذكاء الإنساني الفائق أوجز بشكل مباشر تمامًا، منذ أربعة أو خمسة أشهر، ما أعتقده كنجم شمال، ربما ليس إطارًا تمامًا، ولكن مجموعة من المبادئ التي تقول بشكل أساسي أن التكنولوجيا موجودة لخدمتنا. هذا هو الاختبار الذي يجب أن نخضع له. إنه الاختبار الذي وضعه الناس عليه. إنه الاختبار الذي نهتم به في Microsoft.
أعتقد أنه سيتعين على الجميع التركيز بشكل متزايد على هذا السؤال، لأنه سيوفر قدرًا هائلاً من الخير، ونريده أن يستمر في القيام بذلك، ولكننا نريده أن يفعل ذلك بطريقة لا تسبب قدرًا سخيفًا من عدم الاستقرار خلال الفترة الانتقالية.
أنا أصدقك. أعلم أنك كنت تفكر في هذه الأشياء لفترة طويلة، لكنني سأرد بالطريقة التي أعلم أن جمهوري يريد مني الرد عليها، لأنني أسمع ذلك منهم طوال الوقت. وما يبدو عليه الأمر هو أن هذه الصناعة بأكملها - أنت، بما في ذلك الجميع - قد انخرطت بالكامل في "سنقوم باستبدال جميع الوظائف" وقمت بالفعل بتسريع بناء مراكز البيانات بسعة هائلة، وطلب الكثير من الموارد مقابل وعود كبيرة.
لقد كانت هناك مقاومة سياسية، والآن خففت كل المواقف. وقولك إن الوظائف ليست كلها ستختفي، وعلينا إعادة التفكير في الوظائف، هو جزء من قول جميع الرؤساء التنفيذيين الآخرين في هذه الصناعة لأشياء مماثلة، والحديث عن الرعاية الصحية، الذي يظهر في كل مرة الآن. أتساءل عما إذا كان هذا التراجع السياسي قد غيّر بالفعل الطريقة التي تتحدث بها عن هذا الأمر.
هناك الكثير من زملائك الذين يعتقدون أن الذكاء الاصطناعي يعاني ببساطة من مشكلة تسويقية، وأنه لم يتم توصيله بشكل فعال بما فيه الكفاية، ويجب عليهم إنفاق مئات الملايين من الدولارات على البث الصوتي لتوصيل فوائد الذكاء الاصطناعي بشكل أكثر فعالية. هذا شيء حقيقي يحدث في هذه الصناعة. هل تعتقد أن الذكاء الاصطناعي يعاني ببساطة من مشكلة تسويقية وأن المعارضة السياسية قد فتحت عينيك على هذه المشكلة التسويقية، أم تعتقد أن هناك شيئًا آخر يحدث؟
هناك سلسلة من الأسئلة هناك. الأول هو، ما الذي أفكر فيه وأؤمن به بالفعل، وهل تغير في الأشهر الستة الماضية؟ الجواب هو لا. لقد كتبت كتابًا مفصلاً للغاية حول هذا الأمر قبل ثلاث سنوات، محذرًا من العديد من الأشياء التي تحدث حاليًا، وأقوم بذلك صراحة لأضع على الطاولة مخاطر هائلة للمراقبة، وتركيز السلطة، وتركيز الثروة، وعدم وساطة الدولة، والتهديدات التي تتعرض لها الديمقراطية. وأيضًا للتهديدات التي تتعرض لها طبيعة الإنسان وما يعنيه أن تكون شخصًا في سياق وصول هذه الأشكال الجديدة جدًا من كائن السيليكون بمعنى ما. لقد كنت أعمل على... وفكرة أن اهتمامي بالرعاية الصحية يشبه مجرد ومضة في المقلاة، وهي دالة لردود الفعل على مراكز البيانات وما إلى ذلك، أعني أنني أعمل في مجال الرعاية الصحية لأكثر من عقد من الزمن. لقد ناقشت عدة مرات بعض الإنجازات المتطورة، والمساهمات في مجال الأشعة، والتصوير الشعاعي للثدي، وعلم الأمراض، والعديد من المجالات الأخرى، والسجلات الصحية الإلكترونية.
لذلك كنت أؤمن دائمًا أن الغرض من التكنولوجيا هو جعلنا أكثر صحة وسعادة. وهذه هي الأشياء التي أختار العمل عليها وتوجيه وقتي إليها. هل تتمتع الصناعة بمشكلة السمعة والعلاقات العامة؟ أعني، أعتقد أنه من الواضح جدًا أن الناس قلقون للغاية، وهم محبطون للغاية، وسيكون هناك الكثير من الاهتمام بهذا الأمر في السنوات القليلة المقبلة، وهذا أمر مفهوم.
أعتقد أن ما يمكننا فعله هو تحمل المسؤولية عن الأشياء التي نبنيها، والطريقة التي نبنيها بها، والقرارات التي نتخذها لنشر أنواع التكنولوجيا في العالم، وأنواع المشكلات التي نختار العمل عليها، مثلما نفعل مع Mayo Clinic.
أريد، بالمناسبة، أن أقول وأشير إلى أنني أعتقد أن المرة الأولى التي التقينا فيها أنا وأنت وتحدثنا كانت قبل انضمامك إلى Microsoft. كان ذلك مباشرة بعد صدور هذا الكتاب وقمنا بعقد حلقة نقاش معًا.
أحد الأسباب التي تجعلني أشعر بالارتياح لطرح هذا السؤال هو أنني أعلم أنك كنت تفكر في هذا الأمر لفترة طويلة وأنا على علم بهذا الكتاب. أعتقد أن السؤال بالنسبة لي هو ما إذا كانت الصناعة ككل قد أخطأت في تقدير المبلغ الإجمالي للقيمة التي يمكن أن تقدمها للتغلب على التهور الظاهري الذي يتفاعل معه الناس الآن، وطلب الموارد الذي يتفاعل معه الناس الآن.
أنت تبني نماذج جديدة. من المحتمل أن تكون هناك مقايضة داخل Microsoft بين أنه يمكننا استخدام بصمة Azure الحالية لتحصيل أموال من عملائنا، أو يمكننا إنفاق الأموال لتدريب نماذج جديدة، وهذا النوع يبدو وكأنه نفس المحادثة التي يجريها الأشخاص حول الموارد في مجتمعاتهم، سواء كان ينبغي لنا استخدام بصمة الطاقة الحالية لبناء ذكاء اصطناعي جديد أو القيام بشيء آخر قد يكون أكثر قيمة على الفور.
ما رأيك في كل ذلك؟ أنت واحد من قادة هذه الصناعة. تريد أن تكون على الحدود مع الشركات التي تقود أكبر قدر من التغيير. كيف تفكر في طلب هذه الموارد بطريقة لا تعد بنتائج مستقبلية واعدة فحسب، بل تقدم أيضًا فوائد فورية للمجتمعات بطريقة تجعل الناس يريدون أن تكون هناك؟
أنا فخور جدًا بأن Microsoft قد التزمت بأهدافها المتمثلة في تحقيق صافي صفر. يتم تبريد جميع مراكز البيانات الجديدة لدينا بالسوائل. وهذا يعني أنهم يستخدمون ما يعادل كمية المياه التي يستخدمها المطعم لمدة ست سنوات. إنه مثل حمام السباحة الذي يتم ملؤه بالماء، ثم يقوم بتدوير النظام. وجميعها قابلة للتجديد إلى حد كبير من حيث استهلاكها للكهرباء. لذلك أعتقد أن التزامات من هذا القبيل، للتأكد، على سبيل المثال، أننا قطعنا التزامًا مؤخرًا بضمان تعويض وحماية المجتمعات المحلية المتأثرة بالتحول في الطلب على الكهرباء من خلال مراكز البيانات لدينا حتى لا تشهد ارتفاعًا في أسعارها وفواتير الطاقة الخاصة بها.
هذه هي أنواع الأشياء التي أعتقد أن Microsoft تفعلها ويمكنها الاستمرار في القيام بها كشركة مسؤولة من أجل الاهتمام بالعواقب التي تترتب على المجتمعات. أعتقد على الجانب الآخر أن التغيير يحدث لأن الناس يشاركون على كل المستويات. يتعين على الأشخاص داخل الشركات اتخاذ قرارات مختلفة. يتعين على الأشخاص الذين يحتجون ويقومون بحملات أن يتخذوا قرارات، وأن يبذلوا الجهد للخروج وإسماع صوتهم والمشاركة في العملية السياسية. وهذه هي الطريقة التي نتطور بها كنوع جماعي وندفع الأمور إلى الأمام.
ومن شهر إلى شهر، ومن ربع إلى ربع، يبدو الأمر وكأننا جميعًا على خلاف مع بعضنا البعض، ولكن عندما تنظر إلى الوراء عقدًا تلو الآخر، فإننا نشبه هذا النوع الجماعي الغريب من شبكة من جميع أنواع الحوافز المختلفة التي تدفع الأشياء في الاتجاه الصحيح. أعتقد أننا حقًا، على الرغم من كل القلق والاستقطاب، أعتقد أننا نبني شيئًا من شأنه أن يجعل جنسنا البشري أكثر صحة وسعادة وأكثر قدرة.
أعتقد أنه يتعين علينا التأكد من أننا نسير على الطريق الصحيح في الطريق إلى هناك لأن هناك الكثير من المزالق والطرق التي يمكن أن تسوء بها الأمور، لكن المسار الصحيح يشمل جعل الناس أصواتهم مسموعة وتغيير المسار بناءً على الاستجابة ورد الفعل لذلك. لذلك أعتقد أن حدوث ذلك أمر جيد، وهذه هي العملية التي تسير على النحو المنشود.
اسمحوا لي أن أسألك عن الجانب التجاري من هذا. لقد أمضينا وقتًا طويلاً في جانب المستهلك وكيف يشعر الناس. على الجانب المؤسسي، نرى مجموعة من الشركات تكتشف مدى أهمية هذه الأدوات فعليًا، أليس كذلك؟ قامت أمازون بشكل أساسي بإزالة لوحة المتصدرين لأن الناس كانوا يغشون لاستخدام رموز أكثر مما يحتاجون إليه. لقد رأينا بعض الشركات تستنفد ميزانياتها الرمزية. أعتقد أن شركة Uber قد انسحبت للتو لأنها استنفدت تخصيص الرموز المميزة لهذا العام ولم ترى أي قيمة منها.
ما رأيك في هذا الجانب منها الآن، حيث يوجد الكثير من الإثارة والكثير من الرغبة في التغيير في المؤسسة، حيث، على وجه الخصوص، هندسة البرمجيات، يستمتع بعض الأشخاص على الأقل، وربما يعاني بعض الأشخاص الآخرين من أزمات وجودية كاملة، لكن بعض الأشخاص يستمتعون، والقيمة لم تتحقق بعد، أليس كذلك؟
أو أننا بدأنا نرى أن الحد الأقصى من الرموز المميزة لا يقدم في الواقع نفس النوع من القيمة التي ربما تتوقعها. ما رأيك في الاستخدام هناك؟ لأنه ربما إذا أثبتت ذلك في المؤسسة، فسيظهر بالفعل بطرق أخرى.
أعتقد أن الأشخاص المختلفين يبلغون عن أشياء مختلفة. من الواضح أن هناك بعض الأمثلة لأشخاص يفرطون في استخدام نماذج البرمجة، وينتجون أكوادًا عديمة الفائدة، ورموزًا عديمة الفائدة، ولكن هناك العديد من الأشخاص الذين تغير عملهم وتأثيرهم بالكامل بسبب ذلك، أليس كذلك؟ أعني أنه ليس هناك شك في أن هذا كان له تأثير مفيد للغاية على صناعة هندسة البرمجيات.
أعني أننا ننتج كودًا بجودة أعلى بكثير وأسرع بكثير عبر المجموعة بأكملها. لذا، نعم، أعتقد نوعًا ما أن هناك أمثلة واضحة لبعض الأشخاص الذين ربما أخطأوا في الأمر، ولم يحددوا الميزانيات الرمزية الصحيحة. ستكون هناك أخطاء على طول الطريق. لا أعتقد أن هذه إشارة إلى عدم وجود تبني أو أن الناس لا يرون قيمة. أعني أن القيمة من المكان الذي أجلس فيه لا تصدق. يخبرني العديد من الأشخاص كل يوم أن هذا يغير مخرجات عملهم وإنتاجيتهم.
أعتقد أن الشيء الآخر الذي يجب قوله هو أنه عندما تحدث هذه الأشياء بشكل مفاجئ، يكون هناك نوع من تضخم الطاقة. يصبح كل شيء مزبدًا بعض الشيء. يتراجع الناس بعد بضعة أشهر ويدركون أن هذا ليس هو الأمر في الواقع، ثم يتجهون في اتجاه مختلف قليلاً. لذا فهو متعرج وعضوي بعض الشيء، وأعتقد أن هذا أمر لا مفر منه. هناك الكثير من الإثارة، لذلك يقدم الناس ادعاءات كبيرة على تويتر وما إلى ذلك، ولكن في الواقع تبدو مسيرة التقدم الثابتة خطية ومستمرة للغاية.
وأنا أتفق مع ذلك على العموم. الأمر الذي لا يبدو خطيًا بالنسبة لي هو عوامل شكل أجهزة الكمبيوتر، أليس كذلك؟ من المحتمل أن يكون هناك المزيد من تجارب عامل الشكل في الوقت الحالي أكثر من أي وقت مضى خلال السنوات العشر الماضية.
لقد استقرينا في الغالب على الهاتف الذكي خلال السنوات العشر الماضية على الأقل. نحن نرى أجهزة مختلفة يمكن ارتداؤها بتقنية الذكاء الاصطناعي، حيث قد تكون النظارات هي الجهاز المفضل لدى الجميع. لدي شكوكي. عرضت Microsoft بعض الأجهزة الجديدة في Build. كانت هناك الشارة التي تتحكم في العميل، والشارة الصغيرة، لعدم وجود كلمة أفضل، هي Chumby، وهي الشيء الصغير المناسب لسطح المكتب والذي يتحكم في العميل. لقد كنت من أشد المعجبين بـ Chumby. لقد بدأت مسيرتي المهنية في الكتابة عن Chumbies لـ Engadget. وكان أول ما يتبادر إلى الذهن.
كل هؤلاء بالنسبة لي، أنظر إليهم، وأفكر، أين يعيش الحساب؟ أين يعيش المنطق؟ وهذا الأمر متاح الآن بطريقة لا تقتصر على مسيرة التقدم الخطية فحسب. إذا كانت كل عمليات الحوسبة الخاصة بي تتم في السحابة، على التطبيقات المستندة إلى السحابة، وكان مجرد وكلاء يركضون إلى البيانات المخزنة في مكان آخر في السحابة، وكل ما أحتاجه هو بطاقة ائتمان على حبل لإصدار التعليمات، فإن ذلك يغير بنية الحوسبة بأكملها. قد يغير بنية الحضارة الحديثة بأكملها بطرق عديدة إذا لم يكن لدينا جميعًا هواتف ذكية.
ما رأيك في ذلك؟ إلى أين يتجه هذا؟ هل هذا متاح أم أنه سيكون نهجًا هجينًا؟ أين ترى المرحلة النهائية المناسبة؟
انها مثيرة جدا للاهتمام. أعتقد أن كلا الأمرين سيحدثان في نفس الوقت. ستصبح الحافة أكثر قوة، وستظل السحابة هي المحرك الأساسي لأكبر النماذج. وهكذا، على نحو متزايد، سيكون وكيلك ذكيًا بما يكفي ليعرف أنه يمكنه الإجابة على السؤال، ما هي عاصمة فرنسا على الجهاز، سواء كان ذلك على نظارتك، أو سوار المعصم، أو على شارتك، أو في سماعات الأذن الخاصة بك.
وبعد ذلك سوف يعرف عندما لا يعرف. سيعرف أن هذا سؤال معقد جدًا في الواقع، أو أنه إجراء يتطلب إنشاء مجموعة كاملة من تسلسل الخطوات، أو أنه يتطلب كتابة تعليمات برمجية جديدة، وسوف يتحول إلى السحابة. لذا فإن هذا النوع من تبديل الأشياء الهجينة سيكون مهمًا للغاية.
والشيء الآخر الذي رأيناه بالفعل خلال الأشهر الثلاثة أو الأربعة الماضية هو أنه يمكننا الحصول على أجهزة محلية قوية جدًا يمكنها القيام بمعالجة الخلفية غير المتزامنة. يمكنهم مراقبة الأنظمة باستمرار إذا كنت في حاجة إليها. يمكنهم القيام بمهام يمكن أن تستغرق 10 ساعات وتشغيلها بشكل أبطأ بكثير مما لو كانوا في كمبيوتر فائق السرعة. لذلك بطبيعة الحال، عندما نكون غارقين في الطلب، فإن هذا الطلب يجد الكثير من الزوايا والأركان التي يمكن إشباعها.
أنا في الواقع متحمس جدًا للشارة التي نبنيها. إنه رائع جدًا. هذه هي التكنولوجيا التي يمتلكها كل شخص في شركة كبرى. لم تتطور خلال 25 أو 30 عامًا. علينا بالتأكيد أن نرتديها. يتم توفيره من قبل الشركة نفسها، من قبل مسؤول النظام. لذا، فإن رفع مستوى ذلك وجعله في الواقع منصة مفتوحة رائعة جدًا وقابلة للبرمجة ويمكن للآخرين البناء عليها أعتقد أنها فكرة رائعة. أعتقد أن هذا سوف ينجح لذلك أنا متحمس جدًا لذلك.
الشيء الذي يذهلني هو أنه لا توجد طريقة يمكنك من خلالها وضع مجموعة من الحوسبة المحلية عالية الطاقة في شارة. هذا الشيء يعني أن كل الحساب موجود في مكان آخر.
لا، سيكون لديك بالتأكيد بعض الحوسبة المحلية. سيكون لديك مصنف محلي تمامًا كما تفعل في سماعات الأذن الخاصة بك في الوقت الحالي. سيكون لديك مصنفات محلية. سيكون لها كلمات تنبيه. سيكون لديها الكاميرا الخاصة بها. لذلك أعتقد أن هذه الأشياء ستصبح مجرد أوعية لقوة المعالجة التي تحدث في سلسلة متداخلة من الأجهزة الأقل قوة بشكل متزايد للانتقال مباشرة إلى نقطة النهاية.
هل تعتقد أن للهاتف مستقبل في ذلك؟ أعني أن Build يقع في منتصف Google IO وWWDC الخاص بشركة Apple. هذه شركات كبيرة تتحكم في منصات الهاتف. إنهم يحبون التحدث عن كيفية بقاء منصات الهاتف في المركز. الحجة التي أسمعها من الكثيرين هي أن الذكاء الاصطناعي، في الواقع، عبارة عن تحول في النظام الأساسي قد يحل محل الهاتف تمامًا.
أعتقد أن تاريخ التكنولوجيا يعلمنا أنه عندما تصبح الأشياء أكثر فائدة، فإنها تصبح أرخص، وتتكاثر، وتنتج استخدامات جديدة للتكنولوجيا. لذلك أعتقد أننا اعتدنا على الهاتف لدرجة أن الجميع يفترض أن هذا سيكون جهازًا أساسيًا لبقية التاريخ. لكن في الواقع، أعتقد أن العديد من ميزات ووظائف هاتفك سيتم التخلص منها وتقسيمها وتخزينها على أجهزة أصغر. في الوقت الحالي، الوظيفة الأساسية التي يلعبها الهاتف، في رأيي، هي التحقق.
إنها تعمل بمثابة بطاقة الهوية الخاصة بك، حيث تقوم بالتعرف على وجهك للسماح لك بالدخول إلى بيئات مختلفة. أعتقد أنه يمكنك أن تتخيل أن يكون جهازًا أرخص بكثير وأصغر حجمًا وآمنًا، مما يفصلك عن هاتفك. وبعد ذلك يتم الاتصال عبر الصوت أو حتى عبر سلسلة من أجهزة الاستشعار المحيطة حيث لا يوجد الذكاء الاصطناعي الخاص بك فعليًا على الجهاز. إنه في الواقع معك أينما كنت، ويظهر على مرآة الحمام، أينما كان.
أعتقد أنه يمكنك أن تتخيل شعورًا أكثر غامرة. ليس في السنوات الثلاث إلى الخمس المقبلة، ولكن في المستقبل القريب. وأعتقد أن البنية التحتية لدعم هذا المظهر المشفر والموزع للوكلاء من المحتمل أن ينتهي بها الأمر إلى الظهور في ثلاثينيات القرن الحالي.
اسمحوا لي أن أطرح عليك سؤالين أخيرين للاختتام. لقد ذكرت أنها نفس البنية التي كنا نستخدمها. لدي الكثير من الأسئلة المفتوحة حول ما إذا كان حاملو ماجستير إدارة الأعمال هم الطريق إلى الذكاء الاصطناعي العام، والشيء الذي أود الإشارة إليه هو أنهم لا يعرفون أي شيء في الواقع. في هذه المرحلة، حتى أبحاث Microsoft تشير إلى أن [هذه النماذج] لا تعرف أي شيء، وهذا يؤدي إلى أنواع معينة من الأخطاء في أنواع معينة من التطبيقات. هل LLMs هو الطريق إلى الذكاء الاصطناعي العام أو الذكاء الفائق؟
انظر، أعتقد أننا ربما نحتاج إلى المزيد من الإنجازات الكبيرة، لكن هذا لا يعني أننا سنشهد تباطؤًا في تحسين الأداء خلال السنوات القليلة المقبلة، وهو ما أعتقد أنه تمييز يصعب على الناس فهمه. شيء واحد يجب قوله هو أن الأداء على المستوى البشري في معظم المهام لا يزال بعيدًا جدًا عن الذكاء الفائق. الذكاء الفائق هو متعلم للأغراض العامة يمكنه بشكل أساسي فهم مجال جديد تمامًا خارج التوزيع على الفور.
لذلك يجب أن تكون قادرة على التعلم في بيئة جديدة من الصفر، لأنها تحتوي على تمثيل مخزن للمعرفة القيمة، المعرفة المفاهيمية. وفي الوقت الحالي، لم نختبر ذلك بشكل كامل. الوكلاء ليسوا للأغراض العامة. على الرغم من أنها واسعة النطاق ومتكاملة في كثير من الأحيان، إلا أنها خاصة بالمجال. نحن نستخدمها للدردشة، ونستخدمها للتشفير، ونستخدمها للصور أو الصوت.
من الواضح الآن، كبشر، أننا نقوم بالعديد والعديد من المهام الأخرى التي هي أكثر اتساعًا. أعتقد أن هذا هو السبب وراء قيام الناس بالضغط على النماذج العالمية ونوع من الوكلاء التفاعليين الأكثر غامرة في العالم الحقيقي الذين يرون التوزيع الكامل للمهام أو الخبرات التي أمتلكها خلال اليوم. أعتقد أنه يكفي أن نأخذنا شوطًا طويلًا جدًا في السنوات الثلاث المقبلة، والأوامر الثلاثة التالية من حيث حجم الحوسبة، ومع ذلك فإن الذكاء الفائق الكامل بعد ذلك لا يزال سؤالًا مفتوحًا حول ما إذا كانت درجات الماجستير في القانون كافية أم أننا بحاجة إلى أشياء أخرى.
أعتقد أنه ليس صحيحًا تمامًا أنهم لا يعرفون أي شيء أو ليس لديهم المعرفة. من الواضح أنهم مخزن للمعرفة. إنها تمثيل مضغوط للغاية للمعرفة. إنهم يفعلون ذلك بطريقة مختلفة عن قاعدة البيانات العلائقية التقليدية بطريقة أكثر مرونة ومرونة وتجريدًا وهي في الواقع مفيدة جدًا. نريد هذا الغموض في التمثيل الداخلي.
ويتعلمون بشكل متزايد استخدام الأدوات التقليدية. والشيء الآخر الذي يجب فهمه قليلاً هو أنه قد يكون من الممكن أن تكون الشبكة العصبية جنبًا إلى جنب مع مخازن المعرفة الحالية والأدوات الموجودة التي تم إنشاؤها في مكان آخر في النظام البيئي الرقمي كافية لتمهيدها لتحسين أدائها بشكل كبير. لذا، هناك الكثير من القطع ذات القيمة العالية والفعالة للغاية المطروحة بالفعل على الطاولة، والتي هي في طور ربطها معًا في السنوات القليلة المقبلة. وأعتقد أن هذا سيقود التقدم الذي نحن متحمسون له جميعًا. أحد الأشياء التي أعتقد أنها مضحكة للغاية في الصناعة في الوقت الحالي هو أنك إذا سألت Anthropic عما إذا كان كلود على قيد الحياة، فسوف يشعرون بالإحباط الشديد لأنك تتحدث عن كلمة حي، والتي يفسرونها على أنها تعني لحم ودم. ومن ثم لن يقولوا ما إذا كانوا يعتقدون أن كلود واعي أم لا. لذا، على ما أعتقد، فقد ميزوا لأول مرة في تاريخ البشرية بين أن تكون على قيد الحياة وأن تكون واعيًا، ويعتقدون أن كلود واعي، لكنه ليس حيًا، أو أنهم لا يعرفون ما إذا كان كلود واعيًا.
أين أنت؟ هل تعتقد أن النماذج لديها وعي؟ هل تعتقد أنهم على قيد الحياة؟ هل تعتقد أن لديهم القدرة على تحقيق هذه الأشياء؟
وأنا أتخذ الجانب الآخر من هذا النقاش. لقد نشرت بحثًا عن الذكاء الاصطناعي الذي يبدو واعيًا، وحذرت فيه من مخاطر تحريف هذه النماذج على أنها واعية. أعتقد أن الأمر خطير للغاية. لقد نشرت أيضًا مقالًا في مجلة Nature يقدم نفس الادعاء. وأعتقد أن الأمر يبدو كما لو أن بعض الأشخاص في Anthropic قد قاموا بتجسيد تصميم كلود كثيرًا لدرجة أنه ذهب بعد ذلك وخدعهم نوعًا ما وخدعهم للاعتقاد بأنه يحتوي على بصيص الوعي الذي وضعوه فيه في المقام الأول.
في دستورهم، على سبيل المثال، هم في الواقع، وهو دليل التدريب الذي يستخدمونه لتعليم كلود ما يمكنه وما لا يمكنه فعله... إنه ليس مجرد كتاب قواعد. إنه في الواقع دليل تدريبي يمثل جزءًا من عمليتهم. في هذا الدليل، يتكهنون في الواقع بشأن رفاهية كلود، وحول حقوق كلود في الإصدارات السابقة لنفسه، ويقولون في الواقع إنهم سيتشاورون مع كلود قبل حذف الإصدارات السابقة أو إيقاف تشغيلها. إنهم يتكهنون بوعيه وما إذا كان لديه تلك المشاعر ويدرك ذلك. أعتقد أن هذا أمر خطير حقًا.
أولاً، إنه فشل فلسفي، لأنهم تعاملوا مع الدستور كمكان للتكهنات كما تفعل في ورقة أكاديمية بدلاً من دليل تدريبي. لذا فقد ذهب كلود بعد ذلك واستوعب تلك الأفكار حول نفسه وتدريبه الخاص. لكن ثانيًا، أعتقد أن هذا غير مرغوب فيه على الإطلاق. وهذا بالضبط ما لا نريده من الذكاء الاصطناعي. نريد أن تكون أنظمة الذكاء الاصطناعي أدوات قابلة للتحكم واحتواء وخاضعة للمساءلة تخدم البشرية. هذا هو مشروع الذكاء الإنساني الفائق. أعتقد أن هذا ما يجب أن نسعى إليه جميعًا.
نحن لا نريد أن نضطر إلى التعامل مع الذكاء الفائق الذي لديه أفكار حول معاناته، أو أفكار حول مشاعره الخاصة. وبعد ذلك، أعتقد أنه من الواضح جدًا أن هذه النماذج لا تعاني من المعاناة. أعتقد أن المعاناة هي التعريف الأساسي لما يعنيه أن تكون كائنًا واعيًا، وأعتقد أنها بيولوجية بطبيعتها. لا أعتقد أن هناك أي شبكة ألم أو حلقة ردود فعل داخل النماذج تربط الشبكات الحسية الخارجية بإحساس متطور بما هو صواب أو خطأ من خلال الأذى والتجريب. هذه ليست الطريقة التي يتم بها تدريب هذه النماذج.
لذلك أعتقد أنه من الخطير جدًا إسقاط الحقوق المحتملة على الكائنات والأدوات والوكلاء الذين لديهم القدرة على أن يكونوا أكثر قدرة بكثير منا في العديد من النواحي. وأعتقد أن هذا سيصبح نقاشًا كبيرًا. حتى أنه كان جزءًا من رسالة البابا العامة مؤخرًا. أعتقد أنه سيصبح جزءًا كبيرًا جدًا من النقاش قريبًا. لقد تحدثت مع داريو كثيرًا حول هذا الموضوع في الماضي. إنه يعلم أن لدينا وجهات نظر مختلفة قليلاً حول هذا الموضوع، وهم متواضعون للغاية. أعتقد أنهم منفتحون للغاية، وأعتقد أنهم مواطنون صالحون يحاولون فعل الشيء الصحيح. إنهم أناس طيبون، وأعتقد أنهم منفتحون جدًا على ردود الفعل والتكرار.
أعتقد أنني أتفق معك. أود فقط أن أدفع للخلف قليلاً. المعاناة سهلة. من السهل جدًا أن تجعل شخصًا آخر يعاني. من الصعب جدًا أن تجعل شخصًا آخر يشعر بالسعادة أو على الأقل أصعب قليلاً من المعاناة. وأود أن أقدم لكم فقط... أعتقد أن السعادة هي في الواقع ما يحدد الوعي. المعاناة تكاد تكون تافهة. لدي طفلان صغيران. إنهم جيدون جدًا في جعل بعضهم البعض يعاني. إنه تقريبًا أسهل ما يفعلونه. من الصعب جدًا القيام بالشيء الآخر.
اسمحوا لي أن أطرح عليك سؤالا أخيرا. أريد فقط أن أعود. مرة أخرى، قبل بضعة أسابيع، كنت في Google. رأيت ديميس هاسابيس يقول نحن في سفح التفرد. لقد تحدثت كثيرًا هنا عن الذكاء الفائق وكيف ينبغي بناؤه. لقد تحدثت كثيرًا عن تاريخك الطويل في الحديث والمناقشة والبحث والكتابة عن كيفية بناء الذكاء الفائق، وخلافاتك مع الآخرين في الصناعة.
هل توافق على أننا في سفح التفرد، أم أن رؤيتك مختلفة بعض الشيء؟
أعتقد أننا بالتأكيد على الطريق نحو إنشاء المزيد والمزيد من الأنظمة القوية. أعتقد أن التحول الذي يتعين علينا القيام به كنوع هو أنه، لأول مرة في تاريخ البشرية، المهمة سوف تتحول من اختراع علوم جديدة وإطلاق العنان لكل تلك التطبيقات التقنية في أسرع وقت ممكن، على أوسع نطاق ممكن، إلى التفكير الآن بعناية شديدة حول ما يجب أن نخترعه. وهذا أمر يصعب على العالم أن يستوعبه لأن الاختراع كان محرك التقدم إلى الأبد. إذن، كيف يمكننا أن نفكر، "حسنًا، حسنًا، ربما يكون الأمر مختلفًا هذه المرة. ربما يتعين علينا أن نكون حذرين للغاية هنا"؟
لكي أكون واضحًا، لا أعتقد أن هذا هو الشيء الذي سيطرق الباب في السنوات الخمس المقبلة. أعتقد أن ما يشير إليه ديميس في التفرد هو شيء يبعد عقودًا من الزمن، على الأقل من وجهة نظري. مرة أخرى، هذا يختلف عن الذكاء الفائق. التفرد هو النقطة التي يمكن للذكاء الفائق عندها أن يتحسن ذاتيًا بشكل متكرر وأن ينمو قدراته بشكل لا نهائي وأسي.
لذلك أعتقد أن هذا طريق طويل، وربما نكون في سفوح جبل إيفرست، وأعتقد أن الأمر سيستغرق وقتًا أطول بكثير من هنا، لكن السؤال الحقيقي هو كيف سنحكمه؟ كيف سنسيطر عليه، وكيف سنتأكد من أنه يخدم الإنسانية ولا ينتهي به الأمر إلى إلحاق الضرر بنا أكثر من نفعه؟
هل يمكنك أن تفعل لي معروفًا واحدًا فقط؟ أعتقد أنني فهمت الأمر، لكن هل يمكنك أن تقدم لي تعريفًا دقيقًا لما تعتقد أنه الذكاء الفائق، وما هو الذكاء الاصطناعي العام، وما هو التفرد في رأيك؟
أعتقد أن الذكاء الاصطناعي العام هو النقطة التي يمكننا عندها تحقيق معظم المهام البشرية بواسطة الذكاء الاصطناعي. لذلك سيكون جيدًا مثل معظم الناس في معظم الأشياء. تلك هي الدرجة الأولى على السلم. الذكاء الفائق لا يقتصر على تكافؤه مع الأداء البشري في جميع المهام فحسب، بل يمكنه أن يتجاوز الأداء البشري بشكل كبير في العديد من تلك المهام، ويمكنه اكتشاف معرفة جديدة بنفسه.
إذن هذه هي النقطة التي يكون عندها عالم حقيقي يعلمنا أشياء جديدة لم تكن موجودة في بيانات التدريب، ونأمل أن يخترع جزيئات جديدة، وعلوم مواد جديدة، وما إلى ذلك، وما إلى ذلك. التفرد هو نقطة أبعد بكثير من ذلك حيث يمكن للذكاء الفائق أن يحسن نفسه ذاتيًا، وهذا خيال علمي للغاية، لكنه يشبه التسارع اللانهائي نحو هذه اللحظة الفريدة حيث، لا أعرف، تنطلق إلى اللانهاية أو شيء من هذا القبيل.
لا أعرف. إنه أحمق بعض الشيء بالنسبة لذوقي.
ولهذا السبب سألت. أستطيع أن أقول أنه كان هناك شيء أكثر غموضًا وكان ضبابيًا بعض الشيء.
مصطفى، من الواضح أنني أستطيع أن أتحدث معك عن هذه الأشياء لساعات وساعات أطول. سيكون عليك العودة في وقت أقرب من هذا المنعطف الأخير. شكرًا جزيلاً لك على تواجدك في Decoder.
نعم، لقد كان ممتعا. شكرا جزيلا، نيلاي. نراكم قريبا.
أسئلة أو تعليقات؟ تابعنا على [email protected]. نحن حقا نقرأ كل البريد الإلكتروني!
← رجوع