مقابلة مع مؤسس DeepMind: بنية الذكاء الاصطناعي العام، حالة الوكيل، والاختراق العلمي في العقد القادم

عنوان الفيديو الأصلي: ديميس هاسابيس: الوكلاء، الذكاء الاصطناعي العام والاختراق العلمي الكبير القادم

مصدر الفيديو الأصلي: Y Combinator
ترجمة النص: Deep潮 TechFlow

مقدمة التحرير

الرئيس التنفيذي لشركة DeepMind، الحائز على جائزة نوبل في الكيمياء ديميس هاسابيس يزور Y Combinator، ويتحدث عن التقدمات الرئيسية التي لا تزال ضرورية للوصول إلى الذكاء الاصطناعي العام، ويقدم نصائح لرواد الأعمال حول كيفية الحفاظ على التقدم، وأين قد يظهر الاختراق العلمي الكبير القادم.

أكثر حكم عملي لرواد الأعمال في التكنولوجيا العميقة هو أنه إذا أطلقت مشروعًا تكنولوجيًا عميقًا يمتد لعشر سنوات، فيجب أن تضع في خطتك ظهور الذكاء الاصطناعي العام. بالإضافة إلى ذلك، كشف عن أن شركة Isomorphic Labs (التي انفصلت عن DeepMind، وهي شركة أدوية تعتمد على الذكاء الاصطناعي) ستصدر أخبارًا مهمة قريبًا.

مقتطفات مهمة

مسار و جدول زمني للذكاء الاصطناعي العام

· “هذه المكونات التقنية الحالية ستصبح بالتأكيد جزءًا من الهيكل النهائي للذكاء الاصطناعي العام.”

· “مشاكل التعلم المستمر، والاستنتاج على المدى الطويل، وبعض جوانب الذاكرة لم تُحل بعد، والذكاء الاصطناعي العام يحتاج إلى حلها جميعًا.”

· “إذا كانت جدولك الزمني للذكاء الاصطناعي العام حول عام 2030، وبدأت مشروعًا تكنولوجيًا عميقًا اليوم، فعليك أن تضع في اعتبارك أن الذكاء الاصطناعي العام قد يظهر في منتصف الطريق.”

الذاكرة ونوافذ السياق

· “نافذة السياق تقريبًا تعادل الذاكرة العاملة. متوسط الذاكرة العاملة للبشر هو سبعة أرقام، بينما لدينا نوافذ سياق بمليون أو حتى عشرات الملايين من الرموز. لكن المشكلة أننا نضع كل شيء فيها، بما في ذلك المعلومات غير المهمة والخاطئة، وهذا الأسلوب حالياً هو أسلوب خشن جدًا.”

· “إذا أردت معالجة تدفق الفيديو المباشر وتخزين كل الرموز، فإن مليون رمز يكفي تقريبًا لمدة 20 دقيقة.”

نقائص الاستنتاج

· “أحب أن ألعب الشطرنج باستخدام Gemini. أحيانًا يدرك أن الخطوة سيئة، لكنه لا يجد خيارًا أفضل، فيدور حول نفسه ويختار الخطوة السيئة. لكن نظام استنتاج دقيق لا ينبغي أن يحدث معه هذا.”

· “هو من ناحية يستطيع حل مسائل بمستوى ميداليات أولمبياد IMO، ومن ناحية أخرى، عند طرح السؤال بطريقة مختلفة، يرتكب أخطاء رياضيات ابتدائية. يبدو أن هناك شيئًا مفقودًا في عملية التفكير الداخلي لديه.”

الوكيل والإبداع

· “لتحقيق الذكاء الاصطناعي العام، يجب أن يكون لديك نظام قادر على حل المشكلات بشكل نشط نيابة عنك. الوكيل هو الطريق، وأعتقد أننا بدأنا للتو.”

· “لم أرَ بعد أحدًا يستخدم برمجة vibe لإنشاء لعبة AAA تتصدر قوائم التطبيقات. وفقًا للجهود المبذولة حاليًا، هذا ممكن، لكنه لم يحدث بعد. هذا يدل على أن هناك شيئًا مفقودًا في الأدوات أو العمليات.”

التقطير والنماذج الصغيرة

· “افترضنا أن نموذج Pro متقدم، بعد نصف سنة إلى سنة من إصداره، يمكن ضغط قدراته إلى نموذج صغير جدًا يمكن تشغيله على الأجهزة الطرفية. حتى الآن، لم نصل إلى الحد الأقصى من كثافة المعلومات نظريًا.”

اكتشافات علمية و"اختبار أينشتاين"

· “أطلق عليه أحيانًا اسم ‘اختبار أينشتاين’، وهو القدرة على تدريب نظام باستخدام معرفة عام 1901، ثم أن يدير استنتاجاته بشكل مستقل ويصل إلى نتائج أينشتاين التي توصل إليها عام 1905، بما في ذلك النظرية النسبية الخاصة. إذا تمكنت من ذلك، فهذه الأنظمة ليست بعيدة جدًا عن اختراع أشياء جديدة تمامًا.”

· “حل مشكلة جائزة الألفية الكبرى هو إنجاز عظيم، لكن الأصعب هو أن تتمكن من طرح مجموعة جديدة من مشاكل الألفية الكبرى، ويعتبرها كبار الرياضيين عميقة بما يكفي وتستحق أن تدرس مدى الحياة.”

نصائح لرواد الأعمال في التكنولوجيا العميقة

· “السعي وراء المشكلات الصعبة والسهلية في الواقع متشابه، فقط بأساليب صعوبة مختلفة. الحياة قصيرة، فمن الأفضل أن تركز طاقتك على الأمور التي لن ينجح أحد غيرك في القيام بها.”

مسار تحقيق الذكاء الاصطناعي العام

Gary Tan: أنت تفكر في الذكاء الاصطناعي العام منذ وقت أطول من معظم الناس. بالنظر إلى النموذج الحالي، كم تعتقد أن لدينا من الهيكل النهائي للذكاء الاصطناعي العام؟ وما الذي ينقصنا بشكل جوهري الآن؟

Demis Hassabis: أنا متأكد أن التدريب المسبق على نطاق واسع، وتقنيات RLHF، وسلسلة التفكير، ستصبح جزءًا من الهيكل النهائي للذكاء الاصطناعي العام. لقد أثبتت هذه التقنيات جدواها بشكل كبير حتى الآن. لا أستطيع تصور أن نكتشف خلال عامين أن هذا الطريق مسدود، فهذا غير منطقي بالنسبة لي. لكن، على ما يبدو، ما زال هناك واحد أو اثنين من العناصر المفقودة، مثل التعلم المستمر، والاستنتاج على المدى الطويل، وبعض جوانب الذاكرة، لم تُحل بعد.

الذكاء الاصطناعي العام يحتاج إلى حل كامل. ربما يمكن للتقنيات الحالية مع بعض الابتكارات التدريجية أن تصل إلى ذلك، لكن قد يتبقى عنصر أو عنصرين رئيسيين يحتاجان إلى اختراق. أعتقد أن الاحتمال كبير أن هناك عنصرًا أو اثنين غير محلولين، وأن احتمالية وجودها حوالي 50-50. لذلك، في DeepMind، نحن نعمل على كلا المسارين.

Gary Tan: أتعامل مع العديد من أنظمة الوكيل، وأدهشني أن الوزن الأساسي يتكرر ويعاد استخدامه. لذا فإن مفهوم التعلم المستمر مثير جدًا، لأننا نستخدم حاليًا طرقًا مؤقتة، مثل دورات الأحلام الليلية.

Demis Hassabis: نعم، تلك الدورات الأحلامية مثيرة جدًا. لقد فكرنا سابقًا في دمج الذاكرة السياقية معًا. دراستي كانت حول كيف يدمج الحُصين المعرفة الجديدة بشكل أنيق مع المعرفة الموجودة. الدماغ يفعل ذلك بشكل ممتاز.

يتم ذلك خلال النوم، خاصة أثناء النوم السريع (REM sleep)، حيث يعيد تشغيل التجارب المهمة للتعلم منها. برنامجنا المبكر على Atari، DQN (شبكة Q العميقة التي نشرتها DeepMind في 2013، والتي حققت مستوى بشري في ألعاب Atari باستخدام التعلم المعزز العميق)، تمكن من إتقان ألعاب Atari عبر تقنية إعادة التشغيل التجريبي (experience replay).

هذه التقنية مستوحاة من علم الأعصاب، حيث يعيد الدماغ تكرار المسارات الناجحة. كانت تلك في 2013، زمن قديم في مجال الذكاء الاصطناعي، لكنها كانت حاسمة جدًا في ذلك الوقت.

أتفق معك، نحن الآن نستخدم لاصقًا مؤقتًا. نضع كل شيء في نافذة السياق. هذا الأسلوب غير مثالي. حتى لو كنا نعمل على آلة وليس دماغًا بشريًا، من الناحية النظرية يمكن أن نصل إلى نوافذ سياق بملايين أو عشرات الملايين من الرموز، ويمكن أن تكون الذاكرة مثالية، لكن تكلفة البحث والاسترجاع لا تزال قائمة. في اللحظة التي نحتاج فيها لاتخاذ قرار محدد، من الصعب العثور على المعلومات ذات الصلة حقًا، حتى لو استطعنا تخزين كل شيء. لذلك، أعتقد أن مجال الذاكرة لا يزال مليئًا بالفرص للابتكار.

Gary Tan: بصراحة، نافذة سياق بمليون رمز أكبر مما توقعت، ويمكن أن يؤدي العديد من المهام.

Demis Hassabis: نعم، بالنسبة لمعظم الحالات التي يحتاجها، فهي كبيرة بما يكفي. لكن فكر في الأمر، نافذة السياق تعادل تقريبًا الذاكرة العاملة. نحن نمتلك نوافذ سياق بملايين أو حتى عشرات الملايين من الرموز، بينما متوسط الذاكرة العاملة للبشر هو سبعة أرقام. المشكلة أننا نضع كل شيء فيها، بما في ذلك المعلومات غير المهمة والخاطئة، وهذا أسلوب خشن جدًا. وإذا أردت معالجة تدفق فيديو مباشر، فببساطة تسجيل كل الرموز، فإن مليون رمز يكفي تقريبًا لمدة 20 دقيقة. لكن إذا أردت أن يفهم النظام حياتك على مدى شهر أو شهرين، فهذا بعيد جدًا عن الكفاية.

Gary Tan: DeepMind دائمًا يركز على التعلم المعزز والبحث، هل هذا النهج متأصل في بناء Gemini؟ هل لا زلتم تستهينون بقيمة التعلم المعزز؟

Demis Hassabis: ربما، نعم، هذا النهج يُقدّر حقًا. اهتمامنا به يتغير ويتقلب. منذ تأسيس DeepMind، ونحن نعمل على أنظمة الوكيل. كل أعمالنا على Atari وAlphaGo، في جوهرها، كانت أنظمة تعلم معزز، قادرة على تحقيق الأهداف، واتخاذ القرارات، ووضع الخطط بشكل مستقل. بالطبع، اخترنا مجال الألعاب لأنه يمكن التحكم في التعقيد، ثم توسعنا إلى ألعاب أكثر تعقيدًا، مثل AlphaStar بعد AlphaGo، وحققنا نجاحات كبيرة.

السؤال التالي هو، هل يمكن تعميم هذه النماذج لتصبح نماذج عالمية أو نماذج لغوية، وليس فقط نماذج للألعاب؟ لقد كنا نعمل على ذلك خلال السنوات الماضية. اليوم، أنماط التفكير والتسلسل المنطقي في النماذج الرائدة، هو في جوهره إعادة تطبيق للأفكار التي بدأها AlphaGo منذ زمن.

أعتقد أن الكثير من الأعمال التي قمنا بها منذ ذلك الحين مرتبطة جدًا بما نفعله اليوم، ونحن نعيد النظر في تلك الأفكار القديمة، ونستخدم مقاييس أكبر، وأساليب أكثر عمومية، بما في ذلك البحث باستخدام أشجار مونت كارلو (Monte Carlo tree search) وطرق التعلم المعزز المختلفة. أفكار AlphaGo وAlphaZero مرتبطة جدًا بالنماذج الأساسية الحالية، وأعتقد أن جزءًا كبيرًا من التقدم في السنوات القادمة سيأتي من هذا.

التقطير والنماذج الصغيرة

Gary Tan: الآن، لكي نكون أذكى، نحتاج إلى نماذج أكبر، لكن تقنيات التقطير تتقدم أيضًا، ويمكن للنماذج الصغيرة أن تصبح سريعة جدًا. نماذج Flash الخاصة بكم قوية جدًا، وتصل إلى حوالي 95% من أداء النماذج الرائدة، ولكن بتكلفة أقل بعشر مرات. هل هذا صحيح؟

Demis Hassabis: أعتقد أن هذا أحد ميزاتنا الأساسية. عليك أن تبني أكبر نموذج ممكن للحصول على قدرات رائدة. أحد أكبر مميزاتنا هو أننا نستطيع بسرعة تقليل تلك القدرات إلى نماذج أصغر وأصغر. تقنية التقطير هي من ابتكارنا، ونحن لا نزال من بين الأفضل عالميًا. ولدينا دافع قوي للقيام بذلك، فنحن أكبر منصة تطبيقات ذكاء اصطناعي في العالم.

نحن نمتلك نظرة عامة على الذكاء الاصطناعي، ونماذج AI Mode، وGemini، وكل منتجات Google، بما في ذلك الخرائط وYouTube، كلها تدمج تقنيات Gemini أو تقنيات ذات صلة. هذا يشمل مئات الملايين من المستخدمين، ومنتجات بمليارات المستخدمين. يجب أن تكون سريعة جدًا، وفعالة، ومنخفضة التكلفة، وذات زمن استجابة منخفض. هذا يمنحنا دافعًا كبيرًا لتحسين نماذج Flash وFlash-Lite الصغيرة جدًا، وأتمنى أن يخدم ذلك المستخدمين في مختلف مهامهم.

Gary Tan: أنا فضولي جدًا حول مدى ذكاء هذه النماذج الصغيرة. هل التقطير له حدود؟ هل يمكن لنماذج بحجم 50 مليار أو 400 مليار أن تكون بنفس ذكاء النماذج الرائدة اليوم؟

Demis Hassabis: لا أعتقد أننا وصلنا بعد إلى الحد النظري للمعلومات، على الأقل لا أحد يعلم ذلك حتى الآن. ربما في يوم من الأيام نصل إلى سقف كثافة المعلومات، لكن فرضيتنا الحالية أن بعد إصدار نموذج Pro متقدم، خلال ستة أشهر إلى سنة، يمكن ضغط قدراته إلى نموذج صغير جدًا يمكن تشغيله على الأجهزة الطرفية.

يمكنكم أن تروا ذلك في نموذج Gemma، حيث أداء نموذج Gemma 4 قوي جدًا بالنسبة لنفس الحجم. هذا يعتمد على تقنيات التقطير وتحسين كفاءة النماذج الصغيرة. لذلك، لم أجد حدودًا نظرية بعد، وأعتقد أننا لا نزال بعيدين جدًا عن ذلك الحد.

Gary Tan: هناك ظاهرة غريبة الآن، وهي أن المهندسين يمكنهم إنجاز عمل يعادل 500 إلى 1000 مرة من العمل قبل ستة أشهر. بعض الأشخاص في هذه الغرفة يقومون بعمل يعادل ألف مرة من عمل مهندس Google في التسعينات. Steve Yegge ذكر ذلك.

Demis Hassabis: أشعر بحماس كبير. النماذج الصغيرة لها العديد من الاستخدامات. أحدها هو انخفاض التكلفة وسرعة الأداء، مما يتيح لك التكرار بشكل أسرع، خاصة عند التعاون مع أنظمة أخرى. أنظمة سريعة، حتى لو لم تكن في قمة الأداء، مثل أن تكون بنسبة 90-95% من الأفضل، فهي كافية تمامًا، والربح من سرعة التكرار يفوق تلك العشرة بالمئة.

جانب آخر مهم هو تشغيل هذه النماذج على الأجهزة الطرفية، ليس فقط من أجل الكفاءة، ولكن أيضًا من أجل الخصوصية والأمان. فكر في الأجهزة التي تتعامل مع معلومات شخصية جدًا، والروبوتات، فبالنسبة للروبوتات المنزلية، تود أن يكون لديك نموذج فعال وقوي يعمل محليًا، ويُعهد إليه بالمهمة فقط عند الحاجة، مع عدم الاعتماد على السحابة إلا عند الضرورة. معالجة الصوت والفيديو محليًا، والبيانات تبقى على الجهاز، وأتخيل أن هذا سيكون الحالة المثالية.

الذاكرة والاستنتاج

Gary Tan: نعود إلى السياق والذاكرة. النماذج حاليًا غير ذات حالة، وإذا أُضيفت القدرة على التعلم المستمر، كيف ستكون تجربة المطورين؟ كيف ستوجه مثل هذه النماذج؟

Demis Hassabis: سؤال مهم جدًا. نقص التعلم المستمر هو أحد العقبات الرئيسية التي تمنع الوكيل من إكمال المهام بشكل كامل. الوكيل الحالي مفيد جدًا في أجزاء معينة من المهمة، ويمكن تجميعها لعمل أشياء رائعة، لكنه غير قادر على التكيف بشكل جيد مع البيئة المحددة التي أنت فيها. هذا هو السبب في أنها لا تزال غير قادرة على “الإطلاق وعدم الاهتمام”، فهي بحاجة إلى أن تتعلم من سياقك الخاص. لتحقيق الذكاء العام الحقيقي، يجب حل هذه المشكلة.

Gary Tan: أين وصلنا في مجال الاستنتاج؟ نماذج التفكير الحالية قوية جدًا، لكن لا تزال ترتكب أخطاءً لا يرتكبها طلاب المرحلة الابتدائية. ما الذي يحتاج إلى تحسين؟ وما المتوقع من التقدم في الاستنتاج؟

Demis Hassabis: هناك الكثير من الابتكار في نماذج التفكير. ما نفعله لا يزال بدائيًا جدًا، وأساليبنا قاسية جدًا. يمكن تحسينه بعدة طرق، مثل مراقبة عملية سلسلة التفكير، والتدخل أثناء عملية التفكير. أحيانًا أعتقد أن أنظمتنا، أو أنظمة المنافسين، تتفلسف بشكل مفرط، وتدخل في حلقات مفرغة.

أحب أن أراقب Gemini وهو يلعب الشطرنج. جميع النماذج الأساسية الرائدة ضعيفة جدًا في الشطرنج، وهذا مثير جدًا.

مراقبة مسارات تفكيرها مهمة جدًا، لأنها مجال مفهوم تمامًا، وأستطيع بسرعة أن أرى إذا كانت تنحرف عن المسار الصحيح، وإذا كانت استنتاجاتها فعالة. أحيانًا، تفكر خطوة، وتدرك أنها خطوة سيئة، لكنها لا تجد خيارًا أفضل، فتدور حول نفسها وتختار الخطوة السيئة. نظام استنتاج دقيق لا ينبغي أن يحدث معه هذا.

هذا الفارق الكبير لا يزال قائمًا، لكن إصلاحه قد يتطلب تعديلًا أو اثنين فقط. لهذا السبب نرى أحيانًا “ذكاء مسنن” (jagged intelligence)، حيث يمكنها أن تحل مسائل بمستوى ميداليات أولمبياد IMO، وعند طرح السؤال بطريقة مختلفة، ترتكب أخطاء رياضيات ابتدائية. يبدو أن هناك شيئًا مفقودًا في عملية التفكير الداخلي لديها.

القدرة الحقيقية للوكيل

Gary Tan: الوكيل هو موضوع كبير. البعض يراه مجرد دعاية. أنا أعتقد أنه بدأ للتو. ما هو تقييمكم الحقيقي لقدرات الوكيل، مقارنةً بالإعلانات الخارجية؟

Demis Hassabis: أتفق معك، نحن بدأنا للتو. لتحقيق الذكاء الاصطناعي العام، يجب أن يكون لديك نظام قادر على حل المشكلات بشكل نشط نيابة عنك. هذا دائمًا كان واضحًا بالنسبة لنا. الوكيل هو الطريق، وأعتقد أننا بدأنا للتو.

الجميع يحاول اكتشاف كيف يمكن أن يتعاون الوكيل بشكل أفضل، لقد أجرينا الكثير من التجارب الشخصية، والكثير من الأشخاص هنا ربما فعلوا ذلك أيضًا. كيف ندمج الوكيل في سير العمل، وكيف نجعله لا يقتصر على أن يكون مجرد إضافة، بل أن يكون فعالًا في حل المشكلات الأساسية. نحن لا زلنا في مرحلة التجريب، وربما بدأنا منذ شهرين أو ثلاثة فقط في اكتشاف سيناريوهات ذات قيمة حقيقية. التقنية الآن وصلت إلى مرحلة لا تعتبر مجرد عرض تجريبي، بل تساهم فعليًا في تحسين وقتك وكفاءتك.

أرى كثيرين يطلقون عشرات الوكلاء ويشغلونهم لساعات طويلة، لكنني لست متأكدًا من أن الناتج يبرر هذا الجهد.

لم نرَ بعد أحدًا يستخدم برمجة vibe لإنشاء لعبة AAA تتصدر قوائم التطبيقات. لقد كتبتُ بنفسي، وكتب الكثير منكم عروضًا صغيرة جيدة. أستطيع الآن أن أصنع نموذجًا لـ “Theme Park” في نصف ساعة، بينما استغرقت مني الأمر ستة أشهر عندما كنت في السابعة عشرة.

أشعر أنه إذا قضيت صيفًا كاملًا في العمل على ذلك، فستتمكن من صنع شيء مذهل حقًا. لكنه لا يزال يتطلب مهارة، وروح الإنسان، وذوقه، ويجب أن تضمن إدخال هذه العناصر في أي منتج تبنيه. في الواقع، لم يصنع طفل حتى الآن لعبة ناجحة بيعت بملايين النسخ، ومع الأدوات الحالية، من الممكن أن يكون ذلك ممكنًا. إذن، هناك شيء مفقود، ربما يتعلق بالعملية، أو بالأدوات. أتوقع أن نرى مثل هذه الإنجازات خلال 6 إلى 12 شهرًا القادمة.

Gary Tan: إلى أي مدى سيكون ذلك تلقائيًا بالكامل؟ أعتقد أنه لن يكون تلقائيًا بالكامل من البداية. المسار الأكثر احتمالية هو أن يحقق الأشخاص هنا كفاءة 1000 مرة، ثم يظهر من يستخدم هذه الأدوات لإنشاء تطبيقات وألعاب ناجحة، ثم تتجه العمليات نحو الأتمتة بشكل أكبر.

Demis Hassabis: بالضبط، هذا هو ما يجب أن تراه أولًا.

Gary Tan: هناك أيضًا جانب أن بعض الأشخاص فعلوا ذلك بالفعل، لكنهم لا يرغبون في الكشف عن مدى مساهمة الوكيل.

Demis Hassabis: ربما، لكن أود أن أتحدث عن الإبداع. أستخدم دائمًا مثال AlphaGo، خاصة الجولة الثانية، الحركة 37. بالنسبة لي، كنت أنتظر ذلك اللحظة، وعندما حدثت، بدأت مشاريع علمية مثل AlphaFold. بدأنا بعد عودتنا من سول مباشرة في العمل على AlphaFold، وكان ذلك قبل عشر سنوات. زرت كوريا للاحتفال بمرور عشر سنوات على AlphaGo.

لكن مجرد أن تتخذ الحركة 37 لا يكفي. هو نظام رائع ومفيد، لكنه لا يستطيع اختراع لعبة Go نفسها. إذا أعطيت النظام وصفًا عالي المستوى، مثل “لعبة تتعلم قواعدها خلال خمس دقائق، لكن من الصعب جدًا إتقانها مدى الحياة، وتتمتع بجمال فني، ويمكن أن تنتهي خلال ظهيرة”، ثم يعود النظام بنتيجة أن اللعبة هي Go، فهذه مشكلة. لماذا؟

Gary Tan: ربما يكون هناك شخص في الحضور يمكنه فعل ذلك.

Demis Hassabis: إذا تمكن أحدهم من ذلك، فالإجابة ليست أن النظام يفتقر إلى شيء، بل ربما أن طريقة استخدامنا للنظام خاطئة. ربما هذا هو الحل الصحيح. ربما أنظمة اليوم لديها القدرة، فقط تحتاج إلى مبدع عبق يوجهها، ويعطيها روح المشروع، ويكون متكاملًا معها بشكل كبير. إذا قضيت ليالي وأيامًا في العمل على هذه الأدوات، وكنت تملك إبداعًا عميقًا، فربما يمكنك صنع أشياء تتجاوز التوقعات.

المصادر المفتوحة والنماذج متعددة الوسائط

Gary Tan: لنتحدث عن المصادر المفتوحة. إصدار Gemma مؤخرًا سمح بتشغيل نماذج قوية محليًا. ما رأيك؟ هل ستتحول الذكاء الاصطناعي إلى شيء يملكه المستخدمون أنفسهم، بدلاً من أن يظل في السحابة؟ هل سيغير ذلك من يمكنه بناء منتجات باستخدام هذه النماذج؟

Demis Hassabis: نحن من الداعمين بقوة للمصادر المفتوحة والعلوم المفتوحة. لقد أطلقنا جميع نتائج AlphaFold مجانًا. أبحاثنا العلمية لا تزال تُنشر في مجلات مرموقة. فيما يخص Gemma، نريد أن نخلق نماذج رائدة على مستوى العالم بنفس الحجم. حاليًا، تم تنزيل Gemma حوالي 40 مليون مرة، ولم يمض على إطلاقه سوى أسبوعين ونصف.

أعتقد أيضًا أن وجود تكنولوجيا مفتوحة المصدر في الغرب مهم جدًا. النماذج المفتوحة الصينية ممتازة، وتتصدر المجال، لكننا نعتقد أن Gemma تنافس بقوة على نفس الحجم.

لدينا مشكلة موارد، لا أحد يملك طاقة حسابية فائضة لبناء نموذجين متقدمين كاملين. لذلك، قرارنا هو أن النماذج الطرفية تُستخدم على أجهزة أندرويد، نظارات، روبوتات، ويُفضل أن تكون مفتوحة المصدر، لأنه بمجرد نشرها على الأجهزة، فهي معرضة، والأفضل أن تكون مفتوحة تمامًا. لقد وحدنا استراتيجية الفتح على مستوى النانومتر، وهذا منطقي استراتيجيًا.

Gary Tan: قبل أن أقدم لك عرضًا، أظهرت لي نظام تشغيل AI الذي بنيته، ويمكنني التفاعل معه صوتيًا مباشرة مع Gemini. أعتذر عن التوتر أثناء العرض، لكنه نجح. Gemini من البداية كان متعدد الوسائط. لقد جربت العديد من النماذج، والتفاعل الصوتي المباشر مع النماذج، مع قدرات استدعاء الأدوات، وفهم السياق، لا يوجد نموذج يقارن بـ Gemini حتى الآن.

Demis Hassabis: صحيح. أحد المزايا غير المعروفة بعد في سلسلة Gemini هو أننا من البداية بنيناها بشكل متعدد الوسائط. هذا جعل البداية أصعب من الاعتماد على النص فقط، لكننا نؤمن أن الفائدة طويلة المدى ستكون كبيرة، وقد بدأنا بالفعل في جني ثمار ذلك.

على سبيل المثال، في مجال النماذج العالمية، بنينا على Gemini نموذج Genie (نموذج بيئة تفاعلية توليدي من DeepMind). وفي مجال الروبوتات، ستعتمد Gemini Robotics على نماذج متعددة الوسائط، ومزايانا في هذا المجال ستصبح سياج حماية تنافسي. نحن نستخدم Gemini بشكل متزايد في Waymo (شركة القيادة الذاتية التابعة لألفابت).

تخيل مساعدًا رقميًا يتبعك إلى العالم الحقيقي، ربما على هاتفك أو نظاراتك، ويفهم البيئة المادية من حولك. أنظمتنا قوية جدًا في هذا المجال. سنواصل الاستثمار في هذا الاتجاه، وأعتقد أن ميزتنا في هذا المجال كبيرة جدًا.

Gary Tan: مع انخفاض تكلفة الاستدلال بسرعة، ماذا أصبح ممكنًا الآن؟ هل ستتغير استراتيجيات فريقكم بسبب ذلك؟

Demis Hassabis: لست متأكدًا أن الاستدلال سيكون مجانيًا تمامًا، هناك مفارقة جيفنز (Jevons’ Paradox) — أي أن زيادة الكفاءة تؤدي إلى زيادة الاستهلاك الإجمالي. أعتقد أن الجميع في النهاية سيستخدم كل القدرة الحاسوبية المتاحة.

يمكن تصور مجموعات من مئات الآلاف من الوكلاء يتعاونون، أو فريق من الوكلاء يتفكر في عدة اتجاهات في آن واحد، ثم يدمجون النتائج. نحن نختبر هذه الاتجاهات، وكلها ستستهلك موارد استدلال.

بالنسبة للطاقة، إذا حللنا بعض مشاكل الاندماج النووي، أو الموصلية الفائقة في درجة الغرفة، أو البطاريات المثلى، أعتقد أن ذلك ممكن من خلال علوم المواد، وسيؤدي إلى تكاليف طاقة قريبة من الصفر. لكن، لا تزال هناك قيود في التصنيع الفيزيائي للرقائق، على الأقل لعقود قادمة. لذلك، لا تزال هناك حدود على استهلاك الحوسبة، ويجب أن نستخدمها بكفاءة.

الاختراق العلمي القادم

Gary Tan: من الجيد أن النماذج الصغيرة أصبحت أكثر ذكاءً. هناك العديد من رواد الأعمال في مجالات الأحياء والتكنولوجيا الحيوية. لقد تجاوز AlphaFold البروتينات، وامتد إلى جزيئات حيوية أوسع. كم تبعد عنا نمذجة النظام الخلوي الكامل؟ هل هو مشكلة من مستوى صعوبة مختلف تمامًا؟

Demis Hassabis: تقدم Isomorphic Labs ممتاز جدًا. AlphaFold هو مجرد جزء من عملية اكتشاف الأدوية، ونحن نعمل على أبحاث كيميائية حيوية مجاورة، وتصميم مركبات ذات خصائص صحيحة، وسنصدر نتائج مهمة قريبًا.

هدفنا النهائي هو إنشاء خلية افتراضية كاملة، محاكاة خلية ذات وظيفة كاملة يمكن التلاعب بها، وتكون مخرجاتها قريبة جدًا من النتائج التجريبية، وتكون ذات فائدة عملية. يمكنك تجاوز العديد من خطوات البحث، وتوليد بيانات تركيبية كثيرة لتدريب نماذج أخرى، وتوقع سلوك الخلايا الحقيقية.

أقدّر أن الوصول إلى خلية افتراضية كاملة قد يستغرق حوالي عشر سنوات. نحن نعمل على ذلك من خلال الجانب العلمي في DeepMind، بدءًا من نواة الخلية، لأنها نظام مستقل نسبيًا. المشكلة الأساسية هي: هل يمكننا تحديد مقطع معقد بشكل مناسب، يكون مكتفيًا ذاتيًا، ويمكننا تقريب مدخلاته ومخرجاته بشكل معقول، ثم نركز على هذا النظام الفرعي؟ نواة الخلية مناسبة جدًا لهذا.

مشكلة أخرى هي نقص البيانات. تحدثت مع علماء في التصوير الإلكتروني المجهري وتقنيات التصوير الأخرى. إذا استطعنا التصوير الحي للخلايا دون قتلها، فسيكون ذلك ثورة. لأنه يمكننا حينها تحويل الأمر إلى مسألة بصرية، ونحن نعرف كيف نحلها.

لكن، حتى الآن، لا توجد تقنية تمكن من التصوير بدقة نانوية للخلايا الحية بشكل ديناميكي دون تدميرها. يمكننا التقاط صور ثابتة عالية الدقة جدًا، وهو أمر مثير جدًا، لكنه غير كافٍ لتحويله إلى مسألة بصرية.

لذا، هناك مساران، أحدهما يعتمد على الأجهزة والبيانات، والآخر على بناء محاكيات قابلة للتعلم بشكل أفضل لمحاكاة هذه الأنظمة الديناميكية.

Gary Tan: أنت لا تقتصر على البيولوجيا فقط. هل تعتقد أن علوم المواد، اكتشاف الأدوية، نمذجة المناخ، الرياضيات، إذا رتبتها، أي مجال علمي سيشهد أكبر ثورة خلال الخمس سنوات القادمة؟

Demis Hassabis: كل مجال يثير الحماس، ولهذا السبب كانت دائمًا شغفي الأكبر، ومنذ أكثر من 30 عامًا أعمل في الذكاء الاصطناعي. لطالما اعتقدت أن الذكاء الاصطناعي هو الأداة النهائية للعلم، لدفع فهمنا العلمي، والاكتشافات العلمية، والطب، ومعرفتنا للكون.

بدأنا بمهمة من خطوتين. أولًا، حل مشكلة الذكاء، أي بناء الذكاء الاصطناعي العام؛ ثانيًا، استخدامه لحل جميع المشكلات الأخرى. ثم اضطررنا لتعديل الصياغة، لأن البعض سأل: “هل تعني حقًا حل جميع المشكلات؟”

نعم، نحن نعني ذلك. الآن، بدأ الناس يفهمون ما يعنيه ذلك. بشكل محدد، أعني حل تلك “مشكلات الجذر” في العلوم، وهي المجالات التي بمجرد أن تتجاوزها، تفتح فروعًا جديدة من الاكتشافات. على سبيل المثال، يعد AlphaFold نموذجًا لما نريد تحقيقه.

أكثر من ثلاثة ملايين باحث، تقريبًا كل الباحثين في علم الأحياء يستخدمون الآن AlphaFold. سمعت من بعض كبار التنفيذيين في شركات الأدوية أن كل دواء يُكتشف في المستقبل تقريبًا سيستخدم AlphaFold في مرحلة من مراحل اكتشافه. نحن فخورون بذلك، وهو التأثير الذي نأمل أن يحققه الذكاء الاصطناعي. لكن، هذا مجرد البداية.

لا أستطيع أن أتصور أن هناك مجالًا علميًا أو هندسيًا لا يمكن للذكاء الاصطناعي أن يساعد فيه. تلك المجالات التي ذكرتها، أعتقد أنها لا تزال في “لحظة AlphaFold 1”، والنتائج حتى الآن واعدة جدًا، لكن لم يتم التغلب على التحدي الكبير بعد. خلال العامين المقبلين، سنشهد تقدمًا كبيرًا في جميع هذه المجالات، من علوم المواد إلى الرياضيات.

Gary Tan: يبدو الأمر كأننا نمنح البشر قدرات جديدة تمامًا، كأننا بروميثيوس.

Demis Hassabis: بالضبط. وكما يحمل قصة بروميثيوس عبرة، يجب أن نكون حذرين جدًا بشأن كيفية استخدام هذه القدرات، والأماكن التي تُستخدم فيها، والخطر من إساءة استخدام نفس الأدوات.

خبرات النجاح

Gary Tan: هناك الكثير من الأشخاص هنا يحاولون تأسيس شركات تستخدم الذكاء الاصطناعي في العلم. برأيك، ما الفرق بين الشركات الناشئة التي تدفع حدود البحث المتقدم، وتلك التي تكتفي بتغليف النماذج الأساسية عبر API وتطلق على نفسها “الذكاء الاصطناعي للعلم”؟

Demis Hassabis: أفكر لو أنني مكانكم، وأشاهد المشاريع في Y Combinator، كيف سأتصرف. أحد الأمور هو أن تتوقع مسار تطور الذكاء الاصطناعي، وهو أمر صعب جدًا. لكن، أعتقد أن الجمع بين الذكاء الاصطناعي ومجال علمي عميق آخر يحمل فرصًا هائلة. هذا التقاطع، سواء كان في المواد، الطب، أو مجالات علمية صعبة أخرى، خاصة تلك التي تتعلق بالعالم الذري، لن يكون هناك طرق مختصرة في المستقبل القريب. هذه المجالات لن تتعرض للاندثار مع تحديثات النماذج الأساسية القادمة. لكن، إذا كنت تبحث عن مسار دفاعي، فهذه نصيحتي.

أنا شخصيًا أفضّل التكنولوجيا العميقة. الأشياء المستدامة والقيمة لا تأتي بسهولة. دائمًا ما أجد نفسي منجذبًا للتكنولوجيا العميقة. عندما بدأنا في 2010، كان الذكاء الاصطناعي مجالًا عميقًا — قال لي المستثمرون: “نحن نعلم أن هذا لن ينجح”، واعتقدت أن هذا مجال صغير فاشل منذ التسعينات.

لكن، إذا كنت تؤمن بأفكارك — لماذا ستكون هذه المرة مختلفة، وما الذي يميز خلفيتك؟ — من المثالي أن تكون خبيرًا في التعلم الآلي والتطبيقات، أو أن تكون قادرًا على تشكيل فريق مؤسس من خبراء. هناك إمكانيات هائلة وقيمة يمكن أن تخلقها.

Gary Tan: هذه المعلومات مهمة جدًا. شيء واحد ينجح، ويبدو واضحًا، لكنه كان معارضًا جدًا قبل أن يتحقق.

Demis Hassabis: بالطبع، لذلك عليك أن تتابع ما تحبه حقًا. بالنسبة لي، سأظل دائمًا أعمل على الذكاء الاصطناعي، منذ طفولتي قررت أن هذا هو المجال الأكثر تأثيرًا الذي يمكنني العمل فيه. وقد ثبت ذلك، لكنه قد لا يكون كذلك، ربما نحن متقدمون بـ 50 سنة.

وهو أيضًا أكثر شيء أجد متعة فيه. حتى لو ظللنا في مرآب صغير، ولم نحقق بعد الذكاء الاصطناعي، سأواصل العمل على ذلك. ربما أعود للأكاديمية، لكني سأجد طريقة للاستمرار.

Gary Tan: AlphaFold هو مثال على أنك اتبعت اتجاهًا ونجحت في الرهان. ما الذي يجعل مجالًا علميًا مناسبًا لتحقيق اختراق مثل AlphaFold؟ هل هناك قواعد، مثل وظيفة هدف معينة؟

Demis Hassabis: يجب أن أخصص وقتًا لكتابة ذلك. من خلال تجاربي مع AlphaGo وAlphaFold، تعلمت أن التقنيات الحالية تعمل بشكل أفضل عندما:

أولًا، المشكلة تحتوي على مساحة بحثية ضخمة جدًا، وكلما كانت أكبر، كان ذلك أفضل، بحيث لا يمكن حلها إلا بالبحث المكثف، وليس بواسطة الحوسبة العشوائية أو خوارزمية خاصة. مساحة خيارات الشطرنج والأشكال الثلاثية للبروتين تتجاوز بكثير عدد الذرات في الكون. ثانيًا، يمكن تحديد وظيفة هدف واضحة، مثل تقليل الطاقة الحرة للبروتين، أو الفوز في الشطرنج، بحيث يمكن للنظام أن يستخدم التدرج الصاعد. ثالثًا، وجود بيانات كافية، أو وجود محاكٍ يمكنه توليد بيانات تركيبية كثيرة ضمن التوزيع.

إذا توافرت هذه الشروط، فحتى الطرق الحالية يمكن أن تصل بعيدًا، وتجد “الإبرة في كومة القش”. اكتشاف الأدوية يتبع نفس المنطق: وجود مركب يمكنه علاج مرض معين بدون آثار جانبية، طالما أن قوانين الفيزياء تسمح بوجوده، المشكلة الوحيدة هي كيف نبحث عنه بكفاءة. أعتقد أن AlphaFold أثبت أن هذه الأنظمة قادرة على العثور على مثل هذه الإبر في مساحات بحث هائلة.

Gary Tan: أريد أن أرتقي بمستوى النقاش. نحن نتحدث عن أن البشر يستخدمون هذه الطرق لخلق AlphaFold، لكن هناك مستوى أعلى، وهو أن البشر يستخدمون الذكاء الاصطناعي لاستكشاف فضاء الافتراضات المحتملة. كم نحن بعيدون عن أن تكون أنظمة الذكاء الاصطناعي قادرة على إجراء استنتاجات علمية حقيقية، وليس مجرد نمطية في البيانات؟

Demis Hassabis: أعتقد أن ذلك قريب جدًا. نحن نعمل على أنظمة عامة من هذا النوع. لدينا نظام يسمى AI co-scientist، وخوارزمية مثل AlphaEvolve، يمكنها أن تتجاوز ما يقدمه Gemini بشكل أكبر. جميع المختبرات الرائدة تستكشف هذا الاتجاه.

لكن، حتى الآن، لم أرى اكتشافًا علميًا حقيقيًا وذو أهمية كبيرة يتم بواسطة هذه الأنظمة. أعتقد أن ذلك سيحدث قريبًا، وربما يكون مرتبطًا بالإبداع الحقيقي، وتجاوز الحدود المعروفة. عند ذلك، لن يكون الأمر مجرد نمطية، لأنه لن يكون هناك نمط للمطابقة. سيكون نوعًا من الاستنتاج بالمقارنة (analogical reasoning)، وأعتقد أن هذه الأنظمة لا تملكها بعد، أو أننا لم نستخدمها بشكل صحيح.

أقول دائمًا في المجال العلمي، هل يمكن أن تطرح فرضية مثيرة للاهتمام حقًا، وليس مجرد اختبار فرضية؟ لأن اختبار فرضية قد يكون إنجازًا عظيمًا، مثل إثبات فرضية ريمان أو حل مشكلة الألفية، لكن ربما نقترب من ذلك بعد بضع سنوات فقط.

الأصعب هو أن تطرح مجموعة جديدة من مشكلات الألفية، ويعتبرها كبار الرياضيين عميقة وتستحق الدراسة مدى الحياة. أعتقد أن هذا أصعب بكثير، ونحن لا نعرف كيف نصل إليه بعد. لكن، لا أعتقد أن ذلك سحري، وأؤمن أن هذه الأنظمة ستصل إلى ذلك، ربما مع بعض الاختلافات الصغيرة.

يمكننا اختبار ذلك عبر ما أسميه "اختبار أينشت

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت