تحدث الفريق بعد إصدار Gemini3: ثلاث نقاط ابتكار رئيسية وقانون الحجم لا يزالان ساريين

المؤلف: Wuji، محرر خاص لـ Tencent Technology

في 19 نوفمبر بتوقيت بكين، بعد أن أصدرت جوجل سلسلة نماذج Gemini 3، أصدر البودكاست التكنولوجي “Hard Fork” المملوك لصحيفة نيويورك تايمز برنامجًا خاصًا أجرى فيه المضيفان كيفن روز وكيسي نيوتن مقابلة حصرية مع الرئيس التنفيذي لشركة Google DeepMind ديميس هاسابيس ورئيس فريق Google Gemini جوش وودوارد.

تركز هذه المقابلة على أحدث طراز Gemini 3 الرائد للذكاء الاصطناعي من Google (في الواقع الإصدار الاحترافي من سلسلة Gemini 3.0). يعد هذا أول إصدار بارز من Google والذي تعتبره الصناعة على نطاق واسع لاستعادة ريادة التكنولوجيا والمنتجات بعد فشل Bard ومرحلة اللحاق بـ Gemini 1.x و2.x.

وتحدث الزعيمان بالتفصيل عن إنجازات جيميني 3 في التفكير متعدد الخطوات، وتوليد الأكواد (خاصة الواجهة الأمامية و”ترميز الغلاف الجوي”)، والتوليد الديناميكي للواجهات التفاعلية.وشددوا على أن جوجل دفعت بسرعة أقوى النماذج إلى مليارات من منتجات المستخدم مثل البحث، وGmail، وWorkspace، مما أعاد تشكيل الحواجز التنافسية.

النقاط الرئيسية من المقابلة:

الجوزاء 3 يتماشى تمامًا مع مسار التطوير المتوقع،<ب>لا يزال الذكاء الاصطناعي العام (AGI) يحتاج إلى ما بين 5 إلى 10 سنوات وإنجاز بحثي كبير واحد أو اثنين;<لي>

إن المزايا الكاملة التي تتمتع بها Google من حيث الكفاءة والتكلفة والتوزيع تمكنها من الفوز في أي بيئة سوقية؛<لي>

<ب>فقاعة الذكاء الاصطناعي موجودة جزئيًا، لكن لدى Google ضمانات مزدوجة لتحقيق الدخل على المدى القصير ومسار جديد على مستوى تريليون على المدى الطويل.

وفيما يلي نسخة مختصرة من المقابلة

<ب>رودس: كاثي، سنضيف مؤقتًا حلقة خاصة اليوم، موضوعها هو إصدار Gemini 3.

<ب>نيوتن: نعم، كيفن.لقد طال انتظار هذا النموذج في دوائر الذكاء الاصطناعي في وادي السيليكون، وأخيراً تمكنا من تجربة المنتج النهائي الحقيقي بأيدينا.

<ب>رودس: هناك سببان رئيسيان وراء كسرنا إيقاع إصدار الجمعة المعتاد وتسجيل هذه المشكلة على وجه التحديد.أولاً، حصلنا على فرصة مقابلة حصرية مع اثنين من قادة الذكاء الاصطناعي الأساسيين في Google (الرئيس التنفيذي لشركة DeepMind هاسابيس ونائب رئيس فريق Gemini Woodward).

ثانيا، اجتذب إصدار Gemini 3 اهتماما قويا في الصناعة.لقد سمعنا مصادر داخلية من مختبرات متعددة تقول إن هذا النموذج قد حقق اختراقات في بعض المجالات الرئيسية وقد يشكل تهديدًا كبيرًا للمنافسين.لقد كان يُنظر إلى جوجل على أنها شركة مطاردة على مدى العامين الماضيين، والسؤال الآن هو: هل عادوا إلى الصدارة؟

<ب>نيوتن: قبل الدخول رسميا في المقابلة سنقدم المعلومات المعروفة بإيجاز. عقدت Google إحاطة مغلقة قبل الإصدار.تشمل القدرات الجديدة الأكثر لفتًا للانتباه في Gemini 3 ما يلي: إمكانات الترميز و”التشفير المحيطي” المحسنة بشكل كبير؛ ووظيفة إنشاء واجهة تفاعلية جديدة.

لم يعد يقوم بإخراج النص فحسب، بل يقوم مباشرة بإنشاء واجهات تفاعلية مخصصة للمستخدمين.على سبيل المثال، عندما يسأل المستخدم عن حياة فان جوخ، سيقوم النموذج على الفور بإنشاء صفحة تعليمية كاملة تحتوي على صور وجداول زمنية وعناصر تفاعلية؛مثال آخر هو إنشاء حاسبة الرهن العقاري للعقارات التي تزيد قيمتها عن مليون دولار.تمثل هذه الميزات الانتقال من “الإجابة على الأسئلة” إلى “بناء الخبرات”.

<ب>رودس: يتفوق Gemini 3 بشكل كبير على Gemini 2.5 Pro في جميع المعايير العامة.على سبيل المثال، في مجموعة مسائل متعددة التخصصات على مستوى الدكتوراه تسمى “الاختبار الأخير للإنسانية”، سجل الأول 21.6% فقط، في حين تحسن الأخير بشكل مباشر إلى 37.5%.يتمثل الموقف العام لشركة Google في أن أي مهمة يمكنك القيام بها على ChatGPT أو Claude أو الإصدارات الأقدم الأخرى من Gemini يمكن تنفيذها بشكل أفضل على Gemini 3.

<ب>نيوتن: لقد أظهروا أيضًا عرضًا توضيحيًا مبكرًا لـ Gemini Agent: يمكن للنموذج الوصول بعمق إلى صندوق بريد المستخدم، وفهم محتوى جميع رسائل البريد الإلكتروني، والتصنيف تلقائيًا، وصياغة الردود، وحتى مساعدة المستخدمين على مسح صناديق البريد الوارد الخاصة بهم تمامًا.

بالإضافة إلى ذلك، سيكون Gemini 3 متاحًا في تطبيق Gemini وGoogle Search AI Mode بدءًا من هذا الأسبوع؛ سيحصل طلاب الجامعات الأمريكية على وصول مجاني إلى الإصدار المميز لمدة عام واحد.الكلمة الرئيسية التي تؤكد عليها Google مرارًا وتكرارًا هي “تعلم أي شيء”، والتي تضع Gemini في الواقع كأداة تعليمية شخصية نهائية.

<ب>رودس: ديميس، جوش، مرحبًا بك في هارد فورك.قبل عامين، قارن ساندر بيتشاي سيارة Bard بسيارة “هوندا سيفيك معدلة” تتسابق على مضمار ضد منافسين أكثر قوة.إذن، ما هو نوع السيارة الجوزاء 3؟

<ب>هاسابيس: أتمنى أن تكون أسرع بكثير من هوندا سيفيك. أنا لست معتادًا على استخدام تشبيه السيارة، ربما أشبه بمتسابق السحب المحترف (Drag Racer).إنها ليست مصممة للقيادة اليومية أو سباقات الحلبات، إنها قوة خالصة تركز على غرض محدد.إنه يمثل المزيج المثالي بين أفضل نتائج أبحاثنا وقوة الحوسبة واسعة النطاق.الهدف هو إظهار قوة انفجارية لحظية لا مثيل لها في هذه المنافسة في طليعة الذكاء.

<ب>رودس: هذا مثير للاهتمام.بالمقارنة مع جميع نماذج الذكاء الاصطناعي السابقة، ما هي الأشياء الجديدة التي يمكن لـ Gemini 3 القيام بها على مستوى معين؟ من فضلك أعطنا بعض الأمثلة الكمية والعملية.

<ب>وودوارد: هناك ثلاث نقاط تبرز أكثر من غيرها.أولاً، في الاستدلال متعدد الخطوات، يمكنه التفكير في المزيد من الخطوات في نفس الوقت، وقد رفعنا موثوقيته إلى مستوى جديد تمامًا.غالبًا ما “تفقد نماذج الجيل السابق قطار أفكارها” أو تهذي عند الوصول إلى الخطوتين الخامسة والسادسة من الاشتقاق المنطقي المعقد، بينما يمكن لـ Gemini 3 إكمال 10 إلى 15 خطوة من مهام الاستدلال المتماسكة، مثل التخطيط الضريبي المعقد، والتخطيط الشامل وحجز السفر عبر الحدود، أو التصحيح الشامل لنظام ضخم يحتوي على ملايين الأسطر من التعليمات البرمجية.

ثانيًا، سيتم إنشاء واجهة تفاعلية جديدة على نطاق واسع لأول مرة. ما يحتاجه المستخدمون لم يعد إجابات نصية بسيطة، بل مكونات برمجية مخصصة.على سبيل المثال، إذا سألته: “ساعدني في تصميم لوحة معلومات يمكنها تتبع جميع محافظي الاستثمارية”، فسيتم إنشاء واجهة لوحة معلومات تفاعلية وتشغيلية في الوقت الفعلي، بدلاً من مجموعة من النصوص التي تصف كيفية إنشاء لوحة معلومات.

ثالثًا، نحن نستثمر بكثافة في قدرات البرمجة، وخاصة الواجهة الأمامية و”الترميز المحيطي”، مما يعني أنه يمكن إنشاء كود واجهة مستخدم كامل الوظائف ومصمم بشكل جميل بناءً على مطالبات اللغة الطبيعية.كما ستوضح المنتجات الجديدة القادمة مثل Google Antigravity ذلك بشكل كامل، مع نماذج قادرة على تغيير تخطيط ووظائف واجهة المستخدم ديناميكيًا بناءً على السياق.

<ب>نيوتن: يعتقد الكثير من الناس أنه بالنسبة للمستخدمين العاديين، تم حل حالة استخدام “الدردشة” بشكل أساسي.لم يتمكنوا حتى من التفكير في أي أسئلة جديدة من شأنها أن تجعل إجابات الجوزاء 3 مختلفة نوعيًا عن إجابات سابقتها.ما رأيك في هذا التصور؟

<ب>وودوارد: وأنا أفهم وجهة النظر هذه.ظاهريًا، معدل دقة الأسئلة والأجوبة الأساسية مرتفع جدًا بالفعل.لكن الفرق الحقيقي هو الموثوقية والتكامل وعرض المعلومات.ستكون إجابات الجوزاء 3 أكثر إيجازًا وأكثر تعبيرًا، كما سيتم تقديم المعلومات بطريقة أكثر قابلية للفهم. هذا هو التغيير الذي سوف يدركه معظم الناس على الفور.

والأهم من ذلك، أن النموذج يبدأ في الاندماج بشكل عميق مع مصادر بيانات المستخدمين الآخرين، مثل الارتباط بمنتجات أخرى في نظام Google البيئي، مما يتجاوز نموذج الأسئلة والأجوبة البسيط ويصبح “المشرف الرقمي” للمستخدم.إنه يفهم سياق بريدك الإلكتروني بالكامل بحيث أنه عند صياغة الرد، لا يجيب على السؤال فحسب، بل يصمم أيضًا اللهجة والمحتوى بناءً على أسلوبك السابق وعلاقتك مع المستلم.

<ب>هاسابيس: أنا أتفق تماما. لقد تم تحسين موثوقيتها وأسلوبها وشخصيتها لجعلها أكثر بساطة وأكثر دقة.وفي سيناريوهات مثل “ترميز الغلاف الجوي”، تم تجاوز عتبة التطبيق العملي.وهذا تحول من “المساعد الذكي” إلى “الزميل الذكي”.أنا شخصيًا أخطط لاستخدامه للعودة إلى برمجة الألعاب خلال عطلة عيد الميلاد، ولا يمكنه الآن كتابة التعليمات البرمجية الوظيفية فحسب، بل يمكنه أيضًا تقديم المشورة المعمارية في المراحل الأولى من التصميم.

<ب>رودس: ديميس، عندما أجرينا معك مقابلة في شهر مايو من هذا العام، رأيت أن الذكاء الاصطناعي العام سيستغرق من 5 إلى 10 سنوات وقد يتطلب العديد من الإنجازات الكبرى.هل يغير الجوزاء 3 هذا الجدول الزمني؟

<ب>هاسابيس: لا على الاطلاق. إنه يتناسب تمامًا مع المسار الذي حددناه خلال العامين الماضيين.في الواقع، منذ إطلاق سلسلة جيميني، كان تقدمنا هو الأسرع في هذه الصناعة.الجوزاء 3 مذهل، لكنه لا يزال متوقعًا.

قبل أن نتمكن من تحقيق الذكاء الاصطناعي العام الحقيقي، ما زلنا بحاجة إلى تحقيق اختراق رئيسي أو اثنين في الاتساق، وعمق الاستدلال، وآلية الذاكرة، ونمذجة العالم المادي (مثل مشروعي SIMA وGenie اللذين نعمل على تطويرهما).ما نقوم به الآن هو “تفكير النظام 1” (سريع وبديهي)، ولكن لتحقيق الذكاء الاصطناعي العام، يجب علينا إطلاق العنان لـ “تفكير النظام 2” (بطيء ومدروس وتحليلي).

بالإضافة إلى ذلك، تحتاج النماذج إلى آليات ذاكرة انتقائية طويلة المدى يمكنها تذكر وتطبيق تفاعلات معينة منذ أسابيع أو أشهر مضت، بدلاً من الاقتصار على نافذة سياقية محدودة.ولذلك يبقى الحكم من 5 إلى 10 سنوات دون تغيير.

<ب>نيوتن: فيما يتعلق بالعلاقة بين شخصية النموذج والمستخدمين، تناقش الصناعة بشدة “رفاق الذكاء الاصطناعي”.ما نوع العلاقة التي تريد أن يقيمها المستخدمون مع Gemini 3؟

<ب>وودوارد: هذه مسألة حساسة للغاية ولكنها مهمة.نحن نضعها على أنها “أداة فائقة” بدلاً من كونها رفيقًا عاطفيًا.وتتمثل قيمته الأساسية في مساعدة المستخدمين على إكمال المهام اليومية بكفاءة وتحسين الإنتاجية.نحن نولي المزيد من الاهتمام لمؤشر جديد داخليًا: كم عدد المهام التي أكملناها لك اليوم؟وهذا أقرب إلى القيمة الأساسية لبحث Google الأصلي، وهي الكفاءة. نحن نعتقد أن دفع النماذج نحو مكانة الرفقاء العاطفيين يشكل خطرًا أمنيًا وخروجًا عن مهمة Google الأساسية كمزود للمعلومات والأدوات.

<ب>رودس：لقد تخليت عن فرصة النمو الفيروسي لـ “Erotic Companion”. فهل هذا خطأ استراتيجي كبير؟

<ب>وودوارد: لا تعليق.لدى فريق الأمن لدينا معايير وإرشادات صارمة لهذا الغرض.

<ب>رودس: كان المنافسون متوترين بشكل ملحوظ خلال الأسابيع القليلة الماضية.هل تعتقد أن جوجل تقود حاليًا سباق الذكاء الاصطناعي؟

<ب>هاسابيس: البيئة الحالية هي الأكثر تنافسية في التاريخ. الشيء الوحيد الذي يهم حقًا هو معدل التقدم، ونحن سعداء جدًا بذلك.لم نفقد أبدًا ريادتنا البحثية، والآن أصبح الأمر مجرد إطلاق المنتجات التي تحققت أخيرًا.المنافسون ممتازون في الأبحاث، لكنهم لا يستطيعون تكرار المزايا التي لدينا في التوزيع على نطاق واسع والتكامل الرأسي.

نحن نقوم بإدخال Gemini في مليارات من منتجات المستخدم مثل الخرائط، وYouTube، وAndroid، والبحث، وWorkspace. تعتبر شبكة التوزيع وحلقة التغذية الراجعة للبيانات الطرفية بمثابة خندق لا يمكن التغلب عليه.بالإضافة إلى ذلك، فإن ميزة المجموعة الكاملة لدينا على شرائح TPU المخصصة تجعل تكلفة التدريب لدينا وكفاءته أعلى بكثير من المنافسين الذين يعتمدون على موارد وحدة معالجة الرسومات الخارجية.

<ب>نيوتن: ما رأيك في الجدل الدائر بين قانون الحجم وتناقص الغلة؟يعتقد بعض الناس أنه كلما زاد حجم النموذج، انخفضت الفائدة الحدية لتحسين الأداء.

<ب>هاسابيس: هذا نقاش مستمر. نحن راضون جدًا عن التحسن الذي طرأ على Gemini 3 مقارنة بـ 2.5، وهو ما يتماشى تمامًا مع التوقعات.لم تعد العوائد هائلة كما كانت في الأيام الأولى، لكن التحسينات الإضافية في المنفعة والموثوقية التي تجلبها لا تزال أعلى بكثير من تكاليفنا الحدية، ولا تزال تستحق استثمارنا الكامل.وإلى أن يتم التوصل إلى اختراقات بحثية واحدة أو اثنتين مطلوبة للوصول إلى الذكاء الاصطناعي العام، فإن الاستمرار في دفع الأداء من خلال النموذج الأساسي الأوسع نطاقًا لا يزال هو الإستراتيجية الأكثر فعالية في الوقت الحاضر.ونحن نعتقد أن قانون الحجم لا يزال صحيحا.

<ب>رودس: هل نحن في فقاعة الذكاء الاصطناعي؟

<ب>هاسابيس: هذا سؤال ثنائي للغاية.هناك بالفعل فقاعة في بعض المجالات (مثل الجولات الأولية التي تبلغ قيمتها مليار دولار دون وجود منتجات حقيقية، بل مجرد شركات مفاهيمية) حيث تكون التقييمات غير متناسبة مع الإيرادات الفعلية.لكن جوجل تتمتع بتحقيق الدخل على المدى القصير (البحث، ومساحة العمل، والسحابة TPU) ومسارات جديدة طويلة المدى على مستوى تريليون (الروبوتات، والألعاب، واكتشاف الأدوية، وعلوم المواد، وما إلى ذلك).

على سبيل المثال، تخلق النماذج المتخصصة مثل AlphaFold قيمة حقيقية في اكتشاف الأدوية، وهو سوق بقيمة تريليون دولار لا علاقة له بتقييمات الذكاء الاصطناعي للمستهلك.وسواء كانت الفقاعات القصيرة الأجل موجودة أم لا، فسوف ننتصر: اغتنم الفرص عندما تحدث فترات الازدهار، وكن أكثر مرونة وقدرة على الصمود مع المزايا الكاملة والتدفقات النقدية العميقة أثناء الانكماش.

<ب>نيوتن: إذا كان حفل عيد الشكر وأراد شخص ما تغيير موضوع السياسة، ما هي الميزة التي تقترح أن يستخدمها Gemini 3 للتباهي وإبهار الجمهور؟

<ب>وودوارد: لا أعرف إذا كان يمكن أن ينقذ عيد الشكر، لكنه يمكن أن يجلب الضحك.أخرج هاتفك والتقط صورة شخصية، ثم اسمح لـ Gemini 3 بتحرير الصور بجنون.

يظل نموذج صورتنا في برج الجوزاء هو الأقوى عالميًا.يمكنك تحويل صورة عائلية على الفور إلى أي مشهد كوميدي أو نمط أو إعداد زمني.بالتأكيد سوف يضحك الجمهور كله.لاحقًا، عندما توضح لهم كيف يمكن أن يساعدك ذلك في كتابة خطاب استقالة مكتوب جيدًا أو إنشاء حاسبة مخصصة لوصفة العطلات، فسوف يستكشفون بشكل طبيعي ميزات جديدة أخرى.

تحدث الفريق بعد إصدار Gemini3: ثلاث نقاط ابتكار رئيسية وقانون الحجم لا يزالان ساريين

النقاط الرئيسية من المقابلة:

وفيما يلي نسخة مختصرة من المقابلة

jakiro

Related Posts

يتحدث Vitalik عن مستقبل blockchain: سيؤدي تعميم ZK و FHE إلى إحداث ثورة حقيقية

ماذا لو تمكنت أجهزة الكمبيوتر الكمومية من فك عملة البيتكوين؟

اترك تعليقاً إلغاء الرد

You Missed

طريقة الحصاد الجديدة لدائرة العملة في Polymarket

محامي تشيكوسلوفاكيا الخاص يعرض تفاصيل جدل العفو عن ترامب: الرد على اتهامات الصفقة السياسية

تحدث الفريق بعد إصدار Gemini3: ثلاث نقاط ابتكار رئيسية وقانون الحجم لا يزالان ساريين

لعبة تحوط جديدة للعملة مع نقص السيولة: هل هي طريقة جديدة لمستثمري التجزئة لتحقيق أرباح جديدة؟

لماذا تخلت BTC عن كل مكاسبها، العملات البديلة تحت الماء: الحقيقة تظهر

قد تنخفض عملة البيتكوين أولاً إلى 85000، ثم يبدأ جنون طباعة النقود في الارتفاع إلى 200000 دولار أمريكي.