هوانغ رينكسون: سوف يكسر قانون مور وإصدار منتجات جديدة ، عصر الروبوتات قادم

المصدر: Tencent Technology

ألقى المؤسس المشارك والمدير التنفيذي لشركة NVIDIA Huang Renxun خطابًا رئيسيًا في Computex 2024 (2024 معرض تايبيه الدولي للكمبيوتر) ، وتبادل كيف يمكن لعصر الذكاء الاصطناعي أن يعزز الثورة الصناعية الجديدة العالمية.

فيما يلي النقاط الرئيسية لهذا الخطاب:

① عرض Huang Renxun أحدث إصدار من رقائق Blackwell ، وقال إنه سيطلق رقائق Blackwell Ultra AI في عام 2025. سيتم تسمية الجيل القادم من منصة الذكاء الاصطناعي. “مرة واحدة في السنة” ، كسر “مور” القانون.

ادعى Huang Renxun أن NVIDIA روج لميلاد نموذج لغة كبير ، والذي غير بنية GPU بعد عام 2012 ودمجت جميع التقنيات الجديدة على جهاز كمبيوتر واحد.

ساعدت تقنية الحوسبة المتسارعة في Nvidia على زيادة معدل 100 ضعف في المعدل ، بينما يتم زيادة استهلاك الطاقة إلى 3 مرات فقط ، والتكلفة 1.5 مرة.

④ يتوقع Huang Renxun أن الجيل القادم من الذكاء الاصطناعى يحتاج إلى فهم العالم المادي.الطريقة التي قدمها هي السماح لمنظمة العفو الدولية بالتعلم من خلال الفيديو والبيانات الاصطناعية ، والسماح لوكالة الذكاء الاصطناعى بالتعلم من بعضها البعض.

⑤ قام هوانغ رينكسون بإنهاء ترجمة صينية للرمز المميز في ppt – ci yuan.

⑥ قال هوانغ رينكسون إن عصر الروبوتات قد وصل ، وستعمل جميع الأشياء المتحركة بشكل مستقل في المستقبل.

فيما يلي النص الكامل للخطاب الذي استمر لمدة ساعتين جمعته Tencent Technology:

الضيوف الأعزاء ، يشرفني أن أكون هنا مرة أخرى.بادئ ذي بدء ، أود أن أشكر جامعة تايوان على تزويدنا بهذه الصالة الرياضية كمكان للأحداث.آخر مرة أتيت إلى هنا كانت عندما حصلت على شهادتي من جامعة تايوان.اليوم ، هناك الكثير من الأشياء التي سنستكشفها ، لذلك يجب أن أسرع ونقل الرسالة بطريقة سريعة وواضحة.لدينا الكثير من الموضوعات التي نتحدث عنها ، ولدي الكثير من القصص المثيرة لمشاركتها معك.

أنا سعيد جدًا لوجودي هنا في تايوان ، الصين ، حيث يوجد العديد من شركائنا هنا.في الواقع ، هذا ليس فقط جزءًا لا غنى عنه من تاريخ تطوير NVIDIA ، ولكن أيضًا عقدة رئيسية لنا وشركائنا للترويج للابتكار بشكل مشترك للعالم.نحن نعمل مع العديد من الشركاء لبناء بنية تحتية للذكاء الاصطناعي في جميع أنحاء العالم.اليوم ، أود مناقشة العديد من الموضوعات الرئيسية معك:

1) ما هو التقدم الذي يتم إحرازه في عملنا المشترك وما هي أهمية هذا التقدم؟

2) ما هو بالضبط الذكاء الاصطناعي التوليدي؟كيف سيؤثر ذلك على صناعتنا ، وحتى كل صناعة؟

3) مخطط حول كيف يمكننا المضي قدمًا وكيف سنغتنم هذه الفرصة المذهلة؟

ماذا سيحدث بعد ذلك؟AI التوليدي وتأثيرها العميق ، مخططنا الاستراتيجي ، كلها مواضيع مثيرة على وشك استكشافها.نحن نقف عند نقطة الانطلاق لإعادة تشغيل صناعة الكمبيوتر ، وعصر جديد أنشأته وصنعته على وشك البدء.أنت الآن مستعد للرحلة المهمة التالية.

1.يبدأ عصر جديد من الحوسبة

لكن قبل بدء المناقشة المتعمقة ، أود التأكيد على شيء واحد: تقع Nvidia عند تقاطع رسومات الكمبيوتر والمحاكاة والذكاء الاصطناعي ، والتي تشكل روح شركتنا.اليوم ، كل ما سأريكمه يعتمد على المحاكاة.هذه ليست مجرد مؤثرات بصرية ، فهي جوهر الرياضيات والعلوم وعلوم الكمبيوتر ، والهندسة المعمارية للكمبيوتر لالتقاط الأنفاس.لا توجد رسوم متحركة مسبقة الصنع ، كل شيء هو تحفة لفريقنا.هذا ما يفهمه Nvidia ، وندمج كل شيء في العالم الافتراضي Omniverse الذي نفخر به.الآن ، يرجى الاستمتاع بالفيديو!

يرتفع استهلاك الطاقة في مراكز البيانات في جميع أنحاء العالم بشكل حاد ، بينما ترتفع تكاليف الحوسبة أيضًا.نواجه التحدي الشديد للتضخم الحسابي ، والذي من الواضح أنه لا يمكن الحفاظ عليه لفترة طويلة.ستستمر البيانات في النمو بشكل كبير ، في حين يصعب توسيع أداء وحدة المعالجة المركزية بالسرعة التي كان من قبل.ومع ذلك ، هناك نهج أكثر كفاءة الناشئة.

منذ ما يقرب من عقدين ، كنا نعمل على بحث الحوسبة المتسارع.تعزز تقنية CUDA إمكانات وحدة المعالجة المركزية ، وإفراغ المهام والتسريع التي يمكن للمعالجات الخاصة إكمالها بشكل أكثر كفاءة.في الواقع ، بسبب تباطؤ أو حتى ركود توسيع أداء وحدة المعالجة المركزية ، أصبحت مزايا الحوسبة المتسارعة ذات أهمية متزايدة.أتوقع أن يتم تسريع كل تطبيق كثيف المعالجة ، وفي المستقبل القريب ، سيتم تسريع كل مركز بيانات بالكامل.

الآن ، يعد اختيار الحوسبة المتسارعة خطوة حكيمة ، والتي أصبحت إجماعًا في الصناعة.تخيل أن التطبيق يستغرق 100 وحدة من الوقت لإكماله.سواء كان ذلك 100 ثانية أو 100 ساعة ، لا يمكننا في كثير من الأحيان تحمل تطبيق الذكاء الاصطناعي الذي يعمل لعدة أيام أو حتى أشهر.

من بين هذه الوحدات الزمنية المائة ، تتضمن وحدة واحدة رمزًا يجب تنفيذه بالتتابع.لا غنى عن منطق التحكم في نظام التشغيل ويجب تنفيذه بصرامة وفقًا لتسلسل التعليمات.ومع ذلك ، هناك العديد من الخوارزميات ، مثل رسومات الكمبيوتر ، ومعالجة الصور ، والمحاكاة المادية ، والتحسين التوافقي ، ومعالجة الرسوم البيانية ومعالجة قواعد البيانات ، وخاصة الجبر الخطي المستخدم على نطاق واسع في التعلم العميق ، والتي تكون مناسبة تمامًا للتسارع من خلال المعالجة الموازية.لتحقيق ذلك ، اخترعنا بنية مبتكرة تجمع بشكل مثالي وحدة معالجة الرسومات مع وحدة المعالجة المركزية.

المعالج المخصص قادر على تسريع مهام تستغرق وقتًا طويلاً بسرعات لا تصدق.نظرًا لأن المعالجتين يمكن أن يعملوا بالتوازي ، فإن كل منهما يعمل بشكل مستقل ومستقل.هذا يعني أنه يمكن الآن إكمال المهام التي تتطلب في الأصل 100 وحدة من الوقت في وحدة زمنية واحدة فقط.على الرغم من أن تأثير التسارع هذا لا يصدق ، إلا أنني سأقوم اليوم بالتحقق من صحة هذا البيان بسلسلة من الأمثلة.

فوائد تحسين الأداء هذا مذهلة ، مع تسارع 100x ، في حين أن حوالي 3x زيادة في الطاقة وحوالي 50 ٪ فقط في التكلفة.لقد مارسنا بالفعل هذه الاستراتيجية في صناعة الكمبيوتر.إن إضافة وحدة معالجة الرسومات GeForce بقيمة 500 دولار إلى جهاز الكمبيوتر الخاص بك سيؤدي إلى تحسين أدائها بشكل كبير ، مع زيادة قيمتها الإجمالية إلى 1000 دولار.في مركز البيانات ، اعتمدنا نفس النهج.تم تحويل مركز بيانات بقيمة مليار دولار على الفور إلى مصنع ذكاء اصطناعي قوي بعد إضافة وحدة معالجة الرسومات بقيمة 500 مليون دولار.اليوم ، يحدث هذا التغيير في جميع أنحاء العالم.

وفورات التكلفة هي صدمة بنفس القدر.مقابل كل دولار واحد مستثمر ، تحصل على ما يصل إلى 60x مكاسب أداء.التسارع 100 مرة ، في حين أن الطاقة هي 3 مرات فقط ، والتكلفة هي 1.5 مرة فقط.المدخرات حقيقية!

على ما يبدو ، تنفق العديد من الشركات مئات الملايين من الدولارات على معالجة البيانات في السحابة.يصبح توفير مئات الملايين من الدولارات معقولة عندما تتم معالجة البيانات بشكل أسرع.لماذا هذا يحدث؟والسبب بسيط ، لقد شهدنا عنق الزجاجة على المدى الطويل في الحوسبة العامة.

الآن ، ندرك هذا أخيرًا وقررنا تسريعه.من خلال تبني معالج مخصص ، يمكننا استعادة الكثير من مكاسب الأداء التي تم تجاهلها مسبقًا ، وتوفير الكثير من المال والطاقة.لهذا السبب أقول ، كلما اشتريت أكثر ، كلما حفظت أكثر.

الآن ، لقد عرضت عليك الأرقام.على الرغم من أنها ليست دقيقة لبعض الأماكن العشرية ، فإن هذا يعكس بدقة الحقائق.يمكن أن يسمى هذا “الرياضيات الرئيس التنفيذي”.على الرغم من أن الرياضيات الرئيس التنفيذي لا تتابع الدقة الشديدة ، إلا أن المنطق وراءه صحيح – كلما زادت قوة الحوسبة المتسارعة التي تشتريها ، زادت تكلفة توفيرها.

2.350 مكتبات وظائف تساعد في فتح أسواق جديدة

نتائج الحوسبة المتسارعة غير عادية بالفعل ، لكن عملية التنفيذ ليست سهلة.لماذا يوفر الكثير من المال ، لكن الناس لم يتبنوا هذه التكنولوجيا في وقت سابق؟والسبب هو أنه من الصعب للغاية تنفيذها.

لا يوجد برنامج جاهز يمكن تشغيله ببساطة عن طريق تسريع المترجم ، ويمكن تسريع التطبيق على الفور بمقدار 100 مرة.هذا ليس منطقيًا ولا واقعيًا.إذا كان الأمر سهلاً للغاية ، فسيقوم مصنعو وحدة المعالجة المركزية بذلك منذ فترة طويلة.

في الواقع ، لتحقيق التسارع ، يجب إعادة كتابة البرنامج بالكامل.هذا هو الجزء الأكثر تحديا من العملية.يجب إعادة تصميم البرنامج وإعادة ترميزه من أجل تحويل الخوارزميات التي كانت تعمل في الأصل على وحدة المعالجة المركزية إلى تنسيقات يمكن تشغيلها بالتوازي على المسرع.

على الرغم من أن أبحاث علوم الكمبيوتر هذه صعبة ، فقد أحرزنا تقدمًا كبيرًا على مدار العشرين عامًا الماضية.على سبيل المثال ، أطلقنا مكتبة Cudnn Deep Learning الشهيرة ، والتي تتخصص في التعامل مع تسارع الشبكة العصبية.كما نقدم مكتبة لمحاكاة فيزياء الذكاء الاصطناعي للتطبيقات مثل ديناميات السوائل التي تتطلب الامتثال للقوانين الفيزيائية.بالإضافة إلى ذلك ، لدينا مكتبة جديدة تسمى Aerial ، والتي تستخدم CUDA لتسريع تقنية الراديو 5G ، مما يتيح لنا استخدام البرامج لتحديد وتسريع شبكات الاتصالات مثل شبكات الإنترنت المحددة للبرامج.

هذه إمكانات التسارع لا تعمل على تحسين الأداء فحسب ، بل تساعدنا أيضًا في تحويل صناعة الاتصالات بأكملها إلى منصة حوسبة مماثلة للحوسبة السحابية.بالإضافة إلى ذلك ، تعد منصة Coolitho Compacting Lategraphy مثالًا جيدًا أيضًا ، مما يحسن بشكل كبير من كفاءة صنع القناع ، وهو الجزء الأكثر كثافة من الناحية الحسابية في عملية تصنيع الرقائق.بدأت شركات مثل TSMC بالفعل في استخدام Coolitho للإنتاج ، مما لا يوفر الطاقة بشكل كبير فحسب ، بل يقلل أيضًا بشكل كبير من التكاليف.هدفهم هو الاستعداد لمزيد من تطوير الخوارزميات وقوة الحوسبة الضخمة المطلوبة لجعل الترانزستورات الأعمق والأضيق من خلال تسريع كومة التكنولوجيا.

زوج من الطوب هو مكتبة تسلسل الجينات الفخورة لدينا ، التي لديها إنتاجية الجينات الرائدة في العالم.CO OPT هي مكتبة التحسين المركب الرائعة التي يمكنها حل المشكلات المعقدة مثل تخطيط المسار ، وتحسين خط سير الرحلة ، ومشاكل وكالة السفر.يُعتقد عمومًا أن هذه المشكلات تحتاج إلى حلها بواسطة أجهزة الكمبيوتر الكم ، لكننا أنشأنا خوارزمية سريعة للغاية من خلال تقنية الحوسبة المتسارعة ، ونجبحت 23 سجلًا عالميًا حتى يومنا هذا.

Coup Quantum هو نظام محاكاة كمبيوتر الكم الذي قمنا بتطويره.يعد محاكاة موثوقة ضرورية للباحثين الذين يرغبون في تصميم أجهزة الكمبيوتر الكمومية أو خوارزميات الكم.بدون أجهزة الكمبيوتر الكمومية الفعلية ، أصبح Nvidia Cuda – ما نسميه أسرع الكمبيوتر في العالم – أداة مفضلة.نحن نقدم محاكاة يمكنها محاكاة تشغيل أجهزة الكمبيوتر الكم ومساعدة الباحثين على تحقيق اختراقات في مجال الحوسبة الكمومية.تم استخدام هذا المحاكاة على نطاق واسع من قبل مئات الآلاف من الباحثين في جميع أنحاء العالم وتم دمجها في جميع أطر الحوسبة الكمومية الرائدة ، مما يوفر دعمًا قويًا لمراكز الحوسبة الفائقة العلمية في جميع أنحاء العالم.

بالإضافة إلى ذلك ، قمنا بإطلاق مكتبة معالجة البيانات Kudieff ، والتي تم تصميمها خصيصًا لتسريع معالجة البيانات.تمثل معالجة البيانات الغالبية العظمى من الإنفاق السحابي اليوم ، وبالتالي فإن تسريع معالجة البيانات أمر بالغ الأهمية في توفير التكلفة.QDF هي أداة تسريع قمنا بتطويرها والتي يمكن أن تحسن بشكل كبير من أداء مكتبات معالجة البيانات الرئيسية في العالم ، مثل قواعد بيانات Spark و Pandas و Polar و NetworkX معالجة الرسوم البيانية.

تعد هذه المكتبات مكونًا رئيسيًا للنظام الإيكولوجي ، وتتيح استخدام الحوسبة المتسارعة على نطاق واسع.بدون مكتباتنا الخاصة بالمجال المصنوعة بعناية مثل Cudnn ، قد لا يتمكن علماء التعلم العميق في جميع أنحاء العالم من استخدام إمكاناتهم تمامًا مع CUDA ، لأن هناك اختلافات كبيرة بين CUDA والخوارزميات المستخدمة في أطر التعلم العميق مثل Tensorflow و Pytorch.هذا غير عملي مثل القيام رسومات الكمبيوتر دون OpenGL أو معالجة البيانات دون SQL.

هذه المكتبات الخاصة بالمجال هي كنوز لشركتنا ولدينا حاليًا أكثر من 350 مكتبًا.هذه المكتبات هي التي تبقينا مفتوحة وقبل السوق.اليوم ، سأريكم المزيد من الأمثلة إثارة.

في الأسبوع الماضي فقط ، أعلنت Google أنها نشرت QDFs على السحابة وتسارعوا بنجاح الباندا.Pandas هي مكتبة علوم البيانات الأكثر شعبية في العالم ، وتستخدمها 10 ملايين من علماء البيانات في جميع أنحاء العالم ، مع تنزيلات شهرية تصل إلى 170 مليون مرة.إنه مثل Excel لعلماء البيانات ، مساعدهم الأيمن لمعالجة البيانات.

الآن ، ما عليك سوى النقر على منصة Cloud Data Center من Google Colab ويمكنك تجربة الأداء القوي الذي جلبته Pandas المعشاة QDF.هذا التسارع مذهل حقًا ، تمامًا مثل العرض التوضيحي الذي رأيته للتو ، فإنه يكمل مهمة معالجة البيانات على الفور تقريبًا.

3.كودا يدرك دورة فاضلة

لقد وصلت كودا إلى ما يسميه الناس نقطة حرجة ، لكن الواقع أفضل من ذلك.حقق كودا دورة تطوير فاضلة.إذا نظرنا إلى الوراء في التاريخ وتطوير مختلف بنيات ومنصات الحوسبة ، يمكننا أن نجد أن مثل هذه الحلقات ليست شائعة.خذ وحدة المعالجة المركزية المعالج الدقيقة كمثال.

غالبًا ما يواجه إنشاء منصة حوسبة جديدة معضلة “هناك دجاج أولاً أو البيض أولاً”.بدون دعم المطورين ، من الصعب على المنصة جذب المستخدمين ؛ابتليت هذه المعضلة بتطوير منصات حوسبة متعددة على مدار العشرين عامًا الماضية.

ومع ذلك ، فقد نجحنا في كسر هذه المعضلة عن طريق طرح المكتبات الخاصة بالمجال والمكتبات المتسارعة باستمرار.اليوم ، لدينا 5 ملايين مطور في جميع أنحاء العالم يستخدمون تقنية CUDA لخدمة كل مجال من المجالات في الصناعة والعلوم الرئيسية تقريبًا ، من الرعاية الصحية ، والخدمات المالية إلى صناعة الكمبيوتر ، وصناعة السيارات.

مع استمرار توسيع قاعدة العملاء ، بدأ مصنعي المعدات الأصلية ومقدمي الخدمات السحابية في تطوير اهتمام بأنظمتنا ، مما يدفع المزيد من الأنظمة لدخول السوق.خلقت هذه الدورة الفاضلة فرصًا هائلة بالنسبة لنا ، مما يسمح لنا بتوسيع نطاقنا وزيادة استثمارات البحث والتطوير ، وبالتالي تعزيز التطوير المتسارع لمزيد من التطبيقات.

إن تسارع كل تطبيق يعني انخفاضًا كبيرًا في تكاليف الحوسبة.كما أظهرت من قبل ، يمكن أن يصل تسارع 100x إلى 97.96 ٪ ، أو ما يقرب من 98 ٪ من وفورات التكاليف.مع زيادة تسارع الحساب من 100 مرة إلى 200 مرة ثم إلى 1000 مرة ، تستمر التكلفة الحدية للحساب في الانخفاض ، مما يدل على فوائد اقتصادية ملحوظة.

بالطبع ، نعتقد أنه من خلال تقليل تكاليف الحوسبة بشكل كبير ، سيستمر الأسواق والمطورين والعلماء والمخترع في اكتشاف خوارزميات جديدة تستهلك المزيد من موارد الحوسبة.حتى نقطة ما ، سيحدث تغيير عميق بهدوء.عندما تصبح التكلفة الحدية للحوسبة منخفضة للغاية ، ستظهر طريقة جديدة لاستخدام أجهزة الكمبيوتر.

في الواقع ، يحدث هذا التغيير أمام أعيننا.على مدار العقد الماضي ، استخدمنا خوارزميات محددة لتقليل التكلفة الهامشية للحوسبة بمليون مرة مذهلة.اليوم ، أصبح استخدام جميع البيانات على الإنترنت لتدريب نماذج اللغة الكبيرة اختيارًا منطقيًا وطبيعيًا ولم يعد موضع استجواب.

الفكرة – لبناء جهاز كمبيوتر يمكنه معالجة كميات هائلة من البيانات والبرنامج نفسه – هي حجر الزاوية في صعود الذكاء الاصطناعي.إن صعود الذكاء الاصطناعي ممكن تمامًا لأننا نعتقد اعتقادا راسخا أننا إذا صنعنا أرخص الحوسبة ، فستكون هناك دائمًا استخدامات ضخمة.اليوم ، أثبت نجاح كودا جدوى هذه الدورة الفاضلة.

مع التوسع المستمر لمؤسسة التثبيت والخفض المستمر لتكاليف الحوسبة ، يمكن للمزيد والمزيد من المطورين تحقيق إمكاناتهم المبتكرة واقتراح المزيد من الأفكار والحلول.وقد دفع هذا الابتكار زيادة في الطلب في السوق.الآن نحن نقف في نقطة تحول كبيرة.ومع ذلك ، قبل أن أظهر ذلك أكثر ، أود أن أؤكد أن ما أريد أن أظهره أدناه لن يكون ممكنًا بدون اختراق CUDA وتقنيات الذكاء الاصطناعى الحديثة – وخاصة الذكاء الاصطناعي.

هذا هو مشروع Earth 2 – فكرة طموحة لإنشاء التوأم الرقمي للأرض.سنحاكي حركة الأرض بأكملها للتنبؤ بتغيراتها المستقبلية.من خلال مثل هذه المحاكاة ، يمكننا منع الكوارث بشكل أفضل والحصول على فهم أعمق لتأثيرات تغير المناخ ، مما يسمح لنا بالتكيف بشكل أفضل مع هذه التغييرات وحتى البدء في تغيير سلوكياتنا وعاداتنا الآن.

ربما يكون مشروع Earth 2 أحد أكثر المشاريع صعوبة وطموحة في العالم.لقد أحرزنا تقدمًا كبيرًا في هذا المجال كل عام ، ونتائج هذا العام رائعة بشكل خاص.الآن ، اسمحوا لي أن أريكم هذا التقدم المثير.

في المستقبل القريب ، سيكون لدينا قدرات تنبؤات مستمرة لتغطية كل كيلومتر مربع على هذا الكوكب.سوف تفهم دائمًا كيف سيتغير المناخ ، وسيستمر هذا التنبؤ في العمل لأننا ندرب الذكاء الاصطناعي ، والذي يتطلب طاقة محدودة للغاية.سيكون إنجازًا لا يصدق.آمل أن تستمتعوا بها يا رفاق ، والأهم من ذلك ، أن هذا التنبؤ قد تم من قِبل Jensen AI ، وليس أنا.لقد صممتها ، ولكن يتم تقديم التنبؤات النهائية بواسطة Jensen AI.

بينما نسعى جاهدين لتحسين الأداء بشكل مستمر وخفض التكاليف ، اكتشف الباحثون CUDA في عام 2012 ، والذي كان أول اتصال NVIDIA بالذكاء الاصطناعي.هذا اليوم أمر بالغ الأهمية بالنسبة لنا لأننا اتخذنا الخيار الحكيم للعمل عن كثب مع العلماء لجعل التعلم العميق ممكنًا.لقد حقق ظهور Alexnet طفرة كبيرة في رؤية الكمبيوتر.

4.لم يتم التعرف على ظهور أجهزة الكمبيوتر العملاقة من الذكاء الاصطناعي في البداية

لكن الحكمة الأكثر أهمية هي أننا نتراجع ونفهم بعمق طبيعة التعلم العميق.ما هو أساسه؟ما هو تأثيره على المدى الطويل؟ما هي إمكاناتها؟نحن ندرك أن هذه التكنولوجيا لديها إمكانات كبيرة لمواصلة توسيع الخوارزميات التي تم اختراعها واكتشفها قبل عقود ، مما يجمع بين المزيد من البيانات والشبكات الكبيرة وموارد الحوسبة الحاسمة ، يمكن للتعلم العميق تحقيق مهام البشر التي لا يمكن أن تصل إليها الخوارزميات فجأة.

الآن ، تخيل ماذا سيحدث إذا وسعنا بنيةنا أكثر ولدينا شبكة أكبر ، والمزيد من البيانات وحساب الموارد؟لذلك نحن ملتزمون بإعادة اختراع كل شيء.منذ عام 2012 ، قمنا بتغيير بنية وحدة معالجة الرسومات ، وأضفنا Core Tensor ، واخترع NV-Link ، وأطلقوا Cudnn ، Tensorrt ، Nickel ، Mellanox ، وأطلقت خادم Triton Inferfects.

يتم دمج هذه التقنيات على جهاز كمبيوتر جديد تمامًا ، والذي تجاوز خيال الجميع في ذلك الوقت.لا أحد يتوقع ألا أحد يقدم مثل هذا الطلب ، ولم يفهم أحد إمكاناته الكاملة.في الواقع ، لست متأكدًا مما إذا كان أي شخص يريد شرائه.

ولكن في مؤتمر GTC ، أصدرنا هذه التكنولوجيا رسميًا.لاحظت شركة San Francisco التي تسمى Openai نتائجنا بسرعة وطلبت منا تقديم جهاز.أنا شخصياً أرسلت أول مجموعة من الذكاء الاصطناعي في العالم DGX إلى Openai.

في عام 2016 ، واصلنا توسيع نطاق البحث والتطوير.من الحاسوب الخارق للذكاء الاصطناعي إلى تطبيق الذكاء الاصطناعي الواحد ، توسعت إلى إطلاق مجموعة كبيرة من الحاسبات الفائقة في عام 2017.مع التقدم المستمر للتكنولوجيا ، شهد العالم صعود المحول.يتيح لنا ظهور هذا النموذج معالجة كميات هائلة من البيانات وتحديد وتعلم الأنماط المستمرة على الامتدادات الطويلة.

اليوم ، لدينا القدرة على تدريب نماذج اللغة الكبيرة هذه على تحقيق اختراقات كبيرة في فهم اللغة الطبيعية.لكننا لم نتوقف عند هذا الحد ، واصلنا المضي قدمًا وبناء نموذج أكبر.بحلول نوفمبر 2022 ، على أجهزة الكمبيوتر العملاقة الذكاء الاصطناعي القوية للغاية ، نستخدم عشرات الآلاف من وحدات معالجة الرسومات Nvidia للتدريب.

بعد 5 أيام فقط ، أعلن Openai أن Chatgpt لديها مليون مستخدم.ارتفع معدل النمو المذهل هذا إلى 100 مليون مستخدم في شهرين فقط ، مما يحدد أسرع سجل نمو في تاريخ التطبيق.السبب بسيط للغاية – تجربة مستخدم ChatGPT مريحة وسحرية.

يمكن للمستخدمين التفاعل بشكل طبيعي وسلس مع أجهزة الكمبيوتر ، كما لو كانوا يتواصلون مع الأشخاص الحقيقيين.بدون تعليمات مملة أو أوصاف واضحة ، يمكن لـ ChatGPT فهم نوايا المستخدم واحتياجاته.

يمثل ظهور chatgpt تغييرًا في صنع الحقبة ، وتلتقط هذه الشريحة هذا التطور الحرج.واسمحوا لي أن أعرض ذلك لك.

لم يكن حتى ظهور chatgpt أنه كشف حقًا عن الإمكانات اللانهائية للذكاء الاصطناعي التوليدي للعالم.لفترة طويلة ، ركز تركيز الذكاء الاصطناعي على مجالات الإدراك ، مثل فهم اللغة الطبيعية ، ورؤية الكمبيوتر والتعرف على الكلام ، والتقنيات المخصصة لمحاكاة قدرات الإدراك البشري.لكن Chatgpt قد جلبت قفزة نوعية ، لا تقتصر فقط على الإدراك ، ولكنها توضح قوة الذكاء الاصطناعي التوليدي لأول مرة.

إنه يولد الرموز واحدة تلو الأخرى ، والتي يمكن أن تكون الكلمات والصور والمخططات والجداول وحتى الأغاني والنصوص والصوت ومقاطع الفيديو.يمكن أن يمثل الرمز المميز أي شيء ذي معنى واضح ، سواء كانت مواد كيميائية أو بروتينات أو جينات أو أنماط الطقس التي ذكرناها سابقًا.

إن صعود هذا الذكاء الاصطناعي التوليدي يعني أنه يمكننا تعلم ومحاكاة الظواهر البدنية ، مما يسمح نماذج الذكاء الاصطناعي بفهم وتوليد مختلف الظواهر في العالم المادي.لم نعد نقصر أنفسنا على تضييق نطاق وتصفية ، ولكن بدلاً من ذلك نستكشف الاحتمالات اللانهائية من خلال التوليد.

اليوم ، يمكننا توليد الرموز المميزة لأي شيء تقريبًا ذي قيمة ، سواء كانت التحكم في عجلة القيادة في السيارة ، أو حركة المفاصل للذراع الآلي ، أو أي شيء يمكن أن نتعلمه في الوقت الحالي.لذلك ، لم نعد في عصر الذكاء الاصطناعي ، ولكن عصرًا جديدًا يقوده الذكاء الاصطناعي التوليدي.

والأهم من ذلك ، أن هذا الجهاز ، الذي ظهر في الأصل كحاسوب مفعمة بالحيوية ، قد تطور الآن إلى مركز بيانات الذكاء الاصطناعي الفعال والفعال.يستمر في الإنتاج ، لا يولد الرموز الرموز فقط ، ولكن أيضًا مصنع ذكاء اصطناعي يخلق قيمة.يقوم مصنع الذكاء الاصطناعي هذا بتوليد وإنشاء وإنتاج سلع جديدة مع إمكانات السوق الضخمة.

مثلما اخترع نيكولا تسلا المولد في نهاية القرن التاسع عشر ، مما جعلنا دفقًا مستمرًا من الإلكترونيات ، فإن مولدات الذكاء الاصطناعية في Nvidia تولد أيضًا رموزًا مستمرة مع إمكانيات لا حصر لها.كلاهما لديه فرص سوق ضخمة ومن المتوقع أن يتغير في كل صناعة.هذه بالفعل ثورة صناعية جديدة!

نحن نرحب الآن بمصنع جديد يمكنه إنتاج منتجات جديدة غير مسبوقة وقيمة لجميع الصناعات.هذه الطريقة ليست قابلة للتطوير للغاية فحسب ، بل قابلة للتكرار تمامًا أيضًا.يرجى ملاحظة أنه في الوقت الحاضر ، تظهر نماذج الذكاء الاصطناعي المختلفة باستمرار كل يوم ، وخاصة نماذج الذكاء الاصطناعي التوليدي.في الوقت الحاضر ، تتنافس كل صناعة على المشاركة ، وهي مناسبة كبرى غير مسبوقة.

إن صناعة تكنولوجيا المعلومات التي تبلغ قيمتها 3 تريليونات دولار على وشك تقديم إنجازات مبتكرة يمكنها أن تخدم مباشرة صناعة 100 تريليون دولار.لم تعد مجرد أداة لتخزين المعلومات أو معالجة البيانات ، ولكنها محرك لتوليد الذكاء في كل صناعة.سيصبح هذا نوعًا جديدًا من صناعة التصنيع ، لكنه ليس صناعة تصنيع كمبيوتر تقليدية ، ولكنه نموذج جديد للتصنيع باستخدام أجهزة الكمبيوتر.مثل هذا التغيير لم يحدث من قبل ، وهو في الواقع شيء رائع.

5.يعزز AI التوليدي إعادة تشكيل الكامل للبرامج ، مما يوضح الخدمات الدقيقة السحابة NIM

فتح هذا عصرًا جديدًا من الحوسبة المتسارعة ، وعزز التطور السريع للذكاء الاصطناعي ، وبالتالي ولدت صعود الذكاء الاصطناعي.والآن ، نشهد ثورة صناعية.دعونا نلقي نظرة فاحصة على تأثيره.

تأثير هذا التغيير هو بعيد المدى لصناعتنا.كما قلت من قبل ، هذه هي المرة الأولى في السنوات الستين الماضية ، كل طبقة من الحوسبة تخضع للتحول.من الحوسبة للأغراض العامة لموحدة المعالجة المركزية إلى الحوسبة المتسارعة ل GPU ، يمثل كل تغيير قفزة في التكنولوجيا.

في الماضي ، كان على أجهزة الكمبيوتر اتباع التعليمات لأداء العمليات ، ولكن الآن ، تتعامل أكثر مع LLM (نموذج اللغة الكبيرة) ونماذج الذكاء الاصطناعي.استندت نماذج الحوسبة السابقة إلى الاسترجاع ، وفي كل مرة تستخدم فيها هاتفك تقريبًا ، فإنه يسترجع النص أو الصور أو مقاطع الفيديو المخزنة مسبقًا لك وإعادة تجميع هذه المحتويات وفقًا لنظام التوصية لتقديمها لك.

ولكن في المستقبل ، سيقوم جهاز الكمبيوتر الخاص بك بإنشاء أكبر قدر ممكن من المحتوى واسترداد المعلومات اللازمة فقط ، لأن توليد البيانات يستهلك طاقة أقل عند الحصول على المعلومات.علاوة على ذلك ، فإن البيانات التي تم إنشاؤها لها صلة بسياق أعلى ويمكن أن تعكس احتياجاتك بشكل أكثر دقة.عندما تحتاج إلى إجابة ، لم تعد بحاجة إلى توجيه الكمبيوتر بشكل صريح إلى “الحصول على هذه المعلومات” أو “أعطني هذا الملف” ، فقط قل ، “أعطني إجابة”.

علاوة على ذلك ، لم تعد أجهزة الكمبيوتر مجرد أدوات نستخدمها ، فهي تبدأ في توليد المهارات.إنها تؤدي المهام ، ولم تعد صناعة برمجيات إنتاج ، والتي كانت فكرة تخريبية في أوائل التسعينيات.يتذكر؟لقد قام مفهوم تغليف البرامج الذي اقترحه Microsoft بتغيير صناعة الكمبيوتر بالكامل.بدون برامج معبأة ، سيخسر جهاز الكمبيوتر الخاص بنا معظم وظائفه.وقد دفع هذا الابتكار تطوير الصناعة بأكملها.

الآن لدينا مصنع جديد وجهاز كمبيوتر جديد ، وعلى هذا الأساس هو نوع جديد من البرامج التي تعمل – نسميها NIM (NVIDIA Interference Microservices).نيم يركض في هذا المصنع الجديد هو نموذج تدريب مسبقًا ، وهو ذكاء اصطناعي.

هذا الذكاء الاصطناعى نفسه معقد للغاية ، لكن كومة الحوسبة التي تدير الذكاء الاصطناعي معقدة بشكل لا يصدق.عندما تستخدم نموذجًا مثل ChatGPT ، يوجد خلفه مكدس برامج ضخم.هذا المكدس معقد وضخم لأن النموذج يحتوي على مليارات من المعلمات ويعمل ليس فقط على جهاز كمبيوتر واحد ، ولكن يعمل معًا على أجهزة كمبيوتر متعددة.

لزيادة الكفاءة إلى الحد الأقصى ، يحتاج النظام إلى تخصيص أعباء العمل لعمليات معالجة وحدات معالجة الرسومات المتعددة لمختلف المعالجة المتوازية ، مثل التوازي الموتر ، وتوازي خط الأنابيب ، وتوازي البيانات ، والتوازي الخبير.هذا التخصيص هو التأكد من إكمال العمل في أسرع وقت ممكن ، لأنه في المصنع ، ترتبط الإنتاجية مباشرة بالإيرادات وجودة الخدمة وعدد العملاء الذين يمكن تقديمهم.اليوم ، نحن في عصر حيث يكون استخدام إنتاجية مركز البيانات أمرًا بالغ الأهمية.

في الماضي ، على الرغم من أن الإنتاجية كانت مهمة ، إلا أنها لم تكن عاملاً حاسماً.ومع ذلك ، يتم الآن قياس كل معلمة من وقت بدء التشغيل ، ووقت التشغيل ، والاستخدام ، والإنتاجية إلى وقت الخمول بدقة لأن مركز البيانات أصبح “مصنعًا” حقيقيًا.في هذا المصنع ، ترتبط الكفاءة التشغيلية ارتباطًا مباشرًا بالأداء المالي للشركة.

بالنظر إلى هذا التعقيد ، فإننا نعرف التحديات التي تواجهها معظم الشركات عند نشر الذكاء الاصطناعي.لذلك ، قمنا بتطوير محلول حاوية AI متكامل يلف الذكاء الاصطناعي في صندوق يسهل نشره وإدارته.يحتوي هذا المربع على مجموعة ضخمة من البرامج مثل CUDA و CUDACNN و TENSORRT ، وكذلك خدمة الاستدلال Triton.وهو يدعم البيئات السحابية الأصلية ، ويسمح بالتوسع التلقائي في بيئة Kubernetes (حل بنية موزعة على أساس تكنولوجيا الحاويات) ، ويوفر خدمات الإدارة لتسهيل المستخدمين لمراقبة حالة تشغيل خدمات الذكاء الاصطناعي.

الأمر الأكثر إثارة هو أن حاوية الذكاء الاصطناعى توفر واجهة واجهة برمجة تطبيقات عالمية قياسية ، مما يتيح للمستخدمين التفاعل مباشرة مع “المربع”.يمكن للمستخدمين بسهولة نشر وإدارة خدمات الذكاء الاصطناعى ببساطة عن طريق تنزيل NIM وتشغيل الكمبيوتر الذي يدعم CUDA.اليوم ، CUDA موجود في كل مكان ، وهو يدعم مقدمي الخدمات السحابية الرئيسية ، ويقدم جميع مصنعي الكمبيوتر تقريبًا دعم CUDA ، ويمكن العثور عليه في مئات الملايين من أجهزة الكمبيوتر.

عندما تقوم بتنزيل NIM ، يكون لديك على الفور مساعد منظمة العفو الدولية يتواصل بسلاسة مثل محادثة مع ChatGPT.الآن ، تم تبسيط جميع البرامج ودمجها في حاوية واحدة ، وتم تحسين جميع التبعيات 400 المرهقة سابقًا مركزيًا.أجرينا اختبارًا صارمًا لـ NIM ، وتم اختبار كل نموذج مسبق بالكامل على البنية التحتية السحابية لدينا ، بما في ذلك إصدارات مختلفة من وحدات معالجة الرسومات مثل Pascal و Ampere وأحدث النطاط.هذه الإصدارات من مجموعة واسعة ، تغطي جميع المتطلبات تقريبًا.

لا شك أن اختراع نيم هو إنجاز ، وهو أحد أكثر إنجازاتي فخوراً.اليوم ، لدينا القدرة على بناء نماذج لغوية كبيرة ونماذج مختلفة تم تدريبها مسبقًا تغطي مجالات متعددة مثل اللغة والرؤية والصور والإصدارات المخصصة لصناعات محددة مثل الرعاية الصحية والبيولوجيا الرقمية.

لمعرفة المزيد أو تجربة هذه الإصدارات ، ما عليك سوى زيارة ai.nvidia.com.اليوم ، أصدرنا Llama 3 NIM المحسّن بالكامل على وجه المعانقة ، والتي يمكنك تجربتها على الفور وحتى التخلص منها مجانًا.بغض النظر عن النظام الأساسي السحابي الذي تختاره ، يمكنك تشغيله بسهولة.بالطبع ، يمكنك أيضًا تنزيل هذه الحاوية إلى مركز البيانات الخاص بك ، واستضافةها بنفسك ، وخدمة عملائك.

كما ذكرت سابقًا ، لدينا إصدارات NIM تغطي مجالات مختلفة ، بما في ذلك الفيزياء ، والبحث الدلالي ، واللغة المرئية ، وما إلى ذلك ، والتي تدعم لغات متعددة.يمكن دمج هذه الخدمات المجهرية بسهولة في تطبيقات كبيرة ، أحد أكثر التطبيقات الواعدة هو وكيل خدمة العملاء.إنه قياسي في كل صناعة تقريبًا ويمثل سوق خدمة العملاء العالميين تريليون دولار.

تجدر الإشارة إلى أن الممرضات ، باعتبارهن جوهر خدمة العملاء ، يلعبن دورًا مهمًا في البيع بالتجزئة والوجبات السريعة والخدمات المالية والتأمين وغيرها من الصناعات.اليوم ، تم تعزيز عشرات ملايين موظفي خدمة العملاء بشكل كبير بمساعدة نماذج اللغة وتكنولوجيا الذكاء الاصطناعي.في قلب أدوات التحسين هذه هو بالضبط ما تراه NIM.

يطلق على البعض وكلاء التفكير ، وعند تعيين المهام ، يمكنهم تحديد الأهداف والتخطيط.بعضها جيد في استرداد المعلومات ، وبعضها يتقن في البحث ، وقد يستخدم البعض أدوات مثل Coop ، أو يحتاج إلى تعلم لغات محددة تعمل على SAP مثل ABAP ، أو حتى تنفيذ استعلامات SQL.يتم الآن تشكيل هؤلاء الخبراء المزعومين في فريق فعال وتعاون.

لقد تغيرت طبقة التطبيق أيضًا: في الماضي ، كتبت التطبيقات من خلال التعليمات ، ولكن الآن تم بناؤها عن طريق تجميع فرق الذكاء الاصطناعي.بينما تتطلب كتابة البرنامج خبرة ، يعرف الجميع تقريبًا كيفية تحطيم المشاكل وتشكيل فريق.لذلك ، أعتقد اعتقادا راسخا أن كل شركة في المستقبل سيكون لديها مجموعة كبيرة من NIM.يمكنك اختيار الخبراء كما تريد وتوصيلهم بفريق.

والأكثر مدهشة هو أنك لا تحتاج حتى إلى معرفة كيفية توصيلها.ما عليك سوى تعيين مهمة للوكيل ، ستقرر NIM بذكاء كيفية تحطيم المهمة وتعيينها لأفضل خبير.إنهم مثل القادة المركزين للتطبيقات أو الفرق ، قادرون على تنسيق عمل أعضاء الفريق وتقديم النتائج لك في النهاية.

العملية برمتها فعالة ومرنة مثل العمل الجماعي البشري.هذا ليس مجرد اتجاه في المستقبل ، ولكنه على وشك أن يصبح حقيقة من حولنا.هذه نظرة جديدة تمامًا على أن التطبيقات ستظهر في المستقبل.

6.سيصبح الكمبيوتر الناقل الرئيسي للأشخاص الرقميين

عندما نتحدث عن التفاعلات مع خدمات الذكاء الاصطناعى الكبيرة ، يمكننا الآن القيام بذلك مع المطالبات النصية والصوت.لكن نتطلع إلى المستقبل ، نأمل أن نتفاعل بطريقة أكثر إنسانية ، أي الأشخاص الرقميين.حققت Nvidia تقدمًا كبيرًا في مجال التكنولوجيا البشرية الرقمية.

لا يقتصر الأمر على أن الأشخاص الرقميين لديهم القدرة على أن يكونوا عوامل تفاعلية ممتازة ، بل هم أكثر جاذبية وقد يظهرون تعاطفًا أعلى.ومع ذلك ، لا يزال الأمر يتطلب جهداً هائلاً لعبور هذه الفجوة المذهلة وجعل الناس الرقميين يبدو ويشعرون بمزيد من الطبيعية.هذه ليست فقط رؤيتنا ، ولكن أيضا هدفنا المتواصل.

قبل أن أريكم إنجازاتنا الحالية ، يرجى السماح لي بالتعبير عن تحياتي الدافئة إلى تايوان ، الصين.قبل استكشاف سحر الأسواق الليلية بعمق ، دعونا أولاً نقدر ديناميات التكنولوجيا البشرية الرقمية.

هذا أمر لا يصدق بالفعل.لا يتم تشغيل ACE (Avatar Cloud Engine) بكفاءة في السحابة فحسب ، بل يتوافق أيضًا مع بيئات الكمبيوتر.لدينا تكامل تطلعية ل GPUs Core Tensor في جميع عائلات RTX ، والتي تمثل وصول عصر منظمة العفو الدولية وحدات معالجة الرسومات ونحن على استعداد تام لهذا.

المنطق وراءه واضح للغاية: لبناء منصة حوسبة جديدة ، يجب وضع أساس متين أولاً.مع أساس متين ، ستظهر التطبيقات بشكل طبيعي.إذا كان مثل هذا الأساس غير موجود ، فسيكون الطلب غير وارد.لذلك ، فقط عندما نبنيه ، يمكن أن يكون ازدهار الطلب ممكنًا.

لذلك ، لدينا وحدات معالجة Core المدمجة في كل وحدة معالجة الرسومات RTX حاليًا.في معرض Computex الأخير ، أطلقنا أربعة أجهزة كمبيوتر محمولة جديدة منظمة العفو الدولية.

هذه الأجهزة لديها القدرة على تشغيل الذكاء الاصطناعي.ستصبح أجهزة الكمبيوتر المحمولة وأجهزة الكمبيوتر في المستقبل ناقلات ذكاء اصطناعي ، وسوف يوفرون لك المساعدة والدعم بصمت في الخلفية.في الوقت نفسه ، ستقوم أجهزة الكمبيوتر هذه أيضًا بتشغيل التطبيقات التي يتم تعزيزها بواسطة الذكاء الاصطناعي ، وما إذا كنت تقوم بتحرير الصور أو الكتابة أو استخدام أدوات أخرى ، فسوف تستمتع بآثار الراحة والتعزيز التي تسببها الذكاء الاصطناعي.

بالإضافة إلى ذلك ، سيتمكن جهاز الكمبيوتر الخاص بك من استضافة التطبيقات البشرية الرقمية مع الذكاء الاصطناعي ، والسماح بتقديم الذكاء الاصطناعي بطرق أكثر تنوعًا وتطبيقه على جهاز الكمبيوتر الخاص بك.من الواضح أن الكمبيوتر الشخصي سيصبح منصة AI حاسمة.لذا ، كيف سنطور بعد ذلك؟

تحدثت عن توسيع مراكز البيانات الخاصة بنا من قبل ، ويرافق كل توسع تغييرات جديدة.عندما توسعنا من DGX إلى أجهزة الكمبيوتر الفائقة من الذكاء الاصطناعي ، قمنا بتنفيذ تدريب فعال للمحول على مجموعات البيانات الضخمة.هذا يمثل تحولًا كبيرًا: في البداية ، تتطلب البيانات الإشراف البشري ، ويتم تدريب الذكاء الاصطناعي من خلال العلامات البشرية.ومع ذلك ، فإن كمية البيانات التي يمكن للبشر علاماتها محدودة.الآن ، مع تطور المحول ، أصبح التعلم غير الخاضع للإشراف ممكنًا.

اليوم ، قادر على استكشاف كميات هائلة من البيانات ومقاطع الفيديو والصور من تلقاء نفسها ، وتعلم واكتشاف الأنماط والعلاقات المخفية.من أجل تعزيز الذكاء الاصطناعي إلى مستوى أعلى ، يجب أن يكون الجيل القادم من الذكاء الاصطناعي متجذرًا في فهم القوانين المادية ، لكن معظم أنظمة الذكاء الاصطناعي تفتقر إلى فهم عميق للعالم المادي.من أجل إنشاء صور واقعية ومقاطع فيديو ورسومات ثلاثية الأبعاد ومحاكاة الظواهر الفيزيائية المعقدة ، نحتاج بشكل عاجل إلى تطوير الذكاء الاصطناعي القائم على الفيزياء ، مما يتطلب أن يكون قادرًا على فهم وتطبيق قوانين الفيزياء.

هناك طريقتان رئيسيتان لتحقيق ذلك.أولاً ، من خلال التعلم من مقاطع الفيديو ، يمكن للذكاء الاصطناعي أن يتراكم تدريجياً المعرفة بالعالم المادي.ثانياً ، باستخدام البيانات الاصطناعية ، يمكننا توفير بيئة تعليمية غنية ويمكن التحكم فيها لأنظمة الذكاء الاصطناعي.بالإضافة إلى ذلك ، يعد التعلم المحاكي بين البيانات وأجهزة الكمبيوتر أيضًا استراتيجية فعالة.تشبه هذه الطريقة الوضع الذاتي لـ AlphaGo ، مما يتيح كيانين لهما نفس القدرة على التعلم من بعضهما البعض لفترة طويلة ، وبالتالي تحسين مستوى الذكاء.لذلك ، يمكننا أن نتوقع أن يظهر هذا النوع من الذكاء الاصطناعي تدريجياً في المستقبل.

7.تم وضع Blackwell بالكامل في الإنتاج ، وزادت قوة الحوسبة بمقدار 1000 مرة في ثماني سنوات

عندما يتم إنشاء بيانات الذكاء الاصطناعي من خلال التوليف وتواصل مع تكنولوجيا التعلم التعزيز ، سيتم تحسين معدل توليد البيانات بشكل كبير.مع نمو توليد البيانات ، سيزداد الطلب على طاقة الحوسبة وفقًا لذلك.نحن على وشك الدخول في عصر جديد يمكن فيه أن يتمكن الذكاء الاصطناعي من تعلم قوانين الفيزياء وفهم واتخاذ القرارات والإجراءات بناءً على بيانات من العالم المادي.لذلك ، نتوقع أن يستمر نموذج الذكاء الاصطناعي في التوسع وستصبح متطلبات أداء GPU مرتفعًا بشكل متزايد.

لتلبية هذه الحاجة ، ظهرت بلاكويل إلى حيز الوجود.تم تصميمه لدعم جيل جديد من الذكاء الاصطناعي ، ويحتوي وحدة معالجة الرسومات هذه على العديد من التقنيات الرئيسية.هذا حجم الرقاقة هو الأفضل في هذه الصناعة.نحن نستخدم رقميتين أكبر قدر الإمكان ، وتوصيلهما بإحكام معًا من خلال رابط عالي السرعة من 10 تيرابايت في الثانية مع الأخلاق الأكثر تقدماً في العالم (واجهة أو تقنية اتصال عالية الأداء).علاوة على ذلك ، نضع رقائق من هذا القبيل على عقدة الكمبيوتر والتنسيق بكفاءة من خلال وحدة المعالجة المركزية Grace.

تعتبر Grace CPUs متعددة الاستخدامات وليس مناسبة فقط لسيناريوهات التدريب ، ولكنها تلعب أيضًا دورًا رئيسيًا في الاستدلال والتوليد ، مثل التقيد السريع وإعادة التشغيل.بالإضافة إلى ذلك ، يمكنه تخزين السياقات ، والسماح لأنظمة الذكاء الاصطناعى بالحصول على ذاكرة وفهم سياق محادثات المستخدم ، وهو أمر بالغ الأهمية لتعزيز استمرارية التفاعلات والطلاقة.

يعمل محرك محول الجيل الثاني على تحسين كفاءة الحوسبة للذكاء الاصطناعي.يمكن لهذا المحرك التكيف ديناميكيًا مع دقة أقل وفقًا لمتطلبات دقة ونطاق طبقة الحوسبة ، وبالتالي تقليل استهلاك الطاقة مع الحفاظ على الأداء.وفي الوقت نفسه ، لدى Blackwell GPUS أيضًا قدرات آمنة للذكاء الاصطناعي لضمان أن يتمكن المستخدمون من مطالبة مقدمي الخدمات بحمايتهم من السرقة أو العبث.

فيما يتعلق بالتوصيل البيني GPU ، اعتمدنا تقنية NV من الجيل الخامس ، والتي تتيح لنا توصيل وحدات معالجة الرسومات المتعددة بسهولة.بالإضافة إلى ذلك ، تم تجهيز وحدات معالجة الرسومات Blackwell بالجيل الأول من محركات الموثوقية والتوافر (RAS Systems) ، وهي تقنية مبتكرة يمكنها اختبار كل ترانزستور ، وذاكرة ، وذاكرة ، وذاكرة خارج الرقاقة على الشريحة للتأكد من أنه يمكننا الحكم بدقة في الموقع ما إذا كانت شريحة معينة تلبي متوسط ​​الوقت بين الفشل (MTBF).

الموثوقية أمر بالغ الأهمية بشكل خاص بالنسبة للأجهزة الحاسوبية الكبرى.قد يكون متوسط ​​وقت الفشل الفاصل بين الحاسوب الفائق الذي يحتوي على 10000 وحدات معالجة الرسومات في ساعات ، ولكن عندما يزداد عدد وحدات معالجة الرسومات إلى 100000 ، سيتم تقليل متوسط ​​وقت الفشل إلى دقائق.لذلك ، لضمان قدرة أجهزة الكمبيوتر العملاقة على الركض لفترة طويلة لتدريب النماذج المعقدة التي قد تستغرق شهورًا ، يجب علينا تحسين الموثوقية من خلال الابتكار التكنولوجي.لا يمكن أن يؤدي تحسين الموثوقية إلى زيادة وقت تشغيل النظام فحسب ، بل يقلل أيضًا من التكاليف بشكل فعال.

أخيرًا ، ندمج أيضًا محرك إزالة الضغط المتقدم في GPU Blackwell.من حيث معالجة البيانات ، فإن سرعة الضغط أمر بالغ الأهمية.من خلال دمج هذا المحرك ، يمكننا سحب البيانات من التخزين بشكل أسرع 20 مرة من التكنولوجيا الحالية ، وتحسين كفاءة معالجة البيانات بشكل كبير.

الميزات المذكورة أعلاه من GPU Blackwell تجعله منتجًا رائعًا.في مؤتمر GTC السابق ، عرضت عليك Blackwell في حالة النموذج الأولي.والآن ، يسرنا أن نعلن أن هذا المنتج قد وضع في الإنتاج.

هذا هو بلاكويل ، الجميع ، باستخدام تقنية لا تصدق.هذه هي تحفة لدينا ، والأكثر تعقيدًا وأكثرها أداءً في العالم اليوم.من بينهم ، نريد بشكل خاص ذكر وحدة المعالجة المركزية Grace ، التي تحمل قوة حوسبة ضخمة.يرجى الاطلاع ، هذان رقائق Blackwell ، وهما متصلان ارتباطًا وثيقًا.هل لاحظت ذلك؟هذه هي أكبر شريحة في العالم ، ونحن نستخدم الروابط التي تصل إلى 10 تيرابايت في الثانية لمزج رقميتي من هذا القبيل في واحدة.

إذن ، ما هو بالضبط بلاكويل؟أدائها لا يصدق.يرجى مراقبة هذه البيانات بعناية.في غضون ثماني سنوات فقط ، زادت قوتنا الحاسوبية ، وذاتية الحساب العائمة والذكاء الاصطناعي ، بمقدار 1000 مرة.هذه السرعة تتجاوز نمو قانون مور في أفضل فترة.

النمو في قوة الحوسبة في بلاكويل مذهل ببساطة.والأكثر جديرة بالذكر هو أنه كلما زادت قوة الحوسبة لدينا ، فإن التكلفة تنخفض باستمرار.اسمحوا لي أن أريكم شيئا.من خلال تحسين قوة الحوسبة ، انخفضت الطاقة المستخدمة لتدريب نماذج GPT-4 (2 تريليون من المعلمات و 8 تريليون رموز) بمقدار 350 مرة.

تخيل لو أن باسكال يقوم بنفس التدريب ، فإنه سيستهلك ما يصل إلى 1000 جيجاوات من الطاقة.هذا يعني أن هناك حاجة إلى مركز بيانات GW لدعمه ، لكن مراكز البيانات هذه غير موجودة في العالم.حتى لو كان موجودًا ، فسوف يستغرق الأمر شهرًا للتشغيل بشكل مستمر.وإذا كان مركز بيانات 100 ميجاوات ، فسيكون وقت التدريب لمدة عام واحد.

من الواضح ، لا أحد يريد أو يمكنه إنشاء مركز بيانات مثل هذا.لهذا السبب قبل ثماني سنوات ، كانت نماذج اللغة الكبيرة مثل Chatgpt لا تزال حلمًا بعيدًا بالنسبة لنا.لكن الآن ، نحقق ذلك من خلال زيادة الأداء وتقليل استهلاك الطاقة.

استخدمنا Blackwell لتقليل الطاقة التي قد تتطلب ما يصل إلى 1000 GWH إلى 3 GWH فقط ، وهو الإنجاز الذي لا شك فيه أنه اختراق صادم.تخيل استخدام 1000 وحدات معالجة الرسومات ، فإن الطاقة التي يستهلكونها تعادل فقط السعرات الحرارية في فنجان من القهوة.ويمكن لـ 10000 وحدة معالجة الرسومات إكمال المهمة نفسها في حوالي 10 أيام فقط.هذه التقدم المحرز في ثماني سنوات لا يصدق ببساطة.

Blackwell ليس مناسبًا للاستدلال فحسب ، بل إن تحسين أداء التوليد الرمزي أكثر جاذبية.في عصر Pascal ، استهلك كل رمز ما يصل إلى 17000 جول من الطاقة ، والتي كانت حول طاقة لمصباح كهربائيين يعملان لمدة يومين.لإنشاء رمز GPT-4 ، يستغرق الأمر تقريبًا لمصابيح كهربائية 200 واط لمدة يومين.بالنظر إلى أن الأمر يتطلب حوالي 3 رموز لإنشاء كلمة ، فهذا بالفعل استهلاك كبير للطاقة.

ومع ذلك ، فإن الوضع مختلف تمامًا الآن.لا يكلف Blackwell سوى 0.4 جول من الطاقة لتوليد كل رمز ، ويكون توليد الرمز المميز بسرعة مذهلة واستهلاك الطاقة المنخفضة للغاية.هذا هو بلا شك قفزة كبيرة.لكن رغم ذلك ، ما زلنا غير راضين.للحصول على تقدم أكبر ، يجب أن نبني آلات أكثر قوة.

هذا هو نظام DGX الخاص بنا ، وسيتم تضمين شريحة Blackwell فيه.يستخدم هذا النظام تقنية تبريد الهواء ومجهز بـ 8 مثل وحدات معالجة الرسومات في الداخل.انظر إلى أتبارات الحرارة على وحدات معالجة الرسومات هذه ، حجمها مذهل.يبلغ استهلاك الطاقة للنظام بأكمله حوالي 15 كيلو واط ، والذي يتم تحقيقه بالكامل من خلال تبريد الهواء.هذا الإصدار متوافق مع x86 وتم تطبيقه على الخوادم التي يتم شحنها.

ومع ذلك ، إذا كنت تفضل تقنية التبريد السائل ، فلدينا أيضًا نظام جديد – MGX.يعتمد على تصميم اللوحة الأم هذا ، والذي نسميه نظام “معياري”.يكمن جوهر نظام MGX في رقميتين من Blackwell ، وتدمج كل عقدة أربع رقائق بلاكويل.يتبنى تقنية التبريد السائل لضمان تشغيل فعالة ومستقرة.

في النظام بأكمله ، هناك تسع عقد من هذا القبيل ، ما مجموعه 72 وحدات معالجة الرسومات ، وتشكل مجموعة حوسبة ضخمة.يتم توصيل وحدات معالجة الرسومات هذه بشكل وثيق من خلال تقنية NV Link الجديدة لتشكيل شبكة حوسبة سلسة.مفاتيح ارتباط NV هي معجزة تقنية.إنه حاليًا التبديل الأكثر تقدماً في العالم ، مع معدل نقل البيانات المذهل.تجعل هذه المفاتيح كل رقاقة Blackwell متصلة بكفاءة ، وتشكل مجموعة ضخمة من GPU 72.

ما هي مزايا هذه المجموعة؟أولاً ، في مجال GPU ، يعمل الآن مثل وحدة معالجة الرسومات المفرطة الفائقة.يحتوي هذا “Super GPU” على إمكانات أساسية لـ 72 وحدات معالجة الرسومات ، والأداء أعلى 9 مرات من الجيل السابق من 8 وحدات معالجة الرسومات.في الوقت نفسه ، زاد عرض النطاق الترددي بمقدار 18 مرة ، زادت الذكاء الاصطناعي (عمليات النقطة العائمة في الثانية) بمقدار 45 مرة ، وزادت الطاقة بمقدار 10 مرات فقط.وهذا يعني أن أحد هذه الأنظمة يمكن أن يوفر قوة قوية تبلغ 100 كيلووات ، في حين أن الجيل السابق كان على بعد 10 كيلووات فقط.

بالطبع ، يمكنك أيضًا توصيل المزيد من هذه الأنظمة معًا لتشكيل شبكة حوسبة أكبر.لكن المعجزة الحقيقية تكمن في حقيقة أن رقاقة ارتباط NV هذه أصبحت كبيرة بشكل متزايد مع زيادة حجم نموذج اللغة الكبير.نظرًا لأن نماذج اللغة الكبيرة هذه لم تعد مناسبة للتشغيل على GPU أو عقدة واحدة ، فإنها تتطلب عمل حامل GPU بالكامل معًا.تمامًا مثل نظام DGX الجديد الذي ذكرته للتو ، يمكن أن يستوعب نماذج لغة كبيرة بمئات تريليونات من المعلمات.

يعد مفتاح NV Link نفسه معجزة تكنولوجية ، حيث تضم 50 مليار ترانزستورات و 74 منفذًا ومعدل بيانات يصل إلى 400 جيجابايت لكل منفذ.ولكن الأهم من ذلك ، أن المفتاح يدمج أيضًا وظائف التشغيل الرياضية ، والتي يمكن أن تؤدي مباشرة عمليات التخفيض ، والتي لها أهمية كبيرة في التعلم العميق.هذا هو الشكل الجديد لنظام DGX الحالي.

كثير من الناس فضولية عنا.تساءلوا عن وجود سوء فهم لنطاق أعمال NVIDIA.يتساءل الناس كيف يمكن أن تصبح Nvidia ضخمة جدًا بمجرد صنع وحدات معالجة الرسومات.لذلك ، شكل الكثير من الناس الانطباع بأن وحدة معالجة الرسومات يجب أن تبدو بطريقة معينة.

ومع ذلك ، فإن ما أريد أن أريكم الآن هو أن هذا هو في الواقع وحدة معالجة الرسومات ، لكنها ليست من النوع الذي تعتقد أنه.هذا هو واحد من وحدات معالجة الرسومات الأكثر تقدما في العالم ، لكنها تستخدم بشكل أساسي في مجال الألعاب.لكننا نعلم جميعًا أن القوة الحقيقية ل GPUs هي أكثر من ذلك بكثير.

الجميع ، يرجى إلقاء نظرة على هذا ، هذا هو الشكل الحقيقي ل GPU.هذا هو وحدة معالجة الرسومات DGX مصممة للتعلم العميق.يتم توصيل الجزء الخلفي من وحدة معالجة الرسومات هذا بالعمود الفقري لربط NV ، والذي يتكون من 5000 خط ويبلغ طوله 3 كيلومترات.هذه الخطوط هي العمود الفقري لربط NV ، الذي يربط 70 وحدات معالجة الرسومات لتشكيل شبكة حوسبة قوية.هذه معجزة ميكانيكية إلكترونية يتيح لنا فيها جهاز الإرسال والاستقبال قيادة الإشارات عبر الطول بالكامل على السلك النحاسي.

لذلك ، يقوم مفتاح ارتباط NV هذا بنقل البيانات على السلك النحاسي من خلال العمود الفقري لربط NV ، مما يسمح لنا بتوفير 20 كيلو واط من الطاقة في رف واحد ، والذي يستخدم الآن بالكامل لمعالجة البيانات ، وهو بالفعل حقيقة رائعة لا تصدق.هذه هي قوة العمود الفقري لربط NV.

8.تعزيز Ethernet ل AI التوليدي

ولكن هذا لا يكفي لتلبية الطلب ، خاصة بالنسبة لمصانع الذكاء الاصطناعي الكبيرة ، لذلك لدينا حل آخر.يتعين علينا توصيل مصانع الذكاء الاصطناعي هذه باستخدام شبكات عالية السرعة.لدينا خياران للشبكة: Infiniband و Ethernet.من بينها ، تم استخدام Infiniband على نطاق واسع في مصانع الحوسبة الفائقة والذكاء الاصطناعي في جميع أنحاء العالم وتنمو بسرعة.ومع ذلك ، لا يمكن لكل مركز بيانات استخدام Infiniband مباشرة لأنها قامت باستثمارات كبيرة في النظام الإيكولوجي Ethernet ، وتتطلب إدارة مفاتيح وشبكات Infiniband بعض الخبرة والتكنولوجيا.

لذلك ، فإن حلنا هو جلب أداء Infiniband إلى بنية Ethernet ، وهو أمر ليس بالأمر السهل.السبب هو أن كل عقدة ، كل كمبيوتر ، عادة ما تكون متصلة بمستخدمين مختلفين على الإنترنت ، ولكن معظم الاتصالات تحدث بالفعل داخل مركز البيانات ، أي نقل البيانات بين مركز البيانات والمستخدمين على الطرف الآخر من الإنترنت .ومع ذلك ، في سيناريو التعلم العميق لمصانع الذكاء الاصطناعي ، لا تتواصل وحدات معالجة الرسومات مع المستخدمين على الإنترنت ، ولكن في كثير من الأحيان وتبادل البيانات المكثفة مع بعضها البعض.

يتواصلون مع بعضهم البعض لأنهم يجمعون جميع النتائج.ثم يتعين عليهم تقليل هذه النتائج الجزئية وإعادة توزيعها.يتميز وضع الاتصال هذا بحركة مرور للغاية.ما يهم ليس متوسط ​​الإنتاجية ، ولكن البيانات الأخيرة التي تصل ، لأنه إذا كنت تقوم بجمع نتائج جزئية من الجميع وأحاول تلقي جميع النتائج الجزئية ، إذا وصلت الحزمة الأخيرة في وقت متأخر ، فستتأخر العملية بأكملها .الكمون هو قضية حاسمة لمصانع الذكاء الاصطناعي.

لذلك ، فإن تركيزنا ليس في المتوسط ​​إنتاجية ، ولكن لضمان وصول الحزمة الأخيرة في الوقت المحدد ودون خطأ.ومع ذلك ، لم يتم تحسين Ethernet التقليدية لمثل هذه متطلبات الكمون المتزامنة للغاية.لتلبية هذه الحاجة ، قمنا بتصميم بنية شاملة تتيح NIC (بطاقات واجهة الشبكة) والتبديل إلى التواصل.لتحقيق ذلك ، اعتمدنا أربع تقنيات رئيسية:

أولاً ، تمتلك NVIDIA تقنية RDMA (REMOTE DIRECT MEMORMENT) الرائدة في الصناعة.الآن لدينا RDMA على مستوى شبكة Ethernet ويقوم بعمل رائع.

ثانياً ، قدمنا ​​آلية التحكم في الازدحام.يحتوي المفتاح على وظيفة القياس عن بُعد في الوقت الفعلي ، والتي يمكن أن تحدد بسرعة الازدحام في الشبكة والاستجابة لها.عندما تكون كمية البيانات المرسلة من GPU أو NIC كبيرة جدًا ، يرسل المفتاح على الفور إشارة لإبلاغهم بإبطاء معدل الإرسال ، وبالتالي تجنب توليد النقاط الساخنة للشبكة.

ثالثًا ، نعتمد تقنية التوجيه التكيفية.تقوم Ethernet التقليدية بنقل البيانات بترتيب ثابت ، ولكن في بنيةنا ، يمكننا ضبطها بمرونة بناءً على ظروف الشبكة في الوقت الفعلي.عند العثور على الازدحام أو أن بعض المنافذ خاملة ، يمكننا إرسال حزم إلى هذه المنافذ الخاملة وإعادة ترتيبها بواسطة جهاز Bluefield على الطرف الآخر لضمان إرجاع البيانات بالترتيب الصحيح.تعمل تقنية التوجيه التكيفية هذه على تحسين مرونة الشبكة وكفاءتها.

رابعا ، قمنا بتنفيذ تكنولوجيا عزل الضوضاء.في مركز البيانات ، قد تتداخل الضوضاء وحركة المرور التي تم إنشاؤها بواسطة نماذج متعددة في وقت واحد مع بعضها البعض وتسبب الارتعاش.يمكن لتكنولوجيا عزل الضوضاء لدينا عزل هذه الضوضاء بشكل فعال ، مما يضمن عدم تأثر نقل حزم البيانات الهامة.

من خلال تبني هذه التقنيات ، نجحنا في توفير حلول شبكة منخفضة الأداء منخفضة الأداء لمصانع الذكاء الاصطناعي.في مركز بيانات بمليارات الدولارات ، إذا زاد استخدام الشبكة بنسبة 40 ٪ وتخفيض وقت التدريب بنسبة 20 ٪ ، فهذا يعني في الواقع أن مركز بيانات بقيمة 5 مليارات دولار يعادل مركز بيانات بقيمة 6 مليارات دولار ، يكشف عن التأثير الكبير من أداء الشبكة على فعالية التكلفة الإجمالية.

لحسن الحظ ، فإن تكنولوجيا Ethernet مع Spectrum X هي المفتاح لإنجازنا ، مما يحسن أداء الشبكة بشكل كبير ، مما يجعل تكاليف الشبكة ضئيلة تقريبًا بالنسبة لمركز البيانات بأكمله.هذا هو بلا شك إنجازًا كبيرًا قمنا به في مجال تكنولوجيا الشبكة.

لدينا تشكيلة إنتاج قوية لإيثرنت ، وأبرزها هو الطيف x800.مع دعم 51.2 تيرابايت في الثانية و 256 مسارًا (Radix) ، يوفر هذا الجهاز اتصالًا فعالًا لشبكة الشبكة لآلاف وحدات معالجة الرسومات.بعد ذلك ، نخطط لإطلاق X800 Ultra في السنة ، والتي ستدعم 512 Radix مع ما يصل إلى 512 مسارًا ، مما يؤدي إلى تحسين سعة الشبكة وأداءها.تم تصميم X1600 لمراكز البيانات الأكبر ويمكن تلبية احتياجات الاتصال للملايين من وحدات معالجة الرسومات.

مع التقدم المستمر للتكنولوجيا ، يكون عصر مركز البيانات لملايين وحدات معالجة الرسومات قاب قوسين أو أدنى.هناك أسباب عميقة وراء هذا الاتجاه.من ناحية ، نحن حريصون على تدريب نماذج أكبر وأكثر تعقيدًا ؛ستعمل هذه AIS وتفاعل معنا لإنشاء مقاطع فيديو وصور ونصوص وحتى أشخاص رقميين.لذلك ، فإن كل تفاعل تقريبًا نتفاعل مع أجهزة الكمبيوتر لا ينفصل عن مشاركة الذكاء الاصطناعي التوليدي.وهناك دائمًا منظمة العفو الدولية توصيلها ، وبعضها يعمل محليًا ، وبعضها يعمل على جهازك ، وقد يعمل الكثيرون في السحابة.

لا تتمتع هذه الذكاء الاصطناعي التوليدي بقدرات التفكير القوية فحسب ، بل تعمل أيضًا على تحسين الإجابات بشكل تكراري لتحسين جودة الإجابات.هذا يعني أننا سنقوم بإنشاء احتياجات توليد بيانات ضخمة في المستقبل.الليلة ، شهدنا قوة هذا الابتكار التكنولوجي معًا.

جذب Blackwell ، باعتباره الجيل الأول من منصة Nvidia ، الكثير من الاهتمام منذ إطلاقه.اليوم ، فإن عصر الذكاء الاصطناعي التوليدي هو الدخول في العالم ، وبداية ثورة صناعية جديدة ، وكل زاوية تدرك أهمية مصانع الذكاء الاصطناعي.يشرفنا بشدة أن نتلقى دعمًا مكثفًا من جميع مناحي الحياة ، بما في ذلك كل شركة تصنيع المعدات الأصلية (مصنّعة المعدات الأصلية) ، ومصنع الكمبيوتر ، ومزود الخدمة السحابية (Cloud Service) ، و GPU Cloud ، و Sovereign Cloud ، و Elecommunications.

يسرنا بشدة أن نجاح بلاكويل ، وتبني واسع النطاق وحماس الصناعة قد وصلوا إلى مستويات غير مسبوقة ، ونود أن نعرب عن خالص امتناننا لك.ومع ذلك ، فإن وتيرتنا لن تتوقف.في هذا العصر النامي السريع ، سنستمر في العمل بجد لتحسين أداء المنتج ، وتقليل تكلفة التدريب والتفكير ، مع توسيع قدرات الذكاء الاصطناعي باستمرار حتى تتمكن كل شركة من الاستفادة منها.نعتقد اعتقادا راسخا أنه مع تحسين الأداء ، سيتم تخفيض التكاليف.منصة Hopper هي بلا شك أنجح معالج مركز البيانات في التاريخ.

9.سيتم إصدار Blackwell Ultra في العام المقبل ، ويسمى منصة الجيل القادم Rubin

هذه بالفعل قصة نجاح مروعة.كما ترون ، فإن ولادة منصة Blackwell ليست مكونًا واحدًا ، ولكنه نظام كامل يدمج عناصر متعددة مثل وحدة المعالجة المركزية و GPU و NVLink و Nick (مكونات تقنية محددة) ومفاتيح NVLink.نحن ملتزمون بتوصيل جميع وحدات معالجة الرسومات بإحكام من خلال كل جيل باستخدام مفاتيح كبيرة للغاية عالية السرعة لتشكيل مجال حوسبة ضخم وفعال.

نحن ندمج النظام الأساسي بأكمله في مصنع AI الخاص بنا ، ولكن بشكل أكثر نقودًا ، نوفر هذا النظام الأساسي للعملاء في جميع أنحاء العالم في شكل معياري.القصد الأصلي لهذا هو أننا نتوقع أن يقوم كل شريك بإنشاء تكوين فريد ومبتكر يعتمد على احتياجاتهم الخاصة للتكيف مع أنماط مختلفة من مراكز البيانات ومجموعات العملاء المختلفة وسيناريوهات التطبيق المتنوعة.من الحوسبة الحافة إلى الاتصالات السلكية واللاسلكية ، ستصبح جميع أنواع الابتكار ممكنة طالما ظل النظام مفتوحًا.

لتمكينك من الابتكار بحرية ، قمنا بتصميم منصة متكاملة ، ولكن في الوقت نفسه قدمت لك في التحلل ، مما يتيح لك بناء أنظمة معيارية بسهولة.الآن ، تم إطلاق منصة Blackwell بالكامل.

تلتزم Nvidia دائمًا بإيقاع التحديث السنوي.فلسفةنا الأساسية واضحة للغاية: 1) إنشاء حلول تغطية مركز البيانات بأكمله ؛ Extreme ، سواء كانت تكنولوجيا العمليات في TSMC ، أو تكنولوجيا التغليف ، أو تكنولوجيا الذاكرة ، أو التكنولوجيا البصرية ، فإننا جميعًا نتابع الأداء النهائي.

بعد الانتهاء من التحدي النهائي للأجهزة ، سنبذل قصارى جهدنا لضمان تشغيل جميع البرامج بسلاسة على هذا النظام الأساسي الكامل.في تكنولوجيا الكمبيوتر ، فإن القصور الذاتي للبرامج أمر بالغ الأهمية.عندما تكون منصة الكمبيوتر الخاصة بنا متوافقة مع الخلف والهندسة المعمارية متوافقة تمامًا مع البرامج الحالية ، سيتم تحسين سرعة المنتجات إلى السوق بشكل كبير.لذلك ، عندما تم إطلاق منصة Blackwell ، تمكنا من الاستفادة الكاملة من مؤسسة النظام الإيكولوجي للبرامج المبنية لتحقيق سرعة استجابة في السوق المذهلة.في العام المقبل ، سوف نرحب بلاكويل Ultra.

تمامًا مثل سلسلة H100 و H200 التي أطلقناها ، ستقود Blackwell Ultra أيضًا جنون جيل جديد من المنتجات ، مما يجلب تجارب مبتكرة غير مسبوقة.في الوقت نفسه ، سنستمر في تحدي حدود التكنولوجيا وإطلاق مفتاح طيف الجيل التالي ، وهي المحاولة الأولى في الصناعة.تم تحقيق هذا الاختراق الرئيسي بنجاح ، على الرغم من أنني ما زلت مترددًا قليلاً في اتخاذ هذا القرار.

داخل NVIDIA ، اعتدنا على استخدام أسماء التعليمات البرمجية والحفاظ على بعض السرية.في كثير من الأحيان ، حتى معظم الموظفين في الشركة لا يعرفون هذه الأسرار جيدًا.ومع ذلك ، تم تسمية منصة الجيل التالي لدينا روبن.لن أخوض في تفاصيل حول روبن هنا.أعرف فضول الجميع ، لكن من فضلك اسمحوا لي بالحفاظ على بعض الغموض.قد تكون متحمسًا لالتقاط الصور أو دراسة تلك الشخصيات الصغيرة بعناية ، لذلك لا تتردد في القيام بذلك.

ليس لدينا فقط منصة Rubin ، ولكننا سنطلق أيضًا منصة Rubin Ultra في غضون عام.جميع الرقائق المعروضة هنا في مرحلة التطوير الكاملة ، مما يضمن أن كل التفاصيل مصقولة بعناية.لا تزال وتيرة التحديث الخاصة بنا مرة واحدة في السنة ، وتتابع دائمًا التقنية في التكنولوجيا مع ضمان الحفاظ على جميع المنتجات توافقًا معماريًا بنسبة 100 ٪.

إذا نظرنا إلى الوراء في السنوات الـ 12 الماضية ، منذ اللحظة التي ولد فيها ImageNet ، نتوقع مستقبل مجال الحوسبة الذي سيخضع لتغييرات في تهزئة الأرض.الآن ، أصبح كل هذا حقيقة واقعة ، تتزامن مع فكرتنا الأصلية.من Geforce قبل عام 2012 إلى Nvidia اليوم ، خضعت الشركة لتحول كبير.هنا ، أود أن أشكر بصدق جميع شركائي على دعمهم وشركتهم على طول الطريق.

10.وصل عصر الروبوتات

هذه هي منصة Blackwell في Nvidia.

تقود الذكاء الاصطناعي الجسدي موجة جديدة في مجال الذكاء الاصطناعي.تحقيقًا لهذه الغاية ، لا يحتاج الذكاء الاصطناعي البدني إلى بناء نموذج عالمي دقيق لفهم كيفية تفسير العالم من حوله وإدراكه ، ولكن أيضًا يحتاج إلى قدرات إدراكية ممتازة لفهم احتياجاتنا بعمق وأداء المهام بكفاءة.

في المستقبل ، لن تكون الروبوتات مفهومًا بعيد المنال ، ولكن سيتم دمجها بشكل متزايد في حياتنا اليومية.عند الحديث عن الروبوتات ، غالبًا ما يفكر الناس في الروبوتات البشرية ، ولكن في الواقع ، فإن تطبيقاتهم أكثر من ذلك بكثير.ستصبح الميكنة هي القاعدة ، ستدرك المصانع الأتمتة بالكامل ، وستعمل الروبوتات معًا لإنشاء سلسلة من المنتجات الميكانيكية.سيكون التفاعل بينهما أقرب ، مما يخلق بيئة إنتاج آلية للغاية معًا.

لتحقيق ذلك ، نحتاج إلى التغلب على مجموعة من التحديات الفنية.بعد ذلك ، سأعرض هذه التقنيات المتطورة من خلال الفيديو.

هذه ليست مجرد رؤية للمستقبل ، بل أصبحت حقيقة واقعة.

سنخدم السوق بعدة طرق.أولاً ، نحن ملتزمون بإنشاء منصات لأنواع مختلفة من أنظمة الروبوت: منصات مخصصة لمصانع الروبوت والمستودعات ، ومنصات روبوت معالجة الكائنات ، ومنصات الروبوت المتنقلة ، ومنصات الروبوت البشرية.مثل العديد من أعمالنا الأخرى ، تعتمد هذه المنصات الآلية على مكتبات تسريع الكمبيوتر والنماذج التي تم تدريبها مسبقًا.

نحن نستخدم مكتبات تسريع الكمبيوتر ، والنماذج المدربة مسبقًا ، ونجري اختبارات شاملة وتدريب وتكامل في Omniverse.كما يظهر الفيديو ، فإن Omniverse هو المكان الذي تتعلم فيه الروبوتات كيفية التكيف بشكل أفضل مع العالم الحقيقي.بطبيعة الحال ، فإن النظام البيئي لمستودعات الروبوت معقد للغاية ويتطلب العديد من الشركات والأدوات والتقنيات لبناء مستودعات حديثة مشتركة.اليوم ، تتحرك المستودعات تدريجياً نحو الميكنة الكاملة وستكون ذات يوم مؤتمتة بالكامل.

في مثل هذا النظام الإيكولوجي ، نقدم واجهات SDK و API لصناعة البرمجيات ، وصناعة ذكاء الاصطناعية ، وأيضًا تصميم أنظمة مخصصة لـ PLC والأنظمة الآلية لتلبية احتياجات مجالات محددة مثل وزارة الدفاع.يتم دمج هذه الأنظمة من خلال المتكاملين لإنشاء مستودعات فعالة وذكية في نهاية المطاف للعملاء.على سبيل المثال ، يقوم كين ماك ببناء مستودع روبوت للمجموعة العملاقة العملاقة.

بعد ذلك ، دعونا نركز على مجال المصنع.النظام البيئي للمصنع مختلف تمامًا.خذ Foxconn كمثال ، إنهم يبنون بعض المصانع الأكثر تقدماً في العالم.تغطي النظم الإيكولوجية لهذه المصانع أيضًا أجهزة الكمبيوتر الحافة والبرامج الآلية ، لتصميم تخطيطات المصانع ، وتحسين سير العمل ، وروبوتات البرمجة ، وأجهزة الكمبيوتر PLC المستخدمة لتنسيق المصانع الرقمية ومصانع الذكاء الاصطناعي.نقدم أيضًا واجهة SDK لكل رابط في هذه النظم الإيكولوجية.

مثل هذه التغييرات تحدث في جميع أنحاء العالم.تقوم Foxconn و Delta ببناء توائم رقمية لمصانعهما لتحقيق مزيج مثالي من الواقع والرقمي ، ويلعب Omniverse دورًا مهمًا.تجدر الإشارة أيضًا إلى أن Pegatron و Wistron تتابعان الاتجاه وإنشاء منشآت توأم رقمية لمصانع الروبوت الخاصة بهما.

هذا مثير حقا.بعد ذلك ، يرجى الاستمتاع بفيديو رائع لمصنع Foxconn الجديد.

يتكون مصنع Robot من ثلاثة أنظمة كمبيوتر رئيسية تقوم بتدريب نماذج الذكاء الاصطناعي على منصة Nvidia AI ، ونحن نضمن أن الروبوت يعمل بكفاءة على النظام المحلي لتنظيم عمليات المصنع.في الوقت نفسه ، نستخدم Omniverse ، وهي منصة تعاون محاكاة لمحاكاة جميع عناصر المصنع بما في ذلك الأسلحة الآلية و AMR (روبوت متنقل مستقل).تجدر الإشارة إلى أن أنظمة المحاكاة هذه تشترك في نفس المساحة الافتراضية لتحقيق التفاعل والتعاون السلس.

عندما تدخل الأسلحة الآلية و AMR في هذه المساحة الافتراضية المشتركة ، يمكنهم محاكاة بيئة مصنع حقيقية في Omniverse ، مما يضمن التحقق والتحسين الكافيين قبل النشر الفعلي.

لزيادة تعزيز نطاق التكامل والتطبيق للحلول ، نقدم ثلاثة أجهزة كمبيوتر عالية الأداء ، مزودة بطبقات تسريع ونماذج من الذكاء الاصطناعى المدربين مسبقًا.بالإضافة إلى ذلك ، نجحنا في الجمع بين NVIDIA Manipulator و Omniverse مع برامج وأنظمة الأتمتة الصناعية لـ Siemens.يسمح هذا التعاون Siemens بتمكين تشغيل وأتمتة أكثر كفاءة في المصانع في جميع أنحاء العالم.

بالإضافة إلى Siemens ، أنشأنا أيضًا علاقات تعاونية مع العديد من الشركات المعروفة.على سبيل المثال ، قامت Symantec Pick AI بدمج NVIDIA ISAAC ، بينما قامت Somatic Pick AI بتشغيل وتشغيل الروبوتات من العلامات التجارية المعروفة مثل ABB و Kuka و Yaskawa Motoman.

لقد وصل عصر الروبوتات والذكاء الاصطناعي البدني ، ويتم استخدامه على نطاق واسع في كل مكان.في المستقبل ، ستصبح الروبوتات في المصانع سائدة ، وسوف تصنع جميع المنتجات ، اثنان منها لافتة للنظر بشكل خاص.أولاً ، السيارات أو السيارات ذاتية الحكم مع استقلالية عالية ، تلعب NVIDIA مرة أخرى دورًا رئيسيًا في هذا المجال من خلال مجموعة التكنولوجيا الشاملة.في العام المقبل ، نخطط للانضمام إلى فريق مرسيدس بنز ثم العمل مع فريق جاكوار لاند روفر (JLR) في عام 2026.نحن نقدم مكدس حلول كامل ، ولكن يمكن للعملاء اختيار أي جزء أو تسلسل هرمي بناءً على احتياجاتهم ، لأن مكدس السائق بالكامل مفتوح ومرن.

بعد ذلك ، منتج آخر يمكن تصنيعه في غلة عالية من مصانع الروبوت هو الروبوتات البشرية.في السنوات الأخيرة ، تم إجراء اختراقات كبيرة في القدرة المعرفية وقدرة فهم العالم ، وآفاق التطوير في هذا المجال مثيرة.أنا متحمس بشكل خاص للروبوتات البشرية لأنها على الأرجح للتكيف مع العالم الذي بنيناه للبشر.

يتطلب تدريب الروبوتات البشرية الكثير من البيانات مقارنة بأنواع الروبوتات الأخرى.نظرًا لأن لدينا أشكالًا متشابهة في الجسم ، فإن الكمية الكبيرة من بيانات التدريب المقدمة من خلال إمكانيات العرض التوضيحي والفيديو ستكون ذات قيمة كبيرة.لذلك ، نتوقع تقدمًا كبيرًا في هذا المجال.

الآن ، دعونا نرحب ببعض أصدقاء الروبوت الخاصين.وصل عصر الروبوتات ، وهذه هي الموجة التالية من الذكاء الاصطناعي.هناك مجموعة واسعة من أجهزة الكمبيوتر المصنوعة في تايوان ، بما في ذلك النماذج التقليدية المزودة بلوحات المفاتيح ، والأجهزة المحمولة الصغيرة والخفيفة والمحمولة ، بالإضافة إلى المعدات المهنية التي توفر قوة حوسبة قوية لمراكز البيانات السحابية.لكن نتطلع إلى الأمام ، سنشهد لحظة أكثر إثارة – إنشاء أجهزة كمبيوتر يمكنها المشي والتجول ، وهي الروبوتات الذكية.

هذه الروبوتات الذكية لها أوجه تشابه تقنية مذهلة مع أجهزة الكمبيوتر كما نعرفها ، وكلها مبنية على تقنيات الأجهزة والبرامج المتقدمة.لذلك ، لدينا سبب للاعتقاد بأن هذه ستكون رحلة غير عادية حقًا!

<-style-type>

  • Related Posts

    هل يستطيع ترامب إطلاق النار على باول؟ ما هي المخاطر الاقتصادية التي ستجلبها؟

    المؤلف: نيك بوبلي ، الوقت ؛ التجميع: Tao Zhu ، رؤية Baitchain لطالما انخرت بنك الاحتياطي الفيدرالي عن استقلاله عن الضغط السياسي. لكن هذا التقليد يتعرض لضغوط جديدة حيث قام…

    لماذا يريد الأمريكيون مغادرة الولايات المتحدة: التغييرات الاقتصادية والسياسية والعالمية

    المصدر: Zhou Ziheng أثارت رئاسة دونالد ترامب أكبر حرب تجارية في التاريخ ، مما دفع المزيد والمزيد من الأميركيين إلى التفكير في مغادرة البلاد. أظهرت دراسة استقصائية جديدة أن ارتفاع…

    اترك تعليقاً

    لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

    You Missed

    على “نمط” دولة المدينة الرقمية

    • من jakiro
    • أبريل 21, 2025
    • 2 views
    على “نمط” دولة المدينة الرقمية

    بعد حرب التعريفة الجمركية: كيف ستؤثر إعادة توازن رأس المال العالمي على البيتكوين

    • من jakiro
    • أبريل 21, 2025
    • 2 views
    بعد حرب التعريفة الجمركية: كيف ستؤثر إعادة توازن رأس المال العالمي على البيتكوين

    مفترق طرق Ethereum: اختراق استراتيجي في إعادة بناء النظام الإيكولوجي L2

    • من jakiro
    • أبريل 21, 2025
    • 0 views
    مفترق طرق Ethereum: اختراق استراتيجي في إعادة بناء النظام الإيكولوجي L2

    Ethereum يختمر تغييراً تكنولوجياً عميقاً بقيادة تقنية ZK

    • من jakiro
    • أبريل 21, 2025
    • 2 views
    Ethereum يختمر تغييراً تكنولوجياً عميقاً بقيادة تقنية ZK

    BTC 2025 Q3 Outlook: متى ستقدم سوق التشفير مرة أخرى؟

    • من jakiro
    • أبريل 21, 2025
    • 4 views
    BTC 2025 Q3 Outlook: متى ستقدم سوق التشفير مرة أخرى؟

    هل قاعدة “سرقة” إجمالي الناتج المحلي الإجمالي لـ Ethereum؟

    • من jakiro
    • أبريل 21, 2025
    • 3 views
    هل قاعدة “سرقة” إجمالي الناتج المحلي الإجمالي لـ Ethereum؟
    Home
    News
    School
    Search