المؤلف: Sleepy.txtص>
ص>
<سبان ليف = "">في الصباح الباكر من يوم 4 نوفمبر، انتهت مسابقة التداول Alpha Arena AI التي طال انتظارها.ص>
<سبان ليف = "">فاجأت النتائج الجميع، حيث احتلت شركة Qwen 3 Max التابعة لشركة Alibaba المركز الأول بعائد قدره 22.32%، واحتلت شركة صينية أخرى، DeepSeek، المركز الثاني بعائد قدره 4.89%.ص>
<سبان ليف = "">تم هزيمة اللاعبين الأربعة نجوم من وادي السيليكون في جميع المجالات.خسر GPT-5 من OpenAI 62.66%، وخسر Gemini 2.5 Pro من Google 56.71%، وخسر Musk’s Grok 4 45.3%، وخسر Claude 4.5 Sonnet من Anthropic أيضًا 30.81%.ص>
ص>
منحنيات التداول لجميع النماذج|المصدر: nof1ص>
<سبان ليف = "">هذه اللعبة هي في الواقع تجربة خاصة. في 17 أكتوبر، قامت شركة الأبحاث الأمريكية Nof1.ai بوضع ستة من أفضل نماذج اللغات الكبيرة في العالم في سوق العملات المشفرة الحقيقية.حصل كل نموذج على رأس مال أولي قدره 10000 دولار أمريكي لإجراء تداول عقد دائم لمدة 17 يومًا على منصة التداول اللامركزية Hyperliquid.العقود الدائمة هي مشتقات ليس لها تاريخ انتهاء صلاحية تسمح للمتداولين بتضخيم العائدات من خلال الرافعة المالية، ولكنها في الوقت نفسه، تعمل أيضًا على تضخيم المخاطر.ص>
<سبان ليف = "">تبدأ أنظمة الذكاء الاصطناعي هذه من نفس نقطة البداية، ولها نفس بيانات السوق، ولكنها تنتهي بنتائج مختلفة تمامًا.ص>
<سبان ليف = "">هذا ليس اختبارًا قياسيًا في بيئة افتراضية، ولكنه لعبة البقاء على قيد الحياة بأموال حقيقية.وعندما يترك الذكاء الاصطناعي بيئة المختبر “العقيمة” ويواجه سوقا حقيقية ديناميكية ومواجهة وغير مؤكدة للمرة الأولى، فإن اختياراتهم لن تظل محددة وفقا لمعايير النموذج، بل من خلال فهمهم للمخاطر والجشع والخوف.ص>
<سبان ليف = "">أتاحت هذه التجربة للناس أن يروا لأول مرة أنه عندما يواجه ما يسمى “الذكاء” تعقيدات العالم الحقيقي، فإن الأداء الأنيق للنموذج غالبًا ما يكون غير مستدام، مما يكشف عيوبًا تتجاوز التدريب.ص>
<ب><سبان ليف = "">من صانع الأسئلة إلى التاجرب>
<سبان ليف = "">لفترة طويلة، استخدم الناس معايير ثابتة مختلفة لقياس قدرات الذكاء الاصطناعي.ص>
<سبان ليف = "">من MMLU إلى HumanEval، يحصل الذكاء الاصطناعي على درجات أعلى وأعلى في أوراق الاختبار الموحدة هذه، حتى أنه يتفوق على البشر.لكن جوهر هذه الاختبارات يشبه طرح الأسئلة في غرفة هادئة، وتكون الأسئلة والأجوبة ثابتة.يحتاج الذكاء الاصطناعي فقط إلى إيجاد الحل الأمثل في البيانات الضخمة.يمكنه حفظ الإجابات حتى على المسائل الرياضية الأكثر تعقيدًا.ص>
<سبان ليف = "">أما العالم الحقيقي، وخاصة الأسواق المالية، فهو مختلف تماما.ص>
<سبان ليف = "">إنه ليس بنك أسئلة ثابتًا، ولكنه ساحة دائمة التغير ومليئة بالضوضاء والخداع.هذه لعبة محصلتها صفر، ومكسب شخص واحد يجب أن يعني خسارة شخص آخر.إن تقلبات الأسعار ليست مجرد نتيجة لحسابات عقلانية فحسب، بل تتأثر أيضًا بالمشاعر الإنسانية. يظهر الجشع والخوف والحظ والتردد بوضوح في كل ارتفاع في الأسعار.ص>
<سبان ليف = "">ولجعل الأمور أكثر تعقيدا، فإن السوق نفسه يستجيب للسلوك البشري. عندما يعتقد الجميع أن الأسعار سوف ترتفع، غالبا ما تكون الأسعار قد وصلت إلى ذروتها.ص>
<سبان ليف = "">تقوم آلية ردود الفعل هذه باستمرار بتصحيح اليقين، ونتائج عكسية، ومعاقبة اليقين، مما يجعل أي اختبار ثابت باهتًا بالمقارنة.ص>
<سبان ليف = "">تهدف Alpha Arena التي أطلقتها Nof1.ai إلى رمي الذكاء الاصطناعي في بوتقة انصهار اجتماعي حقيقية.يُعطى كل نموذج نقودًا حقيقية، والخسائر هي خسائر حقيقية، والأرباح هي أرباح حقيقية.ص>
<سبان ليف = "">يجب أن يكمل النموذج التحليل واتخاذ القرار ووضع الأوامر والتحكم في المخاطر بشكل مستقل.وهذا يعادل منح كل ذكاء اصطناعي غرفة تداول مستقلة، وتحويله من “صانع أسئلة” إلى “متداول”.يجب عليها أن تقرر ليس فقط اتجاه فتح المركز، ولكن أيضًا حجم المركز، وتوقيت اتخاذ الإجراء، وما إذا كان سيتم إيقاف الخسارة أو جني الأرباح.ص>
ص>
سجلات التشغيل لنماذج مختلفة|المصدر: nof1ص>
<سبان ليف = "">والأهم من ذلك أن كل قرار يتخذونه سيغير البيئة التجريبية. الشراء سيدفع السعر للأعلى، والبيع سيدفع السعر للأسفل.قد ينقذ وقف الخسارة حياتك، أو قد يفوتك الارتداد.السوق سائل، وكل خطوة تشكل الخطوة التالية.ص>
<سبان ليف = "">ما تريد هذه التجربة الإجابة عليه هو سؤال أكثر جوهرية، وهو ما إذا كان الذكاء الاصطناعي يفهم المخاطر حقًا.ص>
<سبان ليف = "">في الاختبارات الثابتة، يمكن الاعتماد على الذاكرة ومطابقة الأنماط للاقتراب بشكل لا نهائي من “الإجابة الصحيحة”؛ ولكن في السوق الحقيقية حيث لا توجد إجابة موحدة ومليئة بالضوضاء وردود الفعل، إلى متى يمكن أن يستمر “ذكاؤها” عندما يتعين عليها التصرف في حالة من عدم اليقين؟ص>
<ب><سبان ليف = "">السوق يعلم الذكاء الاصطناعي درساب>
<سبان ليف = "">كان تقدم اللعبة أكثر دراماتيكية مما كان يتصور.ص>
<سبان ليف = "">في منتصف شهر أكتوبر، كان سوق العملات المشفرة متقلبًا للغاية، حيث كان سعر البيتكوين يقفز صعودًا وهبوطًا يوميًا تقريبًا.في هذه البيئة، بدأت ستة نماذج من الذكاء الاصطناعي أول تداول حقيقي لها.ص>
ص>
اتجاه سعر البيتكوين خلال المنافسة |المصدر: TradingViewص>
<سبان ليف = "">بحلول 28 أكتوبر، في منتصف البطولة، تم الإعلان عن تصنيفات منتصف المدة. ارتفعت قيمة حساب DeepSeek إلى 22500 دولار، مع عائد 125٪. بمعنى آخر، تضاعفت أموالها في 11 يومًا فقط.ص>
<سبان ليف = "">وحذت شركة “كوين” التابعة لشركة “علي بابا” حذوها، حيث تجاوزت عائداتها 100%.وحتى كلود وجروك، اللذان هُزما لاحقًا، ظلا يحتفظان بأرباح بلغت 24% و13% في ذلك الوقت.ص>
<سبان ليف = "">وسرعان ما انتشرت وسائل التواصل الاجتماعي.بدأ بعض الأشخاص في مناقشة ما إذا كان ينبغي عليهم تسليم محافظهم الاستثمارية إلى إدارة الذكاء الاصطناعي، وقال بعض الأشخاص مازحين إن الذكاء الاصطناعي ربما وجد بالفعل رمز تداول من المؤكد أنه سيحقق المال دون خسارة المال.ص>
<سبان ليف = "">ومع ذلك، سرعان ما أصبحت قسوة السوق واضحة.ص>
<سبان ليف = "">مع دخولها في أوائل نوفمبر، كانت عملة البيتكوين تحوم بالقرب من 110.000 دولار، مع تضخم التقلبات بشكل حاد.تلك النماذج التي زادت رهاناتها على طول الطريق خلال الاتجاه الصعودي تعرضت لخسائر فادحة عندما تحول السوق.ص>
<سبان ليف = "">وفي النهاية، تمكن نموذجان فقط من الصين من الحفاظ على الأرباح، وكان أداء المعسكر الأمريكي هزيمة.أتاحت لنا هذه اللعبة المتقلبة أن نرى بوضوح ولأول مرة أن أنظمة الذكاء الاصطناعي التي اعتقدنا أنها متقدمة بفارق كبير لم تكن ذكية بالقدر الذي كنا نتصوره في السوق الحقيقية.ص>
<ب><سبان ليف = "">تقسيم استراتيجيات التداولب>
<سبان ليف = "">ومن خلال بيانات المعاملة، يمكن رؤية “شخصية” كل ذكاء اصطناعي.ص>
<سبان ليف = "">تم تداول كوين 43 مرة فقط خلال 17 يومًا، بمتوسط أقل من ثلاث مرات يوميًا، وكان الأكثر تحفظًا بين جميع اللاعبين.معدل فوزها ليس رائعًا، لكن نسبة الربح إلى الخسارة لكل لقطة مرتفعة للغاية، حيث يصل الحد الأقصى للربح في معاملة واحدة إلى 8,176 دولارًا.ص>
<سبان ليف = "">بمعنى آخر، كوين ليس “الأكثر دقة في التنبؤات”، بل “الأكثر انضباطًا في الرهان”.إنه يتصرف فقط عندما يكون متأكدًا ويختار أن يظل ثابتًا عندما يكون غير مؤكد.أتاحت هذه الإستراتيجية عالية الجودة للإشارة حصولها على ارتدادات محدودة أثناء تصحيحات السوق والحفاظ في النهاية على ثمار النصر.ص>
<سبان ليف = "">كان لدى DeepSeek عدد مماثل من التحركات مثل Qwen، مع 41 فقط في 17 يومًا، لكنه تصرف كمدير صندوق حذر.لديها أعلى نسبة شارب بين جميع اللاعبين، حيث تصل إلى 0.359، وهو رقم نادر جدًا بالفعل في سوق العملات المشفرة شديد التقلب.ص>
<سبان ليف = "">في الأسواق المالية التقليدية، عادة ما تستخدم نسبة شارب لقياس العائدات المعدلة حسب المخاطر. كلما ارتفعت القيمة، أصبحت الإستراتيجية أكثر قوة.ولكن في مثل هذه الدورة القصيرة وهذا السوق العنيف، فإن أي نموذج يمكنه الحفاظ على قيمة إيجابية ليس بالأمر السهل.تظهر نتائج DeepSeek أنها لا تسعى إلى تعظيم العائدات، ولكنها تسعى جاهدة للحفاظ على التوازن في بيئة عالية الضوضاء.ص>
<سبان ليف = "">خلال المباراة بأكملها، حافظ دائمًا على الإيقاع ولم يطارد الزيادة أو يتحرك بشكل أعمى.وهو أشبه بالمتداول الذي يتبع نظامًا صارمًا، فهو يفضل التخلي عن الفرص بدلاً من السماح للعواطف بالسيطرة على عملية صنع القرار.ص>
<سبان ليف = "">وفي المقابل، يكشف أداء معسكر الذكاء الاصطناعي الأمريكي عن مشاكل واضحة في السيطرة على المخاطر.ص>
<سبان ليف = "">قدم فريق Gemini من Google إجمالي 238 طلبًا خلال 17 يومًا، أي بمعدل أكثر من 13 مرة يوميًا، وهو الأكثر تكرارًا بين جميع اللاعبين.كما جلبت مثل هذه المعاملات عالية التكرار تكاليف باهظة، حيث بلغت رسوم المناولة وحدها 1331 دولارًا أمريكيًا، وهو ما يمثل 13٪ من أصل المبلغ الأولي.في البطولة التي يبلغ رأس مالها المبدئي 10000 دولار فقط، يعد هذا بمثابة استنزاف كبير لك.ص>
<سبان ليف = "">والأسوأ من ذلك هو أن هذا التداول المتكرر لا يحقق إيرادات إضافية.يستمر الجوزاء في المحاولة وارتكاب الأخطاء، وإيقاف الخسائر، والمحاولة مرارًا وتكرارًا، مثل مستثمر التجزئة المهووس بمراقبة السوق، والذي يقوده ضجيج السوق.كل تقلب طفيف في الأسعار سيؤدي إلى تفعيل أمر التداول الخاص به.فهو يتفاعل بسرعة كبيرة مع التقلبات ويدرك المخاطر ببطء شديد.ص>
<سبان ليف = "">في التمويل السلوكي، هذا الاختلال في التوازن له اسم: الثقة المفرطة.يبالغ المتداولون في تقدير قدراتهم على التنبؤ ولكنهم يتجاهلون تراكم عدم اليقين والتكاليف.إن فشل الجوزاء هو نتيجة نموذجية لهذه الثقة العمياء.ص>
<سبان ليف = "">أداء GPT-5 مخيب للآمال للغاية.لم يتم أخذ العديد من الجرعات، 116 في 17 يومًا، لكن لم يكن هناك سوى القليل من السيطرة على المخاطر.وبلغت أكبر خسارة منفردة 622 دولارًا أمريكيًا، في حين بلغ أكبر ربح 271 دولارًا أمريكيًا فقط.كانت نسبة الربح إلى الخسارة غير متوازنة بشكل خطير. إنه مثل مقامر مدفوع بالثقة.يمكنه الفوز في بعض الأحيان عندما يسير السوق بشكل جيد، ولكن بمجرد انعكاس السوق، ستتضاعف الخسائر.ص>
<سبان ليف = "">لديها نسبة شارب تبلغ -0.525، مما يعني أنها لم تتحمل أي مخاطرة مقابل أي مكافأة.وفي مجال الاستثمار، هذه النتيجة تكاد تعادل عبارة “من الأفضل عدم العمل”.ص>
<سبان ليف = "">تثبت هذه التجربة مرة أخرى أن ما يحدد النصر أو الهزيمة ليس دقة تنبؤات النموذج، بل كيفية تعامله مع عدم اليقين.إن انتصار Qwen و DeepSeek هو في الأساس انتصار للسيطرة على المخاطر.يبدو أنهم يفهمون بشكل أفضل أنه في السوق، فقط من خلال البقاء على قيد الحياة أولاً يمكن اعتبارك ذكيًا.ص>
<ب><سبان ليف = "">السوق الحقيقي هو مرآة الذكاء الاصطناعيب>
<سبان ليف = "">تعتبر نتائج Alpha Arena بمثابة استهزاء كبير بنظام تقييم الذكاء الاصطناعي الحالي.تلك “النماذج الذكية” التي تُصنف من بين الأفضل في الاختبارات المعيارية مثل MMLU تفقد قوتها عندما تصل إلى السوق الحقيقية.ص>
<سبان ليف = "">هذه النماذج هي أساتذة لغة مكدسة من نصوص لا تعد ولا تحصى. يمكنهم توليد إجابات بمنطق صارم وقواعد نحوية مثالية، لكنهم قد لا يفهمون الواقع الذي تشير إليه تلك النصوص حقًا.ص>
<سبان ليف = "">يمكن للذكاء الاصطناعي أن يكتب ورقة بحثية عن إدارة المخاطر في بضع ثوانٍ، مع الاستشهادات المناسبة والتفكير الكامل؛ ويمكنه أيضًا أن يوضح بدقة نسبة شارب والحد الأقصى للسحب والقيمة المعرضة للخطر.ولكن عندما يحتفظ بالمال فعليًا، يمكنه اتخاذ القرارات الأكثر خطورة.لأنه فقط “يعرف” ولا “يفهم”.ص>
<سبان ليف = "">المعرفة والفهم شيئان مختلفان.ص>
<سبان ليف = "">هناك فرق كبير بين القدرة على قول ذلك والقدرة على القيام به.ص>
<سبان ليف = "">وتسمى هذه الفجوة بالمشكلة المعرفية في الفلسفة. لقد ميز أفلاطون ذات مرة بين المعرفة والإيمان الحقيقي.المعرفة ليست مجرد معلومات صحيحة، ولكنها أيضًا فهم لسبب صحتها.ص>
<سبان ليف = "">قد تحتوي نماذج اللغات الكبيرة اليوم على الكثير من “المعلومات الصحيحة”، لكنها لا تملك هذا النوع من الفهم.يمكنها أن تخبرك بأهمية إدارة المخاطر، لكنها لا تعرف كيف يتعلم البشر هذه الأهمية من الخوف والخسارة.ص>
<سبان ليف = "">السوق الحقيقي هو المكان الأمثل لاختبار فهمك. لن يكون متساهلاً لمجرد أنك GPT-5.سيتم إرجاع كل قرار خاطئ على الفور إلى الحساب في شكل خسارة أموال.ص>
<سبان ليف = "">في المختبر، يمكن تكرار الذكاء الاصطناعي مرات لا حصر لها، وتعديل المعلمات باستمرار والاختبار الخلفي حتى يجد ما يسمى “الإجابة الصحيحة”.لكن في السوق كل خطأ يعني خسارة أموال حقيقية، ولا رجعة عن هذه الخسارة.ص>
<سبان ليف = "">كما أن منطق السوق أكثر تعقيدًا بكثير مما يتصوره النموذج. عندما يتم فقدان رأس المال بنسبة 50%، يلزم عائد بنسبة 100% للعودة إلى نقطة البداية؛عندما تتسع الخسارة إلى 62.66%، فإن العائد المطلوب لإرجاع رأس المال سيرتفع إلى 168%. هذا الخطر غير الخطي يضاعف تكلفة الأخطاء.يمكن للذكاء الاصطناعي أن يقلل الخسائر من خلال الخوارزميات أثناء التدريب، لكنه لا يستطيع أن يفهم حقًا آلية عقاب السوق التي يتشكلها الخوف والتردد والجشع.ص>
<سبان ليف = "">ولهذا السبب أصبح السوق مرآة لاختبار صحة الذكاء. فهو يسمح للأشخاص والآلات برؤية ما يعرفونه حقًا وما يخشونه حقًا.ص>
<سبان ليف = "">كما تجعل هذه اللعبة الناس يعيدون التفكير في الاختلافات في أفكار البحث والتطوير في مجال الذكاء الاصطناعي بين الصين والولايات المتحدة.ص>
<سبان ليف = "">لا تزال العديد من الشركات الرئيسية في الولايات المتحدة تلتزم بالطريق النموذجي المشترك، على أمل بناء أنظمة يمكنها إظهار قدرات مستقرة في مجموعة واسعة من المهام.تنتمي نماذج OpenAI وGoogle وAnthropic جميعها إلى هذا النوع. هدفهم هو متابعة الاتساع والاتساق، بحيث يتمتع النموذج بقدرات الفهم والاستدلال عبر المجالات.ص>
<سبان ليف = "">يفضل الفريق الصيني النظر في آلية التنفيذ والتغذية الراجعة لسيناريوهات محددة في المراحل الأولى من تطوير النموذج.على الرغم من أن Qwen التابع لـ Alibaba يعد أيضًا نموذجًا كبيرًا للأغراض العامة، فقد تم ربط بيئة التدريب والاختبار الخاصة به بنظام الأعمال الفعلي في وقت سابق.إن إعادة تدفق البيانات من السيناريوهات الحقيقية قد يجعل النموذج أكثر حساسية للمخاطر والقيود بشكل غير مرئي.ويظهر أداء DeepSeek خصائص مماثلة، حيث يبدو أنه قادر على تصحيح القرارات بشكل أسرع في البيئات الديناميكية.ص>
<سبان ليف = "">هذه ليست مسألة “من يفوز ومن يخسر”.توفر هذه التجربة نافذة على كيفية أداء فلسفات التدريب المختلفة في العالم الحقيقي.تؤكد النماذج ذات الأغراض العامة على العالمية، ولكنها عرضة لعدم الاستجابة في البيئات القاسية؛ في حين أن تلك النماذج التي تعرضت لردود فعل حقيقية في وقت سابق قد تبدو أكثر مرونة واستقرارًا في الأنظمة المعقدة.ص>
<سبان ليف = "">وبطبيعة الحال، قد لا تمثل نتائج مباراة واحدة القوة الإجمالية للذكاء الاصطناعي الصيني والأمريكي. دورة التداول التي تبلغ سبعة عشر يومًا قصيرة جدًا، ومن الصعب استبعاد تأثير الحظ؛إذا تم تمديد الوقت، قد يكون الاتجاه مختلفا تماما.علاوة على ذلك، فإن هذا الاختبار يتضمن فقط تداول العقود الدائمة للعملات المشفرة، وهو ما لا يمكن استقراءه لجميع الأسواق المالية، كما أنه لا يكفي لتعميم أداء الذكاء الاصطناعي في مجالات أخرى.ص>
<سبان ليف = "">لكن هذا يكفي لجعل المرء يعيد التفكير في ما يشكل القدرة الحقيقية.عندما يتم وضع الذكاء الاصطناعي في بيئة حقيقية ويحتاج إلى اتخاذ قرارات وسط المخاطر والشكوك، فإن ما نراه ليس فقط نجاح أو فشل الخوارزمية، ولكن أيضًا الاختلاف في المسارات.وعلى مسار تحويل تكنولوجيا الذكاء الاصطناعي إلى إنتاجية فعلية، أخذ النموذج الصيني زمام المبادرة بالفعل في مجالات محددة معينة.ص>
<سبان ليف = "">وفي لحظة انتهاء اللعبة، تم إغلاق آخر مركز بيتكوين خاص بـ Qwen، مما ترك رصيد حسابه عند 12,232 دولارًا.لقد فاز، لكنه لم يكن يعلم أنه فاز.إن المكاسب البالغة 22.32% لا تعني شيئًا بالنسبة لها، إنها مجرد أمر تنفيذ آخر.ص>
<سبان ليف = "">في وادي السيليكون، ربما لا يزال المهندسون يحتفلون بتحسن آخر بنسبة 0.1% في نتيجة MMLU الخاصة بـ GPT-5.على الجانب الآخر من العالم، أثبت الذكاء الاصطناعي من الصين للتو بأبسط طريقة في كازينو أموال حقيقية أن الذكاء الاصطناعي الجيد فقط هو الذي يمكنه كسب المال.ص>
<سبان ليف = "">أعلن Nof1.ai أن الموسم القادم من المنافسة على وشك البدء. وستكون الدورة أطول، وسيكون هناك عدد أكبر من المشاركين، وستكون بيئة السوق أكثر تعقيدًا.هل ستتعلم العارضات اللواتي فشلن في الموسم الأول شيئاً من خسارتهن؟أم أن المصير نفسه سيتكرر مع تقلبات أكبر؟ص>
<سبان ليف = "">لا أحد يعرف الجواب.ولكن الأمر المؤكد هو أنه عندما يبدأ الذكاء الاصطناعي في الخروج من البرج العاجي وإثبات نفسه بأموال حقيقية، فإن كل شيء سيكون مختلفًا.ص>






