الذهاب إلى الإنترنت المملوكة للمستخدمين

  • jakirojakiro
  • DAO
  • سبتمبر 19, 2024
  • 0 تعليق

في عام 2022 ، كتبت أنا (Anna) اقتراحًا لاقتراح نموذج أساسي مملوك للمستخدمين المدربين على استخدام البيانات الخاصة بدلاً من الزحف علنًا من الإنترنت.أعتقد أنه على الرغم من أنه من الممكن تدريب النماذج الأساسية باستخدام البيانات العامة (مثل ويكيبيديا ، 4Chan) ، لنقلها إلى المستوى التالي ، إلا أنك تحتاج إلى بيانات خاصة عالية الجودة موجودة فقط في ما تحتاجه الأذونات أو تسجيل الدخول للوصول إلى المعزولة المنصات (مثل Twitter ، الرسائل الشخصية ، معلومات الشركة).

هذا التنبؤ بدأ يدخل حيز التنفيذ.أدركت شركات مثل Reddit و Twitter قيمة بيانات المنصات الخاصة بهم ، لذلك تم حبسها في API للمطور (1 ، 2) لمنع الشركات الأخرى من استخدام بيانات النص الخاصة بهم لتدريب النموذج الأساسي.

لقد تغير هذا بشكل كبير مقارنة مع عامين.لخصت Sam Lessin الرأسمالية الاستثمارية التغيير: “[المنصة] فقط ترمي هذه القمامة خلفها ، لا أحد يعتني بها ، ثم فجأة ، أنت مثل ، اللعنة ، أن القمامة هي الذهب ، أليس كذلك؟ لقد حصلنا عليه كثيرًا.لم يعد هذا ممكنًا بعد استخدام واجهة برمجة تطبيقات Reddit الجديدة.

أصبح الإنترنت غير مفتوح بشكل متزايد ، وتبني المنصات المعزولة جدران أكبر لحماية بيانات التدريب القيمة.

على الرغم من أنه لم يعد بإمكان المطورين الوصول إلى هذه البيانات على نطاق واسع ، إلا أنه لا يزال بإمكان الأفراد الوصول إلى بياناتهم الخاصة وتصديرها عبر الأنظمة الأساسية بسبب لوائح خصوصية البيانات (5 ، 6).حقيقة أن النظام الأساسي يحبس واجهة برمجة تطبيقات المطورين ، في حين أن المستخدمين الأفراد لا يزالون يمكنهم الوصول إلى بياناتهم الخاصة يوفر فرصة: هل يمكن 100 مليون مستخدم تصدير بيانات النظام الأساسي الخاص بهم لإنشاء أكبر دار للكنز في العالم؟سيؤدي هذا البيت الكنز للبيانات إلى تجميع جميع بيانات المستخدم التي تم جمعها من قبل شركات التكنولوجيا الكبيرة والشركات الأخرى التي غالباً ما تكون مترددة في المشاركة.ستكون هذه أكبر مجموعة بيانات تدريب وأكثرها شمولاً حتى الآن ، أكبر 100 مرة من مجموعة البيانات المستخدمة لتدريب النماذج الأساسية الرائدة اليوم.1

الجدول 1. البيانات

تقدير تقريبي لمقارنة مجموعة بيانات تدريب النماذج الأساسية مع مجموعة بيانات مستخدم عينة.المصدر والحساب.

يمكن للمستخدم بعد ذلك إنشاء نموذج أساسي يتمتع به المستخدم ، والذي يستخدم بيانات أكثر من أي شركة يمكنها تجميعها.يتطلب تدريب النموذج الأساسي الكثير من حسابات GPU.ولكن يمكن لكل مستخدم استخدام أجهزته الخاصة للمساعدة في تدريب جزء صغير من النموذج ، ثم دمج هذه الأجزاء معًا لإنشاء نموذج أكبر وأكثر قوة (7 ، 8 ، 9).2 عندما تكون الحوافز مناسبة ، يمكن للمستخدمين جمع عدد كبير من الحسابات.على سبيل المثال ، يبلغ إجمالي كمية حساب عمال المناجم Ethereum أكثر من 50 مرة من استخدامها لتدريب النماذج الأساسية الرائدة.

الجدول 2. الحساب

إجمالي عدد عمليات الفاصلة العائمة (تعويم في الثانية = مجموع سرعات “التفكير”) لمركز البيانات المستخدم لتدريب النموذج الأساسي مقارنة بوحدة معالجة الرسومات Ethereum Miner.3 مع مصدر الحساب.

سوف يمتلك المستخدمون الذين يساهمون في النموذج بشكل جماعي ويدير النموذج.يمكن دفعها عند استخدام النموذج ، وحتى استنادًا إلى مقدار بياناتها التي تحسن النموذج.يمكن للتجمعات وضع قواعد للاستخدام ، بما في ذلك من يمكنه الوصول إلى النموذج وعناصر التحكم التي يجب تنفيذها.ربما يقوم المستخدمون في كل بلد بإنشاء نماذج خاصة بهم تمثل أيديولوجيتهم وثقافتهم.أو ربما لا يكون البلد هو الخط الصحيح ، وسنرى عالمًا يكون فيه كل بلد شبكة لديه نموذج أساسي خاص به بناءً على بيانات الأعضاء.

أشجعك على قضاء الوقت في التفكير في أي جزء من النموذج الأساسي الذي تريد الحصول عليه وما هي بيانات التدريب التي يمكنك المساهمة بها من النظام الأساسي الذي تستخدمه.قد يكون لديك بيانات أكثر مما تدرك – أوراق البحث الخاصة بك ، والأعمال الفنية غير المنشورة ، ووثائق Google الخاصة بك ، وملفك الشخصي المواعدة ، وسجلاتك الطبية ، ورسائل الركود الخاصة بك.تتمثل إحدى طرق الجمع بين هذه البيانات معًا من خلال خادم شخصي ، مما يتيح لك استخدام بياناتك الخاصة بسهولة مع LLM المحلي.في المستقبل ، يمكن لخادمك الشخصي أيضًا تدريب جزء من نموذج قاعدة المستخدمين لديك.

تميل النماذج الأساسية إلى الاحتكار لأنها تتطلب استثمارًا كبيرًا في البيانات والحوسبة.من السهل اختيار الخيار البسيط: استخدم النموذج المفتوح المصدر الذي يتخلف عن الأجيال ، وبقايا شركات الذكاء الاصطناعى الكبيرة ، قدر الإمكان.لكن لا ينبغي أن نكون راضين عن التغلب على الأجيال وتناول الطعام فقط!كمستخدمين ، يجب أن ننشئ أفضل طراز خاص بنا – لدينا البيانات والحوسبة لتحقيق ذلك.

نظرًا لأن الذكاء الاصطناعي قادر بشكل متزايد على إكمال العمل الاقتصادي القيمة ، فإن هناك تحول اقتصادي كبير.قامت شركات التكنولوجيا الكبيرة بتدريب نماذج الذكاء الاصطناعى بناءً على عملك العام ، والكتابة ، والصور الفنية ، والصور وغيرها من البيانات ، وغيرها ، وتبدأ في صنع مليارات الدولارات سنويًا (1).إنهم يطاردون الآن البيانات التي لا يمكنك الحصول عليها على الإنترنت العام ، وشراء بياناتك الخاصة من شركات مثل Reddit حتى يتمكنوا من زيادة إيرادات الذكاء الاصطناعي إلى تريليونات الدولارات سنويًا (2 ، 3).

ألا يجب أن يكون لديك جزء من نموذج الذكاء الاصطناعي الذي تم إنشاؤه بواسطة مساعدة البيانات الخاصة بك؟

هذا هو المكان الذي تعمل فيه البيانات DAO.Data DAO هي كيان لامركزي يتيح للمستخدمين تجميع وإدارة بياناتهم ومكافأة المساهمين مع الرموز المحددة التي تمثل ملكية مجموعة بيانات معينة.إنه نوع من اتحاد البيانات.يمكن أن تكرر مجموعات البيانات هذه أو حتى تجاوز مجموعات البيانات التي تباعها شركات التكنولوجيا الكبيرة لمئات الملايين من الدولارات (4).يتمتع DAO بالتحكم الكامل في مجموعة البيانات ولديه خيار استئجار أو بيع نسخ مجهولة.على سبيل المثال ، يمكن استخدام بيانات Reddit لزرع منصات جديدة مملوكة للمستخدمين ، بما في ذلك الأصدقاء ، ومشاركاتك السابقة وغيرها من البيانات التي يمكن استخدامها في أي وقت على النظام الأساسي الجديد.

إذا كنت مهتمًا بالتفاصيل الفنية: لدى DAIT مكونان رئيسيان: 1) الحوكمة على السلسلة ، والحصول على الرموز من خلال مساهمات البيانات ؛ .للمساهمة ، تحتاج أولاً إلى التحقق من البيانات لإثبات الملكية وتقدير قيمتها.بعد ذلك ، استخدم المفتاح العام للخادم لتشفير البيانات في المتصفح وتخزين البيانات المشفرة في السحابة.يتم فك تشفير البيانات فقط عندما يوافق DAO على الاقتراح لمنح الوصول.على سبيل المثال ، يمكن أن تسمح لشركات الذكاء الاصطناعى باستئجار البيانات لتدريب النماذج.يمكنك قراءة المزيد حول بنية شبكة VANA هنا ، والتي تهدف إلى تنفيذ الملكية الجماعية لمجموعات البيانات والنماذج.

لا تفيد DAO DAO المستخدمين فحسب ، بل تدفع أيضًا تطوير الذكاء الاصطناعي ، مما يجعل من الممكن بناء AI مثل البرامج المفتوحة المصدر ، ويفيد كل من يساهم.تكافح Open Source AI للعثور على نماذج أعمال قابلة للحياة: من المكلف للغاية دفع وحدات معالجة الرسومات والبيانات والباحثين.وبمجرد تدريب النموذج ، إذا كان مفتوح المصدر ، فلا يمكن استرداد هذه التكاليف.يمكن تطبيق البنية الفنية للبيانات DAO على النموذج DAO ، حيث يمكن للمستخدمين والمطورين المساهمة بالبيانات والحسابات والبحث في مقابل ملكية النموذج.

يتمثل الخيار الافتراضي في مجتمع اليوم في السماح لشركات التكنولوجيا الكبيرة بالحصول على بياناتنا واستخدامها لتدريب نماذج الذكاء الاصطناعى التي تعمل معنا.إنها تستفيد من نماذج الذكاء الاصطناعى هذه لأننا يتم استبدالنا بنماذج مدربة ببياناتنا.هذه صفقة سيئة للغاية للمجتمع ، ولكنها شيء جيد لشركات التكنولوجيا الكبرى.الطريقة الوحيدة لمنع حدوث ذلك هي اتخاذ إجراء جماعي.البيانات هي العملة ، والبيانات الجماعية هي قوة.أشجعك على المشاركة: أول بيانات في العالم تركز على Reddit Data DAO على الإنترنت اليوم على شبكة VANA.من خلال كسر البيانات التي تتحكم فيها الخندق من قبل الأقلية المميزة ، فتحت Data DAO طريقًا إلى الإنترنت المملوكة للمستخدمين الحقيقيين.

  • Related Posts

    69 اتجاه في تصميم DAO في عام 2025

    مقدمة المترجم تتصاعد المنظمات المستقلة اللامركزية (DAOS) بسرعة وتصبح قوة رئيسية في إعادة تشكيل الحوكمة العالمية وتخصيص الموارد ، وتشكل نماذج التفكير والتصميم أكثر وأكثر ابتكارًا مستقبل DAOs.هذه المقالة هي…

    من DAO إلى الهجين DAO: كيف يحكم البشر و AI بشكل مشترك؟

    المؤلف: Davide Crapis المصدر: ترجمة فكرة: شان أوبا ، رؤية Baitchain يمكن إرجاع أصول المنظمة المستقلة اللامركزية (DAO) إلى الأفكار الرئيسية قبل ولادة Ethereum.في عام 1996 ، اقترح Nick Szabo…

    اترك تعليقاً

    لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

    You Missed

    من النسخ المتماثل التقليدي إلى الابتكار ، هل يمكن أن تستحوذ حقيبة الظهر على المستقبل؟

    • من jakiro
    • مارس 26, 2025
    • 10 views
    من النسخ المتماثل التقليدي إلى الابتكار ، هل يمكن أن تستحوذ حقيبة الظهر على المستقبل؟

    استراتيجية سايلور البالغة 200 تريليون دولار: الهيمنة والخلود في الولايات المتحدة BTC

    • من jakiro
    • مارس 26, 2025
    • 10 views
    استراتيجية سايلور البالغة 200 تريليون دولار: الهيمنة والخلود في الولايات المتحدة BTC

    تم شرح ترقيتي Ethereum الرئيسية إلى Pectra و Fusaka بالتفصيل. ماذا سيتم إحضاره إلى ETH؟

    • من jakiro
    • مارس 26, 2025
    • 13 views
    تم شرح ترقيتي Ethereum الرئيسية إلى Pectra و Fusaka بالتفصيل. ماذا سيتم إحضاره إلى ETH؟

    Coingecko: كيف ينظر المستثمرون إلى إمكانات تقنية Crypto AI؟

    • من jakiro
    • مارس 26, 2025
    • 10 views
    Coingecko: كيف ينظر المستثمرون إلى إمكانات تقنية Crypto AI؟

    Galaxy: بحث عن الوضع الحالي لنظام حوكمة المستقبل وسوق التنبؤ على السلسلة

    • من jakiro
    • مارس 26, 2025
    • 10 views
    Galaxy: بحث عن الوضع الحالي لنظام حوكمة المستقبل وسوق التنبؤ على السلسلة

    آخر التحديثات من ETH و Solana: ما هي الأشياء التي يجب الانتباه إليها؟

    • من jakiro
    • مارس 25, 2025
    • 10 views
    آخر التحديثات من ETH و Solana: ما هي الأشياء التي يجب الانتباه إليها؟
    Home
    News
    School
    Search