Site icon السعودية برس

تقوم هذه الشركات الناشئة ببناء نماذج AI المتقدمة بدون مراكز بيانات

لقد تدرب الباحثون نوع جديد من نموذج اللغة الكبير (LLM) يستخدم وحدات معالجة الرسومات المنتشرة في جميع أنحاء العالم وتغذي البيانات الخاصة وكذلك البيانات العامة – وهي خطوة تشير إلى أن الطريقة السائدة لبناء الذكاء الاصطناعي يمكن تعطيلها.

عملت Flower AI و VANA ، وهما شركات ناشئة تتبع مقاربات غير تقليدية لبناء الذكاء الاصطناعى ، عملت معًا لإنشاء النموذج الجديد ، يسمى Collective-1.

أنشأت الأزهار التقنيات التي تسمح بنشر التدريب عبر مئات أجهزة الكمبيوتر المتصلة عبر الإنترنت. يتم استخدام تقنية الشركة بالفعل من قبل بعض الشركات لتدريب نماذج الذكاء الاصطناعي دون الحاجة إلى تجميع الموارد أو البيانات. قدمت VANA مصادر للبيانات بما في ذلك الرسائل الخاصة من X و Reddit و Telegram.

تعد Collective-1 صغيرة وفقًا للمعايير الحديثة ، مع 7 مليارات من المعلمات-القيمة التي تجمع بين إعطاء النموذج قدراته-تتمثل في مئات المليارات في النماذج الأكثر تقدماً اليوم ، مثل تلك التي برامج الطاقة مثل ChatGpt و Claude و Gemini.

يقول نيك لين ، عالم الكمبيوتر بجامعة كامبريدج ومؤسس شركة Flower AI ، إن النهج الموزع يعد بتوسيع نطاق حجم الجماعي -1. يضيف Lane أن Flower AI جزء من ذلك من خلال تدريب نموذج يحتوي على 30 مليار معلمة باستخدام البيانات التقليدية ، ويخطط لتدريب نموذج آخر يحتوي على 100 مليار معلمة – إلى الحجم الذي يقدمه قادة الصناعة – هذا العام. يقول لين: “يمكن أن يغير ذلك حقًا الطريقة التي يفكر بها الجميع في الذكاء الاصطناعي ، لذلك نحن نطارد هذا الأمر الصعب للغاية”. يقول إن بدء التشغيل يدمج أيضًا الصور والصوت في التدريب لإنشاء نماذج متعددة الوسائط.

يمكن لبناء النماذج الموزعة أيضًا أن يزعج ديناميات الطاقة التي شكلت صناعة الذكاء الاصطناعي.

تقوم شركات الذكاء الاصطناعى حاليًا بإنشاء نماذجها من خلال الجمع بين كميات هائلة من بيانات التدريب وكميات هائلة من المراكز المركزة داخل المراكز المحلية مع وحدات معالجة الرسومات المتقدمة التي يتم توصيلها معًا باستخدام كابلات الألياف البصرية فائقة السرعة. كما أنها تعتمد اعتمادًا كبيرًا على مجموعات البيانات التي تم إنشاؤها عن طريق تجريف للوصول علنًا – على الرغم من أنه في بعض الأحيان محفوظ بحقوق الطبع والنشر – بما في ذلك المواقع الإلكترونية والكتب.

يعني النهج أن أغنى الشركات ، والأمم التي لديها إمكانية الوصول إلى كميات كبيرة من أقوى الرقائق ، يمكنها تطوير النماذج الأقوى والقيمة. حتى النماذج المفتوحة المصدر ، مثل LLAMA's Meta و R1 من Deepseek ، تم تصميمها من قبل الشركات التي لديها إمكانية الوصول إلى مراكز البيانات الكبيرة. يمكن أن تتيح الأساليب الموزعة أن تمكن الشركات والجامعات الأصغر من بناء الذكاء الاصطناعي المتقدم من خلال تجميع الموارد المتباينة معًا. أو يمكن أن تسمح للبلدان التي تفتقر إلى البنية التحتية التقليدية للتواصل مع العديد من المراكز الخاصة ببناء نموذج أكثر قوة.

يعتقد لين أن صناعة الذكاء الاصطناعى ستتطلع بشكل متزايد إلى طرق جديدة تسمح للتدريب بالخروج من مراكز البيانات الفردية. يقول: “يسمح لك النهج الموزع بتوسيع نطاق حساب أكثر أناقة من نموذج مركز البيانات”.

تقول هيلين تونر ، الخبيرة في حوكمة الذكاء الاصطناعي في مركز الأمن والتكنولوجيا الناشئة ، إن نهج Flower AI “مثير للاهتمام وربما وثيق الصلة” بمنافسة وحكم الذكاء الاصطناعي. يقول تونر: “من المحتمل أن يستمر ذلك في النضال من أجل مواكبة الحدود ، ولكن قد يكون نهجًا مثيرًا للاهتمام”.

تقسيم وقهر

يتضمن تدريب الذكاء الاصطناعي الموزعة إعادة التفكير في طريقة تقسيم الحسابات المستخدمة لبناء أنظمة AI قوية. يتضمن إنشاء LLM تغذية كميات هائلة من النص في نموذج يقوم بضبط معلماته من أجل إنتاج استجابات مفيدة لمطالبة. داخل مركز البيانات ، يتم تقسيم عملية التدريب بحيث يمكن تشغيل الأجزاء على وحدات معالجة الرسومات المختلفة ، ثم يتم دمجها بشكل دوري إلى نموذج رئيسي واحد.

يسمح النهج الجديد للعمل عادةً داخل مركز بيانات كبير على الأجهزة التي قد تبعد عدة أميال وتوصيلها عبر اتصال إنترنت بطيء نسبيًا أو متغيرًا.

Exit mobile version