ابق على اطلاع بالتحديثات المجانية

وتعمل شركات الذكاء الاصطناعي الصينية على خفض التكاليف لإنشاء نماذج تنافسية، في ظل مواجهتها للقيود الأميركية على الرقائق وميزانياتها الأصغر من نظيراتها الغربية.

ونجحت الشركات الناشئة مثل 01.ai وDeepSeek في خفض الأسعار من خلال تبني استراتيجيات مثل التركيز على مجموعات بيانات أصغر لتدريب نماذج الذكاء الاصطناعي وتوظيف مهندسي كمبيوتر رخيصين ولكن ماهرين.

كما انخرطت مجموعات التكنولوجيا الأكبر مثل Alibaba وBaidu وByteDance في حرب تسعير لخفض تكاليف “الاستدلال”، وهو ثمن استدعاء نماذج لغوية كبيرة لتوليد الاستجابة، بنسبة تزيد على 90 في المائة وبنسبة ضئيلة من تلك المقدمة. من قبل نظرائهم الأمريكيين.

هذا على الرغم من اضطرار الشركات الصينية إلى التغلب على الحظر الذي فرضته واشنطن على صادرات رقائق Nvidia AI المتطورة، والتي يُنظر إليها على أنها ضرورية لتطوير أحدث النماذج في الولايات المتحدة.

وقالت شركة 01.ai ومقرها بكين، بقيادة لي كاي فو، الرئيس السابق لشركة جوجل في الصين، إنها خفضت تكاليف الاستدلال من خلال بناء نموذج تم تدريبه على كميات أصغر من البيانات التي تتطلب قوة حاسوبية أقل وتحسين أجهزتها.

وقال لي لصحيفة فاينانشيال تايمز: “إن قوة الصين تكمن في صنع محركات استدلال بأسعار معقولة، ثم السماح للتطبيقات بالانتشار”.

هذا الأسبوع، جاء نموذج Yi-Lightning الخاص بشركة 01.ai في المركز الثالث بين شركات LLM جنبًا إلى جنب مع Grok-2 من شركة x.AI، ولكن خلف OpenAI وGoogle في تصنيف أصدره باحثون في جامعة كاليفورنيا في بيركلي سكاي لاب وLMSYS.

تعتمد التقييمات على المستخدمين الذين يسجلون إجابات نماذج مختلفة على الاستعلامات. كما تسللت شركات صينية أخرى، بما في ذلك ByteDance وAlibaba وDeepSeek، إلى لوحات تصنيف LLMs.

تبلغ تكلفة الاستدلال في Yi-Lightning من 01.ai 14 سنتًا لكل مليون رمز، مقارنة بـ 26 سنتًا لنموذج GPT o1-mini الأصغر من OpenAI. وفي الوقت نفسه، تبلغ تكاليف الاستدلال لـ GPT 4o الأكبر حجمًا من OpenAI 4.40 دولارًا لكل مليون رمز مميز. يعتمد عدد الرموز المميزة المستخدمة لإنشاء الاستجابة على مدى تعقيد الاستعلام.

وقال لي أيضًا إن Yi-Lightning تكلف 3 ملايين دولار “للتدريب المسبق”، وهو تدريب نموذجي أولي يمكن بعد ذلك ضبطه أو تخصيصه لحالات استخدام مختلفة. وهذا جزء صغير من التكلفة التي ذكرتها أمثال OpenAI لنماذجها الكبيرة. وأضاف أن الهدف ليس الحصول على “النموذج الأفضل”، بل نموذج تنافسي “أقل تكلفة بخمس إلى عشر مرات” للمطورين لاستخدامه في بناء التطبيقات.

وقد تبنت العديد من مجموعات الذكاء الاصطناعي الصينية، بما في ذلك 01.ai، وDeepSeek، وMiniMax، وStepfun ما يسمى بنهج “نموذج الخبراء”، وهي استراتيجية نشرها لأول مرة باحثون أمريكيون.

بدلا من تدريب “نموذج كثيف” واحد في وقت واحد على قاعدة بيانات واسعة استخرجت البيانات من الإنترنت ومصادر أخرى، يجمع هذا النهج بين العديد من الشبكات العصبية المدربة على بيانات خاصة بالصناعة.

ينظر الباحثون إلى منهج نموذج الخبير باعتباره وسيلة رئيسية لتحقيق نفس المستوى من الذكاء كنموذج كثيف ولكن مع قوة حاسوبية أقل. لكن هذا النهج يمكن أن يكون أكثر عرضة للفشل حيث يتعين على المهندسين تنسيق عملية التدريب عبر “خبراء” متعددين بدلاً من نموذج واحد.

ونظرا للصعوبة في تأمين إمدادات ثابتة ووافرة من رقائق الذكاء الاصطناعي المتطورة، تنافست شركات الذكاء الاصطناعي الصينية على مدار العام الماضي لتطوير مجموعات البيانات الأعلى جودة لتدريب هؤلاء “الخبراء” لتمييز أنفسهم عن المنافسة.

وقال لي إن 01.ai لديه أساليب لجمع البيانات تتجاوز الطريقة التقليدية لاستخراج البيانات من الإنترنت، بما في ذلك مسح الكتب ضوئيًا والزحف إلى المقالات على تطبيق المراسلة WeChat الذي لا يمكن الوصول إليه على الويب المفتوح.

وقال: “هناك الكثير من العمل الجاد” الذي يقوم به المهندسون لتسمية البيانات وتصنيفها، لكنه أضاف أن الصين – مع مجموعتها الهائلة من المواهب الهندسية الرخيصة – في وضع أفضل للقيام بذلك من الولايات المتحدة.

وقال لي: “إن قوة الصين لا تكمن في إجراء أفضل الأبحاث المتقدمة التي لم يقم بها أحد من قبل حيث لا حدود للميزانية”. “إن قوة الصين تكمن في البناء الجيد، والبناء السريع، والبناء الموثوق، والبناء الرخيص”.

شارك في التغطية كريستينا كريدل في سان فرانسيسكو

شاركها.