Site icon السعودية برس

كيف صنعت شركة Deepseek من AI الصينية نموذجًا ينافسه Openai

اليوم ، تعد Deepseek واحدة من شركات الذكاء الاصطناعى الوحيدة في الصين التي لا تعتمد على تمويل من عمالقة التكنولوجيا مثل Baidu أو Alibaba أو Bytedance.

مجموعة شابة من العباقرة يتوقون إلى إثبات أنفسهم

وفقًا لـ Liang ، عندما جمع فريق الأبحاث في Deepseek ، لم يكن يبحث عن مهندسين ذوي خبرة لبناء منتج مواجه للمستهلك. بدلاً من ذلك ، ركز على طلاب الدكتوراه من أفضل الجامعات في الصين ، بما في ذلك جامعة بكين وجامعة تسينغهوا ، الذين كانوا حريصين على إثبات أنفسهم. تم نشر العديد منهم في المجلات العليا وفازوا بجوائز في المؤتمرات الأكاديمية الدولية ، لكنهم يفتقرون إلى الخبرة في الصناعة ، وفقًا لما ذكره المنشور التقني الصيني Qbitai.

“يتم شغل المناصب الفنية الأساسية لدينا في الغالب من قبل الأشخاص الذين تخرجوا هذا العام أو خلال عام أو عامين الماضيين” ، أخبر ليانغ 36 كير في عام 2023. ساعدت استراتيجية التوظيف في إنشاء ثقافة شركة تعاونية حيث كان الناس أحرارًا في استخدام موارد الحوسبة الواسعة لمتابعة مشاريع البحث غير التقليدية. إنها طريقة مختلفة بشكل صارخ للعمل من شركات الإنترنت القائمة في الصين ، حيث تتنافس الفرق غالبًا على الموارد. (مثال حديث: اتهم Bytedance المتدرب السابق – الفائز بجائزة أكاديمية مرموقة ، لا يقل عن – تخريب عمل زملائه من أجل تخزين المزيد من موارد الحوسبة لفريقه.)

قال ليانغ إن الطلاب يمكن أن يكونوا مناسبة بشكل أفضل للبحث عن الاستثمار العالي والربح. “معظم الناس ، عندما يكونون صغارًا ، يمكنهم تكريس أنفسهم تمامًا لمهمة دون اعتبارات نفعية” ، أوضح. إن ملعبه للتعيينات المحتملين هو أنه تم إنشاء Deepseek “لحل أصعب الأسئلة في العالم”.

يقول الخبراء إن حقيقة أن هؤلاء الباحثين الشباب يتعلمون تمامًا في الصين يضيف إلى محركهم. “هذا الجيل الأصغر سنا يجسد أيضًا شعورًا بالوطنية ، لا سيما أثناء التنقل في قيود الولايات المتحدة ونقاط الاختناق في تقنيات الأجهزة والبرامج الحرجة” ، يوضح تشانغ. “لا يعكس تصميمهم على التغلب على هذه الحواجز الطموح الشخصي فحسب ، بل يعكس أيضًا التزامًا أوسع بتطوير موقف الصين كقائد عالمي للابتكار.”

الابتكار المولود من أزمة

في أكتوبر 2022 ، بدأت حكومة الولايات المتحدة تجمع ضوابط التصدير التي تقيد شركات AI الصينية بشدة من الوصول إلى رقائق متطورة مثل Nvidia's H100. قدمت هذه الخطوة مشكلة ل Deepseek. بدأت الشركة بمخزون يبلغ 10000 H100 ، لكنها كانت بحاجة إلى المزيد للتنافس مع شركات مثل Openai و Meta. “المشكلة التي نواجهها لم يتم تمويلها أبدًا ، لكن التحكم في التصدير على الرقائق المتقدمة” ، قال ليانغ لـ 36 كير في مقابلة ثانية في عام 2024.

كان على ديبسيك التوصل إلى أساليب أكثر كفاءة لتدريب نماذجها. يقول ويندي تشانغ ، أحد مهندس البرمجيات ، ” محلل في معهد ميراتور لدراسات الصين. “إن العديد من هذه الأساليب ليست أفكارًا جديدة ، لكن الجمع بينها بنجاح لإنتاج نموذج متطور يعد إنجازًا رائعًا.”

حقق Deepseek أيضًا تقدمًا كبيرًا في الاهتمام الكامن متعدد الرأس (MLA) ومزيج الخبرة ، وهما تصميمان تقنيان يجعلان نماذج Deepseek أكثر فعالية من حيث التكلفة من خلال طلب موارد حوسبة أقل للتدريب. في الواقع ، فإن أحدث نموذج لـ Deepseek فعال للغاية لدرجة أنه يتطلب عُشر قوة الحوسبة لنموذج LAMA 3.1 المماثل لـ Meta ، وفقًا لمؤسسة الأبحاث AI.

إن استعداد ديبسيك لمشاركة هذه الابتكارات مع الجمهور قد أكسبها شهرة كبيرة في مجتمع أبحاث الذكاء الاصطناعى العالمي. بالنسبة للعديد من شركات AI الصينية ، فإن تطوير نماذج مفتوحة المصدر هو الطريقة الوحيدة للعب مع نظرائها الغربيين ، لأنها تجذب المزيد من المستخدمين والمساهمين ، والتي بدورها تساعد النماذج على النمو. يقول تشانغ: “لقد أثبتوا الآن أنه يمكن بناء النماذج المتطورة باستخدام أقل ، على الرغم من أنها لا تزال كثيرة ، وأن المعايير الحالية لبناء النماذج تترك مجالًا كبيرًا للتحسين”. “من المؤكد أننا سنرى الكثير من المحاولات في هذا الاتجاه للمضي قدمًا.”

يمكن أن تثير الأخبار المتاعب لعناصر التحكم في التصدير الأمريكية الحالية التي تركز على إنشاء اختناقات موارد الحوسبة. يقول تشانغ: “التقديرات الحالية لمقدار قوة الحوسبة الذكاء الاصطناعي التي يتمتع بها الصين ، وما يمكن أن يحققه به ، يمكن أن يتم رفعه”.

Exit mobile version