أحدثت شركة الذكاء الاصطناعي الصينية «ديب سيك» ضجة في قطاع صناعة الذكاء الاصطناعي. إذ بعد حرمانها من أقوى الرقائق التي يُعتقد أنها ضرورية لإنشاء نماذج الذكاء الاصطناعي الحديثة، نجحت «ديب سيك» في تحقيق بعض الضربات الهندسية الرائعة التي سمحت للباحثين بفعل المزيد بأقل قدر من الموارد.
أداء متطور أفضل من جميع النماذج
حققت نماذج «ديب سيك» -V3 وDeepSeek-R1 التي أصدرتها الشركة أخيراً أداءً متطوراً في اختبارات المقارنة وهي تكلف وقتاً ومالاً أقل بكثير للتدريب والتشغيل من النماذج المماثلة.
نتائج لجميع الباحثين في العالم
أما «الكرز على الكعكة» فتجسَّد في إظهار باحثي الشركة نتائج عملهم؛ لقد شرحوا الاختراقات في أوراق البحث وفتحوا النماذج حتى يتمكن الآخرون من استخدامها لإنشاء نماذجهم ووكلائهم الخاصة.
قيود أميركية على الرقائق
السبب الرئيسي وراء اضطرار «ديب سيك» إلى فعل المزيد بموارد أقل، هو أن إدارة بايدن وضعت سلسلة من القيود على صادرات الرقائق قائلةً إن شركات تصنيع الرقائق الأمريكية مثل «نفيديا» لا يمكنها تصدير أقوى وحدات معالجة الرسومات (وحدات معالجة الرسومات، الشريحة المفضلة لتدريب الذكاء الاصطناعي) إلى دول خارج الولايات المتحدة.
بدأ هذا الجهد في أكتوبر (تشرين الأول) 2022، وجرى تحديثه وضبطه عدة مرات لإغلاق الثغرات. وأصدر بايدن أمراً تنفيذياً قبل وقت قصير من مغادرته منصبه بتشديد القيود بشكل أكبر.
«ديب سيك» إبداع برقائق أضعف
يبدو أن «ديب سيك» التزمت بالقواعد، فقد اكتفت بشرائح H800 التي سمحت الولايات المتحدة لشركة «نفيديا» ببيعها في الصين، بدلاً من H100 الأكثر قوة التي تستخدمها شركات التكنولوجيا والذكاء الاصطناعي الأمريكية.
مع الرقائق الأقل قوة، اضطر الباحثون إلى إيجاد طرق لتدريب وتشغيل نماذج الذكاء الاصطناعي باستخدام ذاكرة وقوة حوسبة أقل.
تستخدم نماذج «ديب سيك» نهج «مزيج من الخبراء mixture of experts»، الذي يسمح لهم بتنشيط مجموعة فرعية فقط من معاملات النموذج المتخصصة في نوع معين من الاستعلام. ويوفر هذا النهج الطاقة الحاسوبية ويزيد السرعة.
لم تخترع شركة «ديب سيك» هذا النهج، إذ يستخدمه نموذج «GPT-4» من «أوبن إيه آي» ونموذج «DBRX» من «داتابريكس»، لكن الشركة وجدت طرقاً جديدة لاستخدام البنية لتقليل وقت معالجة الكمبيوتر اللازم في أثناء التدريب المسبق، وهي العملية التي يعالج فيها النموذج كميات هائلة من البيانات من أجل تحسين معاملاته للاستجابة بشكل صحيح لاستفسارات المستخدم.
تقليل الذاكرة المخصصة لتخزين البيانات
في «ديب سيك»-R1، وهو نموذج استدلالي يضاهي أحدث سلسلة من نماذج OpenAI o1 (تم الإعلان عنها في سبتمبر - أيلول)، وجدت «ديب سيك» طرقاً لتوفير الوقت في أثناء وقت الاستدلال، عندما «يفكر» النموذج من خلال طرق مختلفة للوصول إلى إجابة جيدة. في أثناء عملية التجربة والخطأ هذه، يجب على النظام جمع وتخزين مزيد ومزيد من المعلومات حول المشكلة والحلول الممكنة لها في «نافذة السياق»، (ذاكرته)، في أثناء عمله.
مع إضافة نافذة السياق لمزيد من المعلومات، تقفز الذاكرة وقوة المعالجة المطلوبة بسرعة. ربما يكون أكبر ابتكار لشركة «ديب سيك» هو تقليل مقدار الذاكرة المخصصة لتخزين كل هذه البيانات بشكل كبير.
بشكل عام، يخزن نظام R1 بيانات السياق في شكل مضغوط، مما يؤدي إلى توفير الذاكرة وتحسين السرعة دون التأثير في جودة الإجابة التي يراها المستخدم.
تكلفة يسيرة جداً مقارنةً بالنماذج الأميركية
قالت شركة «ديب سيك» في ورقة بحثية إن تكلفة تدريب نموذج V3 الخاص بها بلغت 5.576 مليون دولار فقط. وبالمقارنة، قال الرئيس التنفيذي لشركة «أوبن إيه آي» سام ألتمان، إن تكلفة تدريب نموذج GPT-4 الخاص بها كانت أكثر من 100 مليون دولار.
أفضل تطبيق مجاني رائد
منذ إصدار «ديب سيك» V3، كان المطورون يشيدون بأداء النموذج وفائدته. والآن يتبنى المستهلكون الآن روبوت محادثة جديداً من «ديب سيك» مدعوماً بنموذجي V3 وR1، (الذي أصبح الآن رقم واحد في تصنيف أبل للتطبيقات المجانية)، ومع ذلك، فقد اجتذب هذا النجاح هجمات إلكترونية ضد «ديب سيك» وتسبب في تقييد الشركة لتسجيلات المستخدمين الجدد مؤقتاً.
ترويج خادع
على مدى العامين الماضيين، كانت السردية في هذا القطاع تتمثل في فكرة أن إنشاء نماذج متطورة يتطلب مليارات الدولارات، إضافة إلى الكثير من أسرع شرائح «نفيديا»، وأعداد كبيرة من الباحثين المتميزين.
والآن يجري في جميع أنحاء القطاع وفي دوائر الاستثمار، تحدي هذا الافتراض. ونتيجة لذلك، انخفض سهم «نفيديا» بنحو 17 في المائة أمس (الاثنين)، حيث يشكك المستثمرون في افتراضاتهم حول الطلب على وحدات معالجة الرسومات باهظة الثمن.
مختبر بحث صيني متفوق
وكل هذا يحدث لأن مختبراً صغيراً من الباحثين الصينيين كانوا يعرفون أنهم سيحتاجون إلى بعض الاختراقات الهندسية الكبيرة من أجل إنشاء نماذج متطورة باستخدام شرائح أقل من أحدث التقنيات.
* مجلة «فاست كومباني»، خدمات «تريبيون ميديا».