منذ أن بدأت الطفرة في الذكاء الاصطناعي، طالب خبراء التكنولوجيا في الولايات المتحدة بتوسيع كبير لمراكز البيانات والبنية الأساسية للطاقة، لدعم مزيد من التقدم واستيعاب التكنولوجيا. والآن، تتحدى موجة الصدمة التي أحدثتها شركة «ديب سيك» DeepSeek الصينية هذه النظرة؛ كما كتب أليكس ويلكنز*.
«ديب سيك» والتغيرات الجذرية
في حين توجد مخاوف خطيرة تتعلق بالسلامة والرقابة بشأن نموذج الذكاء الاصطناعي للشركة، يعتقد كثيرون في الصناعة أن تقدم «ديب سيك» يمكن أن يؤدي إلى تغييرات جذرية في طريقة تطوير مثل هذه النماذج واستخدامها، فضلاً عن توفير كبير للطاقة وخفض العبء المناخي. فهل هم على حق؟
كان نموذج «آر1» R1 من «ديب سيك» بمنزلة صدمة لشركات الذكاء الاصطناعي الأميركية، ولغزاً.
الصينيون يتحدون آلاف الخبراء الأميركيين وملياراتهم
كيف تمكن فريق من بضع مئات من الباحثين، وميزانية تبلغ عدة ملايين من الدولارات، من إنتاج نموذج قادر مثل نموذج «أوبن إيه آي» وأفضل مما لدى «غوغل»، الشركتين اللتين تمتلكان فِرَقاً مكونة من عدة آلاف من الاختصاصيين وميزانياتهم التي تبلغ مليارات الدولارات؟
يقول آرثر غارسيز من جامعة سيتي سانت جورج، في لندن، إن السر لم يكن في مكون سحري واحد؛ بل في مجموعة من الحيل الهندسية الذكية التي كانت معروفة بالفعل بشكل فردي.
التعليم التعزيزي
تُعد طريقة ما يسمى «التعلم التعزيزي»reinforcement learning واحدة من أكثر الطرق نجاحاً في تدريب الذكاء الاصطناعي؛ حيث يُظهر الباحثون للذكاء الاصطناعي كيف يبدو النجاح، ويتركونه ليكتشف القواعد باستخدام شكل من أشكال التجربة والخطأ.
كان هذا هو مفتاح إنجازات «ديب مايند» DeepMind من «غوغل»، مع أنظمة الذكاء الاصطناعي للشطرنج ونظم دراسة طي البروتين؛ حيث يمكن تعريف النجاح في لعبة الشطرنج أو التنبؤ بشكل البروتين بسهولة. ومع ذلك، وجد الباحثون أن من الصعب ترجمة هذه الطريقة إلى نماذج لغوية كبيرة؛ حيث يكون النجاح أقل واقعية.
وبينما تستخدم نماذج «جي بي تي» GPT من «أوبن إيه آي» شكلاً من أشكال التعلم التعزيزي؛ حيث يتم إعطاؤها ملاحظات حول الإجابات التي يفضلها الناس، فإن هذا ليس في الحقيقة التعلم التعزيزي بالطريقة التي استخدمها الباحثون تقليدياً.
ويقول غارسيز إن «آر1» في «ديب سيك»، مثل نماذج «جي بي تي»، تم تدريبه أولاً على كميات هائلة من النصوص من الإنترنت، ولكن بعد ذلك تُرِك ليكتشف كيفية التفكير من تلقاء نفسه باستخدام التعلم التعزيزي الفعلي، دون الحاجة إلى ردود فعل بشرية.
مشكلات بإجابات واضحة
وللقيام بذلك، ركز المهندسون في «ديب سيك» على تطبيق التعلم التعزيزي على المشكلات؛ حيث يمكنهم تحديد إجابات واضحة، كما هي الحال في الرياضيات والترميز، كما جعلوا النموذج ينتج كثيراً من الإجابات في وقت واحد، بحيث يمكنه مقارنتها جنباً إلى جنب. بعد ذلك تم عرض أمثلة مُسمّاة من قبل البشر على النموذج لضبط قدراته في مجالات أخرى.
بعد تدريب النموذج بهذه الطريقة، وجد باحثو «ديب سيك» طريقة لزرع قدراته على التفكير، في نماذج أصغر مفتوحة المصدر تم تدريبها بالفعل، في خطوة أطلقوا عليها اسم «التقطير» distillation.
يقول غارسيز إن هذه المرحلة من العملية أثارت شكوك كثيرين، في تصورات شركات التكنولوجيا الأميركية حول ضرورات التوسع في حجم قدرات الحوسبة.
يقول غارسيز: «كانت شركة (أوبن إيه آي) وبعض منافسيها يبالغون في التوسع. وكانت الشركات تتبنى شعاراً مفاده أن التوسع هو كل ما تحتاج إليه، وكانت تتوسع في كل عام. وما نراه من خلال عملية التقطير والمكاسب التي تظهرها، هو أنك لا تملك حقاً سبباً كافياً (مقنعاً) للتوسع».
قوة حوسبة أقل لتدريب الذكاء الاصطناعي
إذا كانت شركات التكنولوجيا بحاجة إلى قوة حوسبة أقل لتدريب النماذج، فقد يعني هذا أن الذكاء الاصطناعي يجب ألا يكون ضاراً بالمناخ (نتيجة استهلاكه لطاقة كهربائية عالية) كما هي الحال حالياً، وأن خططاً مثل مشروع البنية التحتية للذكاء الاصطناعي بقيمة 500 مليار دولار في الولايات المتحدة قد لا تحتاج إلى المضي قدماً.
ولكن شركات التكنولوجيا الأميركية كانت سريعة في التصدي لهذا. فقد نشر ساتيا ناديلا، الرئيس التنفيذي لشركة «مايكروسوفت» التي تمتلك حصة كبيرة في «أوبن إيه آي» على منصة «إكس» أنه «مع ازدياد كفاءة الذكاء الاصطناعي وسهولة الوصول إليه، سنرى استخدامه يرتفع بشكل كبير، مما يحوله إلى سلعة لا نشبع منها».
تقول ميريلا لاباتا، من جامعة إدنبره بالمملكة المتحدة: «إذا تحدثت إلى الرؤساء التنفيذيين، فسوف يروجون لتصوراتهم، ويطرحون تنبؤات بأن الذكاء الاصطناعي سيحتاج إلى مراكز البيانات هذه. ولكن إذا كان بإمكاني تشغيل هذه الأشياء على جهاز الكومبيوتر الخاص بي، على وحدة معالجة الرسومات، فلماذا أدفع لشركة (أوبن إيه آي) أجوراً للقيام بأي شيء؟».
اقتصاد في النفقات والطاقة
ومع ذلك، فإن جانباً آخر من نموذج «آر» الخاص بشركة «ديب سيك» قد يزيد بالفعل من متطلبات الذكاء الاصطناعي للطاقة. ومثل نماذج الاستدلال «أو1»o1، الخاصة بشركة «أوبن إيه آي»، يستخدم هذا النظام طريقة تسمى «سلسلة الفكر»؛ حيث «يفكر الذكاء الاصطناعي بصوت عالٍ» ويُظهِر عمله عندما يُطلب منه الرد على مطالبة. وقد وجد الباحثون أن هذا يمكن أن يحسن أداءه في بعض مهام الرياضيات والترميز.
وإذا بدأ مزيد من الأشخاص في استخدام أدوات الذكاء الاصطناعي التي تحتاج إلى التفكير بهذه الطريقة، فقد يؤدي ذلك إلى زيادة الحاجة والتكلفة الحسابية، كما يتوقع ناديلا.
ولكن وقت التفكير في «ديب سيك» مقسم بين كثير من الأنظمة الفرعية المتخصصة في مجالات مختلفة، مثل الرياضيات أو الترميز، فيما يُعرف بنموذج «مزيج الخبراء». يقول نيكوس أليتراس، من جامعة شيفيلد بالمملكة المتحدة، إن هذا سيؤدي إلى الحاجة إلى قوة حسابية أقل من استخدام النموذج كله. ويضيف أن الغالبية العظمى من الطلبات قد لا تحتاج إلى نماذج «التفكير» الأكثر كثافة حسابياً، ما يؤدي إلى انخفاض تكاليف الطاقة الإجمالية.
نماذج رخيصة التكلفة
في النهاية، سيعتمد مدى تأثير ابتكارات «ديب سيك» على صناعة الذكاء الاصطناعي واستهلاكها للطاقة، على ما إذا كانت شركات التكنولوجيا الأميركية قادرة على إظهار أن نهجها يحقق نتائج متفوقة. ولكن مع قدرة العملاء على استخدام «آر1» من «ديب سيك» بأقل من عشرين مرة من تكلفة نماذج مثل «أو1»، فإن الفارق في الجودة يجب أن يكون كبيراً. يقول لاباتا: «إذا لم يكن علينا أن ندفع، فلماذا ندفع؟ وهذا يعني أن استهلاك الطاقة سيكون أقل فعلياً».
نجاحات الصين رغم الحصار الإلكتروني الأميركي
في عام 2022، بدأت الحكومة الأميركية في تنفيذ ضوابط التصدير التي تسعى إلى الحد من وصول الصين إلى الرقائق الأميركية المطورة للاستخدام مع الذكاء الاصطناعي. ولا يبدو أن هذا قد أثر على تطوير «ديب سيك»، حتى الآن.
وبعدما أن قامت «ديب سيك» بتدريب نموذج «R1» الخاص بها بكفاءة، قال لينارت هايم من مؤسسة «راند» RAND، البحثية الأميركية في كاليفورنيا: «من المحتمل أن تكون مكاسب الكفاءة قد جاءت من وجود وصول كبير إلى الحوسبة».
وكتب هايم وسيهاو هوانغ من جامعة أكسفورد في منشور على مدونة، أن «ديب سيك» تدير واحدة من أكبر مجموعات شرائح الذكاء الاصطناعي في آسيا، ولديها وصول غير مقيد إلى موارد الحوسبة المخزنة في السحابة. وساعدت هذه الموارد «ديب سيك» على إنشاء بيانات تدريب اصطناعية، ثم اكتشاف تقنيات أكثر كفاءة من خلال التجربة والخطأ.
وأضافا: «لا تزال الصين تدير مراكز بيانات ما قبل القيود بعشرات الآلاف من الرقائق، بينما تبني الشركات الأميركية مراكز بيانات بمئات الآلاف».
لكن آخرين يرون أن ضوابط التصدير لها نتائج مختلطة، وحتى أنها تحفز الشركات التقنية الصينية على تطوير حلول بديلة فعَّالة. ويقول بول تريولو من مجموعة DGA، وهي شركة استشارية عالمية في واشنطن العاصمة: «كان لضوابط التصدير الأميركية تأثير كبير على ابتكار (ديب سيك)، ولا شك في ذلك».
* مجلة «نيوساينتست»، خدمات «تريبيون ميديا».