بعد ظهور «ديب سيك» الصيني... هل خسرت شركات الذكاء الاصطناعي الكبرى تفوّقها؟

شعار تطبيق «ديب سيك» الصيني على أحد الهواتف (رويترز)
شعار تطبيق «ديب سيك» الصيني على أحد الهواتف (رويترز)
TT
20

بعد ظهور «ديب سيك» الصيني... هل خسرت شركات الذكاء الاصطناعي الكبرى تفوّقها؟

شعار تطبيق «ديب سيك» الصيني على أحد الهواتف (رويترز)
شعار تطبيق «ديب سيك» الصيني على أحد الهواتف (رويترز)

هزت شركة ديب سيك الصينية الصغيرة قطاع الذكاء الاصطناعي التوليدي، في نهاية يناير (كانون الثاني) الماضي، مع برنامجها منخفض التكلفة وعالي الأداء في الوقت نفسه، لدرجة أنها دفعت لإعادة النظر في هيمنة الشركات الكبرى؛ ومن بينها «أوبن إيه آي»، على القطاع.

وعلى مدار العامين الفائتين، نجحت حفنة من برامج المساعدة القائمة على الذكاء الاصطناعي في ترسيخ وجودها، من «تشات جي بي تي»، إلى «كلود» (من شركة أنثروبيك)، مروراً بـ«جيميناي» من «غوغل»؛ وذلك بفضل استثمارات بمليارات الدولارات للتعامل مع أفضل المهندسين، ونشر القدرات اللازمة (رقائق وخوادم ومراكز بيانات).

وابتكرت «ديب سيك» نموذجها «آر1» بعددٍ أقل من المعالجات، دون استخدام الرقائق الأكثر تقدماً، وبتكلفة مُعلَنة قدرها ستة ملايين دولار فقط.

وبالنسبة لكثيرين، كان هذا التطوّر بمثابة ثورة، فقد سلّط الضوء على حركة كانت قائمة منذ أشهر، وهي حركة «تسليع» برامج الذكاء الاصطناعي التوليدية.

وفي هذا السياق، يقول توماس وولف، المشارك في تأسيس منصة الذكاء الاصطناعي «هاغينغ فايس» إن «تكلفة إطلاق نموذج تتقلص، ومسألة تحديد النموذج الذي ينبغي الاعتماد عليه تتراجع أهميتها». ويضيف، لـ«وكالة الصحافة الفرنسية»: «الناس يتجهون نحو عالم متعدد النماذج»، مضيفاً: «أن يكون للمرء حرية الخيار أمر مذهل».

ويرى أنّ الاستقبال البارد، الذي قدَّمه القطاع ووسائل الإعلام لإطلاق «تشات جي بي تي 4.5» (أوبن إيه آي)، في نهاية فبراير (شباط) الماضي، يشكل مثالاً على هذا الاتجاه.

«المصادر المفتوحة»

أكد مدير المنتجات لدى «أوبن إيه آي» كيفن ويل، في مؤتمر «هيومن إكس إيه آي»، الذي أقيم أخيراً في لاس فيغاس، أن مقولة إن كل النماذج متشابهة «ليست صحيحة». وأضاف: «لن نكون أبداً بعد اليوم متقدمين على منافسينا بفارق 12 شهراً، لكننا لا نزال متقدمين بما يتراوح بين 3 و6 أشهر».

ومع 400 مليون مستخدم فردي، تستفيد الشركة الأميركية الناشئة، وفقاً لويل، من تأثير حجم يمنحها ميزة مرتبطة بالبيانات المستمَدة من الاستخدام الهائل، والمستعملة لتحسين نماذجها بشكل متواصل.

يقول رئيس شركة ديجيتس الناشئة جيف سيبرت: «أعتقد أنها ستبقى في المقدمة، لكنّ الفجوة بينها وبين شركات أخرى ستتقلّص، وفي حالات كثيرة سيجري استخدامها» مع برامج أخرى. ويضيف: «بالنسبة إلى التطبيقات الأكثر تقدماً، سيكون هناك فرق، لكن بالنسبة لمعظم الاستخدامات الأخرى، لن يكون لذلك أهمية كبيرة، لذا فإن نصيحتي لرواد الأعمال والمستثمرين هي التأكد من إمكانية تنقل المستخدم بسهولة بين النماذج».

أدى الاستخدام الأفضل للرقائق وتقنيات تحسين النماذج الجديدة إلى خفض تكلفة تصميم «إل إل إم» (نموذج لغوي كبير)، وهو المحرّك المخفي تحت غطاء محرك «تشات جي بي تي» أو «جيميناي» من «غوغل».

ويسهم صعود «المصادر المفتوحة»؛ أي نشر برنامج للاستخدام المجاني والمفتوح، في انتشار منصات الذكاء الاصطناعي التوليدية.

ويقول أنجيلو زينو، من شركة «سي إف آر إيه» إنّ «تقييم المتخصصين في النماذج الكبيرة لشركات مثل أوبن إيه آي وأنثروبيك، وهما من المجموعات القليلة التي تقاوم حتى اليوم (المصادر المفتوحة)، ربما وصل إلى ذروته، مع تبدد التأثير المرتبط بالسرعة».

لكن ذلك لم يمنع شركة الاستثمار اليابانية «سوفت بنك» من ضخ 40 مليار دولار في رأسمال «أوبن إيه آي» في فبراير.

وتُقدر هذه العملية الشركة بـ300 مليار دولار؛ أي نحو ضِعف القيمة التي كانت عليها في العام الفائت.

وفي مطلع مارس (آذار) الحالي، جمعت «أنثروبيك» مبلغاً قدره 3.5 مليار دولار، وهو ما يقدر قيمة الشركة بـ61.5 مليار دولار.

ويقول جاي داس، من شركة رأسمال المخاطرة «سافير فانتشرز»: «إذا كنت تحصل على مليار دولار نقداً، كل شهر، وهذه هي الحال، على ما أعتقد، مع (أوبن إيه آي)، فعليك الاستمرار في جمع الأموال حتى يتجاوز حجم إيراداتك هذا المبلغ، وأجد صعوبة في رؤية كيف سيصلون إلى هناك».


مقالات ذات صلة

150 قتيلا على الأقل حصيلة زلزال ميانمار وتايلاند

آسيا متطوعون يبحثون عن ناجين في مبنى متضرر بعاصمة ميانمار (أ.ب) play-circle

150 قتيلا على الأقل حصيلة زلزال ميانمار وتايلاند

أودى زلزال قوي، اليوم الجمعة، بأكثر من 150 شخصا وإصاب المئات مع عشرات لا يزالون تحت أنقاض المباني المهدمة في ميانمار (بورما) وتايلاند، في حصيلة مرشحة للارتفاع.

«الشرق الأوسط» (نايبيداو)
آسيا الرئيس الصيني شي جينبينغ (أ.ب)

شي لرجال أعمال أجانب: أبواب الصين «ستُفتح أكثر فأكثر»

أعلن الرئيس الصيني شي جينبينغ، خلال استقباله في بكين رجال أعمال أجانب، أنّ أبواب الصين «ستُفتح أكثر فأكثر».

«الشرق الأوسط» (بكين)
الولايات المتحدة​ مقاتلة صينية تستعد للإقلاع من حاملة الطائرات «شاندونغ» خلال تدريبات عسكرية حول تايوان (أرشيفية - أ.ب)

الاستخبارات الأميركية تَعدّ الصين أكبر خطر عسكري على واشنطن

أورد تقرير لأجهزة الاستخبارات الأميركية أن الصين تطرح أكبر خطر على مصالح الولايات المتحدة على الصعيد العالمي، مشيراً إلى أن بكين تعزز وسائلها العسكرية.

«الشرق الأوسط» (واشنطن)
الولايات المتحدة​ إيلون ماسك لدى وصوله إلى البنتاغون في العاصمة الأميركية واشنطن (رويترز)

ترمب: ماسك لن يطلع على استراتيجية عسكرية سرية تتعلق بالصين

نفى الرئيس الأميركي دونالد ترمب بشدة تقارير صحافية أشارت إلى أنه كان يخطط لإطلاع إيلون ماسك على خطة الولايات المتحدة الحربية السرية جداً ضد الصين.

«الشرق الأوسط» (واشنطن)
رياضة عالمية أعلن مستشفى محلي وفاة اللاعب الصيني دماغياً قبل نقله إلى بلاده (أ.ف.ب)

وفاة لاعب صيني شاب بعد تعرضه لإصابة بالرأس في إسبانيا

توفي لاعب كرة قدم صيني واعد بعد تعرضه لإصابة خطيرة في الرأس خلال تمارين في إسبانيا وضعته في غيبوبة، وذلك وفق ما أعلن ناديه الخميس.

«الشرق الأوسط» (بكين)

في جزء من الثانية... «هارت» يولد صوراً عالية الجودة عبر الذكاء الاصطناعي

مزج الباحثون بين نماذج الذكاء الاصطناعي التوليدية لإنشاء أداة سريعة تنتج صوراً بدقة عالية (Christine Daniloff, MIT)
مزج الباحثون بين نماذج الذكاء الاصطناعي التوليدية لإنشاء أداة سريعة تنتج صوراً بدقة عالية (Christine Daniloff, MIT)
TT
20

في جزء من الثانية... «هارت» يولد صوراً عالية الجودة عبر الذكاء الاصطناعي

مزج الباحثون بين نماذج الذكاء الاصطناعي التوليدية لإنشاء أداة سريعة تنتج صوراً بدقة عالية (Christine Daniloff, MIT)
مزج الباحثون بين نماذج الذكاء الاصطناعي التوليدية لإنشاء أداة سريعة تنتج صوراً بدقة عالية (Christine Daniloff, MIT)

يُعدُّ توليد صور عالية الجودة بكفاءة تحدياً بالغ الأهمية، خصوصاً للتطبيقات، مثل تدريب السيارات ذاتية القيادة، أو تصميم بيئات ألعاب الفيديو، أو محاكاة سيناريوهات العالم الحقيقي. وفي حين حققت نماذج الذكاء الاصطناعي تقدماً كبيراً في توليد الصور، لا تزال الطرق الحالية تواجه مفاضلة بين السرعة والجودة.

نماذج الانتشار (Diffusion Models)، مثل تلك المستخدمة في «DALL-E» و«Stable Diffusion»، تنتج صوراً واقعية مذهلة، لكنها تتطلب قوة حاسوبية كبيرة ووقتاً طويلاً. من ناحية أخرى، النماذج الانحدارية الذاتية (Autoregressive Models) المشابهة لتلك المستخدمة في نماذج اللغة الكبيرة مثل «تشات جي بي تي» (ChatGPT) تولد الصور بسرعة، لكنها غالباً ما تعاني مع التفاصيل الدقيقة، ما يؤدي إلى نتائج مشوهة أو ضبابية. الآن، طور فريق من الباحثين من معهد «ماساتشوستس للتكنولوجيا» (MIT) وشركة «إنفيديا» (NVIDIA) حلّاً مبتكراً يُدعى «هارت» (HART) وهو نموذج ذكاء اصطناعي جديد يجمع بين مزايا الطريقتين لتقديم صور عالية الجودة بسرعات غير مسبوقة.

أفضل ما في الطريقتين

يعمل «HART» على مبدأ بسيط لكنه قوي. أولاً، يقوم النموذج برسم الخطوط العريضة للصورة بسرعة، ثم يقوم نموذج انتشار صغير بتنقيح التفاصيل، فماذا يعني ذلك؟

يوضح هاوتيان تانغ، طالب الدكتوراه في «MIT»، والمؤلف الرئيسي المشارك للبحث، الأمر بهذه العبارة: «تخيَّل الأمر مثل الرسم». ويتابع: «إذا غطّيت اللوحة كلها دفعة واحدة، فقد تبدو النتيجة خاماً. لكن إذا بدأت برسم عام، ثم نقحته بضربات فرشاة أصغر وأدق، تصبح الصورة النهائية أكثر إتقاناً».

تعمل نماذج الانتشار التقليدية عن طريق إزالة الضوضاء من الصورة خطوة بخطوة حتى تظهر صورة واضحة. وهذه العملية تضمن دقة عالية لكنها بطيئة وتستهلك موارد كبيرة. في المقابل، تولد نماذج «هارت» (HART) الصور بشكل تسلسلي، متنبئة بأجزاء صغيرة في كل مرة. وفي حين تكون أسرع، فإنها غالباً ما تفقد تفاصيل مهمة بسبب الضغط.

يملأ «HART» هذه الفجوة باستخدام نموذج انحدار ذاتي للتعامل مع الجزء الأكبر من توليد الصورة، ثم تطبيق نموذج انتشار خفيف فقط لتحسين التفاصيل المتبقية، أي تلك العناصر الدقيقة التي تجعل الصورة حية مثل ملمس الشعر، وبريق العين، أو الحواف الدقيقة للأجسام.

يتميز نموذج «HART» الجديد بقدرته على إنتاج صور بجودة تعادل أو تفوق أحدث نماذج الانتشار لكن بسرعة أعلى بتسع مرات (MIT)
يتميز نموذج «HART» الجديد بقدرته على إنتاج صور بجودة تعادل أو تفوق أحدث نماذج الانتشار لكن بسرعة أعلى بتسع مرات (MIT)

السرعة دون التضحية بالجودة

من أكثر إنجازات «HART» إثارة للإعجاب هي كفاءته. وفي حين تتطلب نماذج الانتشار الحديثة مليارات المعلمات وعشرات الخطوات للتنقيح، يُحقق «هارت» نتائج مماثلة أو حتى أفضل بجزء بسيط من التكلفة الحاسوبية.

في الاختبارات، أنتج «HART» صوراً أسرع بتسع مرات من نماذج الانتشار الرائدة، مع الحفاظ على مستوى التفاصيل نفسه. والأكثر إثارة، أنه يفعل ذلك باستخدام طاقة حاسوبية أقل بنسبة 31 في المائة، ما يجعله قابلاً للتشغيل على أجهزة المستهلك العادية، مثل أجهزة اللابتوب أو الهواتف الذكية.

يقول تانغ: «نموذج الانتشار في (HART) لديه مهمة أبسط بكثير... فهو يحتاج فقط لتصحيح التفاصيل الدقيقة، وليس الصورة بأكملها، ما يجعل العملية أكثر كفاءة».

فتح آفاق جديدة

تمتد آثار «HART» إلى ما هو أبعد من مجرد توليد صور أسرع. تصميمه الهجين يجعله شديد التكيف للدمج مع أنظمة الذكاء الاصطناعي متعددة الوسائط، مثل نماذج الرؤية واللغة التي يُمكنها تفسير وتوليد النصوص والصور معاً.

تخيَّل أن تطلب من مساعد ذكي أن يرشدك خلال تجميع قطعة أثاث، مع عرض مرئي لكل خطوة في الوقت الفعلي، أو فكِّر في سيارات ذاتية القيادة يتم تدريبها في بيئات افتراضية فائقة الواقعية، تتعلم تجنب المخاطر غير المتوقعة، قبل أن تصل حتى إلى الطريق. سرعة ودقة «HART» مكَّنَتا من جعل هذه التطبيقات ليست ممكنة فحسب، بل عملية أيضاً.

في المستقبل، يُخطط الباحثون لتوسيع قدرات «HART»، لتشمل توليد الفيديو وتركيب الصوت، مستفيدين من تصميمه القابل للتوسع لمهام أكثر تعقيداً.

خطوة نحو ذكاء اصطناعي أذكى

يُمثل «HART» قفزة كبيرة إلى الأمام في مجال الذكاء الاصطناعي التوليدي، مبرهناً على أن السرعة والجودة يجب ألا يكونا متناقضين. من خلال الجمع الذكي بين نقاط قوة النماذج الانحدارية الذاتية ونماذج الانتشار، يفتح الباحثون أبواباً جديدة لتوليد الصور عالية الدقة في الوقت الفعلي، ما يقربنا من مستقبل يمكن فيه للذكاء الاصطناعي أن يدمج الإبداع والكفاءة بسلاسة.

هذا البحث، المدعوم من مختبر «MIT-IBM Watson» للذكاء الاصطناعي، ومركز «MIT» و«Amazon للعلوم»، ومؤسسة «العلوم الوطنية الأميركية»، سيُعرض في المؤتمر الدولي حول التمثيلات التعليمية. ومع مزيد من التطوير، قد يصبح «HART» قريباً حجر الزاوية في تطبيقات الذكاء الاصطناعي من الجيل التالي، ما يُعيد تشكيل طريقة تفاعلنا مع الذكاء الاصطناعي والاستفادة منه.