«الشرق الأوسط» تختبر خدمة «ديب سيك» للذكاء الاصطناعي التي تتفوق على «تشات جي بي تي»

شركة صينية غير معروفة تهز عرش الشركات الأميركية المتخصصة

شعار «ديب سيك»
شعار «ديب سيك»
TT

«الشرق الأوسط» تختبر خدمة «ديب سيك» للذكاء الاصطناعي التي تتفوق على «تشات جي بي تي»

شعار «ديب سيك»
شعار «ديب سيك»

استطاعت شركة صينية اسمها «ديب سيك» (DeepSeek) تطوير نموذج ذكاء اصطناعي جديد اسمه «آر1» (R1) يتفوق على النماذج المنافسة الأميركية، خصوصاً «تشات جي بي تي»، في مستويات الأداء وأيضاً السعر، حيث يعمل بتكلفة لا تتعدى 3 في المائة من تكلفة تشغيل نماذج اللغة التي يتدرب عليها الذكاء الاصطناعي من الشركات الأميركية. ولكن ما هذا النموذج؟ وما الذي يقدمه ومن طوره؟

ما هي شركة «ديب سيك»؟

«ديب سيك» هي شركة صينية ناشئة عمرها عام واحد استطاعت تحقيق إنجاز ضخم؛ وهو بناء نموذج ذكاء اصطناعي توليدي لا يتحدى نماذج الذكاء الاصطناعي المعروفة اليوم من «أوبن إيه آي» و«غوغل» و«ميتا»، فحسب، بل يتفوق عليها في مستويات الأداء وأيضاً التكلفة، حيث بلغت تكلفة تطوير النموذج الأساسي منه 5.6 مليون دولار فقط، مستخدماً بطاقات رسومات قديمة من «إنفيديا» جراء منع مشاركة التقنيات الأميركية المتقدمة مع الشركات الصينية، مقارنة بمئات الملايين من الدولارات التي تنفقها الشركات الأميركية في تطوير نماذج مشابهة. أي أنه بإمكان الشركات تطوير تقنيات ذكاء اصطناعي متقدمة ومتفوقة باستخدام تقنيات ليست الأحدث، وبالتالي فهي أقل تكلفة.

يقدم «ديب سيك» قدرات أفضل وبسعر أقل مقارنة بمنافسه «تشات جي بي تي»

نموذج علمي بحثي لطلاب الكومبيوتر

وكان الفريق جزءاً من شركة «فاير-فلاير» (Fire-Flyer)، وهي شركة أبحاث في التعلم العميق تفرعت من صندوق استثماري، وقررت تطوير شركة جديدة اسمها «ديب سيك» لبناء نماذج ذكاء اصطناعي ثورية باستخدام طلاب علوم الكومبيوتر لبناء نموذج علمي بحثي وليس تجارياً، ما أوجد شركة ذات بيئة عمل مريحة يستطيعون فيها استخدام الموارد لإجراء الأبحاث.

ونظراً للعقوبات الأميركية على الصين التي تقيد بيع الدارات المتقدمة، قام الفريق بابتكار روابط بين وحدات الرسومات الموجودة لديهم لرفع كفاءة نقل البيانات الضخمة وخفض كمية الذاكرة اللازمة للعمل، وبالتالي خفض المواصفات التقنية اللازمة لإجراء التدريبات على البيانات الضخمة جداً. واحتاج هذا النموذج إلى 10 في المائة من قدرات الحوسبة للتدريب مقارنة بنظام «لاما 3.1» من «ميتا».

نموذج متفوق على المنافسة الأميركية

اسم النموذج الجديد هو «آر1» وهو مفتوح المصدر (يمكن لأي شخص قراءة نصه البرمجي والمشاركة بتطويره) ويقدم جميع المزايا التي يقدمها «تشات جي بي تي أو1»، ويتفوق عليها في المسائل الحسابية والاستنباط المنطقي وسرعة الاستجابة والتكلفة، ما يزعج الشركات الأميركية التي تقدم هذه الخدمات باشتراكات شهرية باهظة.

وبينما تستخدم الشركات الأميركية أسلوب زيادة القدرة بشراء مزيد من وحدات الرسومات لمعالجة البيانات وتدريب الذكاء الاصطناعي لفترات أطول، قامت هذه الشركة الصينية الصغيرة بإعادة النظر في مفهوم تدريب الذكاء الاصطناعي وطورت أسساً جديدة أكثر كفاءة تستطيع العمل على وحدات الرسومات القديمة والأقل تكلفة لتقديم نتيجة أفضل من تلك التي تقدمها الشركات الأميركية، أي أنها ركزت على الابتكار التقني بكفاءة عالية في ظل شح الموارد عوضاً عن التقدم بالمال فقط.

وكانت «ميتا» قد قالت الأسبوع الماضي، إنها ستنفق 65 مليار دولار هذا العام لتطوير نماذج الذكاء الاصطناعي الخاصة بها، بينما قال الرئيس التنفيذي لشركة «أوبن إيه آي» إن القطاع يحتاج إلى تريليونات الدولارات من الاستثمارات لدعم تطوير الشرائح الإلكترونية اللازمة لتطوير مراكز البيانات الخاصة بالذكاء الاصطناعي.

اشتراكات بأجور يسيرة

وفيما يتعلق بالتكلفة، فتبدأ اشتراكات «تشات جي بي تي» من 20 دولاراً شهرياً، بينما تبلغ تكلفة اشتراك «ديب سيك» الشهرية نصف دولار فقط. وإن أراد المستخدم تفعيل واجهة برمجية للاتصال بالبنية التحتية لـ«تشات جي بي تي» (Application Programming Interface API)، فتبلغ التكلفة 7.5 دولار لنحو 750 ألف كلمة في «تشات جي بي تي»، بينما تبلغ القيمة 0.14 دولار لعدد الكلمات نفسه في «ديب سيك». يضاف إلى ذلك أن تكلفه تشغيل «ديب سيك» أقل بنحو 27 مرة مقارنة بـ«تشات جي بي تي»، إن أراد المستخدم تشغيل النظام على أجهزته الخاصة لأغراض الأعمال.

ويمكن استخدام الخدمة من خلال موقعها الإلكتروني أو برنامج يتم تحميله على الكومبيوتر الشخصي، أو من خلال تطبيقات للهواتف الجوالة بنظامي التشغيل «أندرويد» و«آي أو إس».

ومن شأن هذه الشركة زعزعة تربع شركات الذكاء الاصطناعي الأميركية على عرش هذا القطاع، حيث تستطيع الصين تقديم خدمات أقوى وأفضل وأقل تكلفة على الرغم من وجود عقوبات أميركية صارمة ضد بيع دارات إلكترونية أميركية قد تساعد في تطوير الذكاء الاصطناعي إلى الصين. ومن المتوقع أن ترد الشركات الأميركية بتقديم خدمات أفضل، وأقل تكلفة للمستخدمين بعد إعادة النظر في الأسس التقنية والتجارية لعملها.

تجربة «الشرق الأوسط»

وحاولت «الشرق الأوسط» التسجيل بالخدمة، ولكن ظهرت رسالة مفادها أن الموقع يتعرض لضغط كبير من التسجيل ولهجمات رقمية قد تبطئ أو تمنع عملية التسجيل حالياً. وبعد الانتظار لمدة ساعة ونصف الساعة ومعاودة التسجيل، تمت العملية بنجاح.

وقمنا بسؤال «ديب سيك» عن قيمة الجذر التربيعي للرقم 41، ليقوم بمشاركة طريقة تفكيره وحسابه بشكل مفصل مع ذكر المواطئ التي تتطلب منه تغيير أسلوب الحساب، وكانت عملية مفصلة جداً. ولدى سؤال «غوغل جيميناي» عن قيمة الجذر التربيعي كانت الإجابة مختصرة.

وقمنا بعد ذلك بطلب ترجمة بضع فقرات من «ديب سيك» من الإنجليزية إلى العربية، وكانت الترجمة صحيحة لغوياً وفي الأسلوب، مع قدرته على الإجابة بشكل صحيح لدى طلب كتابة نص برمجي لقواعد بيانات يدمج جدولين ويعرض معدل قيمة المبيعات للأقسام التي تجاوزت 50 ألف وحدة مباعة، حيث قام بالتفكير وشرح آلية تفكيره، ومن ثم كتابة النص البرمجي بشكل صحيح. وكان من الواضح أن «ديب سيك» يشارك تفاصيل عملية التفكير معنا بشكل أكبر مقارنة بـ«غوغل جيميناي» الذي كان يعرض النتيجة فقط.

ولوحظ أن «ديب سيك1» لا يترجم النصوص ترجمة حرفية، بل يترجم المعنى حسب السياق، واستطاع كذلك الإجابة أسرع من «تشات جي بي تي» في المسائل الرياضية، بل وكانت نتائج «ديب سيك» أكثر دقة. كما يستطيع «ديب سيك» تقديم معلومات غنية أكثر حول مسائل تاريخية. كما استطاع كتابة قصة كاملة وكانت مشوقة مقارنة بأسلوب «تشات جي بي تي» الذي كان مملاً بعض الشيء.


مقالات ذات صلة

في جزء من الثانية... «هارت» يولد صوراً عالية الجودة عبر الذكاء الاصطناعي

تكنولوجيا مزج الباحثون بين نماذج الذكاء الاصطناعي التوليدية لإنشاء أداة سريعة تنتج صوراً بدقة عالية (Christine Daniloff, MIT)

في جزء من الثانية... «هارت» يولد صوراً عالية الجودة عبر الذكاء الاصطناعي

«هارت» (HART) أداة جديدة لإنشاء الصور بالذكاء الاصطناعي، تتفوق على التقنيات الحالية بجودة أعلى، وسرعة أكبر بتسع مرات من النماذج الحالية!

نسيم رمضان (لندن)
علوم تحليل البيانات من المستشعرات

«نيوتن»… ذكاء اصطناعي يتدارك الأحداث قبل وقوعها

يقدم استنتاجات فيزيائية من بيانات المستشعرات بدلاً من استنتاج المنطق اللغوي من النصوص

مارك ويلسون (واشنطن)
يوميات الشرق الملياردير الأميركي بيل غيتس (أ.ف.ب)

بسبب الذكاء الاصطناعي... غيتس يرى أنه لن تكون هناك حاجة للبشر في «معظم الأشياء» بعد عقد

كشف الملياردير الأميركي بيل غيتس إنه خلال العقد المقبل، ستعني التطورات في مجال الذكاء الاصطناعي أنه لن تكون هناك حاجة للبشر في «معظم الأمور» في العالم.

«الشرق الأوسط» (واشنطن)
خاص تؤدي استراتيجية المدينة الآمنة الشاملة إلى انخفاض ملحوظ في الخسائر البشرية والمادية وتحسين استخدام الموارد وتعزيز جودة الحياة (شاترستوك)

خاص كيف يعيد الذكاء الاصطناعي صياغة مفهوم السلامة الحضرية للمدن؟

يعزز الذكاء الاصطناعي السلامة الحضرية في المدن من خلال تحسين إدارة المرور وتعزيز الأمن العام والاستجابة للطوارئ.

نسيم رمضان (لندن)
علوم لضمان الهيمنة الأميركية: شركات الذكاء الاصطناعي تتراجع عن تعهدات السلامة

لضمان الهيمنة الأميركية: شركات الذكاء الاصطناعي تتراجع عن تعهدات السلامة

توجيهات حكومية جديدة للعلماء حذفت فيها عبارة «سلامة الذكاء الاصطناعي»، ومسؤوليته، وعدالة الذكاء الاصطناعي.

«الشرق الأوسط» (واشنطن)

في جزء من الثانية... «هارت» يولد صوراً عالية الجودة عبر الذكاء الاصطناعي

مزج الباحثون بين نماذج الذكاء الاصطناعي التوليدية لإنشاء أداة سريعة تنتج صوراً بدقة عالية (Christine Daniloff, MIT)
مزج الباحثون بين نماذج الذكاء الاصطناعي التوليدية لإنشاء أداة سريعة تنتج صوراً بدقة عالية (Christine Daniloff, MIT)
TT

في جزء من الثانية... «هارت» يولد صوراً عالية الجودة عبر الذكاء الاصطناعي

مزج الباحثون بين نماذج الذكاء الاصطناعي التوليدية لإنشاء أداة سريعة تنتج صوراً بدقة عالية (Christine Daniloff, MIT)
مزج الباحثون بين نماذج الذكاء الاصطناعي التوليدية لإنشاء أداة سريعة تنتج صوراً بدقة عالية (Christine Daniloff, MIT)

يُعدُّ توليد صور عالية الجودة بكفاءة تحدياً بالغ الأهمية، خصوصاً للتطبيقات، مثل تدريب السيارات ذاتية القيادة، أو تصميم بيئات ألعاب الفيديو، أو محاكاة سيناريوهات العالم الحقيقي. وفي حين حققت نماذج الذكاء الاصطناعي تقدماً كبيراً في توليد الصور، لا تزال الطرق الحالية تواجه مفاضلة بين السرعة والجودة.

نماذج الانتشار (Diffusion Models)، مثل تلك المستخدمة في «DALL-E» و«Stable Diffusion»، تنتج صوراً واقعية مذهلة، لكنها تتطلب قوة حاسوبية كبيرة ووقتاً طويلاً. من ناحية أخرى، النماذج الانحدارية الذاتية (Autoregressive Models) المشابهة لتلك المستخدمة في نماذج اللغة الكبيرة مثل «تشات جي بي تي» (ChatGPT) تولد الصور بسرعة، لكنها غالباً ما تعاني مع التفاصيل الدقيقة، ما يؤدي إلى نتائج مشوهة أو ضبابية. الآن، طور فريق من الباحثين من معهد «ماساتشوستس للتكنولوجيا» (MIT) وشركة «إنفيديا» (NVIDIA) حلّاً مبتكراً يُدعى «هارت» (HART) وهو نموذج ذكاء اصطناعي جديد يجمع بين مزايا الطريقتين لتقديم صور عالية الجودة بسرعات غير مسبوقة.

أفضل ما في الطريقتين

يعمل «HART» على مبدأ بسيط لكنه قوي. أولاً، يقوم النموذج برسم الخطوط العريضة للصورة بسرعة، ثم يقوم نموذج انتشار صغير بتنقيح التفاصيل، فماذا يعني ذلك؟

يوضح هاوتيان تانغ، طالب الدكتوراه في «MIT»، والمؤلف الرئيسي المشارك للبحث، الأمر بهذه العبارة: «تخيَّل الأمر مثل الرسم». ويتابع: «إذا غطّيت اللوحة كلها دفعة واحدة، فقد تبدو النتيجة خاماً. لكن إذا بدأت برسم عام، ثم نقحته بضربات فرشاة أصغر وأدق، تصبح الصورة النهائية أكثر إتقاناً».

تعمل نماذج الانتشار التقليدية عن طريق إزالة الضوضاء من الصورة خطوة بخطوة حتى تظهر صورة واضحة. وهذه العملية تضمن دقة عالية لكنها بطيئة وتستهلك موارد كبيرة. في المقابل، تولد نماذج «هارت» (HART) الصور بشكل تسلسلي، متنبئة بأجزاء صغيرة في كل مرة. وفي حين تكون أسرع، فإنها غالباً ما تفقد تفاصيل مهمة بسبب الضغط.

يملأ «HART» هذه الفجوة باستخدام نموذج انحدار ذاتي للتعامل مع الجزء الأكبر من توليد الصورة، ثم تطبيق نموذج انتشار خفيف فقط لتحسين التفاصيل المتبقية، أي تلك العناصر الدقيقة التي تجعل الصورة حية مثل ملمس الشعر، وبريق العين، أو الحواف الدقيقة للأجسام.

يتميز نموذج «HART» الجديد بقدرته على إنتاج صور بجودة تعادل أو تفوق أحدث نماذج الانتشار لكن بسرعة أعلى بتسع مرات (MIT)

السرعة دون التضحية بالجودة

من أكثر إنجازات «HART» إثارة للإعجاب هي كفاءته. وفي حين تتطلب نماذج الانتشار الحديثة مليارات المعلمات وعشرات الخطوات للتنقيح، يُحقق «هارت» نتائج مماثلة أو حتى أفضل بجزء بسيط من التكلفة الحاسوبية.

في الاختبارات، أنتج «HART» صوراً أسرع بتسع مرات من نماذج الانتشار الرائدة، مع الحفاظ على مستوى التفاصيل نفسه. والأكثر إثارة، أنه يفعل ذلك باستخدام طاقة حاسوبية أقل بنسبة 31 في المائة، ما يجعله قابلاً للتشغيل على أجهزة المستهلك العادية، مثل أجهزة اللابتوب أو الهواتف الذكية.

يقول تانغ: «نموذج الانتشار في (HART) لديه مهمة أبسط بكثير... فهو يحتاج فقط لتصحيح التفاصيل الدقيقة، وليس الصورة بأكملها، ما يجعل العملية أكثر كفاءة».

فتح آفاق جديدة

تمتد آثار «HART» إلى ما هو أبعد من مجرد توليد صور أسرع. تصميمه الهجين يجعله شديد التكيف للدمج مع أنظمة الذكاء الاصطناعي متعددة الوسائط، مثل نماذج الرؤية واللغة التي يُمكنها تفسير وتوليد النصوص والصور معاً.

تخيَّل أن تطلب من مساعد ذكي أن يرشدك خلال تجميع قطعة أثاث، مع عرض مرئي لكل خطوة في الوقت الفعلي، أو فكِّر في سيارات ذاتية القيادة يتم تدريبها في بيئات افتراضية فائقة الواقعية، تتعلم تجنب المخاطر غير المتوقعة، قبل أن تصل حتى إلى الطريق. سرعة ودقة «HART» مكَّنَتا من جعل هذه التطبيقات ليست ممكنة فحسب، بل عملية أيضاً.

في المستقبل، يُخطط الباحثون لتوسيع قدرات «HART»، لتشمل توليد الفيديو وتركيب الصوت، مستفيدين من تصميمه القابل للتوسع لمهام أكثر تعقيداً.

خطوة نحو ذكاء اصطناعي أذكى

يُمثل «HART» قفزة كبيرة إلى الأمام في مجال الذكاء الاصطناعي التوليدي، مبرهناً على أن السرعة والجودة يجب ألا يكونا متناقضين. من خلال الجمع الذكي بين نقاط قوة النماذج الانحدارية الذاتية ونماذج الانتشار، يفتح الباحثون أبواباً جديدة لتوليد الصور عالية الدقة في الوقت الفعلي، ما يقربنا من مستقبل يمكن فيه للذكاء الاصطناعي أن يدمج الإبداع والكفاءة بسلاسة.

هذا البحث، المدعوم من مختبر «MIT-IBM Watson» للذكاء الاصطناعي، ومركز «MIT» و«Amazon للعلوم»، ومؤسسة «العلوم الوطنية الأميركية»، سيُعرض في المؤتمر الدولي حول التمثيلات التعليمية. ومع مزيد من التطوير، قد يصبح «HART» قريباً حجر الزاوية في تطبيقات الذكاء الاصطناعي من الجيل التالي، ما يُعيد تشكيل طريقة تفاعلنا مع الذكاء الاصطناعي والاستفادة منه.