كيف نجحت «ديب سيك» في بناء نظام ذكاء اصطناعي بتكاليف أقل؟

إبداعات الموهوبين الصينيين تشجع العالم لبناء أدوات أرخص

كيف نجحت «ديب سيك» في بناء نظام ذكاء اصطناعي بتكاليف أقل؟
TT

كيف نجحت «ديب سيك» في بناء نظام ذكاء اصطناعي بتكاليف أقل؟

كيف نجحت «ديب سيك» في بناء نظام ذكاء اصطناعي بتكاليف أقل؟

في الشهر الماضي، انهارت الأسواق المالية الأميركية بعد أن أعلنت شركة صينية ناشئة تدعى «ديب سيك» أنها بنت أحد أقوى أنظمة الذكاء الاصطناعي في العالم باستخدام عدد أقل كثيراً من الرقائق الإلكترونية، مما كان يعتقد الكثير من الخبراء أنه ممكن.

ألفا رقيقة إلكترونية بدلاً من 16 ألفاً

وعادة ما تدرب شركات الذكاء الاصطناعي روبوتات الدردشة الخاصة بها باستخدام أجهزة كمبيوتر عملاقة مزودة بـ16 ألف رقيقة متخصصة أو أكثر. لكن «ديب سيك» قالت إنها احتاجت إلى نحو 2000 شريحة فقط.

عُشر تكاليف الإنفاق

وكما أوضح مهندسو «ديب سيك» في ورقة بحثية نشرت بعد عيد الميلاد مباشرة، استخدمت الشركة الناشئة الكثير من الحيل التكنولوجية لتقليل تكلفة بناء نظامها بشكل كبير. ولم يكن مهندسوها بحاجة سوى إلى نحو 6 ملايين دولار من قوة الحوسبة الخام، وهو ما يقرب من عُشر ما أنفقته «ميتا» في بناء أحدث تقنيات الذكاء الاصطناعي لديها.

ماذا فعلت «ديب سيك» بالضبط؟

إليك الدليل:

* كيف يتم بناء تقنيات الذكاء الاصطناعي؟ تعتمد تقنيات الذكاء الاصطناعي الرائدة على ما يسميه العلماء بالشبكات العصبية، وهي أنظمة رياضية تتعلم مهاراتها من خلال تحليل كميات هائلة من البيانات.

تقضي أقوى الأنظمة شهوراً في تحليل كل النصوص الإنجليزية تقريباً على الإنترنت، بالإضافة إلى العديد من الصور والأصوات والوسائط المتعددة الأخرى. وهذا يتطلب كميات هائلة من قوة الحوسبة.

قبل نحو 15 عاماً، أدرك باحثو الذكاء الاصطناعي أن الرقائق الإلكترونية المتخصصة التي تسمى وحدات معالجة الرسومات

graphics processing units، أو GPUs، كانت وسيلة فعالة لإجراء هذا النوع من تحليل البيانات. صممت شركات مثل شركة تصنيع الرقائق في وادي السيليكون «إنفيديا» هذه الرقائق في الأصل لتقديم رسومات لألعاب الفيديو على الكمبيوتر. لكن وحدات معالجة الرسومات كانت لديها أيضاً موهبة في تشغيل معادلات الرياضيات التي تعمل على تشغيل الشبكات العصبية.

مع قيام الشركات بتعبئة المزيد من وحدات معالجة الرسومات في مراكز بيانات الكمبيوتر الخاصة بها، يمكن لأنظمة الذكاء الاصطناعي الخاصة بها تحليل المزيد من البيانات.

لكن أفضل وحدات معالجة الرسومات تكلف نحو 40 ألف دولار. كما أنها تحتاج إلى كميات هائلة من الكهرباء، إذ يمكن أن يستهلك إرسال البيانات بين الرقائق طاقة كهربائية أكبر من تشغيل الرقائق نفسها.

«ديب سيك» تخفض التكاليف

* كيف تمكنت «ديب سيك» من خفض التكاليف؟ فعلت الشركة العديد من الأشياء. وأبرزها أنها تبنت طريقة تسمى «مزيج الخبراء mixture of experts».

كانت الشركات عادة ما تنشئ شبكة عصبية واحدة تتعلم جميع الأنماط في جميع البيانات على الإنترنت. وكان هذا مكلفاً، لأنه يتطلب كميات هائلة من البيانات للانتقال بين رقائق وحدة معالجة الرسوميات.

إذا كانت إحدى الرقاقات تتعلم كيفية كتابة قصيدة وكانت أخرى تتعلم كيفية كتابة برنامج كمبيوتر، فلا يزال يتعين عليهما «التحادث» مع بعضهما بعضاً، فقط في الحالة التي يوجد فيها بعض التداخل بين الشعر والبرمجة.

«مزيج الخبراء» - خبير لكل مجال

باستخدام طريقة مزيج الخبراء، حاول الباحثون حل هذه المشكلة عن طريق تقسيم النظام إلى العديد من الشبكات العصبية: واحدة للشعر، وواحدة لبرمجة الكمبيوتر، وواحدة لعلم الأحياء، وواحدة للفيزياء، وهكذا. قد يكون هناك 100 من هذه الأنظمة من «الخبراء» الأصغر. ويمكن لكل خبير التركيز على مجاله الخاص.

وقد واجه العديد من الشركات صعوبة في استخدام هذه الطريقة، لكن «ديب سيك» كانت قادرة على القيام بذلك بشكل جيد. كانت حيلتها هي إقران هذه الأنظمة من «الخبراء» الأصغر بنظام «عام».

كانت هذه الأدوات من «الخبراء» لا تزال بحاجة إلى تبادل بعض المعلومات فيما بينها، وكان «الخبير العام» -الأداة التي تتمتع بفهم لائق ولكن غير مفصل لكل موضوع- قادرةً على المساعدة في تنسيق التفاعلات بين الخبراء.

الأمر أشبه إلى حد ما بقيام محرر بالإشراف على غرفة أخبار مليئة بالمراسلين المتخصصين.

كفاءة «رياضيات» أكثر

* هل حقق هذا كفاءة أكثر؟ ولكن هذا ليس الشيء الوحيد الذي فعلته «ديب سيك» فقد أتقنت أيضاً خدعة بسيطة تتضمن الأعداد العشرية التي يمكن لأي شخص يتذكر فصل الرياضيات في المدرسة الابتدائية أن يفهمها.

هل شمل ذلك الرياضيات؟ هل تتذكر مدرس الرياضيات الذي شرح لك مفهوم النسبة الثابتة «ط»، أو «باي Pi» التي يشار إليها أيضاً بالرمز «π»، وهي رقم لا ينتهي أبداً: 3.14159265358979.

يمكنك استخدام «π» لإجراء حسابات مفيدة، مثل تحديد محيط الدائرة. عندما تقوم بهذه الحسابات، فإنك تختصر π إلى بضعة أعداد عشرية فقط: 3.14. إذا استخدمت هذا الرقم الأبسط، فستحصل على تقدير جيد جداً لمحيط الدائرة.

لقد فعلت شركة «ديب سيك» شيئاً مشابهاً، لكن على نطاق أوسع كثيراً، في تدريب تقنية الذكاء الاصطناعي الخاصة بها.

إن الرياضيات التي تسمح للشبكة العصبية بتحديد الأنماط في النص هي في الحقيقة مجرد عمليات ضرب - الكثير والكثير والكثير من الضرب - إننا نتحدث عن أشهر من الضرب عبر آلاف الرقائق الحاسوبية.

عادةً ما تقوم الرقائق بضرب الأرقام التي تتسع لـ 16 بت من الذاكرة. لكن «ديب سيك» ضغط كل رقم في 8 بت فقط من الذاكرة، نصف المساحة، أي أنه قام في الأساس بحذف عدة أرقام عشرية من كل رقم.

هذا يعني أن كل حساب كان أقل دقة. لكن هذا لم يكن مهماً. كانت الحسابات دقيقة بما يكفي لإنتاج شبكة عصبية قوية حقاً.

مهارة وإبداع صينيان

*إذن، هل يمكن لأي طالب في المدرسة الثانوية أن يفعل هذا؟ لا. أظهر مهندسو «ديب سيك» في ورقتهم البحثية أنهم كانوا أيضاً جيدين جداً في كتابة التعليمات البرمجية المعقدة للغاية للكمبيوتر والتي تخبر وحدات معالجة الرسوميات بما يجب القيام به. لقد عرفوا كيفية استخراج المزيد من الكفاءة من هذه الرقائق.

قليل من الناس لديهم هذا النوع من المهارة. لكن مختبرات الذكاء الاصطناعي الجادة لديها المهندسون الموهوبون اللازمون لمضاهاة ما فعلته «ديب سيك».

إذن، لماذا لم يفعل الآخرون ذلك بالفعل؟ قد تستخدم بعض مختبرات الذكاء الاصطناعي بعض الحيل نفسها بالفعل، إلا أن الشركات مثل «أوبن إيه آي» لا تكشف دائماً عما تفعله خلف الأبواب المغلقة.

لكن الآخرين فوجئوا بوضوح بعمل «ديب سيك»، إذ إن القيام بما فعلته الشركة الناشئة ليس بالأمر السهل. وتتضمن التجربة اللازمة لإيجاد اختراق مثل هذا ملايين، إن لم يكن المليارات، من الدولارات للإنفاق على الطاقة الكهربائية.

الخوف من خسارة الأموال يقيد الإبداع

بعبارة أخرى، يتطلب الأمر قدراً هائلاً من المخاطر. «عليك أن تخاطر بالكثير من المال لتجربة أشياء جديدة، وغالباً ما تفشل»، كما قال تيم ديتمرز، الباحث في معهد ألين للذكاء الاصطناعي في سياتل، والمتخصص في بناء أنظمة الذكاء الاصطناعي الفعّالة، وعمل سابقاً باحثاً في مجال الذكاء الاصطناعي في «ميتا».

وأضاف: «لهذا السبب لا نرى الكثير من الإبداع. يخشى الناس خسارة ملايين عدة لمجرد تجربة شيء لا يعمل».

مشاركة الباحثين الصينيين إبداعاتهم

أشار عدد من الخبراء إلى أن مبلغ 6 ملايين دولار الذي حصلت عليه شركة «ديب سيك» غطى فقط ما أنفقته الشركة الناشئة عند تدريب النسخة النهائية من النظام.

وفي ورقتهم البحثية، قال مهندسو «ديب سيك» إنهم أنفقوا أموالاً إضافية على البحث والتجريب قبل الجولة التدريبية النهائية. ولكن الأمر نفسه ينطبق على أي مشروع ذكاء اصطناعي متطور.

لقد أجرت شركة «ديب سيك» تجارب، وأثمرت. والآن، نظراً لأن الشركة الناشئة الصينية تشاركت بأساليبها مع باحثين آخرين في مجال الذكاء الاصطناعي، فإن طرقها التكنولوجية مؤهلة لتقليل تكلفة بناء أدوات الذكاء الاصطناعي بشكل كبير.

* خدمة «نيويورك تايمز».


مقالات ذات صلة

هوليوود تدعو ترمب إلى حماية السينما من الذكاء الاصطناعي

يوميات الشرق عبارة الذكاء الاصطناعي تظهر إلى جانب لوحة مفاتيح وروبوت في صورة مركبة (رويترز)

هوليوود تدعو ترمب إلى حماية السينما من الذكاء الاصطناعي

دعت أكثر من 400 شخصية هوليوودية البيت الأبيض إلى حماية حقوق المؤلف المتعلقة بالأعمال السينمائية والموسيقية لمنع استغلالها بواسطة الذكاء الاصطناعي.

«الشرق الأوسط» (لوس أنجليس)
علوم 60 % من نتائج بحث أدوات الذكاء الاصطناعي... غير دقيقة

60 % من نتائج بحث أدوات الذكاء الاصطناعي... غير دقيقة

تقدِّم أحيانا نتائج «معقولة» لكن غير صحيحة

كيت إيتون (واشنطن)
الخليج الرئيس الأميركي دونالد ترمب مع الشيخ طحنون بن زايد آل نهيان نائب حاكم إمارة أبوظبي ومستشار الأمن الوطني في الإمارات خلال اللقاء (وام)

الرئيس الأميركي ترمب يجري محادثات مع مستشار الأمن الوطني الإماراتي

بحث الرئيس الأميركي دونالد ترمب مع الشيخ طحنون بن زايد آل نهيان، نائب حاكم إمارة أبوظبي ومستشار الأمن الوطني في الإمارات، آفاق الشراكة الاستراتيجية طويلة الأمد.

«الشرق الأوسط» (أبوظبي - واشنطن)
تكنولوجيا منافسة حادة بين نموذجي «تشات جي بي تي 4.5» و«غوغل جيميناي 2.0» للتربع على عرش الذكاء الاصطناعي

«تشات جي بي تي 4.5» و«غوغل جيميناي 2.0»: صراع العمالقة في عالم الذكاء الاصطناعي

أي منهما سيتفوق في سباق العقول الاصطناعية؟

خلدون غسان سعيد (جدة)
خاص التقارب بين الذكاء الاصطناعي والحوسبة الكمومية يمكن أن يسرع الاكتشافات في مجالات مثل الأدوية والمناخ (أدوبي)

خاص كيف يغير تقارب الذكاء الاصطناعي والحوسبة الكمومية وجه الاكتشافات العلمية؟

الحوسبة الكمومية والذكاء الاصطناعي يجتمعان لقيادة الابتكار العلمي، مع تقدم سريع في التطبيقات التجارية، من اكتشاف الأدوية إلى الأمن السيبراني.

نسيم رمضان (سياتل)

«تشات جي بي تي 4.5» و«غوغل جيميناي 2.0»: صراع العمالقة في عالم الذكاء الاصطناعي

منافسة حادة بين نموذجي «تشات جي بي تي 4.5» و«غوغل جيميناي 2.0» للتربع على عرش الذكاء الاصطناعي
منافسة حادة بين نموذجي «تشات جي بي تي 4.5» و«غوغل جيميناي 2.0» للتربع على عرش الذكاء الاصطناعي
TT

«تشات جي بي تي 4.5» و«غوغل جيميناي 2.0»: صراع العمالقة في عالم الذكاء الاصطناعي

منافسة حادة بين نموذجي «تشات جي بي تي 4.5» و«غوغل جيميناي 2.0» للتربع على عرش الذكاء الاصطناعي
منافسة حادة بين نموذجي «تشات جي بي تي 4.5» و«غوغل جيميناي 2.0» للتربع على عرش الذكاء الاصطناعي

في سباق محموم نحو تطوير الذكاء الاصطناعي، تطل علينا شركتا «أوبن إيه آي» و«غوغل» بإصدارين جديدين يعدان بنقلة نوعية في عالم نماذج اللغة الكبيرة: «تشات جي بي تي 4.5» Chat GPT 4.5 و«غوغل جيميناي 2.0» Google Gemini 2.0، وهما نموذجان يقدِّمان ميزات وقدرات متطورة تجعل منهما أداتين قويتين ومتنوعتين قادرتين على التعامل مع مهام معقدة بكفاءة ودقة عالية.

وسنستعرض في هذا الموضوع أبرز المزايا التي يقدمها هذان النموذجان ونقارن بينهما في جوانب عدة، لنكشف عن نقاط القوة والضعف في كل منهما ونسلط الضوء على الفروقات التي قد تكون حاسمةً في اختيار النموذج الأنسب لكم.

قفزة «جي بي تي» النوعية

يتجسَّد في «تشات جي بي تي 4.5»، الفهم المحسَّن للسياق. وهو يمثل قفزةً نوعيةً في عالم نماذج اللغة الكبيرة، حيث يأتي بتحسينات ملحوظة في الأداء والقدرات مقارنة بالإصدارات السابقة. وهذه التحسينات تجعله أداةً أكثر قوةً وتنوعاً، قادرةً على التعامل مع مجموعة واسعة من المهام بكفاءة ودقة عالية.

وسنستعرض فيما يلي أبرز المزايا التي يقدِّمها هذا النموذج المطور.

• الميزة الأولى: الفهم المُحسَّن للسياق، حيث يتمتع «تشات جي بي تي 4.5» بقدرة مُحسَّنة على فهم السياق في المحادثات المعقدة والطويلة. وهذا الأمر يعني أنه يمكنه تتبع التفاصيل الدقيقة للمحادثة وفهم العلاقات بين الأفكار المختلفة وتقديم استجابات أكثر دقةً وملاءمة.

وهذه الميزة تجعل النظام أكثر فاعليةً في المهام التي تتطلب فهماً عميقاً للنصوص، مثل تلخيص المستندات الطويلة أو الإجابة عن الأسئلة المعقدة.

• الميزة الثانية: تقديم دقة أعلى في الإجابات، حيث تم تحسينه لتقديم إجابات أكثر دقةً وموثوقيةً، مع خفض الهلوسة أو توليد معلومات خاطئة. وهذا التحسين يجعله أداةً أكثر موثوقيةً للاستخدام في مجموعة متنوعة من المهام المتخصصة، مثل البحث عن المعلومات أو كتابة المحتوى.

• الميزة الثالثة التي يتمتع بها «تشات جي بي تي 4.5»، هي تقديم قدرات إبداعية محسنة، إذ يتمتع بقدرات إبداعية مُطوَّرة تسمح له بتوليد نصوص أكثر إبداعاً وتنوعاً. ويمكن استخدام هذه الميزة لكتابة القصص والشعر والنصوص المتقدمة والمحتوى الإبداعي.

• الميزة الرابعة هي دعم قدرات الوسائط المتعددة؛ حيث تتكامل مع أحدث ميزات «تشات جي بي تي»، بما في ذلك تحميل الملفات والصور وقدرات البحث، وغيرها. ومع ذلك، لا تزال قدرات الوسائط المتعددة مثل الوضع الصوتي ومعالجة الفيديو ومشاركة الشاشة غير مدعومة في هذا الإصدار الجديد.

«جيميناي 2.0»: تكامل مع «غوغل»

يمثل «غوغل جيميناي 2.0» خطوةً ثوريةً في مجال نماذج الذكاء الاصطناعي، حيث يجمع بين قوة التعلم العميق، وقدرات معالجة البيانات الهائلة؛ لتقديم أداء غير مسبوق في مجموعة متنوعة من المهام. ويتميز هذا الإصدار الجديد بقدرته على فهم وتوليد النصوص والصور والصوتيات وعروض الفيديو، مما يجعله نموذجاً متعدد الوسائط، قادراً على التكيف مع احتياجات المستخدمين في مختلف المجالات.

• الميزة الأولى لـ«غوغل جيميناي 2.0» هي دعم الوسائط المتعددة، حيث إن له قدرةً فائقةً على فهم وتوليد المحتوى عبر مختلف الوسائط، بما في ذلك النصوص والصور والصوتيات وعروض الفيديو. ويمكنه تحليل الصور والفيديوهات بدقة عالية وفهم محتواها وتوليد أوصاف نصية دقيقة لها. كما يمكنه توليد الصوتيات وتحويل النصوص إلى كلام منطوق، والعكس. هذه القدرات المتعددة الوسائط تجعله أداةً متقدمةً جداً للإبداع والتواصل والتعلم.

• الميزة الثانية، هي الفهم المتقدم للغات؛ ما يسمح له بتحليل النصوص المعقدة وفهم العلاقات بين الكلمات والجمل بدقة عالية، حيث يمكنه فهم السياق واستخلاص المعلومات المهمة والإجابة عن الأسئلة المعقدة بدقة وموضوعية. وهذا الفهم المتقدم للغة (يشمل فهم اللغة العربية) يجعله أداةً قيّمة للبحث عن المعلومات وتلخيص النصوص والترجمة بين اللغات المختلفة وكتابة المحتوى.

• الميزة الثالثة: تحسن الإصدار من حيث قدرات كتابة النصوص البرمجية، وذلك نتيجة تحسينه للتعامل مع المهام البرمجية المعقدة، حيث يمكنه فهم وتوليد النصوص البرمجية بلغات البرمجة المختلفة وتصحيح الأخطاء واقتراح التحسينات للنصوص الحالية. وهذه القدرات البرمجية تجعله مرجعاً مهماً للمطورين والمبرمجين، حيث يمكنهم استخدامه لكتابة النصوص بشكل أسرع وأكثر كفاءة.

• الميزة الرابعة، وهي تكامله السلس مع خدمات «غوغل»، حيث يتكامل الإصدار الجديد بسلاسة مع مجموعة واسعة من خدمات «غوغل»؛ ما يجعله متاحاً للمستخدمين في مختلف التطبيقات والمنصات. ويمكن استخدامه في محرك البحث و«مساعد غوغل» والخدمات السحابية لـ«غوغل» التي تشمل «وثائق غوغل» وجداول الحسابات وعروض التقديم، وغيرها من الخدمات الأخرى. هذا التكامل السلس يجعل من الإصدار الجديد أداةً عالية الكفاءة للبحث عن المعلومة وإنجاز المهام والتواصل مع الآخرين.

مقارنة بين الإصدارين الجديدين

ولدى طلب التخطيط لقضاء إجازة في منطقة، قدَّم «تشات جي بي تي 4.5» خط سير مفصلاً مع اقتراحات للسير لمسافات طويلة، وأماكن لتناول الطعام، وخيارات للسكن، إلى جانب نصائح حول كيفية الوصول إلى الوجهة. وفي المقابل، قدَّم «غوغل جيميناي 2.0» مقترحات جيدة للسير لمسافات طويلة وتناول الطعام، ولكنه كان أقل تحديداً حول أماكن السكن.

وفي ما يتعلق بالترجمة، قدم كلا النموذجين ترجمات دقيقة بين اللغات العربية والإنجليزية والفرنسية. وكان الفارق الوحيد هو أن «تشات جي بي تي 4.5» قدَّم روابط مع الترجمة. أما لدى سؤال الإصدارين حول حالة الطقس في مدينة الرياض، فقدَّم «غوغل جيميناي 2.0» حالة الطقس الحالي، بينما قدم «تشات جي بي تي 4.5» توقعات لكل ساعة مع صور وكلمات تصف حالة الطقس.

وفي الخلاصة، لا يمكن اعتبار أي منهما أفضل بشكل قاطع من الآخر، على الرغم من وجود بعض الاختلافات الطفيفة بينهما، والتي قد لا تكون ملحوظةً في الاستخدامات اليومية العادية. ويُنصح بالتحقق من جميع النتائج حتى لا يقع المستخدم في مشكلة الهلوسة (تأليف الذكاء الاصطناعي للمعلومة التي لا يعرفها لتبدو وكأنها حقيقية).

النموذجان متقدمان والاختيار بينهما يعتمد على تفضيلات المستخدمين بشكل فردي. ولكن يبقى فارق أخير بينهما يستحق الذكر، وهو أن «غوغل جيميناي 2.0» يسمح بتحميل الملفات والوثائق الكبيرة وتلخيصها والإجابة عن أي استفسارات مرتبطة بها بشكل مجاني، مقارنة باشتراك مدفوع في «تشات جي بي تي 4.5» وقيوده فيما يتعلق بحجم الملفات وعدد مرات استخدام هذا الميزة في اليوم الواحد.

«أبل» تؤجّل ميزات الذكاء الاصطناعي الجديدة

من جهتها أعلنت «أبل» تأجيل إطلاق النسخة المُحدَّثة من مساعدها الصوتي «سيري» التي كان من المفترض أن تُقدِّم قدرات متطورة لفهم السياق الشخصي وتنفيذ المهام داخل التطبيقات. وأوضحت الشركة أنها ستطلق هذه التحديثات خلال العام المقبل دون تحديد موعد دقيق لذلك. ويأتي هذا التأجيل نتيجة لصعوبات واجهت «أبل» في تطوير «سيري» المحدث، وإدراكها أن خططها لربط المساعد الصوتي بنموذج لغة كبير لتعزيز قدراته قد تستغرق سنوات عدة لتنضج بالشكل المرغوب، مقارنة بقدرات «سامسونغ» للذكاء الاصطناعي التي أطلقتها في سلسلة هواتفها «غالاكسي إس 25»، التي أطلقتها في شهر فبراير (شباط) الماضي، والتي تدعم تنفيذ المهام داخل التطبيقات بشكل مدمج.

وكانت «أبل» قد قدَّمت «سيري» المطور بوصفه جزءاً أساسياً من رؤيتها لـ«ذكاء أبل»، حيث وعدت بقدرة المساعد الصوتي على فهم ما يحدث في الجوال وتنفيذ الإجراءات داخل التطبيقات. ولكن ما تم إطلاقه حتى الآن يقتصر على ميزات مبسطة مثل الكتابة إلى «سيري» وفهم وشرح ميزات منتجات «أبل» وتحسينات بصرية، وتكامل مع «تشات جي بي تي».