الثورة التالية في عالم الذكاء الاصطناعي برعاية «Meta»

شعار شركة «ميتا» المالكة لتطبيقات «واتساب» و«إنستغرام» و«فيسبوك»
شعار شركة «ميتا» المالكة لتطبيقات «واتساب» و«إنستغرام» و«فيسبوك»
TT

الثورة التالية في عالم الذكاء الاصطناعي برعاية «Meta»

شعار شركة «ميتا» المالكة لتطبيقات «واتساب» و«إنستغرام» و«فيسبوك»
شعار شركة «ميتا» المالكة لتطبيقات «واتساب» و«إنستغرام» و«فيسبوك»

يبدو أن «Meta» تريد المنافسة وبقوة والبقاء على الحدود المستمرة مع الثورة التقنية في مجال الذكاء الاصطناعي وبناءً عليه أعلنت عن منتج جديد ومنافس، وهو «CM3leon». فلنناقش هذا الابتكار الجديد وماذا يعني لعالم الذكاء الاصطناعي.

«CM3leon»: القفزة التالية في عالم الذكاء الاصطناعي

يعد «CM3leon» نموذجاً أساسياً متعدد الوسائط لتحويل النص إلى صورة والعكس، مما يعني أنه يمكن استخدامه لتوليد تعليقات توضيحية للصور تلقائياً. في حين أن هذه ليست فكرة جديدة في مجال الذكاء الاصطناعي، الجديد هو الأداء الذي يزعم «Meta» أن نموذجها الأساسي قادر على تحقيقه. ولعل الأكثر إثارة هي الطريقة التي يتم بها بناء «CM3leon».

خدمة وأداة «ميتا» الجديدة لصناعة وتوليد الصور عن طريق «PROMPT»

الابتكارات الفريدة لـ«CM3leon»

يعد أغلب الأدوات التي تتيح توليد الصور من النصوص، مثل Stable Diffusion وDALL-E وMidjourney، تعتمد على ما تُعرف بنماذج التوزيع. في حين أن هذه النماذج قد أظهرت نتائج قوية، إلا أن «Meta» أخذت مساراً مختلفاً مع «CM3leon». بدلاً من استخدام نموذج توزيع، يعتمد «CM3leon» على ما يُعرف بنموذج التسلسل التلقائي القائم على الرموز، الذي يعد أكثر تكلفة في التدريب ولكنه يُنتج صوراً بجودة ودقة أفضل عن منافسيه.

كفاءة فائقة

مع ذلك، رغم تعقيد النموذج، يُظهر «CM3leon» كفاءة مدهشة. حسبما ذكرت «Meta»، يتم تدريب «CM3leon» باستخدام الحاسوب بخمسة أضعاف أقل من الأساليب القائمة على التحويل السابقة. هذا يعني أنه يمكن أن يوفر أداءً متفوقاً بأقل تكلفة.

يمكنك عن طريق «CM3leon» إنشاء وتوليد الصور والتعديل عليها بسهولة

حقوق الصور وأخلاقيات التدريب

بعيداً عن الأداء والكفاءة، هناك جانب آخر يجعل «CM3leon» مميزاً، وهي الطريقة التي يجري بها تدريبه. بدلاً من الاستفادة من الصور المتاحة علنياً على الإنترنت -الأمر الذي أثار بعض القضايا القانونية المرتبطة بملكية الصور- تستخدم «Meta» الصور المرخصة من Shutterstock. هذا يسمح لها بتجنب القضايا المرتبطة بملكية الصور والاقتباس.

نموذج من الأداء العالي لـ«CM3leon»

المنافسون في الساحة

DALL-E

هذا النموذج من الذكاء الاصطناعي من OpenAI يُمكنه إنتاج صور فريدة من نوعها من النصوص. ومع ذلك، يعتمد DALL-E على النماذج التوزيعية، والتي قد تكون أقل كفاءة من نموذج «CM3leon» القائم على الرموز.

Stable Diffusion

هي أداة أخرى شهيرة في مجال الذكاء الاصطناعي تتيح توليد الصور من النصوص. ومع ذلك، مثل DALL-E، يعتمد على نماذج التوزيع وقد لا يكون قادراً على المطابقة مع الكفاءة والجودة التي يوفرها «CM3leon».

Midjourney

هذا النموذج أيضاً يعد منافساً لـ«CM3leon»، ولكن مثل DALL-E وStable Diffusion، فإنه يعتمد على نماذج التوزيع، وقد لا يتمتع بالتماسك العالمي الذي يتمتع به «CM3leon».

الخلاصة

CM3leon ليس مجرد خطوة جديدة في عالم الذكاء الاصطناعي، بل هو تقدم ثوري قد يحدد الطريق إلى المستقبل. حالياً، هو جهد بحثي ولا يزال غير واضح متى أو حتى إذا كانت «Meta» ستجعل هذه التقنية متاحة للجمهور. ومع ذلك، وبالنظر إلى الأداء القوي والكفاءة العالية لـ«CM3leon»، فمن المرجح أن نرى مزيداً من التطورات في هذا المجال قريباً.


مقالات ذات صلة

المفوضية الأوروبية تغرّم «ميتا» نحو 800 مليون يورو بتهمة تقويض المنافسة

تكنولوجيا شعار شركة «ميتا» يظهر على شاشة جوّال (أ.ف.ب)

المفوضية الأوروبية تغرّم «ميتا» نحو 800 مليون يورو بتهمة تقويض المنافسة

أعلنت المفوضية الأوروبية، الخميس، أنها فرضت غرامة قدرها 798 مليون يورو على شركة «ميتا» لانتهاكها قواعد المنافسة.

«الشرق الأوسط» (بروكسل)
العالم الانشغال الزائد بالتكنولوجيا يُبعد الأطفال عن بناء صداقات حقيقية (جامعة كوينزلاند) play-circle 00:32

أستراليا تتجه لحظر «السوشيال ميديا» لمن دون 16 عاماً

تعتزم الحكومة الأسترالية اتخاذ خطوات نحو تقييد وصول الأطفال والمراهقين إلى وسائل التواصل الاجتماعي.

«الشرق الأوسط» (سيدني)
الولايات المتحدة​ تحظر «ميتا» و«تيك توك» و«يوتيوب» و«إكس» المنشورات التي تسعى إلى ترهيب الناخبين (رويترز)

كيف تعمل «ميتا» و«تيك توك» و«يوتيوب» و«إكس» على إدارة التهديدات الانتخابية؟

أكثر شبكات التواصل الاجتماعي نفوذاً -بما في ذلك «ميتا» و«تيك توك» و«يوتيوب» و«إكس»- لديها سياسات وخطط جاهزة لإدارة التهديدات الانتخابية والمعلومات المضللة.

«الشرق الأوسط» (واشنطن)
الاقتصاد شعار العلامة التجارية «ميتا» مطبوع بتقنية الطباعة ثلاثية الأبعاد على لوحة مفاتيح كومبيوتر محمول (رويترز)

كوريا الجنوبية تغرم «ميتا» 15 مليون دولار لانتهاك خصوصية المستخدمين

فرضت كوريا الجنوبية غرامة قدرها 21.62 مليار وون (ما يعادل 15.67 مليون دولار) على شركة «ميتا»، المالكة لـ«فيسبوك»، بعدما تبين أنها جمعت بيانات حساسة للمستخدمين.

«الشرق الأوسط» (سيول )
العالم «قانون السلامة عبر الإنترنت» من شأنه أن ينهي عصر التنظيم الذاتي لوسائل التواصل الاجتماعي (أ.ف.ب)

قوانين أوروبية جديدة لمواجهة المحتوى الضار عبر الشبكات الاجتماعية

نشرت آيرلندا، الاثنين، قواعد ملزمة تهدف لحماية مستخدمي منصات مشاركة الفيديو بالاتحاد الأوروبي؛ بما فيها «إكس» و«فيسبوك» و«إنستغرام» و«تيك توك» من المحتوى الضار.


هل وصل الذكاء الاصطناعي إلى حدوده القصوى؟

لوغو تطبيق «شات جي بي تي» (رويترز)
لوغو تطبيق «شات جي بي تي» (رويترز)
TT

هل وصل الذكاء الاصطناعي إلى حدوده القصوى؟

لوغو تطبيق «شات جي بي تي» (رويترز)
لوغو تطبيق «شات جي بي تي» (رويترز)

هل وصلت نماذج الذكاء الاصطناعي التوليدي إلى طريق مسدود؟ منذ إطلاق «تشات جي بي تي» قبل عامين، بعث التقدم الهائل في التكنولوجيا آمالاً في ظهور آلات ذات ذكاء قريب من الإنسان... لكن الشكوك في هذا المجال تتراكم.

وتعد الشركات الرائدة في القطاع بتحقيق مكاسب كبيرة وسريعة على صعيد الأداء، لدرجة أن «الذكاء الاصطناعي العام»، وفق تعبير رئيس «أوبن إيه آي» سام ألتمان، يُتوقع أن يظهر قريباً.

وتبني الشركات قناعتها هذه على مبادئ التوسع، إذ ترى أنه سيكون كافياً تغذية النماذج عبر زيادة كميات البيانات وقدرة الحوسبة الحاسوبية لكي تزداد قوتها، وقد نجحت هذه الاستراتيجية حتى الآن بشكل جيد لدرجة أن الكثيرين في القطاع يخشون أن يحصل الأمر بسرعة زائدة وتجد البشرية نفسها عاجزة عن مجاراة التطور.

وأنفقت مايكروسوفت (المستثمر الرئيسي في «أوبن إيه آي»)، و«غوغل»، و«أمازون»، و«ميتا» وغيرها من الشركات مليارات الدولارات وأطلقت أدوات تُنتج بسهولة نصوصاً وصوراً ومقاطع فيديو عالية الجودة، وباتت هذه التكنولوجيا الشغل الشاغل للملايين.

وتعمل «إكس إيه آي»، شركة الذكاء الاصطناعي التابعة لإيلون ماسك، على جمع 6 مليارات دولار، بحسب «سي إن بي سي»، لشراء مائة ألف شريحة من تصنيع «نفيديا»، المكونات الإلكترونية المتطورة المستخدمة في تشغيل النماذج الكبيرة.

وأنجزت «أوبن إيه آي» عملية جمع أموال كبيرة بقيمة 6.6 مليار دولار في أوائل أكتوبر (تشرين الأول)، قُدّرت قيمتها بـ157 مليار دولار.

وقال الخبير في القطاع غاري ماركوس «تعتمد التقييمات المرتفعة إلى حد كبير على فكرة أن النماذج اللغوية ستصبح من خلال التوسع المستمر، ذكاء اصطناعياً عاماً». وأضاف «كما قلت دائماً، إنه مجرد خيال».

- حدود

وذكرت الصحافة الأميركية مؤخراً أن النماذج الجديدة قيد التطوير تبدو وكأنها وصلت إلى حدودها القصوى، ولا سيما في «غوغل»، و«أنثروبيك» (كلود)، و«أوبن إيه آي».

وقال بن هورويتز، المؤسس المشارك لـ«a16z»، وهي شركة رأسمال استثماري مساهمة في «أوبن إيه آي» ومستثمرة في شركات منافسة بينها «ميسترال»: «إننا نزيد (قوة الحوسبة) بالمعدل نفسه، لكننا لا نحصل على تحسينات ذكية منها».

أما «أورايون»، أحدث إضافة لـ«أوبن إيه آي» والذي لم يتم الإعلان عنه بعد، فيتفوق على سابقيه لكن الزيادة في الجودة كانت أقل بكثير مقارنة بالقفزة بين «جي بي تي 3» و«جي بي تي 4»، آخر نموذجين رئيسيين للشركة، وفق مصادر أوردتها «ذي إنفورميشن».

ويعتقد خبراء كثر أجرت «وكالة الصحافة الفرنسية» مقابلات معهم أن قوانين الحجم وصلت إلى حدودها القصوى، وفي هذا الصدد، يؤكد سكوت ستيفنسون، رئيس «سبيلبوك»، وهي شركة متخصصة في الذكاء الاصطناعي القانوني التوليدي، أن «بعض المختبرات ركزت كثيراً على إضافة المزيد من النصوص، معتقدة أن الآلة ستصبح أكثر ذكاءً».

وبفضل التدريب القائم على كميات كبيرة من البيانات المجمعة عبر الإنترنت، باتت النماذج قادرة على التنبؤ، بطريقة مقنعة للغاية، بتسلسل الكلمات أو ترتيبات وحدات البكسل. لكن الشركات بدأت تفتقر إلى المواد الجديدة اللازمة لتشغيلها.

والأمر لا يتعلق فقط بالمعارف: فمن أجل التقدم، سيكون من الضروري قبل كل شيء أن تتمكن الآلات بطريقة أو بأخرى من فهم معنى جملها أو صورها.

- «تحسينات جذرية»

لكنّ المديرين في القطاع ينفون أي تباطؤ في الذكاء الاصطناعي. ويقول داريو أمودي، رئيس شركة «أنثروبيك»، في البودكاست الخاص بعالم الكمبيوتر ليكس فريدمان «إذا نظرنا إلى وتيرة تعاظم القدرات، يمكننا أن نعتقد أننا سنصل (إلى الذكاء الاصطناعي العام) بحلول عام 2026 أو 2027».

وكتب سام ألتمان الخميس على منصة «إكس»: «ليس هناك طريق مسدود». ومع ذلك، أخّرت «أوبن إيه آي» إصدار النظام الذي سيخلف «جي بي تي - 4».

وفي سبتمبر (أيلول)، غيّرت الشركة الناشئة الرائدة في سيليكون فالي استراتيجيتها من خلال تقديم o1، وهو نموذج من المفترض أن يجيب على أسئلة أكثر تعقيداً، خصوصاً في مسائل الرياضيات، وذلك بفضل تدريب يعتمد بشكل أقل على تراكم البيانات مرتكزاً بدرجة أكبر على تعزيز القدرة على التفكير.

وبحسب سكوت ستيفنسون، فإن «o1 يمضي وقتاً أطول في التفكير بدلاً من التفاعل»، ما يؤدي إلى «تحسينات جذرية».

ويشبّه ستيفنسون تطوّر التكنولوجيا باكتشاف النار: فبدلاً من إضافة الوقود في شكل بيانات وقدرة حاسوبية، حان الوقت لتطوير ما يعادل الفانوس أو المحرك البخاري. وسيتمكن البشر من تفويض المهام عبر الإنترنت لهذه الأدوات في الذكاء الاصطناعي.