الثورة التالية في عالم الذكاء الاصطناعي برعاية «Meta»

شعار شركة «ميتا» المالكة لتطبيقات «واتساب» و«إنستغرام» و«فيسبوك»
شعار شركة «ميتا» المالكة لتطبيقات «واتساب» و«إنستغرام» و«فيسبوك»
TT

الثورة التالية في عالم الذكاء الاصطناعي برعاية «Meta»

شعار شركة «ميتا» المالكة لتطبيقات «واتساب» و«إنستغرام» و«فيسبوك»
شعار شركة «ميتا» المالكة لتطبيقات «واتساب» و«إنستغرام» و«فيسبوك»

يبدو أن «Meta» تريد المنافسة وبقوة والبقاء على الحدود المستمرة مع الثورة التقنية في مجال الذكاء الاصطناعي وبناءً عليه أعلنت عن منتج جديد ومنافس، وهو «CM3leon». فلنناقش هذا الابتكار الجديد وماذا يعني لعالم الذكاء الاصطناعي.

«CM3leon»: القفزة التالية في عالم الذكاء الاصطناعي

يعد «CM3leon» نموذجاً أساسياً متعدد الوسائط لتحويل النص إلى صورة والعكس، مما يعني أنه يمكن استخدامه لتوليد تعليقات توضيحية للصور تلقائياً. في حين أن هذه ليست فكرة جديدة في مجال الذكاء الاصطناعي، الجديد هو الأداء الذي يزعم «Meta» أن نموذجها الأساسي قادر على تحقيقه. ولعل الأكثر إثارة هي الطريقة التي يتم بها بناء «CM3leon».

خدمة وأداة «ميتا» الجديدة لصناعة وتوليد الصور عن طريق «PROMPT»

الابتكارات الفريدة لـ«CM3leon»

يعد أغلب الأدوات التي تتيح توليد الصور من النصوص، مثل Stable Diffusion وDALL-E وMidjourney، تعتمد على ما تُعرف بنماذج التوزيع. في حين أن هذه النماذج قد أظهرت نتائج قوية، إلا أن «Meta» أخذت مساراً مختلفاً مع «CM3leon». بدلاً من استخدام نموذج توزيع، يعتمد «CM3leon» على ما يُعرف بنموذج التسلسل التلقائي القائم على الرموز، الذي يعد أكثر تكلفة في التدريب ولكنه يُنتج صوراً بجودة ودقة أفضل عن منافسيه.

كفاءة فائقة

مع ذلك، رغم تعقيد النموذج، يُظهر «CM3leon» كفاءة مدهشة. حسبما ذكرت «Meta»، يتم تدريب «CM3leon» باستخدام الحاسوب بخمسة أضعاف أقل من الأساليب القائمة على التحويل السابقة. هذا يعني أنه يمكن أن يوفر أداءً متفوقاً بأقل تكلفة.

يمكنك عن طريق «CM3leon» إنشاء وتوليد الصور والتعديل عليها بسهولة

حقوق الصور وأخلاقيات التدريب

بعيداً عن الأداء والكفاءة، هناك جانب آخر يجعل «CM3leon» مميزاً، وهي الطريقة التي يجري بها تدريبه. بدلاً من الاستفادة من الصور المتاحة علنياً على الإنترنت -الأمر الذي أثار بعض القضايا القانونية المرتبطة بملكية الصور- تستخدم «Meta» الصور المرخصة من Shutterstock. هذا يسمح لها بتجنب القضايا المرتبطة بملكية الصور والاقتباس.

نموذج من الأداء العالي لـ«CM3leon»

المنافسون في الساحة

DALL-E

هذا النموذج من الذكاء الاصطناعي من OpenAI يُمكنه إنتاج صور فريدة من نوعها من النصوص. ومع ذلك، يعتمد DALL-E على النماذج التوزيعية، والتي قد تكون أقل كفاءة من نموذج «CM3leon» القائم على الرموز.

Stable Diffusion

هي أداة أخرى شهيرة في مجال الذكاء الاصطناعي تتيح توليد الصور من النصوص. ومع ذلك، مثل DALL-E، يعتمد على نماذج التوزيع وقد لا يكون قادراً على المطابقة مع الكفاءة والجودة التي يوفرها «CM3leon».

Midjourney

هذا النموذج أيضاً يعد منافساً لـ«CM3leon»، ولكن مثل DALL-E وStable Diffusion، فإنه يعتمد على نماذج التوزيع، وقد لا يتمتع بالتماسك العالمي الذي يتمتع به «CM3leon».

الخلاصة

CM3leon ليس مجرد خطوة جديدة في عالم الذكاء الاصطناعي، بل هو تقدم ثوري قد يحدد الطريق إلى المستقبل. حالياً، هو جهد بحثي ولا يزال غير واضح متى أو حتى إذا كانت «Meta» ستجعل هذه التقنية متاحة للجمهور. ومع ذلك، وبالنظر إلى الأداء القوي والكفاءة العالية لـ«CM3leon»، فمن المرجح أن نرى مزيداً من التطورات في هذا المجال قريباً.


مقالات ذات صلة

شولتس يحذر من «السذاجة» على وسائل التواصل الاجتماعي

أوروبا المستشار الألماني أولاف شولتس  (د.ب.أ)

شولتس يحذر من «السذاجة» على وسائل التواصل الاجتماعي

أوصى المستشار الألماني أولاف شولتس مستخدمي وسائل التواصل الاجتماعي بإلقاء نظرة نقدية على المعلومات المنشورة هناك، محذراً من «السذاجة» في التعامل مع المعلومات.

«الشرق الأوسط» (برلين)
الولايات المتحدة​ الرئيس الأميركي السابق والمرشح الرئاسي الجمهوري دونالد ترمب يشير أثناء حديثه خلال تجمع حاشد في دورال- فلوريدا في 9 يوليو 2024 (أ.ف.ب)

«ميتا» ترفع بعض القيود المفروضة على حسابات ترمب

قالت شركة «ميتا» إنها قررت رفع بعض القيود التي كانت مفروضة على حسابي الرئيس الأميركي السابق دونالد ترمب على «فيسبوك» و«إنستغرام».

«الشرق الأوسط» (واشنطن )
الولايات المتحدة​ شعار منصة «ميتا» (أ.ف.ب)

وسط نزاع حول الرموز المرتبطة بغزة...«ميتا» تحظر بيع كعك يحمل رمزاً للبطيخ

اتُهمت شركة «ميتا» بالتورط في رقابة داخلية مفرطة، بعد أن حظرت بيع الكعك الذي يحمل رمزاً للبطيخ، حيث تم تفسيره على أنه رمز للعلم الفلسطيني.

«الشرق الأوسط» (نيويورك)
المشرق العربي أب فلسطيني يحمل جثمان ولده الذي قُتل في غارة إسرائيلية بمستشفى شهداء الأقصى أمس (رويترز)

«ميتا» ستزيل أي منشور يسيء استخدام مصطلح «صهيوني»

أعلنت «ميتا» الشركة الأم لمنصّتي «فيسبوك» و«إنستغرام» الثلاثاء أنها ستزيل من الآن فصاعداً كل منشور يتضمّن كلمة «صهيوني»

«الشرق الأوسط» (سان فرنسيسكو)
تكنولوجيا شعار منصة «ميتا» (أ.ف.ب)

«ميتا» ستزيل المزيد من المنشورات التي تستهدف «الصهاينة»

أعلنت منصة «ميتا»، الثلاثاء، أنها ستبدأ في إزالة المزيد من المنشورات التي تستهدف «الصهاينة»؛ إذ يُستخدم المصطلح للإشارة إلى الشعب اليهودي والإسرائيليين.

«الشرق الأوسط» (واشنطن)

تعرف على مزايا الذكاء الاصطناعي المتقدم في هاتف «أوبو رينو12»

شاشة مقاومة للصدمات والخدوش بمستويات أداء متقدمة وتصميم أنيق
شاشة مقاومة للصدمات والخدوش بمستويات أداء متقدمة وتصميم أنيق
TT

تعرف على مزايا الذكاء الاصطناعي المتقدم في هاتف «أوبو رينو12»

شاشة مقاومة للصدمات والخدوش بمستويات أداء متقدمة وتصميم أنيق
شاشة مقاومة للصدمات والخدوش بمستويات أداء متقدمة وتصميم أنيق

تخيل هاتفاً يستطيع فتح عيون الأفراد في الصور بعد التقاطها وعيونهم مغمضة، مع قدرته على إزالة جميع الأفراد والعناصر المختلفة من خلفية الصور المهمة بضغطة زر واحدة دون الحاجة لتحديد أي من هذه العناصر.

ما رأيك بقدرته على التركيز على أوجه أكثر من شخص في الصور الجماعية، والتقاط الصورة بوضوح كامل لجميع الأوجه في الوقت نفسه؟

هل تريد هاتفاً يستطيع الاستماع إلى التسجيلات الصوتية وتحويلها إلى نصوص، ومن ثم تلخيصها وتحضير قوائم بالخطوات التالية وفق المحادثة؟

كل هذه المزايا أصبحت واقعاً بفضل تقنيات الذكاء الاصطناعي الجديدة، وذلك في هاتف «أوبو رينو12 5 جي (Oppo Reno12 5G)»، الذي سيتم إطلاقه في المنطقة العربية نهاية الأسبوع المقبل. وحضرت «الشرق الأوسط» فعالية الإطلاق في المنطقة العربية، ونذكر أبرز مزايا الذكاء الاصطناعي التي يقدمها.

ميزتا فتح العيون المغمضة وإزالة العناصر من الخلفية بتقنيات الذكاء الاصطناعي

قدرات مطورة للذكاء الاصطناعي

* ميزة «ممحاة الذكاء الاصطناعي (AI Eraser)». يقدم الهاتف هذه الميزة التي تزيل الغرباء العابرين في الصور بنقرة واحدة؛ بسبب قدراتها السريعة على التعرف تلقائياً على الأشخاص والعناصر غير المرغوب بها.

تحسين الصور الجماعية. يدعم الهاتف ميزتَين إضافيَّتين للذكاء الاصطناعي مصممتَين خصيصاً لتحسين الصور الجماعية، الأولى هي «الوجه الواضح (AI Clear Face)»، التي تركز على وجوه جميع الأفراد في الصورة، حتى البعيد منهم عن الكاميرا، وتقديم وضوح كبير من خلال استعادة التفاصيل عالية الدقة مثل محيط الوجه والشعر والحواجب.

وتدعم ميزة «الوجه الأفضل (AI Best Face)» التعرف تلقائياً على الأشخاص الذين ظهروا في الصور وقد رمشت عيونهم، لتستخدم تقنيات الذكاء الاصطناعي التوليدي لإصلاح الأمر، وجعلهم يظهرون بعيون مفتوحة وبواقعية كبيرة.

* ميزة «استوديو الذكاء الاصطناعي (AI Studio)». تقدم القدرة على إيجاد صور رمزية رقمية أو لوحات فنية من صورة واحدة فقط للمستخدم، بحيث يمكن للمستخدمين إظهار أنفسهم كأنهم رعاة بقر أو نجوم في قصص الرسومات اليابانية «مانغا»، وغير ذلك من إبداعات الذكاء الاصطناعي التوليدي.

* ميزة «صندوق أدوات الذكاء الاصطناعي (AI Toolbox)». وهي ميزة تتعلق بالإنتاجية والكفاءة، تعتمد على نموذج اللغة الكبير «Large Language Model LLM»، الخاص بمساعد الذكاء الاصطناعي «غوغل جيميناي (Gemini)»، التي تمثل إضافة جديدة إلى الشريط الجانبي الذكي، وتقوم بتعزيز إمكانات التعرف على محتوى صفحات الإنترنت وما يتم عرضه على الشاشة واقتراح وظائف مختلفة مرتبطة تعتمد على الذكاء الاصطناعي تشمل الإنشاء السريع لمحتوى منصات التواصل الاجتماعي وتلخيص محتوى المقالات الطويلة. ويدعم تطبيق تسجيل الصوتيات أداة «تلخيص التسجيلات المدعومة بالذكاء الاصطناعي (AI Recording Summary)» لتفريغ واستخراج الملخصات النصية من تسجيل صوتي وتنظيمها في نقاط، مع عرض قوائم المهام والأوقات والمواقع والتفاصيل الأخرى لتحسين مراجعتها بعد الانتهاء من التسجيل.

مقارنة مع هاتف «سامسونغ غالاكسي إس24 ألترا»

ولدى مقارنة هذه المزايا مع هاتف «سامسونغ غالاكسي إس24 ألترا» الذي يُعدّ من أول الهواتف التي دعّمت تقنيات الذكاء الاصطناعي بشكل متقدم في الهواتف الجوالة، نجد أن «رينو12» يتفوق في وظائف التصوير الذكية، حيث يدعم مجموعة واسعة من الوظائف التي تشمل فتح عيون المستخدمين بعد التصوير، وحذف عناصر عدة غير مرغوبة في الخلفية بضغطة زر واحدة، إلى جانب القدرة على التركيز على جميع الأوجه في الصورة وجعلها أكثر وضوحاً.

ومن جهته يدعم «غالاكسي إس24 ألترا» وظيفة اختيار عنصر ما من الصورة الملتقطة وتكبيره أو تصغيره وحده فقط، ليقوم الذكاء الاصطناعي بتعديل المحتوى المحيط بذلك العنصر بشكل يجعل الصورة تظهر طبيعية للغاية، مع قدرته على تدوير الصور في أثناء تحريرها من خلال وظيفة «مساعد التصوير (Photo Assist)»، ليقوم الذكاء الاصطناعي بملء الفراغات الموجودة في الزوايا بشكل يتناسق مع محتوى الصورة.

كما يتفوق «رينو12» في القدرة على تفريغ التسجيلات الصوتية وتلخيصها وإضافة المهام التي يجب القيام بها في قوائم خاصة.

ويتعادل الهاتفان في القدرة على تلخيص الملاحظات النصية واختيار أسلوب كتابة نصوص محتوى الشبكات الاجتماعية ليقوم التطبيق بتعديل طول الجملة وأسلوب كتابتها، بينما يقدم «غالاكسي إس24 ألترا» القدرة على الترجمة المباشرة للمحادثات الهاتفية (Live Translation) بدعم للغة الغربية على شكل تحديث تم طرحه بعد إطلاق الهاتف بداية العام الحالي. ولكن بعد تجربة هذه الميزة، لم يستطع الهاتف ترجمة المحادثات من اللغة العربية إلى الإنجليزية بشكل دقيق، وكانت النتائج متوسطة في بعض الأحيان وغير صحيحة في أحيان أخرى، وقد يتطلب هذا الأمر مزيداً من التطوير والتحديث لرفع جودة الترجمة من اللغة العربية إلى اللغات الأخرى. هذا، ويدعم الهاتف ميزة البحث بالضغط على زر الدائرة، بحيث يبحث في الإنترنت عن عنصر ما في الصورة بمجرد تحديده بإصبع المستخدم.

مواصفات تقنية

يبلغ قطر شاشة الهاتف 6.7 بوصة، وهي تعرض الصورة بدقة 2412x1080 وبكثافة 394 بكسل في البوصة وبتقنية AMOLED التي تعرض أكثر من مليار لون بتردد 120 هرتز وبدعم لتقنية HDR10 Plus وبشدة سطوع تبلغ 1200 شمعة، مع مقاومة الخدوش بشكل كبير. واستعرضت الشركة تجربة تشغيل مثقب على الشاشة والضغط عليها، لتقاوم تلك العملية وتستمر الشاشة بالعمل دون أي ضرر أو ظهور أي خدوش.

ويقدم الهاتف مصفوفة كاميرات خلفية ثلاثية بدقة 50 و8 و2 ميغابكسل (للصور عالية الوضوح وبزوايا عريضة وللصور البعيدة) مع استخدام مستشعر Sony LYT-600 فائق الجودة، إلى جانب تقديم كاميرا أمامية بدقة 32 ميغابكسل للصور الذاتية والمكالمات المرئية. ويأتي الهاتف مزوداً بميزة Flash Snapshot التي تضبط عملية التعريض الضوئي للكاميرا والتقاط الإضاءة الواقعية وألوان البشرة بشكل أكثر دقة.

ويعمل الهاتف بمعالج «ميدياتيك دايمنستي 7300-إنيرجي» الجديد ثماني النوى (4 نوى بسرعة 2.5 غيغاهرتز و4 نوى بسرعة 2 غيغاهرتز) بدقة التصنيع 4 نانومتر، ويقدم 12 غيغابايت من الذاكرة التي يمكن توسعتها بـ12 غيغابايت إضافية باستخدام السعة التخزينية المدمجة، مع تقديم 512 غيغابايت من السعة التخزينية المدمجة. وتبلغ شحنة البطارية 5000 ملي أمبير - ساعة ويمكن شحنها بقدرة 80 واط من 0 إلى 32 في المائة في خلال 10 دقائق أو بالكامل في 46 دقيقة فقط.

هذا، ويدعم الجهاز تقنية «لينك بوست (LinkBoost )» المدعومة بالذكاء الاصطناعي التي تضمن تحسين زمن استجابة الشبكة في المناطق ذات الإشارة الضعيفة أو الشبكات المزدحمة، وتعزيز التبديل السلس بين شبكات «واي فاي» وشبكة الاتصالات، وتسريع استعادة الإشارة عند الخروج من المصاعد أو مرآب السيارة. كما يدعم الجهاز تقنيات «واي فاي» a وb وg وn وac وax و«بلوتوث 5.4» اللاسلكية وهو مقاوم للمياه والغبار وفقاً لمعيار IP65، ويعمل بنظام التشغيل «آندرويد 14» وواجهة الاستخدام «كالار أو إس 14.1».

وتبلغ سماكة الهاتف 7.6 مليمتر ويبلغ وزنه 177 غراماً، ويبلغ سعره 1799 ريالاً سعودياً (نحو 479 دولاراً أميركياً)، وهو متوافر في المنطقة العربية باللونين الفضي والبني بدءاً من 1 أغسطس (آب) المقبل.