«ميتا» تكشف عن أداة ذكاء اصطناعي تنتج مقاطع صوت وصورة

«موفي جين» يمكنه إنشاء مقاطع مصورة مصحوبة بالصوت لتبدو واقعية وفقاً لطلبات المستخدم

شعار شركة «ميتا» (أ.ف.ب)
شعار شركة «ميتا» (أ.ف.ب)
TT

«ميتا» تكشف عن أداة ذكاء اصطناعي تنتج مقاطع صوت وصورة

شعار شركة «ميتا» (أ.ف.ب)
شعار شركة «ميتا» (أ.ف.ب)

أعلنت شركة «ميتا» المالكة لـ«فيسبوك»، اليوم (الجمعة)، أنها أنشأت نموذج ذكاء اصطناعي جديداً أطلقت عليه اسم «موفي جين»، يمكنه إنشاء مقاطع مصورة مصحوبة بالصوت، لتبدو واقعية وفقاً لطلبات المستخدم.

وقالت «ميتا» إن بإمكان هذا النموذج منافسة أدوات من شركات ناشئة رائدة في مجال إنشاء الوسائط، مثل «أوبن إيه آي» و«إليفن لابز».

وتضمنت عينات من إنتاج «موفي جين» كشفت عنها «ميتا»، مقاطع مصورة لحيوانات تسبح وتطفو، وأخرى تستخدم صوراً حقيقية لأشخاص لتصويرهم وهم مثلاً يرسمون على قماش، وفق ما ذكرته وكالة «رويترز» للأنباء.

وقالت «ميتا» في منشور على مدونتها، إن «موفي جين» يمكنه أيضاً إنشاء موسيقى خلفية وتأثيرات صوتية متزامنة مع عرض محتوى المقطع المصور، مع إمكانية استخدام الأداة لإجراء تعديلات على المقاطع.

وفي أحد المقاطع من إنتاج «موفي جين»، طلبت «ميتا» من الأداة وضع كرات تستخدم للزينة في يدي رجل يركض بمفرده في الصحراء، بينما في مقطع آخر، غيرت موقف سيارات حيث كان رجل يتزلج على أرض جافة إلى أخرى تغطيها بركة مياه.

وقالت «ميتا» إن مدة المقطع المصور الذي ينتجه «موفي جين»، يمكن أن تصل إلى 16 ثانية، بينما يمكن أن يصل طول المقطع الصوتي إلى 45 ثانية.


مقالات ذات صلة

تعرف على «كانفاس»... الواجهة التعاونية الجديدة لـ«تشات جي بي تي»

تكنولوجيا تطرح «أوبن أيه آي» برنامج «كانفاس» كمساعد رقمي يفهم سياق مشروعك بالكامل (شاترستوك)

تعرف على «كانفاس»... الواجهة التعاونية الجديدة لـ«تشات جي بي تي»

يوفر «كانفاس» أدوات لصقل القواعد النحوية، وتعزيز الوضوح، وضمان الاتساق.

نسيم رمضان (لندن)
علوم نظّم يومك لتحقيق كفاءة الدماغ

نظّم يومك لتحقيق كفاءة الدماغ

مدى نجاح اليوم ليس بعدد الساعات؛ بل بجودة الإنتاج العقلي من حلول وأفكار.

«الشرق الأوسط» (واشنطن)
تكنولوجيا يتشارك المستخدمون محادثات عميقة وتأملية مع نسخة من أنفسهم تم إنشاؤها بواسطة الذكاء الاصطناعي في سن الستين (MIT)

نظام ذكاء اصطناعي يجعلك تتكلم مع «ذاتك المستقبلية»!

يجري ذلك عبر محادثات عميقة وتأملية مع نفسك وأنت في عمر الستين.

نسيم رمضان (لندن)

​«جيمناي لايف» من «غوغل» متاح مجاناً لمستخدمي «آندرويد» بالإنجليزية

تقدم الميزة عشرة خيارات صوتية مختلفة حصرياً للمستخدمين الذين يدفعون اشتراكاً في الخدمة (شاترستوك)
تقدم الميزة عشرة خيارات صوتية مختلفة حصرياً للمستخدمين الذين يدفعون اشتراكاً في الخدمة (شاترستوك)
TT

​«جيمناي لايف» من «غوغل» متاح مجاناً لمستخدمي «آندرويد» بالإنجليزية

تقدم الميزة عشرة خيارات صوتية مختلفة حصرياً للمستخدمين الذين يدفعون اشتراكاً في الخدمة (شاترستوك)
تقدم الميزة عشرة خيارات صوتية مختلفة حصرياً للمستخدمين الذين يدفعون اشتراكاً في الخدمة (شاترستوك)

جعلت «غوغل» مساعدها «جيمناي لايف» (Gemini Live) متاحاً لجميع مستخدمي «آندرويد» الناطقين باللغة الإنجليزية مجاناً. تتبع هذه الخطوة مرحلة أولية، حيث كانت الميزة حصرية لمشتركي «جيمناي أدفانسد» (Gemini Advanced) بتكلفة 20 دولاراً شهرياً. ويمثل الطرح تحولاً محورياً في كيفية تفاعل المستخدمين مع تقنية الذكاء الاصطناعي على الأجهزة المحمولة، مما يوفر تجربة أكثر سهولة.

ميزات وقدرات «Gemini Live»

يمثل «Gemini Live» الذي تم الكشف عنه لأول مرة إلى جانب سلسلة «Google Pixel 9» قفزة إلى الأمام في الاتصال بمساعدة الذكاء الاصطناعي. يسمح Gemini Live للمستخدمين بإجراء محادثات متعددة الأدوار، ومقاطعة وإعادة النظر في الموضوعات، مع التخطيط في النهاية لدمج كاميرا الجوال للسياق البصري - على الرغم من أن تاريخ إطلاق هذه الميزة لا يزال غير محدد. ويمكن للمستخدمين الاستمتاع بخدمة Gemini Live من خلال النقر ببساطة على أيقونة الموجة في أسفل يسار تطبيق «جيمناي» المحدث، واتباع التعليمات التي تظهر على الشاشة لإعداد مباشر.

كيفية الوصول إلى خدمة Gemini Live

لتجربة خدمة Gemini Live يحتاج مستخدمو «آندرويد» إلى التأكد من تحديث تطبيق «جيمناي» الخاص بهم. يتم تنشيط الميزة من خلال النقر على زر «Live» في أسفل شاشة التطبيق، والذي يوجه المستخدم بعد ذلك خلال وظائفه. في الوقت الحالي تتوفر الميزة باللغة الإنجليزية.

يمثل طرح «Gemini Live» لمستخدمي «آندرويد» خطوة حاسمة في وصول الذكاء الاصطناعي إلى الجمهور بشكل أوسع (شاترستوك)

تداعيات المشهد التنافسي

هذا التطور جدير بالملاحظة لأنه يتناقض مع العروض التنافسية مثل وضع Voice Mode الخاص بـChatGPT (تشات جي بي تي) الذي يتوفر حالياً فقط للمستخدمين مقابل اشتراك شهري. من خلال جعل خدمة Gemini Live مجانية تضع «غوغل» نفسها بقوة ضد المنافسين، مما قد يؤدي إلى توسيع قاعدة مستخدميها، وتعزيز مشاركة المستخدمين مع تقنيات الذكاء الاصطناعي الخاصة بها.

ومع ذلك، سيجد مستخدمو «أبل» أنفسهم ينتظرون لفترة أطول قليلاً للحصول على تجربة مماثلة. ستتوفر ميزة Apple Intelligence التي من المقرر أن تعزز «سيري» بين ميزات أخرى، مع نظام التشغيل iOS 18.1 في وقت لاحق من هذا الشهر، ولكن فقط للمستخدمين الذين لديهم أجهزة أحدث مثل iPhone 15 Pro المزود بشريحة A17. ويسلط هذا الطرح الضوء على السباق الجاري بين عمالقة التكنولوجيا لدمج ميزات الذكاء الاصطناعي المتقدمة في الأجهزة الاستهلاكية.

مستقبل مساعدي الذكاء الاصطناعي

مع استمرار تطور تقنية الذكاء الاصطناعي، من المرجح أن يؤدي دمج السياق البصري والمدخلات الحسية الأخرى إلى تعزيز استجابة وفائدة مساعدي الذكاء الاصطناعي بشكل كبير. يشير التزام «غوغل» بتوسيع قدرات Gemini Live جنباً إلى جنب مع قرارها الاستراتيجي بتقديم الخدمة مجاناً إلى مستقبل يدمج مساعدي الذكاء الاصطناعي بشكل أعمق في تفاعلاتنا الرقمية اليومية.​