أعلنت شركة «ميتا» المالكة لـ«فيسبوك»، اليوم (الجمعة)، أنها أنشأت نموذج ذكاء اصطناعي جديداً أطلقت عليه اسم «موفي جين»، يمكنه إنشاء مقاطع مصورة مصحوبة بالصوت، لتبدو واقعية وفقاً لطلبات المستخدم.
وقالت «ميتا» إن بإمكان هذا النموذج منافسة أدوات من شركات ناشئة رائدة في مجال إنشاء الوسائط، مثل «أوبن إيه آي» و«إليفن لابز».
وتضمنت عينات من إنتاج «موفي جين» كشفت عنها «ميتا»، مقاطع مصورة لحيوانات تسبح وتطفو، وأخرى تستخدم صوراً حقيقية لأشخاص لتصويرهم وهم مثلاً يرسمون على قماش، وفق ما ذكرته وكالة «رويترز» للأنباء.
Meta Movie Gen is on the scene! Our breakthrough generative AI research for media enables:-turning text into video-creation of personalized video-precision video editing-audio creationAnd while it’s just research today, we can’t wait to see all the ways people enhance... pic.twitter.com/I4Bq9if3eK
— Meta (@Meta) October 4, 2024
وقالت «ميتا» في منشور على مدونتها، إن «موفي جين» يمكنه أيضاً إنشاء موسيقى خلفية وتأثيرات صوتية متزامنة مع عرض محتوى المقطع المصور، مع إمكانية استخدام الأداة لإجراء تعديلات على المقاطع.
وفي أحد المقاطع من إنتاج «موفي جين»، طلبت «ميتا» من الأداة وضع كرات تستخدم للزينة في يدي رجل يركض بمفرده في الصحراء، بينما في مقطع آخر، غيرت موقف سيارات حيث كان رجل يتزلج على أرض جافة إلى أخرى تغطيها بركة مياه.
وقالت «ميتا» إن مدة المقطع المصور الذي ينتجه «موفي جين»، يمكن أن تصل إلى 16 ثانية، بينما يمكن أن يصل طول المقطع الصوتي إلى 45 ثانية.