«ميدجورني» تدخل عالم الفيديو... صور متحركة يولّدها الذكاء الاصطناعي

الملكية الفكرية على المحك

يتيح النظام للمستخدمين إنشاء مقاطع مدتها حتى 21 ثانية بخيارات حركة تلقائية أو مخصصة وبتكلفة منخفضة نسبياً (شاترستوك)
يتيح النظام للمستخدمين إنشاء مقاطع مدتها حتى 21 ثانية بخيارات حركة تلقائية أو مخصصة وبتكلفة منخفضة نسبياً (شاترستوك)
TT

«ميدجورني» تدخل عالم الفيديو... صور متحركة يولّدها الذكاء الاصطناعي

يتيح النظام للمستخدمين إنشاء مقاطع مدتها حتى 21 ثانية بخيارات حركة تلقائية أو مخصصة وبتكلفة منخفضة نسبياً (شاترستوك)
يتيح النظام للمستخدمين إنشاء مقاطع مدتها حتى 21 ثانية بخيارات حركة تلقائية أو مخصصة وبتكلفة منخفضة نسبياً (شاترستوك)

أعلنت «ميدجورني» (Midjourney) المعروفة بريادتها في مجال الصور المُنشأة بالذكاء الاصطناعي، رسمياً دخولها إلى عالم الفيديو. وكشفت الشركة عن نموذج الفيديو «V1» الذي يتيح للمستخدمين تحويل الصور الساكنة إلى مقاطع فيديو قصيرة تنبض بالحركة. ويُعد هذا الإعلان خطوة استراتيجية تتماشى مع رؤية الشركة الأوسع نحو بناء عوالم افتراضية تفاعلية في الزمن الحقيقي.

آلية الاستخدام بسيطة وبديهية

- ينشئ المستخدم صورة أو يحمّلها داخل «Midjourney» (عبر Discord أو الويب).

- يضغط على زر «Animate»، مع إمكانية الاختيار بين حركة تلقائية أو وصف يدوي لكيفية تحرك العناصر.

- يختار المستخدم نمط الحركة: حركة منخفضة (ناعمة) أو عالية (ديناميكية).

وتنتج كل عملية توليد أربعة مقاطع مدتها 5 ثوانٍ، ويمكن للمستخدم تمديد الفيديو حتى 21 ثانية عبر خطوات قدرها 4 ثوانٍ.

إنها أداة مرنة وسهلة تُضيف الحياة للعمل الفني.

تكلفة معقولة للحركة

رغم أن إنتاج الفيديو يتطلب طاقة حوسبة أكبر، فإن «ميدجورني» صمّمت النموذج ليكون اقتصادياً. كل ثانية من الفيديو تعادل تقريباً 8 أضعاف تكلفة إنشاء صورة، أي ما يعادل رصيد صورة واحد لكل ثانية فيديو. وتعمل الشركة حالياً على تجربة وضع جديد باسم «Video Relax Mode» يتيح لمشتركي الخطط الأعلى توليد الفيديوهات بسرعة أقل ولكن بتكلفة أرخص. ويصف ديفيد هولتز، مؤسس «ميدجورني» النموذج «V1» بأنه حجر الأساس في مشروع أكبر يجمع بين الصور والحركة والتفاعل ثلاثي الأبعاد والمحاكاة الحية. الهدف النهائي هو بناء عوالم رقمية قابلة للاستكشاف تتجاوز مجرد العرض البصري لتتحوّل إلى بيئات ديناميكية.

تهدف الشركة إلى بناء تجربة إبداعية متكاملة تجمع بين الصور والفيديو والتفاعل ثلاثي الأبعاد والعوالم الافتراضية في الزمن الحقيقي (شاترستوك)

ساحة مزدحمة بالمنافسين

تشهد ساحة الفيديو بالذكاء الاصطناعي منافسة محتدمة خاصة مع دخول لاعبين كبار مثل «فاير فلاي» من «أدوبي» و «سورا» من «أوبن إيه آي» و «فيو3» من «غوغل» و«لوما لابس» و«ران واي». هذه النماذج غالباً ما تركز على الجودة السينمائية وإضافة مؤثرات صوتية تلقائية. وفي المقابل، تركّز «ميدجورني» على بساطة التجربة والتحكم الإبداعي والتكلفة المعقولة. فرغم أن النموذج لا يدعم الصوت أو أدوات التحرير المتقدمة، فإنه يوصف بأنه «سهل وممتع وجميل، ومناسب للفنانين والهواة.

تحديات قانونية في الأفق

يتزامن إطلاق «V1» مع تصاعد التحديات القانونية التي تواجهها الشركة. فقد رفعت شركتا «ديزني» و«يونيفيرسال» دعاوى قضائية ضد «ميدجورني»، متهمةً إياها بانتهاك حقوق الملكية الفكرية عبر نماذجها التي تم تدريبها على بيانات مأخوذة من الإنترنت دون ترخيص. هذه القضايا تُسلّط الضوء على تساؤلات حاسمة حول البيانات المستخدمة لتدريب النماذج، وحقوق المبدعين، وحدود الذكاء الاصطناعي في إعادة إنتاج المحتوى.

الإطلاق يأتي وسط دعاوى قانونية من شركات كبرى تتهم «ميدجورني» بانتهاك حقوق ملكية فكرية في تدريب نماذجها (شاترستوك)

استقبال المستخدمين الأولي

جاءت ردود الفعل الأولية إيجابية للغاية حيث وصف البعض النموذج بأنه يشبه «كتاب الصور المتحركة السحري»، في حين قال منشئ الفيديوهات بالذكاء الاصطناعي، في هو آنغ، إن النموذج «فاق كل توقعاته». ورغم أن «V1» لا يزال في نسخته التجريبية، ويعاني من بعض القيود، فإنه يُقدم متعة حقيقية وسرعة في الإبداع، ويُعد خطوة مهمة نحو ديمقراطية صناعة الحركة.

إلى أين تتجه «ميدجورني»؟

تعمل الشركة حالياً على توسيع قدرات النموذج، مثل إنتاج مقاطع أطول، دعم الصوت، وإضافة تفاعل ثلاثي الأبعاد في الزمن الحقيقي. وفي الوقت ذاته، عليها أن تُوازن بين الابتكار والمخاطر القانونية، وأن تتعامل بمسؤولية أخلاقية مع ما تقدّمه.

يمثّل النموذج الجديد نقلة نوعية في مجال المحتوى الإبداعي المُولّد بالذكاء الاصطناعي. فهو لا يضيف مجرد ميزة جديدة، بل يفتح الباب نحو عصر جديد من التعبير البصري الديناميكي. ويبقى السؤال الأهم: «هل يحق للآلة أن تتحرك... دون أن نسأل من يملك هذه الحركة؟».


مقالات ذات صلة

بعد الصورة والفيديو... «أدوبي» تضيف المؤثرات الصوتية إلى «فايرفلاي»

تكنولوجيا أداة التصنيف التلقائي الجديدة تضيف علامات ذكية إلى الملفات الصوتية مما يُسهّل تنظيمها والبحث عنها ضمن المشاريع (أدوبي)

بعد الصورة والفيديو... «أدوبي» تضيف المؤثرات الصوتية إلى «فايرفلاي»

التحديثات تشمل توليد مؤثرات صوتية من النص وتحرير فيديو بالذكاء الاصطناعي وتنظيم المحتوى تلقائياً لتعزيز الإبداع.

نسيم رمضان (لندن)
تكنولوجيا النسخة الجديدة من «ChatGPT» مزوّدة بوكيل ذكي قادر على تنفيذ مهام معقّدة من البداية إلى النهاية باستخدام حاسوب افتراضي (شاترستوك)

«أوبن إيه آي» تطلق «تشات جي بي تي» الجديد... يتصفح ويحلل ويقرر

أطلقت " OpenAI "وكيلًا ذكيًا جديدًا ضمن " ChatGPT" قادرًا على تنفيذ مهام معقدة تلقائيًا باستخدام أدوات متعددة مع ضمانات أمان وتحكّم كامل للمستخدم.

نسيم رمضان (لندن)
تكنولوجيا تم تطوير الحاسوب من قِبَل جامعة بريستول بالشراكة مع جامعة كامبريدج ومختبر الذكاء الاصطناعي الوطني (جامعة بريستول)

بريطانيا تطلق أقوى حاسوب للذكاء الاصطناعي في تاريخها

«إيزامبارد-AI» هو أقوى حاسوب ذكاء اصطناعي في بريطانيا أطلقته جامعة بريستول لدعم الأبحاث في مجالات الصحة والمناخ والأمن باستخدام تقنيات متقدمة.

نسيم رمضان (لندن)
تكنولوجيا مشروع «الحديقة الذكية» يستخدم الذكاء الاصطناعي لتمكين الأشجار من التعبير عن حالتها واحتياجاتها عبر تطبيق «تري توك» (مايكروسوفت)

ليس خيالاً علمياً... الآن يمكنك التحدث مع الأشجار عبر الذكاء الاصطناعي

مشروع «الحديقة الذكية» يمكّن الأشجار من «التحدث» عبر الذكاء الاصطناعي لتحسين استدامة المدن والتخطيط البيئي ورعاية النباتات استباقياً وفق بيانات حيوية.

نسيم رمضان (لندن)
خاص يتطلب عمل «وكلاء الذكاء الاصطناعي» بنية تقنية جديدة تشمل الذاكرة طويلة الأمد والنماذج اللغوية والعرض الفوري وواجهة متعددة الوسائط (شاترستوك)

خاص ذكاء اصطناعي يفهم ويتذكر ويخطط... هل تجاوزنا زمن الأوامر؟

يشهد الذكاء الاصطناعي تحولاً من أدوات تستجيب للأوامر إلى وكلاء مستقلين يفهمون السياق، ويخططون، وينفذون بذكاء، ما يُعيد تشكيل التفاعل الرقمي بالكامل.

نسيم رمضان (لندن)

بعد الصورة والفيديو... «أدوبي» تضيف المؤثرات الصوتية إلى «فايرفلاي»

أداة التصنيف التلقائي الجديدة تضيف علامات ذكية إلى الملفات الصوتية مما يُسهّل تنظيمها والبحث عنها ضمن المشاريع (أدوبي)
أداة التصنيف التلقائي الجديدة تضيف علامات ذكية إلى الملفات الصوتية مما يُسهّل تنظيمها والبحث عنها ضمن المشاريع (أدوبي)
TT

بعد الصورة والفيديو... «أدوبي» تضيف المؤثرات الصوتية إلى «فايرفلاي»

أداة التصنيف التلقائي الجديدة تضيف علامات ذكية إلى الملفات الصوتية مما يُسهّل تنظيمها والبحث عنها ضمن المشاريع (أدوبي)
أداة التصنيف التلقائي الجديدة تضيف علامات ذكية إلى الملفات الصوتية مما يُسهّل تنظيمها والبحث عنها ضمن المشاريع (أدوبي)

أعلنت شركة «أدوبي» توسعة كبرى في إمكانيات منصّتها المدعومة بالذكاء الاصطناعي «فايرفلاي»، مقدِّمة مجموعة جديدة من الأدوات التي تدفع حدود الإبداع في إنتاج الفيديو وتصميم الصوت والرسوم المتحركة. لم تعد «فايرفلاي» مجرد أداة لتوليد الصور أو المؤثرات النصية فحسب، بل أصبحت شريكاً إبداعياً ذكياً في مجالات الصوت والحركة والفيديو.

ويمثّل هذا الإعلان خطوة استراتيجية في تطوّر رؤية «أدوبي» للذكاء الاصطناعي التوليدي، حيث تضيف «فايرفلاي» قدرات جديدة تشمل توليد المؤثرات الصوتية من النصوص، وسير عمل فيديو مدعوم بالذكاء الاصطناعي، ووضع علامات تلقائية للمقاطع الصوتية. وقد صُمّمت هذه الأدوات لتلبية احتياجات المبدعين المتزايدة لإنتاج محتوى سريع ومرن وسهل الاستخدام دون التضحية بالجودة أو الأصالة.

«أدوبي» تطلق تحديثات جديدة لـ«فايرفلاي» تشمل قدرات في الصوت والفيديو والرسوم المتحركة مدعومة بالذكاء الاصطناعي (أدوبي)

مؤثرات صوتية من النص

من أبرز الابتكارات الجديدة قدرة «فايرفلاي» على توليد مؤثرات صوتية انطلاقاً من الأوصاف النصية؛ إذ يكفي أن يكتب المستخدم وصفاً مثل «أمطار خفيفة على سطح معدني» أو «أصوات ألعاب إلكترونية قديمة»، حتى يتم توليد ملف صوتي عالي الجودة يُطابق الوصف فوراً.

وتعتمد هذه الميزة على نماذج الذكاء الاصطناعي المطوّرة داخلياً لدى «أدوبي»، والمدرّبة على محتوى مرخّص وصوتيات من مكتبة «أدوبي ستوك» (Adobe Stock)؛ مما يضمن الاستخدام التجاري الآمن للمحتوى. ويُعد ذلك اختصاراً كبيراً للوقت والجهد، خصوصاً لمحرّري الفيديو، وصنّاع البودكاست، والمسوّقين الرقميين الذين اعتادوا على تصفّح مكتبات صوتية ضخمة للعثور على المؤثر المناسب.

حالياً، تُطرح هذه الميزة بنسخة تجريبية مبكرة في تطبيقَي الفيديو الرئيسيَّين لدى أدوبي «بريميير برو» (Premiere Pro) و«أفتر إفكتس» (After Effects) على أن يتم توسيع نطاقها لاحقاً.

تصنيف تلقائي للصوتيات

تُعالج «أدوبي» أيضاً إحدى المشكلات الشائعة في إنتاج المحتوى، وهي إدارة المؤثرات الصوتية وتنظيمها. فقد قدّمت أداة جديدة داخل «فايرفلاي» تُستخدم في إضافة علامات تعريف تلقائية للمقاطع الصوتية، بحيث تُوصف تلقائياً من حيث النوع، والمزاج، والسياق المناسب للاستخدام.

يتم دمج هذه البيانات الوصفية داخل أنظمة إدارة المحتوى الخاصة بـ«أدوبي»، مما يُسهّل على الفرق الإبداعية البحث عن الملفات الصوتية وفرزها وإعادة استخدامها، خصوصاً في المشروعات الكبيرة متعددة الفرق.

الأمر المطلوب: لقطة مقرّبة لطائر أحمر لامع وجميل يجثم على مادة ناعمة وبيضاء وفاخرة تشبه الفرو (أدوبي)

تجربة فيديو مدعومة بالذكاء الاصطناعي

أصبح «فايرفلاي» الآن مدمجاً مباشرة داخل تطبيق «بريميير برو» (Premiere Pro)؛ مما يُتيح تنفيذ عدد من المهام الذكية داخل بيئة العمل دون الحاجة إلى مغادرة التطبيق، مثل التحرير النصي للمقاطع من خلال تعديل النصوص المكتوبة، واقتراح لقطات «B-roll» ملائمة لمحتوى الفيديو أو المزاج المطلوب وأدوات إزالة العناصر من الإطار باستخدام تقنيات توليد الفيديو التفاعلي.

كل هذه الميزات مدمجة في تجربة «بريميير برو» الأساسية، وقد طُوّرت بالتعاون مع صُنّاع محتوى محترفين من مجالات السينما و«اليوتيوب» والإنتاج التلفزيوني. وتشدد «أدوبي» على أن جميع هذه الأدوات تعتمد على بيانات مرخّصة ومصادر مسؤولة، مما يميّزها عن أدوات أخرى قد تُثير مخاوف قانونية أو أخلاقية بسبب تدريبها على بيانات مسروقة أو غير مرخّصة.

نحو ذكاء متعدد الوسائط

توسعة «فايرفلاي» تعكس رؤية «أدوبي» لتقديم ذكاء اصطناعي متعدد الوسائط، يبدأ من الصور والنصوص ويصل إلى الصوت والفيديو والرسوم المتحركة. فالمبدعون اليوم مطالبون بإنتاج محتوى سريع ومتنوّع عبر منصات وأساليب متعددة، وغالباً تحت ضغط الوقت أو الموارد. وهنا، توفّر «أدوبي» حلاً عملياً وقابلاً للتوسّع ضمن باقتها الإبداعية.

أين الذكاء الأخلاقي؟

تواصل «أدوبي» الالتزام بتطوير ذكاء اصطناعي مسؤول وآمن تجارياً. فكل محتوى يتم توليده عبر «فايرفلاي» يُرفق بما يُعرف بـ«شهادات المحتوى» (Content Credentials)، وهي بمثابة بطاقة تعريف رقمية توضّح كيف ومتى تم إنشاء المحتوى، وهو ما يعزّز الشفافية والثقة لدى المستخدمين والعلامات التجارية.

بهذه التحديثات، لم تعد «فايرفلاي» مجرد أداة مساعدة، بل أصبحت محرّكاً إبداعياً متكاملاً يعمل إلى جانب المبدعين، ويدعمهم في كل مرحلة من مراحل الإنتاج، من المؤثرات الصوتية، إلى تحرير الفيديو، وصولاً إلى تنظيم المحتوى الذكي.