«مون فالي» تُطلق مُولِّد فيديو بتقنية الذكاء الاصطناعي لإنتاج الأفلام

ينتج محتوى عالي الدقة من مُدخلات دقيقة

«مون فالي» تُطلق مُولِّد فيديو بتقنية الذكاء الاصطناعي لإنتاج الأفلام
TT

«مون فالي» تُطلق مُولِّد فيديو بتقنية الذكاء الاصطناعي لإنتاج الأفلام

«مون فالي» تُطلق مُولِّد فيديو بتقنية الذكاء الاصطناعي لإنتاج الأفلام

يُطلق مختبر ذكاء اصطناعي مُموَّل تمويلاً جيداً، ويضم فريقاً بحثياً ثرياً، نموذجاً جديداً قوياً يُنتج فيديوهات عالية الدقة لقطاعي السينما والإعلان.

مولد فيديو ذكي

وقد أطلقت شركة «مون فالي» (Moonvalley)، الأربعاء، نموذجها الأول، المُسمّى «ماري» (Marey) -في إشارة إلى رائد من رواد السينما الأوائل إتيان جول ماري- الذي قد يُساعد استوديوهات هوليوود قريباً على تسريع الإنتاج وخفض التكاليف بشكل كبير.

وما يُميّز «ماري» -الذي لفت انتباه الاستوديوهات التي تُبدي تحفظاً تجاه المخاطر- هو بيانات التدريب الخاصة به، إذ تم تدريب النموذج حصرياً على محتوى فيديو، سواءً كان مملوكاً أو مُرخّصاً بشكل عادل من قِبل «مون فالي». وبذلك، تجنبت الشركة مشكلات حقوق النشر التي تجعل كثيراً من المحتوى المُولّد مُحفوفاً بالمخاطر القانونية.

أداة للاستخدام في 20 مؤسسة منتجة للأفلام

ووفقاً للمؤسس المشارك والرئيس التنفيذي للشركة، نعيم تالوكدار، تُطلق «مون فالي» برنامج «ماري» لمجموعة من 20 جهة منتجة للأفلام موثوقة، يعمل بعضها في استوديوهات كبرى شهيرة (لم يُكشف عن أسمائها). ولا يزال الإصدار الجديد في مراحله الأولى، في حين يخطط لتحديثات دورية وميزات جديدة مقبلة.

الدقة العالية ميزة رئيسية

يقول تالوكدار إن الميزة الرئيسية التي تُميز «ماري» هي الإنتاج الأصلي عالي الدقة، وهو أمرٌ لطالما كان تحقيقه صعباً للغاية. ويضيف: «يكمن التحدي في أنك إذا كنت ترغب في إنتاج محتوى عالي الدقة، فيجب أن تكون مُدخلاتك عالية الدقة؛ لذا يجب أن تكون قادراً على تدريب النموذج على لقطات عالية الدقة»، أي بمعنى آخر: يتطلب ذلك كثيراً من الخوادم القوية.

على النقيض من ذلك، يقول تالوكدار إن مُعظم نماذج توليد الفيديو الأخرى تُدرّب على فيديو 480 بكسل أو 720 بكسل بجودة أقل، وحتى مع ذلك، غالباً ما تُضغط البيانات قبل التشفير، وهذا يُضعف فهم أي نموذج ذكي للتفاصيل الدقيقة، ما يؤدي إلى نتائج غريبة أو مشوهة (مثل رسم الأصابع بشكل خاطئ).

نموذج احترافي

وقد صُمم «Marey» لتجاوز ذلك، كما أنه يعمل بشكل مختلف. فعلى عكس معظم مُولِّدات الفيديو الموجهة للمستهلك التي تبدأ بمطالبات نصية، صُمّم ماري بشكل خاص لسير العمل الاحترافي. ويُمكن لصانعي الأفلام إدخال القصص المصورة أو الإطارات الرئيسية؛ ويُمكن للممثلين تصوير لقطات تجريبية على هواتفهم التي يُمكن للمنتجين استخدامها بعد ذلك لإنشاء مشاهد تُظهر الممثل من زوايا مختلفة أو أداء حركات جديدة. ويُمكن للنموذج إجراء تعديلات طفيفة، مثل تغيير اتجاه الرياح في شعر الشخصية، أو تعديل مشاهد بجودة إنتاجية، مثل ملء تفاصيل الخلفية أو الشخصيات الخلفية (التي عادةً ما يؤديها الممثلون الإضافيون).

برامج تجريبية مع الشركات

تُجري «مون فالي» أيضاً برامج تجريبية مع الشركات التجارية المعروفة التي تتطلع إلى تدريب النموذج على إرشاداتها الخاصة بالصور والأسلوب. قد يسمح ذلك للشركات بإنشاء إعلانات تجارية بجودة البث عند الطلب.

وجمعت الشركة الناشئة 70 مليون دولار أميركي في جولة تمويلية تأسيسية العام الماضي. وإلى جانب كبار المستثمرين، تتمتع الشركة بخبرة واسعة في مجال البحث والتطوير. وقد قاد المؤسسان المشاركان ماتيوش مالينوفسكي وميكولاي بينكوفسكي سابقاً أبحاث الفيديو في «ديب مايند» (DeepMind)، وساعدا في تطوير النموذج الذي أصبح لاحقاً مُولّد الفيديو «Veo 2» من «غوغل» (Google). ويضم الفريق 6 خريجين آخرين، إلى جانب مواهب من «ميتا» و«مايكروسوفت» و«تك توك» و«سناب».

وظائف إبداعية جديدة

وفي حين يُقرّ تالوكدار بأن أدوات الذكاء الاصطناعي، مثل «ماري»، يُمكن أن تُخفِّض تكاليف الإنتاج، فإنه يُصرّ على أنها ليست بداية النهاية للممثلين أو صانعي الأفلام. ويُجادل بأنه من غير المُرجَّح أن تتقلص الميزانيات؛ بل سيستخدم المبدعون الوفورات للسعي وراء أفكار أكبر وأكثر طموحاً. ويقول: «أعتقد أنكم سترون وظائف جديدة»، والأهم من ذلك، أعتقد أن ما سيُحققه هذا حقّاً هو تمكين المبدعين أكثر من أي شخص آخر.

* مجلة «فاست كومباني»، خدمات «تريبيون ميديا».


مقالات ذات صلة

خاص التقارب بين الذكاء الاصطناعي والحوسبة الكمومية يمكن أن يسرع الاكتشافات في مجالات مثل الأدوية والمناخ (أدوبي)

خاص كيف يغير تقارب الذكاء الاصطناعي والحوسبة الكمومية وجه الاكتشافات العلمية؟

الحوسبة الكمومية والذكاء الاصطناعي يجتمعان لقيادة الابتكار العلمي، مع تقدم سريع في التطبيقات التجارية، من اكتشاف الأدوية إلى الأمن السيبراني.

نسيم رمضان (سياتل)
عالم الاعمال «تكنو» تطلق سلسلة هواتف «CAMON 40» المدعومة بالذكاء الاصطناعي

«تكنو» تطلق سلسلة هواتف «CAMON 40» المدعومة بالذكاء الاصطناعي

أطلقت العلامة التجارية «تكنو TECNO» خلال مشاركتها في معرض برشلونة 2025، سلسلة هواتفها الذكية الجديدة «كامون CAMON 40»، المدعومة بأحدث تقنيات الذكاء الاصطناعي.

تكنولوجيا شعار تطبيق «ديب سيك» الصيني على أحد الهواتف (رويترز) play-circle

بعد ظهور «ديب سيك» الصيني... هل خسرت شركات الذكاء الاصطناعي الكبرى تفوّقها؟

هزت شركة ديب سيك الصينية الصغيرة قطاع الذكاء الاصطناعي التوليدي، في نهاية يناير (كانون الثاني) الماضي، مع برنامجها منخفض التكلفة وعالي الأداء في الوقت نفسه.

«الشرق الأوسط» (لاس فيغاس (الولايات المتحدة))
يوميات الشرق الجهاز يعتمد على الذكاء الاصطناعي لتحليل حركات الجسم أثناء أداء مهام إدراكية وحركية (جامعة ميسوري)

جهاز ذكي يكشف عن مؤشرات الخرف مبكراً

طوّر باحثون من جامعة ميسوري الأميركية جهازاً محمولاً يعمل بالذكاء الاصطناعي للمساعدة في الكشف المبكر عن الاختلال المعرفي المعتدل.

«الشرق الأوسط» (القاهرة)

«تشات جي بي تي 4.5» و«غوغل جيميناي 2.0»: صراع العمالقة في عالم الذكاء الاصطناعي

منافسة حادة بين نموذجي «تشات جي بي تي 4.5» و«غوغل جيميناي 2.0» للتربع على عرش الذكاء الاصطناعي
منافسة حادة بين نموذجي «تشات جي بي تي 4.5» و«غوغل جيميناي 2.0» للتربع على عرش الذكاء الاصطناعي
TT

«تشات جي بي تي 4.5» و«غوغل جيميناي 2.0»: صراع العمالقة في عالم الذكاء الاصطناعي

منافسة حادة بين نموذجي «تشات جي بي تي 4.5» و«غوغل جيميناي 2.0» للتربع على عرش الذكاء الاصطناعي
منافسة حادة بين نموذجي «تشات جي بي تي 4.5» و«غوغل جيميناي 2.0» للتربع على عرش الذكاء الاصطناعي

في سباق محموم نحو تطوير الذكاء الاصطناعي، تطل علينا شركتا «أوبن إيه آي» و«غوغل» بإصدارين جديدين يعدان بنقلة نوعية في عالم نماذج اللغة الكبيرة: «تشات جي بي تي 4.5» Chat GPT 4.5 و«غوغل جيميناي 2.0» Google Gemini 2.0، وهما نموذجان يقدِّمان ميزات وقدرات متطورة تجعل منهما أداتين قويتين ومتنوعتين قادرتين على التعامل مع مهام معقدة بكفاءة ودقة عالية.

وسنستعرض في هذا الموضوع أبرز المزايا التي يقدمها هذان النموذجان ونقارن بينهما في جوانب عدة، لنكشف عن نقاط القوة والضعف في كل منهما ونسلط الضوء على الفروقات التي قد تكون حاسمةً في اختيار النموذج الأنسب لكم.

قفزة «جي بي تي» النوعية

يتجسَّد في «تشات جي بي تي 4.5»، الفهم المحسَّن للسياق. وهو يمثل قفزةً نوعيةً في عالم نماذج اللغة الكبيرة، حيث يأتي بتحسينات ملحوظة في الأداء والقدرات مقارنة بالإصدارات السابقة. وهذه التحسينات تجعله أداةً أكثر قوةً وتنوعاً، قادرةً على التعامل مع مجموعة واسعة من المهام بكفاءة ودقة عالية.

وسنستعرض فيما يلي أبرز المزايا التي يقدِّمها هذا النموذج المطور.

• الميزة الأولى: الفهم المُحسَّن للسياق، حيث يتمتع «تشات جي بي تي 4.5» بقدرة مُحسَّنة على فهم السياق في المحادثات المعقدة والطويلة. وهذا الأمر يعني أنه يمكنه تتبع التفاصيل الدقيقة للمحادثة وفهم العلاقات بين الأفكار المختلفة وتقديم استجابات أكثر دقةً وملاءمة.

وهذه الميزة تجعل النظام أكثر فاعليةً في المهام التي تتطلب فهماً عميقاً للنصوص، مثل تلخيص المستندات الطويلة أو الإجابة عن الأسئلة المعقدة.

• الميزة الثانية: تقديم دقة أعلى في الإجابات، حيث تم تحسينه لتقديم إجابات أكثر دقةً وموثوقيةً، مع خفض الهلوسة أو توليد معلومات خاطئة. وهذا التحسين يجعله أداةً أكثر موثوقيةً للاستخدام في مجموعة متنوعة من المهام المتخصصة، مثل البحث عن المعلومات أو كتابة المحتوى.

• الميزة الثالثة التي يتمتع بها «تشات جي بي تي 4.5»، هي تقديم قدرات إبداعية محسنة، إذ يتمتع بقدرات إبداعية مُطوَّرة تسمح له بتوليد نصوص أكثر إبداعاً وتنوعاً. ويمكن استخدام هذه الميزة لكتابة القصص والشعر والنصوص المتقدمة والمحتوى الإبداعي.

• الميزة الرابعة هي دعم قدرات الوسائط المتعددة؛ حيث تتكامل مع أحدث ميزات «تشات جي بي تي»، بما في ذلك تحميل الملفات والصور وقدرات البحث، وغيرها. ومع ذلك، لا تزال قدرات الوسائط المتعددة مثل الوضع الصوتي ومعالجة الفيديو ومشاركة الشاشة غير مدعومة في هذا الإصدار الجديد.

«جيميناي 2.0»: تكامل مع «غوغل»

يمثل «غوغل جيميناي 2.0» خطوةً ثوريةً في مجال نماذج الذكاء الاصطناعي، حيث يجمع بين قوة التعلم العميق، وقدرات معالجة البيانات الهائلة؛ لتقديم أداء غير مسبوق في مجموعة متنوعة من المهام. ويتميز هذا الإصدار الجديد بقدرته على فهم وتوليد النصوص والصور والصوتيات وعروض الفيديو، مما يجعله نموذجاً متعدد الوسائط، قادراً على التكيف مع احتياجات المستخدمين في مختلف المجالات.

• الميزة الأولى لـ«غوغل جيميناي 2.0» هي دعم الوسائط المتعددة، حيث إن له قدرةً فائقةً على فهم وتوليد المحتوى عبر مختلف الوسائط، بما في ذلك النصوص والصور والصوتيات وعروض الفيديو. ويمكنه تحليل الصور والفيديوهات بدقة عالية وفهم محتواها وتوليد أوصاف نصية دقيقة لها. كما يمكنه توليد الصوتيات وتحويل النصوص إلى كلام منطوق، والعكس. هذه القدرات المتعددة الوسائط تجعله أداةً متقدمةً جداً للإبداع والتواصل والتعلم.

• الميزة الثانية، هي الفهم المتقدم للغات؛ ما يسمح له بتحليل النصوص المعقدة وفهم العلاقات بين الكلمات والجمل بدقة عالية، حيث يمكنه فهم السياق واستخلاص المعلومات المهمة والإجابة عن الأسئلة المعقدة بدقة وموضوعية. وهذا الفهم المتقدم للغة (يشمل فهم اللغة العربية) يجعله أداةً قيّمة للبحث عن المعلومات وتلخيص النصوص والترجمة بين اللغات المختلفة وكتابة المحتوى.

• الميزة الثالثة: تحسن الإصدار من حيث قدرات كتابة النصوص البرمجية، وذلك نتيجة تحسينه للتعامل مع المهام البرمجية المعقدة، حيث يمكنه فهم وتوليد النصوص البرمجية بلغات البرمجة المختلفة وتصحيح الأخطاء واقتراح التحسينات للنصوص الحالية. وهذه القدرات البرمجية تجعله مرجعاً مهماً للمطورين والمبرمجين، حيث يمكنهم استخدامه لكتابة النصوص بشكل أسرع وأكثر كفاءة.

• الميزة الرابعة، وهي تكامله السلس مع خدمات «غوغل»، حيث يتكامل الإصدار الجديد بسلاسة مع مجموعة واسعة من خدمات «غوغل»؛ ما يجعله متاحاً للمستخدمين في مختلف التطبيقات والمنصات. ويمكن استخدامه في محرك البحث و«مساعد غوغل» والخدمات السحابية لـ«غوغل» التي تشمل «وثائق غوغل» وجداول الحسابات وعروض التقديم، وغيرها من الخدمات الأخرى. هذا التكامل السلس يجعل من الإصدار الجديد أداةً عالية الكفاءة للبحث عن المعلومة وإنجاز المهام والتواصل مع الآخرين.

مقارنة بين الإصدارين الجديدين

ولدى طلب التخطيط لقضاء إجازة في منطقة، قدَّم «تشات جي بي تي 4.5» خط سير مفصلاً مع اقتراحات للسير لمسافات طويلة، وأماكن لتناول الطعام، وخيارات للسكن، إلى جانب نصائح حول كيفية الوصول إلى الوجهة. وفي المقابل، قدَّم «غوغل جيميناي 2.0» مقترحات جيدة للسير لمسافات طويلة وتناول الطعام، ولكنه كان أقل تحديداً حول أماكن السكن.

وفي ما يتعلق بالترجمة، قدم كلا النموذجين ترجمات دقيقة بين اللغات العربية والإنجليزية والفرنسية. وكان الفارق الوحيد هو أن «تشات جي بي تي 4.5» قدَّم روابط مع الترجمة. أما لدى سؤال الإصدارين حول حالة الطقس في مدينة الرياض، فقدَّم «غوغل جيميناي 2.0» حالة الطقس الحالي، بينما قدم «تشات جي بي تي 4.5» توقعات لكل ساعة مع صور وكلمات تصف حالة الطقس.

وفي الخلاصة، لا يمكن اعتبار أي منهما أفضل بشكل قاطع من الآخر، على الرغم من وجود بعض الاختلافات الطفيفة بينهما، والتي قد لا تكون ملحوظةً في الاستخدامات اليومية العادية. ويُنصح بالتحقق من جميع النتائج حتى لا يقع المستخدم في مشكلة الهلوسة (تأليف الذكاء الاصطناعي للمعلومة التي لا يعرفها لتبدو وكأنها حقيقية).

النموذجان متقدمان والاختيار بينهما يعتمد على تفضيلات المستخدمين بشكل فردي. ولكن يبقى فارق أخير بينهما يستحق الذكر، وهو أن «غوغل جيميناي 2.0» يسمح بتحميل الملفات والوثائق الكبيرة وتلخيصها والإجابة عن أي استفسارات مرتبطة بها بشكل مجاني، مقارنة باشتراك مدفوع في «تشات جي بي تي 4.5» وقيوده فيما يتعلق بحجم الملفات وعدد مرات استخدام هذا الميزة في اليوم الواحد.

«أبل» تؤجّل ميزات الذكاء الاصطناعي الجديدة

من جهتها أعلنت «أبل» تأجيل إطلاق النسخة المُحدَّثة من مساعدها الصوتي «سيري» التي كان من المفترض أن تُقدِّم قدرات متطورة لفهم السياق الشخصي وتنفيذ المهام داخل التطبيقات. وأوضحت الشركة أنها ستطلق هذه التحديثات خلال العام المقبل دون تحديد موعد دقيق لذلك. ويأتي هذا التأجيل نتيجة لصعوبات واجهت «أبل» في تطوير «سيري» المحدث، وإدراكها أن خططها لربط المساعد الصوتي بنموذج لغة كبير لتعزيز قدراته قد تستغرق سنوات عدة لتنضج بالشكل المرغوب، مقارنة بقدرات «سامسونغ» للذكاء الاصطناعي التي أطلقتها في سلسلة هواتفها «غالاكسي إس 25»، التي أطلقتها في شهر فبراير (شباط) الماضي، والتي تدعم تنفيذ المهام داخل التطبيقات بشكل مدمج.

وكانت «أبل» قد قدَّمت «سيري» المطور بوصفه جزءاً أساسياً من رؤيتها لـ«ذكاء أبل»، حيث وعدت بقدرة المساعد الصوتي على فهم ما يحدث في الجوال وتنفيذ الإجراءات داخل التطبيقات. ولكن ما تم إطلاقه حتى الآن يقتصر على ميزات مبسطة مثل الكتابة إلى «سيري» وفهم وشرح ميزات منتجات «أبل» وتحسينات بصرية، وتكامل مع «تشات جي بي تي».