«سورا» من «أوبن إيه آي» لإنشاء فيديوهات من أوامر نصية

تبلغ مدة الفيديو دقيقة بدقة 1080 بكسلاً

يمكن لنموذج «سورا» توليد مشاهد تشبه الأفلام بدقة قدرها 1080 بكسلاً (أوبن إيه آي)
يمكن لنموذج «سورا» توليد مشاهد تشبه الأفلام بدقة قدرها 1080 بكسلاً (أوبن إيه آي)
TT

«سورا» من «أوبن إيه آي» لإنشاء فيديوهات من أوامر نصية

يمكن لنموذج «سورا» توليد مشاهد تشبه الأفلام بدقة قدرها 1080 بكسلاً (أوبن إيه آي)
يمكن لنموذج «سورا» توليد مشاهد تشبه الأفلام بدقة قدرها 1080 بكسلاً (أوبن إيه آي)

تمثل تقنية «سورا (Sora)» الجديدة من «أوبن إيه آي» قفزة غير عادية في عالم الذكاء الاصطناعي، لا سيما في مجال تحويل النص إلى فيديو. تم تصميم هذه التقنية المبتكرة لدخول عصر جديد من إنشاء محتوى الفيديو، مما يتيح إنشاء مقاطع فيديو واقعية للغاية ومبتكرة تصل مدتها إلى دقيقة واحدة عبر تعليمات نصّية بسيطة. وبفضل هذه القدرة، يُعد «سورا» مثالاً رائعاً على إمكانات الذكاء الاصطناعي في إحداث نقلة مهمة في إنشاء الوسائط الرقمية. على سبيل المثال تم إعطاء «سورا» التعليمات التالية:

«امرأة أنيقة تسير في أحد شوارع طوكيو المليئة بالنيون المتوهج الدافئ ولافتات المدينة المتحركة. ترتدي سترة جلدية سوداء، وفستاناً أحمر طويلاً، وحذاءً أسود، وتحمل محفظة سوداء. إنها ترتدي النظارات الشمسية وتضع أحمر الشفاه. إنها تمشي بثقة وبشكل عرضيّ. الشارع رطب وعاكس، مما يخلق تأثير مرآة للأضواء الملونة. يتجول الكثير من المشاة». وهكذا كانت النتيجة (من موقع «أوبن إيه آي»):

القدرات المبتكرة والتحديات

يستطيع «سورا» إنشاء مشاهد معقدة تتميز بشخصيات متعددة، وأنواع معينة من الحركة، وسيناريوهات مفصلة، ​​كل ذلك مع فهم الفروق الدقيقة المضمَّنة في مطالبة المستخدم. كما أن إحدى الميزات البارزة هي قدرة «سورا» على إنشاء فيديو كامل دفعة واحدة، وبالتالي التخلص من التناقضات، مثل التغييرات في المظهر عندما تتحرك الأهداف خارج نطاق الرؤية.

إلا أن النموذج لا يخلو من نقاط الضعف. على سبيل المثال، قد يُصوَّر شخص ما وهو يأخذ قضمة من تفاحة، ولكن قد لا تظهر علامة العضّ على التفاحة بعد ذلك. أيضاً قد يواجه «سورا» صعوبة في التعامل مع التفاصيل المكانية والاتجاهات، مثل عدم التمييز بين اليسار واليمين، أو صعوبة وصف أحداث المشاهد التي تتكشف بمرور الوقت مثل الالتزام بمسار معين للكاميرا.

مثال آخر للنتيجة التي تولّدها تقنية «سورا» كان هذا الفيديو (من موقع «أوبن إيه آي») حيث طُلب منه تحديداً ما يلي:

«تواجه الكاميرا المباني الملونة مباشرةً في بورانو بإيطاليا. يبدو كلب دلماسي رائع من خلال نافذة في مبنى في الطابق الأرضي. كثير من الناس يسيرون ويركبون الدراجات على طول شوارع القناة أمام المباني».

تقنيات البحث والتطوير

يستخدم «سورا» على غرار نماذج «جي بي تي GPT» أنواع بنيات التعلم العميق المستخدمة لمعالجة البيانات التسلسلية، مما يسمح له بالتعامل مع كميات كبيرة من البيانات بفاعلية. يمثّل النموذج مقاطع الفيديو والصور على أنها مجموعات من تصحيحات البيانات، مشابهة للرموز المميزة في «جي بي تي» مما يسمح له بالتدريب على مجموعة متنوعة من البيانات المرئية. تتمكن تقنية «سورا» من خلال هذا التوحيد في تمثيل البيانات من التعامل مع المدة والدقة ومواصفات أخرى بطريقة أكثر كفاءة من أي وقت مضى. كما يستند «سورا» على الأبحاث الخاصة بنماذج «DALL - E» و«جي بي تي»، فهو يستخدم تقنية «الاسترداد« من «DALL - E 3» لإنشاء تسميات توضيحية وصفية للغاية لبيانات التدريب المرئية. يؤدي هذا إلى إنشاء مقاطع فيديو تتبع تعليمات المستخدم النصية بدقة أكبر. كما يمكن للنموذج تحريك الصور الثابتة أو توسيع مقاطع الفيديو الموجودة مع اهتمام ملحوظ بالتفاصيل، مما يُظهر تنوعه وإمكاناته في تطبيقات العالم الحقيقي.

اعتبارات السلامة والأخلاق

وإدراكاً لأهمية السلامة والأخلاقيات، التزمت «أوبن إيه آي» الكثير من الخطوات المهمة قبل إمكانية دمج «سورا» في منتجاتها. وعبّرت الشركة في تغريدة لها على موقع «إكس» عن أنه من خلال التعاون مع أعضاء «الفريق الأحمر»، وهو فريق داخل الشركة متخصص في مجالات مثل المعلومات الخاطئة والمحتوى الذي يحض على الكراهية والتحيز، يجري تطوير أدوات للكشف عن المحتوى المضلل، بما في ذلك أداة تصنيف قادرة على تحديد مقاطع الفيديو التي أنشأها «سورا».

المشاركة والآفاق المستقبلية

تخطط «أوبن إيه آي» للتعامل مع صناع السياسات والمعلمين والفنانين على مستوى العالم لفهم المخاوف وتحديد حالات الاستخدام الإيجابية لـ«سورا»، على الرغم من الأبحاث والاختبارات المكثفة، فإن النطاق الكامل للاستخدامات المفيدة والضارة المحتملة لا يزال غير معروف. وتؤمن «أوبن إيه آي» بأهمية التعلم من الاستخدام الواقعي بوصفه عنصراً حاسماً في إنشاء أنظمة ذكاء اصطناعي أكثر أماناً مع مرور الوقت.

يمثل «سورا» تقدماً كبيراً في قدرة الذكاء الاصطناعي على فهم ومحاكاة العالم الحقيقي، مما يمثل خطوة حاسمة نحو تحقيق الذكاء العام الاصطناعي (AGI). لا يُظهر تطويره إمكانية إنشاء محتوى فيديو جذاب فحسب، بل يسلط الضوء أيضاً على التحديات والمسؤوليات المستمرة في مجال أبحاث وتطبيقات الذكاء الاصطناعي.


مقالات ذات صلة

أدوات مميزة لتحويل أفكارك إلى تصميمات مرئية جذابة

تكنولوجيا تتيح «فينغيج» قوالب وأدوات تخصيص سهلة بينما تستخدم «نابكن إيه آي» الذكاء الاصطناعي لتحويل النصوص إلى تصميمات جذابة (فينغيج)

أدوات مميزة لتحويل أفكارك إلى تصميمات مرئية جذابة

تخيل أن بإمكانك تصميم إنفوغرافيك أو تقرير جذاب بسهولة!

عبد العزيز الرشيد (الرياض)
خاص يتطلب «واي فاي 7» بنية تحتية متقدمة ودعماً لمعدلات بيانات أعلى (أدوبي)

خاص كيف يدعم «واي فاي 7» التحول الرقمي وشبكات القطاعات الحيوية؟

يعزز «واي فاي 7» الاتصال عالي السرعة ويدعم التحول الرقمي في القطاعات الحيوية مع تحسين الأمان وكفاءة استهلاك الطاقة لتحقيق الاستدامة.

نسيم رمضان (دبي)
تكنولوجيا «إنزون إتش 9»: صوتيات مجسمة لمزيد من الانغماس في الألعاب

سماعات محمولة «ذكية» تتعرف على شكل أذني المستخدم

تدعم الاتصال بالكومبيوتر الشخصي والهواتف الجوالة و«بلايستيشن 5»

خلدون غسان سعيد (جدة)
تكنولوجيا حذّرت شركة «فورتينت» من تهديدات سيبرانية متزايدة استهدفت انتخابات الرئاسة الأميركية 2024 (أدوبي)

تقرير استخباراتي: تزايد التهديدات السيبرانية خلال الانتخابات الأميركية

بيّن التقرير تسجيل أكثر من 1000 نطاق وهمي جديد يحمل محتوى انتخابياً منذ بداية عام 2024، يستهدف خداع الناخبين.

نسيم رمضان (لندن)
تكنولوجيا باحثون: يمكن من خلال الذكاء الاصطناعي تحقيق توازن بين النمو والمسؤولية البيئية وضمان مستقبل أكثر استدامة (أدوبي)

ما دور الذكاء الاصطناعي في تعزيز الاستدامة بالشرق الأوسط؟

يقول خبراء إن الذكاء الاصطناعي يمكن أن يقدم حلولاً مبتكرة لتعزيز كفاءة الطاقة وتقليل الهدر وتعزيز النمو المستدام.

نسيم رمضان (دبي)

«ثورة الذكاء الاصطناعي» تطغى على «قمة الويب» في لشبونة

خلال جلسة في «قمة الويب» 2024 في لشبونة عاصمة البرتغال 12 نوفمبر 2024 (إ.ب.أ)
خلال جلسة في «قمة الويب» 2024 في لشبونة عاصمة البرتغال 12 نوفمبر 2024 (إ.ب.أ)
TT

«ثورة الذكاء الاصطناعي» تطغى على «قمة الويب» في لشبونة

خلال جلسة في «قمة الويب» 2024 في لشبونة عاصمة البرتغال 12 نوفمبر 2024 (إ.ب.أ)
خلال جلسة في «قمة الويب» 2024 في لشبونة عاصمة البرتغال 12 نوفمبر 2024 (إ.ب.أ)

يطغى الذكاء الاصطناعي التوليدي والتحوّلات الكبيرة الناتجة عنه على المناقشات خلال «قمة الويب» التي تُعقَد في لشبونة هذا الأسبوع على خلفية إعادة انتخاب دونالد ترمب رئيساً للولايات المتحدة، وتُعَدّ الملتقى الأبرز للاقتصاد الرقمي.

ورأى رئيس «مايكروسوفت» براد سميث أمام جمهور من رجال الأعمال، اليوم (الثلاثاء)، خلال القمة أن «الذكاء الاصطناعي هو التكنولوجيا التخريبية الجديدة الكبرى»، بمعنى أنها قادرة على إحداث تغيير جذري في كل قطاعات المجتمع، على غرار ما فعلت الكهرباء قبله.

وقال: «لدينا الفرصة لإنشاء اقتصاد جديد للذكاء الاصطناعي معاً، ولكن أكثر من ذلك، يمكننا بناء الثورة الصناعية العالمية الجديدة».

وذكّر براد سميث باستثمارات الشركة الأميركية العملاقة في مراكز البيانات، والبنى التحتية الأساسية لعمل الذكاء الاصطناعي الذي يتطلب قدراً ضخماً من القوة الحاسوبية والطاقة.

وقال: «لا يمكننا أن نسمح لأنفسنا ببناء مراكز بيانات واستهلاك الكهرباء من دون القلق بشأن ما يعنيه ذلك بالنسبة إلى منطقة أو بلد أو كوكب الأرض»، في وقت ترتفع فيه أصوات كثيرة للتنديد بالتكلفة البيئية الكبيرة لهذه التكنولوجيا.

خلال جلسة في «قمة الويب» 2024 في لشبونة عاصمة البرتغال 12 نوفمبر 2024 (إ.ب.أ)

وتضم «قمة الويب» في البرتغال أكثر من 71 ألف مشارك من 153 دولة، من بينهم أكثر من 3 آلاف شركة ناشئة وألف مستثمر، لمناقشة التطورات الجديدة المتعلقة بالذكاء الاصطناعي.

واغتنم رئيس شركة «علي بابا» الصينية العملاقة للتجارة الإلكترونية كو تشانغ الفرصة، الثلاثاء، للإعلان عن إطلاق محرك بحث جديد يعتمد على الذكاء الاصطناعي التوليدي، يسمى «Accio»، لمساعدة بائعي المحال الصغيرة في العثور على الموردين على المنصة.

وأوضح أن محرّك البحث هذا «نظام محادثة يسمح للأشخاص بالدردشة باللغة اليومية ويربطهم بالموردين حول العالم». ورأى أن ذلك «يمكّن الشركات الصغيرة والمتوسطة من اتخاذ قرارات أفضل».

وتُعقد القمة بعد إعادة انتخاب دونالد ترمب رئيساً للولايات المتحدة، الأسبوع الماضي، إثر حملة حظيت بدعم قوي من قطب التكنولوجيا إيلون ماسك.

يُخشى أن يعيد الرئيس الأميركي الـ47، دونالد ترمب، النظر في مرسوم مثير للجدل أصدره سلفه جو بايدن، يُحدد معايير الأمان في مجال الذكاء الاصطناعي، مع التركيز على حماية الخصوصية ومكافحة التحيّز.