«سورا» من «أوبن إيه آي» لإنشاء فيديوهات من أوامر نصية

تبلغ مدة الفيديو دقيقة بدقة 1080 بكسلاً

يمكن لنموذج «سورا» توليد مشاهد تشبه الأفلام بدقة قدرها 1080 بكسلاً (أوبن إيه آي)
يمكن لنموذج «سورا» توليد مشاهد تشبه الأفلام بدقة قدرها 1080 بكسلاً (أوبن إيه آي)
TT

«سورا» من «أوبن إيه آي» لإنشاء فيديوهات من أوامر نصية

يمكن لنموذج «سورا» توليد مشاهد تشبه الأفلام بدقة قدرها 1080 بكسلاً (أوبن إيه آي)
يمكن لنموذج «سورا» توليد مشاهد تشبه الأفلام بدقة قدرها 1080 بكسلاً (أوبن إيه آي)

تمثل تقنية «سورا (Sora)» الجديدة من «أوبن إيه آي» قفزة غير عادية في عالم الذكاء الاصطناعي، لا سيما في مجال تحويل النص إلى فيديو. تم تصميم هذه التقنية المبتكرة لدخول عصر جديد من إنشاء محتوى الفيديو، مما يتيح إنشاء مقاطع فيديو واقعية للغاية ومبتكرة تصل مدتها إلى دقيقة واحدة عبر تعليمات نصّية بسيطة. وبفضل هذه القدرة، يُعد «سورا» مثالاً رائعاً على إمكانات الذكاء الاصطناعي في إحداث نقلة مهمة في إنشاء الوسائط الرقمية. على سبيل المثال تم إعطاء «سورا» التعليمات التالية:

«امرأة أنيقة تسير في أحد شوارع طوكيو المليئة بالنيون المتوهج الدافئ ولافتات المدينة المتحركة. ترتدي سترة جلدية سوداء، وفستاناً أحمر طويلاً، وحذاءً أسود، وتحمل محفظة سوداء. إنها ترتدي النظارات الشمسية وتضع أحمر الشفاه. إنها تمشي بثقة وبشكل عرضيّ. الشارع رطب وعاكس، مما يخلق تأثير مرآة للأضواء الملونة. يتجول الكثير من المشاة». وهكذا كانت النتيجة (من موقع «أوبن إيه آي»):

القدرات المبتكرة والتحديات

يستطيع «سورا» إنشاء مشاهد معقدة تتميز بشخصيات متعددة، وأنواع معينة من الحركة، وسيناريوهات مفصلة، ​​كل ذلك مع فهم الفروق الدقيقة المضمَّنة في مطالبة المستخدم. كما أن إحدى الميزات البارزة هي قدرة «سورا» على إنشاء فيديو كامل دفعة واحدة، وبالتالي التخلص من التناقضات، مثل التغييرات في المظهر عندما تتحرك الأهداف خارج نطاق الرؤية.

إلا أن النموذج لا يخلو من نقاط الضعف. على سبيل المثال، قد يُصوَّر شخص ما وهو يأخذ قضمة من تفاحة، ولكن قد لا تظهر علامة العضّ على التفاحة بعد ذلك. أيضاً قد يواجه «سورا» صعوبة في التعامل مع التفاصيل المكانية والاتجاهات، مثل عدم التمييز بين اليسار واليمين، أو صعوبة وصف أحداث المشاهد التي تتكشف بمرور الوقت مثل الالتزام بمسار معين للكاميرا.

مثال آخر للنتيجة التي تولّدها تقنية «سورا» كان هذا الفيديو (من موقع «أوبن إيه آي») حيث طُلب منه تحديداً ما يلي:

«تواجه الكاميرا المباني الملونة مباشرةً في بورانو بإيطاليا. يبدو كلب دلماسي رائع من خلال نافذة في مبنى في الطابق الأرضي. كثير من الناس يسيرون ويركبون الدراجات على طول شوارع القناة أمام المباني».

تقنيات البحث والتطوير

يستخدم «سورا» على غرار نماذج «جي بي تي GPT» أنواع بنيات التعلم العميق المستخدمة لمعالجة البيانات التسلسلية، مما يسمح له بالتعامل مع كميات كبيرة من البيانات بفاعلية. يمثّل النموذج مقاطع الفيديو والصور على أنها مجموعات من تصحيحات البيانات، مشابهة للرموز المميزة في «جي بي تي» مما يسمح له بالتدريب على مجموعة متنوعة من البيانات المرئية. تتمكن تقنية «سورا» من خلال هذا التوحيد في تمثيل البيانات من التعامل مع المدة والدقة ومواصفات أخرى بطريقة أكثر كفاءة من أي وقت مضى. كما يستند «سورا» على الأبحاث الخاصة بنماذج «DALL - E» و«جي بي تي»، فهو يستخدم تقنية «الاسترداد« من «DALL - E 3» لإنشاء تسميات توضيحية وصفية للغاية لبيانات التدريب المرئية. يؤدي هذا إلى إنشاء مقاطع فيديو تتبع تعليمات المستخدم النصية بدقة أكبر. كما يمكن للنموذج تحريك الصور الثابتة أو توسيع مقاطع الفيديو الموجودة مع اهتمام ملحوظ بالتفاصيل، مما يُظهر تنوعه وإمكاناته في تطبيقات العالم الحقيقي.

اعتبارات السلامة والأخلاق

وإدراكاً لأهمية السلامة والأخلاقيات، التزمت «أوبن إيه آي» الكثير من الخطوات المهمة قبل إمكانية دمج «سورا» في منتجاتها. وعبّرت الشركة في تغريدة لها على موقع «إكس» عن أنه من خلال التعاون مع أعضاء «الفريق الأحمر»، وهو فريق داخل الشركة متخصص في مجالات مثل المعلومات الخاطئة والمحتوى الذي يحض على الكراهية والتحيز، يجري تطوير أدوات للكشف عن المحتوى المضلل، بما في ذلك أداة تصنيف قادرة على تحديد مقاطع الفيديو التي أنشأها «سورا».

المشاركة والآفاق المستقبلية

تخطط «أوبن إيه آي» للتعامل مع صناع السياسات والمعلمين والفنانين على مستوى العالم لفهم المخاوف وتحديد حالات الاستخدام الإيجابية لـ«سورا»، على الرغم من الأبحاث والاختبارات المكثفة، فإن النطاق الكامل للاستخدامات المفيدة والضارة المحتملة لا يزال غير معروف. وتؤمن «أوبن إيه آي» بأهمية التعلم من الاستخدام الواقعي بوصفه عنصراً حاسماً في إنشاء أنظمة ذكاء اصطناعي أكثر أماناً مع مرور الوقت.

يمثل «سورا» تقدماً كبيراً في قدرة الذكاء الاصطناعي على فهم ومحاكاة العالم الحقيقي، مما يمثل خطوة حاسمة نحو تحقيق الذكاء العام الاصطناعي (AGI). لا يُظهر تطويره إمكانية إنشاء محتوى فيديو جذاب فحسب، بل يسلط الضوء أيضاً على التحديات والمسؤوليات المستمرة في مجال أبحاث وتطبيقات الذكاء الاصطناعي.


مقالات ذات صلة

السعودية تسجل 44 % انخفاضاً في الهجمات الإلكترونية حتى نوفمبر مقارنة بـ2023

تكنولوجيا تعمل استراتيجيات مثل الأمن متعدد الطبقات واستخبارات التهديدات المتقدمة على تعزيز دفاعات الشركات السعودية (شاترستوك)

السعودية تسجل 44 % انخفاضاً في الهجمات الإلكترونية حتى نوفمبر مقارنة بـ2023

تواجه السعودية التحديات السيبرانية باستراتيجيات متقدمة مع معالجة حماية البيانات وأمن السحابة وفجوات مواهب الأمن السيبراني.

نسيم رمضان (لندن)
خاص تتضمن الاتجاهات الرئيسة لعام 2025 الاستعداد الكمومي وممارسات الأمن السيبراني الخضراء والامتثال (شاترستوك)

خاص كيف يعيد الذكاء الاصطناعي والحوسبة الكمومية تشكيل الأمن السيبراني في 2025؟

«بالو ألتو نتوركس» تشرح لـ«الشرق الأوسط» تأثير المنصات الموحدة والذكاء الاصطناعي والحوسبة الكمومية على مستقبل الأمن السيبراني.

نسيم رمضان (لندن)
يوميات الشرق الاختبارات المعملية أظهرت أن الطريقة الجديدة حسّنت الخصائص الميكانيكية للخرسانة (جامعة نانيانغ التكنولوجية)

خرسانة مطبوعة ثلاثية الأبعاد تمتص ثاني أكسيد الكربون

طوّر علماء من جامعة نانيانغ التكنولوجية في سنغافورة طريقة جديدة لطباعة الخرسانة ثلاثية الأبعاد، تجعلها قادرة على امتصاص ثاني أكسيد الكربون.

«الشرق الأوسط» (القاهرة )
تكنولوجيا تسمح لك ميزة «Image Playground» بالدمج بين الذكاء الاصطناعي وسهولة الاستخدام (أبل)

كل ما تحتاج إلى معرفته عن ميزة «Image Playground» في «iOS 18.2»

تُمثل «Image Playground» قفزة نوعية في مجال الإبداع البصري؛ حيث تدمج بين الذكاء الاصطناعي وسهولة الاستخدام.

عبد العزيز الرشيد (الرياض)

بسبب الاحتيال... إيطاليا تغرّم «تشات جي بي تي» 15 مليون يورو

لوغو تطبيق «شات جي بي تي» (رويترز)
لوغو تطبيق «شات جي بي تي» (رويترز)
TT

بسبب الاحتيال... إيطاليا تغرّم «تشات جي بي تي» 15 مليون يورو

لوغو تطبيق «شات جي بي تي» (رويترز)
لوغو تطبيق «شات جي بي تي» (رويترز)

أعلنت هيئة حماية البيانات الإيطالية أنها فرضت غرامة قدرها 15 مليون يورو على شركة «أوبن إيه آي» الأميركية على خلفية اتهامها باستخدام بيانات شخصية بشكل احتيالي من خلال برنامج «تشات جي بي تي» التابع لها.

وقالت الهيئة المستقلة المسؤولة عن حماية الحقوق والحريات الأساسية المرتبطة بمعالجة البيانات الشخصية إن «هيئة حماية البيانات فرضت غرامة قدرها 15 مليون يورو على شركة (أوبن إيه آي)، وهو مبلغ جرى تخفيضه نظراً إلى أن الشركة كانت متعاونة أثناء التحقيق».

واعتبرت الهيئة الإيطالية أنه لم يتم إخطارها من «أوبن إيه آي» بـ«انتهاك البيانات الذي تعرضت له في مارس (آذار) 2023»، مضيفة «أنها عالجت البيانات الشخصية للمستخدمين لتدريب (تشات جي بي تي) من دون أساس قانوني مناسب»، في انتهاك «لمبدأ الشفافية والالتزامات المترتبة عن ذلك المرتبطة بإعلام المستخدمين».

كذلك، خلص التحقيق الذي استمر قرابة عامين إلى أن «أوبن إيه آي» لم يكن لديها «نظام للتحقق من العمر المناسب لمنع الأطفال دون سن 13 عاماً من التعرض لمحتوى غير لائق» ناتج عن الذكاء الاصطناعي، بحسب هيئة حماية البيانات.

وبالإضافة إلى الغرامة، قالت الهيئة إنها أمرت «أوبن إيه آي» بتنفيذ حملة توعية مدتها ستة أشهر لتعريف عامة الناس بصورة أفضل بـ«تشات جي بي تي».

في مارس 2023، حظرت هيئة حماية البيانات الإيطالية لفترة وجيزة استخدام «تشات جي بي تي» في إيطاليا بسبب انتهاكات مفترضة للخصوصية. وكانت إيطاليا أول دولة غربية تتخذ إجراءات ضد منصة الذكاء الاصطناعي الأكثر شهرة.

وتعليقاً على قرار الهيئة، اعتبرت إدارة «أوبن إيه آي» أن الغرامة المفروضة عليها «غير متناسبة»، مشيرة إلى أنها ستستأنف القرار، حسبما نقلت «وكالة الصحافة الفرنسية».

ولفتت الشركة إلى أنها عملت مع الهيئة الإيطالية بعد تعليق «تشات جي بي تي» لإعادة الخدمة بعد شهر.

وقالت في بيان «لقد أدركوا منذ ذلك الحين نهجنا في حماية الخصوصية في الذكاء الاصطناعي، لكن هذه الغرامة تمثل ما يقرب من عشرين ضعف الإيرادات التي حققناها في إيطاليا خلال الفترة المعنية».

وأضافت «نعتقد أن نهج (الهيئة الإيطالية لحماية البيانات) يقوض طموحات إيطاليا في مجال الذكاء الاصطناعي، لكننا نظل ملتزمين بالعمل مع سلطات الخصوصية في جميع أنحاء العالم لتقديم الذكاء الاصطناعي الذي يقدم الفوائد ويحترم حقوق الخصوصية».