«سورا» من «أوبن إيه آي» لإنشاء فيديوهات من أوامر نصية

تبلغ مدة الفيديو دقيقة بدقة 1080 بكسلاً

يمكن لنموذج «سورا» توليد مشاهد تشبه الأفلام بدقة قدرها 1080 بكسلاً (أوبن إيه آي)
يمكن لنموذج «سورا» توليد مشاهد تشبه الأفلام بدقة قدرها 1080 بكسلاً (أوبن إيه آي)
TT

«سورا» من «أوبن إيه آي» لإنشاء فيديوهات من أوامر نصية

يمكن لنموذج «سورا» توليد مشاهد تشبه الأفلام بدقة قدرها 1080 بكسلاً (أوبن إيه آي)
يمكن لنموذج «سورا» توليد مشاهد تشبه الأفلام بدقة قدرها 1080 بكسلاً (أوبن إيه آي)

تمثل تقنية «سورا (Sora)» الجديدة من «أوبن إيه آي» قفزة غير عادية في عالم الذكاء الاصطناعي، لا سيما في مجال تحويل النص إلى فيديو. تم تصميم هذه التقنية المبتكرة لدخول عصر جديد من إنشاء محتوى الفيديو، مما يتيح إنشاء مقاطع فيديو واقعية للغاية ومبتكرة تصل مدتها إلى دقيقة واحدة عبر تعليمات نصّية بسيطة. وبفضل هذه القدرة، يُعد «سورا» مثالاً رائعاً على إمكانات الذكاء الاصطناعي في إحداث نقلة مهمة في إنشاء الوسائط الرقمية. على سبيل المثال تم إعطاء «سورا» التعليمات التالية:

«امرأة أنيقة تسير في أحد شوارع طوكيو المليئة بالنيون المتوهج الدافئ ولافتات المدينة المتحركة. ترتدي سترة جلدية سوداء، وفستاناً أحمر طويلاً، وحذاءً أسود، وتحمل محفظة سوداء. إنها ترتدي النظارات الشمسية وتضع أحمر الشفاه. إنها تمشي بثقة وبشكل عرضيّ. الشارع رطب وعاكس، مما يخلق تأثير مرآة للأضواء الملونة. يتجول الكثير من المشاة». وهكذا كانت النتيجة (من موقع «أوبن إيه آي»):

القدرات المبتكرة والتحديات

يستطيع «سورا» إنشاء مشاهد معقدة تتميز بشخصيات متعددة، وأنواع معينة من الحركة، وسيناريوهات مفصلة، ​​كل ذلك مع فهم الفروق الدقيقة المضمَّنة في مطالبة المستخدم. كما أن إحدى الميزات البارزة هي قدرة «سورا» على إنشاء فيديو كامل دفعة واحدة، وبالتالي التخلص من التناقضات، مثل التغييرات في المظهر عندما تتحرك الأهداف خارج نطاق الرؤية.

إلا أن النموذج لا يخلو من نقاط الضعف. على سبيل المثال، قد يُصوَّر شخص ما وهو يأخذ قضمة من تفاحة، ولكن قد لا تظهر علامة العضّ على التفاحة بعد ذلك. أيضاً قد يواجه «سورا» صعوبة في التعامل مع التفاصيل المكانية والاتجاهات، مثل عدم التمييز بين اليسار واليمين، أو صعوبة وصف أحداث المشاهد التي تتكشف بمرور الوقت مثل الالتزام بمسار معين للكاميرا.

مثال آخر للنتيجة التي تولّدها تقنية «سورا» كان هذا الفيديو (من موقع «أوبن إيه آي») حيث طُلب منه تحديداً ما يلي:

«تواجه الكاميرا المباني الملونة مباشرةً في بورانو بإيطاليا. يبدو كلب دلماسي رائع من خلال نافذة في مبنى في الطابق الأرضي. كثير من الناس يسيرون ويركبون الدراجات على طول شوارع القناة أمام المباني».

تقنيات البحث والتطوير

يستخدم «سورا» على غرار نماذج «جي بي تي GPT» أنواع بنيات التعلم العميق المستخدمة لمعالجة البيانات التسلسلية، مما يسمح له بالتعامل مع كميات كبيرة من البيانات بفاعلية. يمثّل النموذج مقاطع الفيديو والصور على أنها مجموعات من تصحيحات البيانات، مشابهة للرموز المميزة في «جي بي تي» مما يسمح له بالتدريب على مجموعة متنوعة من البيانات المرئية. تتمكن تقنية «سورا» من خلال هذا التوحيد في تمثيل البيانات من التعامل مع المدة والدقة ومواصفات أخرى بطريقة أكثر كفاءة من أي وقت مضى. كما يستند «سورا» على الأبحاث الخاصة بنماذج «DALL - E» و«جي بي تي»، فهو يستخدم تقنية «الاسترداد« من «DALL - E 3» لإنشاء تسميات توضيحية وصفية للغاية لبيانات التدريب المرئية. يؤدي هذا إلى إنشاء مقاطع فيديو تتبع تعليمات المستخدم النصية بدقة أكبر. كما يمكن للنموذج تحريك الصور الثابتة أو توسيع مقاطع الفيديو الموجودة مع اهتمام ملحوظ بالتفاصيل، مما يُظهر تنوعه وإمكاناته في تطبيقات العالم الحقيقي.

اعتبارات السلامة والأخلاق

وإدراكاً لأهمية السلامة والأخلاقيات، التزمت «أوبن إيه آي» الكثير من الخطوات المهمة قبل إمكانية دمج «سورا» في منتجاتها. وعبّرت الشركة في تغريدة لها على موقع «إكس» عن أنه من خلال التعاون مع أعضاء «الفريق الأحمر»، وهو فريق داخل الشركة متخصص في مجالات مثل المعلومات الخاطئة والمحتوى الذي يحض على الكراهية والتحيز، يجري تطوير أدوات للكشف عن المحتوى المضلل، بما في ذلك أداة تصنيف قادرة على تحديد مقاطع الفيديو التي أنشأها «سورا».

المشاركة والآفاق المستقبلية

تخطط «أوبن إيه آي» للتعامل مع صناع السياسات والمعلمين والفنانين على مستوى العالم لفهم المخاوف وتحديد حالات الاستخدام الإيجابية لـ«سورا»، على الرغم من الأبحاث والاختبارات المكثفة، فإن النطاق الكامل للاستخدامات المفيدة والضارة المحتملة لا يزال غير معروف. وتؤمن «أوبن إيه آي» بأهمية التعلم من الاستخدام الواقعي بوصفه عنصراً حاسماً في إنشاء أنظمة ذكاء اصطناعي أكثر أماناً مع مرور الوقت.

يمثل «سورا» تقدماً كبيراً في قدرة الذكاء الاصطناعي على فهم ومحاكاة العالم الحقيقي، مما يمثل خطوة حاسمة نحو تحقيق الذكاء العام الاصطناعي (AGI). لا يُظهر تطويره إمكانية إنشاء محتوى فيديو جذاب فحسب، بل يسلط الضوء أيضاً على التحديات والمسؤوليات المستمرة في مجال أبحاث وتطبيقات الذكاء الاصطناعي.


مقالات ذات صلة

تكنولوجيا يعد «GPT-4o mini» نموذج ذكاء اصطناعي صغيراً فعالاً من حيث تكلفة العملاء (شاترستوك)

200 مليون مستخدم نشط في «تشات جي بي تي» أسبوعياً

صرحت شركة «أوبن إيه آي (OpenAI)»،الناشئة للذكاء الاصطناعي، بأن روبوت الدردشة الخاص بها «تشات جي بي تي (ChatGPT)» لديه الآن أكثر من 200 مليون مستخدم نشط أسبوعيا.

نسيم رمضان (لندن)
تكنولوجيا من غير الواضح سبب انتظار «سناب شات» حتى الآن لإحضار تطبيقها إلى «آيباد» (شاترستوك)

بعد 13 عاماً من الانتظار... «سناب شات» تطلق تطبيقها على «آيباد»

يمكن الآن الاستفادة الكاملة من حجم شاشة الجهاز والاستمتاع بلوحة أكبر لالتقاط اللقطات وعرض المحتوى.

نسيم رمضان (لندن)
تكنولوجيا اليقظة وتدابير الأمان تمكّنان الأفراد من الدفاع عن بريدهم الإلكتروني ضد الجرائم الإلكترونية (شاترستوك)

​هل بريدك الإلكتروني بأمان؟ إليك بعض النصائح

تعد عناوين البريد الإلكتروني الشخصية والمهنية أهدافاً رئيسية لمجتمع متنامٍ من مجرمي الإنترنت المتطورين

نسيم رمضان (لندن)
تكنولوجيا إضافات مفيدة لمتصفح "كروم" تزيد من قدراته ووظائفه

تعرف على أبرز إضافات متصفح «كروم»

يعد متصفح «كروم» Chrome من أكثر المتصفحات شعبية ومرونة في مزاياه بفضل تقديمه تحديثات دورية وما يُعرف بالإضافات Extensions

خلدون غسان سعيد

«تلغرام»... هل هو بوابة لـ«الإنترنت المظلم» في جيبك؟

شعار تطبيق «تلغرام» (رويترز)
شعار تطبيق «تلغرام» (رويترز)
TT

«تلغرام»... هل هو بوابة لـ«الإنترنت المظلم» في جيبك؟

شعار تطبيق «تلغرام» (رويترز)
شعار تطبيق «تلغرام» (رويترز)

قبل نحو 9 أشهر، وخلال بحث جو تيدي، مراسل شؤون الأمن الإلكتروني في هيئة الإذاعة البريطانية (بي بي سي)، عن قصة صحافية جديدة، وجد نفسه مُضافاً إلى قناة كبيرة على تطبيق «تلغرام» تركز على بيع المخدرات، ثم تمّت إضافته إلى قناة تختص بالقرصنة، ثم أخرى تبيع كل الممنوعات من بطاقات الائتمان المسروقة حتى الأسلحة.

وأدرك تيدي وقتها أن إعدادات «تلغرام» الخاصة به جعلت من الممكن للأشخاص إضافته إلى قنواتهم دون أن يفعل أي شيء، وأبقى الإعدادات كما هي لمعرفة ما سيحدث بعد ذلك، وفي غضون بضعة أشهر تمّت إضافته إلى 82 مجموعة مختلفة.

وبعد أن غيّر إعداداته لإيقاف ذلك، وجد أنه «في كل مرة يقوم فيها بتسجيل الدخول يتلقى آلاف الرسائل الجديدة من عشرات المجموعات غير القانونية النشطة للغاية» وفق قوله.

وأشعل اعتقال بافيل دوروف، مالك ومؤسس «تلغرام»، في فرنسا نقاشاً حول الإشراف على تطبيقه.

وتم توجيه الاتهام إلى دوروف بالتواطؤ «المشتبه به» في السماح للمعاملات غير المشروعة، والاتجار بالمخدرات والاحتيال ونشر صور الاعتداء الجنسي على الأطفال، بالانتشار على موقعه.

الإنترنت المظلم

وحسب تيدي، فلا شك أن الجريمة تحدث على شبكات التواصل الاجتماعي الأخرى أيضاً، لكن «تلغرام» يسهّل الأمر بصورة تجعل المشكلة «أوسع نطاقاً» وتسبب قلقاً متزايداً للعاملين في إنفاذ القانون.

ويصف مقدم البرامج المتخصصة في الأمن السيبراني، باتريك غراي، تطبيق «تلغرام» منذ أشهر بأنه «الويب أو الإنترنت المُظلم في جيبك». ويعدّ «الويب المظلم» جزءاً من الإنترنت لا يمكن الوصول إليه إلا باستخدام برامج متخصصة، ويُستخدم في بيع السلع والخدمات غير القانونية.

وفي تعليقه على اعتقال دوروف، قال غراي إن «تلغرام كان ملاذاً للجريمة لفترة طويلة». وأضاف: «نحن نتحدث عن مواد الاعتداء الجنسي على الأطفال، ونتحدث عن بيع المخدرات، ونتحدث عن مستويات من الجريمة لا تحدث إلا على الويب المظلم ولا يفعل التطبيق شيئاً حيالها».

ويحب المجرمون شبكة الويب المظلمة؛ لأنها تسمح لهم بعدم الكشف عن هوياتهم، وهو ما يسمح به «تلغرام». ويقول الباحثون في شركة الأمن السيبراني «Intel471»: «قبل ظهور (تلغرام)، كان النشاط الإجرامي يتم بشكل أساسي باستخدام خدمات الويب المظلمة. لكن بالنسبة لمجرمي الإنترنت من المستوى الأدنى والأقل مهارة، أصبح (تلغرام) إحدى أكثر الوجهات شعبية عبر الإنترنت».

مواد إساءة معاملة الأطفال

تقول هيئة الإذاعة البريطانية: «في حين يستجيب (تلغرام) لبعض طلبات إزالة هذه المواد التي تقدم من الشرطة أو الجمعيات الخيرية، فإن التطبيق لا يشارك في البرامج التي تهدف إلى منع انتشار صور ومقاطع إساءة معاملة الأطفال جنسياً بشكل استباقي، ولا يبذل جهداً كافياً لمراقبة مواد إساءة معاملة الأطفال جنسياً»، وهو أحد الادعاءات الرئيسية من قبل المدعين العامين الفرنسيين.

بدوره، أخبر التطبيق هيئة الإذاعة البريطانية أنه يبحث «بشكل استباقي عن الأنشطة غير القانونية، بما في ذلك إساءة معاملة الأطفال جنسياً». وقال إن إجراءات «غير معلنة» تم اتخاذها ضد 45 ألف مجموعة في أغسطس (آب) وحده.

عدم التعاون مع الشرطة

ويعد الإشراف على المحتوى جزءاً من المشكلة التي يواجهها «تلغرام»، لكن نهجهه في التعامل مع طلبات الشرطة بإزالة المحتوى غير القانوني أو «تمرير الأدلة» يعد مشكلة أخرى.

ويمكن لـ«تلغرام» قراءة كل المحتوى المتداول عليه، وتمريره إلى الشرطة إذا أراد ذلك، لكنه ينص في شروطه وأحكامه على ألا يفعل ذلك.

وأشارت السلطات الفرنسية، فيما يخص الاتهامات بشأن دوروف، إلى أن الشرطة في فرنسا وفي بلجيكا أيضاً «كانت تعاني تاريخياً» من «انعدام شبه كامل للاستجابة من (تلغرام) للطلبات القانونية».