«سورا» من «أوبن إيه آي» لإنشاء فيديوهات من أوامر نصية

تبلغ مدة الفيديو دقيقة بدقة 1080 بكسلاً

يمكن لنموذج «سورا» توليد مشاهد تشبه الأفلام بدقة قدرها 1080 بكسلاً (أوبن إيه آي)
يمكن لنموذج «سورا» توليد مشاهد تشبه الأفلام بدقة قدرها 1080 بكسلاً (أوبن إيه آي)
TT

«سورا» من «أوبن إيه آي» لإنشاء فيديوهات من أوامر نصية

يمكن لنموذج «سورا» توليد مشاهد تشبه الأفلام بدقة قدرها 1080 بكسلاً (أوبن إيه آي)
يمكن لنموذج «سورا» توليد مشاهد تشبه الأفلام بدقة قدرها 1080 بكسلاً (أوبن إيه آي)

تمثل تقنية «سورا (Sora)» الجديدة من «أوبن إيه آي» قفزة غير عادية في عالم الذكاء الاصطناعي، لا سيما في مجال تحويل النص إلى فيديو. تم تصميم هذه التقنية المبتكرة لدخول عصر جديد من إنشاء محتوى الفيديو، مما يتيح إنشاء مقاطع فيديو واقعية للغاية ومبتكرة تصل مدتها إلى دقيقة واحدة عبر تعليمات نصّية بسيطة. وبفضل هذه القدرة، يُعد «سورا» مثالاً رائعاً على إمكانات الذكاء الاصطناعي في إحداث نقلة مهمة في إنشاء الوسائط الرقمية. على سبيل المثال تم إعطاء «سورا» التعليمات التالية:

«امرأة أنيقة تسير في أحد شوارع طوكيو المليئة بالنيون المتوهج الدافئ ولافتات المدينة المتحركة. ترتدي سترة جلدية سوداء، وفستاناً أحمر طويلاً، وحذاءً أسود، وتحمل محفظة سوداء. إنها ترتدي النظارات الشمسية وتضع أحمر الشفاه. إنها تمشي بثقة وبشكل عرضيّ. الشارع رطب وعاكس، مما يخلق تأثير مرآة للأضواء الملونة. يتجول الكثير من المشاة». وهكذا كانت النتيجة (من موقع «أوبن إيه آي»):

القدرات المبتكرة والتحديات

يستطيع «سورا» إنشاء مشاهد معقدة تتميز بشخصيات متعددة، وأنواع معينة من الحركة، وسيناريوهات مفصلة، ​​كل ذلك مع فهم الفروق الدقيقة المضمَّنة في مطالبة المستخدم. كما أن إحدى الميزات البارزة هي قدرة «سورا» على إنشاء فيديو كامل دفعة واحدة، وبالتالي التخلص من التناقضات، مثل التغييرات في المظهر عندما تتحرك الأهداف خارج نطاق الرؤية.

إلا أن النموذج لا يخلو من نقاط الضعف. على سبيل المثال، قد يُصوَّر شخص ما وهو يأخذ قضمة من تفاحة، ولكن قد لا تظهر علامة العضّ على التفاحة بعد ذلك. أيضاً قد يواجه «سورا» صعوبة في التعامل مع التفاصيل المكانية والاتجاهات، مثل عدم التمييز بين اليسار واليمين، أو صعوبة وصف أحداث المشاهد التي تتكشف بمرور الوقت مثل الالتزام بمسار معين للكاميرا.

مثال آخر للنتيجة التي تولّدها تقنية «سورا» كان هذا الفيديو (من موقع «أوبن إيه آي») حيث طُلب منه تحديداً ما يلي:

«تواجه الكاميرا المباني الملونة مباشرةً في بورانو بإيطاليا. يبدو كلب دلماسي رائع من خلال نافذة في مبنى في الطابق الأرضي. كثير من الناس يسيرون ويركبون الدراجات على طول شوارع القناة أمام المباني».

تقنيات البحث والتطوير

يستخدم «سورا» على غرار نماذج «جي بي تي GPT» أنواع بنيات التعلم العميق المستخدمة لمعالجة البيانات التسلسلية، مما يسمح له بالتعامل مع كميات كبيرة من البيانات بفاعلية. يمثّل النموذج مقاطع الفيديو والصور على أنها مجموعات من تصحيحات البيانات، مشابهة للرموز المميزة في «جي بي تي» مما يسمح له بالتدريب على مجموعة متنوعة من البيانات المرئية. تتمكن تقنية «سورا» من خلال هذا التوحيد في تمثيل البيانات من التعامل مع المدة والدقة ومواصفات أخرى بطريقة أكثر كفاءة من أي وقت مضى. كما يستند «سورا» على الأبحاث الخاصة بنماذج «DALL - E» و«جي بي تي»، فهو يستخدم تقنية «الاسترداد« من «DALL - E 3» لإنشاء تسميات توضيحية وصفية للغاية لبيانات التدريب المرئية. يؤدي هذا إلى إنشاء مقاطع فيديو تتبع تعليمات المستخدم النصية بدقة أكبر. كما يمكن للنموذج تحريك الصور الثابتة أو توسيع مقاطع الفيديو الموجودة مع اهتمام ملحوظ بالتفاصيل، مما يُظهر تنوعه وإمكاناته في تطبيقات العالم الحقيقي.

اعتبارات السلامة والأخلاق

وإدراكاً لأهمية السلامة والأخلاقيات، التزمت «أوبن إيه آي» الكثير من الخطوات المهمة قبل إمكانية دمج «سورا» في منتجاتها. وعبّرت الشركة في تغريدة لها على موقع «إكس» عن أنه من خلال التعاون مع أعضاء «الفريق الأحمر»، وهو فريق داخل الشركة متخصص في مجالات مثل المعلومات الخاطئة والمحتوى الذي يحض على الكراهية والتحيز، يجري تطوير أدوات للكشف عن المحتوى المضلل، بما في ذلك أداة تصنيف قادرة على تحديد مقاطع الفيديو التي أنشأها «سورا».

المشاركة والآفاق المستقبلية

تخطط «أوبن إيه آي» للتعامل مع صناع السياسات والمعلمين والفنانين على مستوى العالم لفهم المخاوف وتحديد حالات الاستخدام الإيجابية لـ«سورا»، على الرغم من الأبحاث والاختبارات المكثفة، فإن النطاق الكامل للاستخدامات المفيدة والضارة المحتملة لا يزال غير معروف. وتؤمن «أوبن إيه آي» بأهمية التعلم من الاستخدام الواقعي بوصفه عنصراً حاسماً في إنشاء أنظمة ذكاء اصطناعي أكثر أماناً مع مرور الوقت.

يمثل «سورا» تقدماً كبيراً في قدرة الذكاء الاصطناعي على فهم ومحاكاة العالم الحقيقي، مما يمثل خطوة حاسمة نحو تحقيق الذكاء العام الاصطناعي (AGI). لا يُظهر تطويره إمكانية إنشاء محتوى فيديو جذاب فحسب، بل يسلط الضوء أيضاً على التحديات والمسؤوليات المستمرة في مجال أبحاث وتطبيقات الذكاء الاصطناعي.


مقالات ذات صلة

«بي واي دي»... قصة سيارات كهربائية بدأت ببطارية هاتف

خاص «بي واي دي»: نخطط للاستثمار في مبادرات تسويقية وتعليمية لزيادة الوعي بفوائد النقل الكهربائي (BYD)

«بي واي دي»... قصة سيارات كهربائية بدأت ببطارية هاتف

من ابتكارات البطاريات الرائدة إلى المنصات المتطورة، تتماشى رؤية «بي واي دي» مع الأهداف العالمية للاستدامة، بما في ذلك «رؤية المملكة 2030».

نسيم رمضان (الصين)
صحتك خاتم «أورا» الذكي

خواتم ذكية تكشف الرجفان الأذيني

الخواتم الذكية - أحدث فئة من الأجهزة القابلة للارتداء - يمكنها القيام بعدد من الأشياء التي يمكن أن تقوم بها الساعة الذكية، بما في ذلك مراقبة معدل ضربات القلب،…

جولي كورليس (كمبردج (ولاية ماساشوستس الأميركية))
تكنولوجيا يبرز نجاح «أكوا بوت» الإمكانات التحويلية للجمع بين الأجهزة المتطورة والبرامج الذكية (أكوا بوت)

روبوت يسبح تحت الماء بشكل مستقل مستخدماً الذكاء الاصطناعي

الروبوت «أكوا بوت»، الذي طوّره باحثون في جامعة كولومبيا، قادر على تنفيذ مجموعة متنوعة من المهام تحت الماء بشكل مستقل.

نسيم رمضان (لندن)
صحتك منصات التواصل الاجتماعي أصبحت جزءاً أساسياً من حياة كثيرين (رويترز)

صداقات «السوشيال ميديا» تعزز الثقة بالنفس

توصلت دراسة أميركية حديثة إلى أن جودة الصداقات عبر الشبكات الاجتماعية يمكن أن تسهم في تقليل الشعور بالوحدة.

«الشرق الأوسط» (القاهرة )
تكنولوجيا تصميم أنيق وقدرات تصويرية متقدمة

تعرف على مزايا هاتف «إتش إم دي سكايلاين 5 جي» الجديد في المنطقة العربية

يدعم نمط التركيز الرقمي ببطارية ذات عمر طويل.

خلدون غسان سعيد (جدة)

السعودية: انطلاق الفعالية السيبرانية الأكثر حضوراً في العالم بمشاركة دولية

جانب من حضور واسع لانطلاق «بلاك هات» (تصوير: تركي العقيلي)
جانب من حضور واسع لانطلاق «بلاك هات» (تصوير: تركي العقيلي)
TT

السعودية: انطلاق الفعالية السيبرانية الأكثر حضوراً في العالم بمشاركة دولية

جانب من حضور واسع لانطلاق «بلاك هات» (تصوير: تركي العقيلي)
جانب من حضور واسع لانطلاق «بلاك هات» (تصوير: تركي العقيلي)

انطلقت، الثلاثاء، أعمال النسخة الثالثة من فعالية الأمن السيبراني الأكثر حضوراً في العالم «بلاك هات» في مركز الرياض للمعارض والمؤتمرات بملهم، شمال العاصمة السعودية الرياض.

ومن المقرر أن يستمر الحدث حتى 28 من الشهر الحالي، بتنظيم من «الاتحاد السعودي للأمن السيبراني والبرمجة والدرونز»، وشركة «تحالف» إحدى شركات الاتحاد، بالشراكة مع «إنفورما» العالمية، وصندوق الفعاليات الاستثماري.

وأعرب ‏فيصل الخميسي، رئيس مجلس إدارة الاتحاد السعودي للأمن السيبراني والبرمجة والدرونز، عن فخره الكبير باستضافة هذه الفعالية، مشيراً خلال كلمته في حفل الافتتاح إلى أن «بلاك هات الشرق الأوسط وأفريقيا» أصبحت رسمياً أكبر حدث للأمن السيبراني في العالم من حيث المساحة بنمو يقارب الضعف، ما يجسد مكانة الفعالية حول العالم.

وتابع الخميسي: «قبل 4 سنوات أثبتنا جاهزية السوق السعودية بأول نسخة، وفي عام 2023 أصبح (بلاك هات الشرق الأوسط وأفريقيا) هو الحدث السيبراني الأكثر حضوراً في العالم».

ينظم «بلاك هات» النسخة الكبرى عالمياً من مسابقة «التقط العلم» (تصوير: ترك العقيلي)

وزاد الخميسي: «على مدار الأيام الثلاثة المقبلة، ستعيشون تجربة فريدة من نوعها مع أكثر من 350 متحدثاً، و450 شركة عارضة، بالإضافة إلى المشاركة في 10 أنشطة متنوعة».

حدث عالمي

من جانبه، قال متعب القني، الرئيس التنفيذي للاتحاد السعودي للأمن السيبراني والبرمجة والدرونز، لـ«الشرق الأوسط»، إن «بلاك هات» أكبر من مجرد فعالية، وهي حدث عالمي لمدة 3 أيام، يجمع الشركات العالمية في الأمن السيبراني، ويجمع المختصين والخبراء والمهتمين والهواة ومسؤولي الأمن السيبراني في الجهات الحكومية وشبه الحكومية وغيرها.

وأضاف القني أن الشركات العالمية والمختصين تنتظره لإطلاق منتجاتهم وأبحاثهم في قطاع الأمن السيبراني، وكشف القني أن نسبة النمو في عدد العارضين بهذه النسخة تجاوزت 190 في المائة عن النسخة الأولى بمقدار 450 جهة عارضة من 5 دول مشاركة، وأكثر من 59 مختصاً ومسؤول أمن سيبراني، بالإضافة إلى زيادة مساحة المعرض بما يتجاوز 100 في المائة عن النسخة الأولى.

إطلاقات منتظرة

القنّي سلّط الضوء خلال حديثه عن إطلاقات منتظرة للشركات خلال أيام المعرض، إلى جانب كشف التحديات الأمنية التي تواجه قطاع الأمن السيبراني، معتبراً أن «بلاك هات» يوفّر المكان للشركات المختصة لتقديم الحلول السيبرانية للقطاعات كافة.

وكانت الجلسات المصاحبة للفعالية انطلقت من خلال الجلسة الأولى، بعنوان «إعادة تقييم المخاطر... خطة لتعزيز المرونة»، إلى جانب ذلك تتضمّن «بلاك هات» عدداً من المنصات والمسارح، مثل القمة التنفيذية، وآرسنال، وورش العمل التقنية، و«بلاك هات كامبس»، ومسابقات سايبر سييد، وديب دايف. ومن المتوقع أن يحضر عددٌ من الشخصيات الفاعلة في المشهد التقني، من بينهم لوري وايد، رئيس قسم البيانات في مجتمع الاستخبارات، وكلٌّ من عمر خان مدير أمن المعلومات ونائب الرئيس الأول للبرمجيات في «Relativity Space»، وسوزان تشيانغ، رئيسة قطاع الأمن السيبراني في «Headway». كما يشارك توني واتسون رئيس قطاع الأمن السيبراني في «Groq»، ويوغو فينيولو لوتاتي رئيس قطاع الأمن السيبراني في «Prada Group».

أجنحة دولية

وتستضيف الفعالية 5 أجنحة دولية. هي: الولايات المتحدة الأميركية، وكندا، والهند، ومصر، وباكستان. أما على صعيد الشركات، فتحضر فعاليات «بلاك هات» هذا العام شركات تقنية وأمن سيبراني بارزة، مثل: «غوغل كلاود سيكيوريتي»، و«سيسكو»، و«سيرار من stc»، و«تريند مايكرو»، و«كاسبرسكي»، و«علي بابا كلاود»، و«فورتينت»، و«بالو ألتو نتوركس»، و«سايت»، و«سيبراني»، و«هبوب»، و«سلام».

وتقدم منطقة الفعاليات هذا العام، برعاية «هبوب»، جوائز تزيد قيمتها على مليوني ريال للمتسابقين والزوار. وتشمل التحديات الطائرات، والمنازل الذكية، وأجهزة المستشفيات، والبنية التحتية، وفك الأقفال، والسيارات والشاحنات.

كما تتضمَّن الجوائز اليومية سحوبات على سيارات مقدمة من «مجموعة صالح للسيارات»، و30 جهاز «آيفون»، و30 جهاز لابتوب ألعاب، و30 جهاز «آيباد»، و30 ساعة «أبل».

كما ينظم «بلاك هات» النسخة الكبرى عالمياً من مسابقة «التقط العلم» بجوائز تصل إلى 790000 ريال، منها 90000 ريال للفرق السعودية. بالإضافة إلى كأس منصة مكافآت الثغرات بجوائز تصل إلى 300000 ريال.