الفيديوهات الفورية... القفزة النّوعية التالية لتقنية الذكاء الصناعي

تسرِّع عمل الفنانين... وقد توظف للتضليل الإلكتروني

فيديو أُنتج بعد طبع عبارة «بقرة في عيد ميلاد»
فيديو أُنتج بعد طبع عبارة «بقرة في عيد ميلاد»
TT

الفيديوهات الفورية... القفزة النّوعية التالية لتقنية الذكاء الصناعي

فيديو أُنتج بعد طبع عبارة «بقرة في عيد ميلاد»
فيديو أُنتج بعد طبع عبارة «بقرة في عيد ميلاد»

تعمل واحدة من مجموعة من الشركات الناشئة في نيويورك، على تطوير نظام لإنتاج فيديوهات قصيرة، بالاعتماد على بضع كلمات تُطبع على جهاز الكمبيوتر.
طبع إيان سانسافيرا، مهندس برمجة بشركة «رانوي إي.آي.» الناشئة في نيويورك، توصيفاً مختصراً لما يريد رؤيته في مقطع فيديو، فكتب: «نهرٌ هادئ في الغابة»... وبعد أقلّ من دقيقتين، ولّدت خدمة إنترنت تجريبية مقطع فيديو قصيراً لنهرٍ هادئ في غابة. تدفّقت مياه النهر تحت ضوء الشمس، وتقاطعت بين الأشجار والأعشاب، ثمّ استدارت وضربت برفقٍ على الصخور.

فيديو بطباعة كلمتين
تُعدّ «رانوي Runway»، التي وفّرت خدمتها لمجموعة صغيرة لاختبارها، بداية هذا الشهر، واحدةً من شركات عدّة تعمل حالياً على تطوير تقنية ذكاء صناعي قد تتيح قريباً للناس صناعة فيديوهات بطباعة بضع كلمات في مربّع على شاشة الكمبيوتر.


فيديو أُنتج بعد طبع عبارة «كلب يحمل هاتفاً»

تمثّل هذه الشركات المرحلة المقبلة من السباق الذي تشهده هذه الصناعة - والذي يضمّ عمالقة كمايكروسوفت وغوغل بالإضافة إلى شركات ناشئة صغيرة أخرى - لابتكار أنظمة يعتقد البعض أنّها ستكون الاختراق المقبل في عالم الذكاء الصناعي، كما حصل عند ابتكار المتصفّحات الإلكترونية والآيفون.
قد تسرِّع أنظمة توليد الفيديوهات الجديدة عمل صانعي الأفلام وغيرهم من الفنّانين الرقميين، ولكنها يمكن أن تتحوّل أيضاً إلى وسيلة تضليل إلكتروني جديدة يصعب رصدها، وتزيد، من ثم، صعوبة التمييز بين الحقيقي والمزيف على شبكة الإنترنت.
تُعدّ هذه الأنظمة من الأمثلة على ما يُعرف بالذكاء الصناعي التوليدي «generative A.I»، القادر على صناعة النصوص، والصور، والأصوات بشكلٍ فوري. ومثلها الآخر هو «تشات جي.بي.تي.»، برنامج المحادثة الذي طوّرته شركة «أوبن إيه.آي.» وأذهل صناعة التقنية بقدراته، منذ أواخر العام الماضي.
وكانت شركتا «غوغل» و«ميتا (الشركة المالكة لفيسبوك)» قد كشفتا عن أوّل نظم صناعة الفيديوهات، العام الماضي، ولكنّهما لم تشاركاه مع المستخدمين بسبب مخاوف من استخدامه لنشر المعلومات المضلّلة بمستوى جديد من السرعة والفعالية.

فيديو أُنتج بعد طبع عبارة «نهرٌ هادئ في الغابة»

ويعتقد كريستوبال فالنزويلا، الرئيس التنفيذي لـ«رانوي»، أن التقنية أهمّ بكثير من أن تُترك في المختبر، رغم مخاطرها، واصفاً إيّاها «بواحدة من أكثر التقنيات المثيرة للإعجاب، التي طُوّرت في السنوات المائة الأخيرة. يجب أن نسمح للنّاس باستخدامها».
لا يُعدّ توليف الأفلام والفيديوهات، والتلاعب بها، بالأمر الجديد طبعاً، إذ يستخدم صانعو الأفلام هذه الأدوات منذ ما يقارب قرناً من الزمن. وعمد الباحثون والفنّانون الرقميون، في السنوات الأخيرة، إلى استخدام تقنيات ذكاء صناعي وبرمجيات متنوّعة لصناعة وتعديل الفيديوهات التي تشتهر باسم «ديب فيك».
لكنّ الأنظمة الشبيهة بنظام «رانوي» قد تحلّ، مع الوقت، محلّ مهارات التعديل التقليدية بكبسة زرّ.

صور غير مألوفة
تولِّد تقنية «رانوي» الجديدة فيديوهات من أي توصيف مختصر. في البداية، يمكنكم طباعة توصيف أشبه بالملاحظة القصيرة.
وقد تحصلون على نتائج أفضل، إذا تضمّن التوصيف قليلاً من الحركة - ولكن ليس الكثير - كـ«يوم ممطر في المدينة الكبيرة»، أو «كلب مع هاتف محمول في الحديقة»، ثمّ انقروا على «إدخال»، ليولّد لكم النظام مقطع الفيديو في دقيقة أو اثنتين. تستطيع التقنية أيضاً إنتاج صور مألوفة لقطٍّ ينام على بساط مثلاً، أو أن تدمج أفكاراً متباينة لتوليد فيديوهات مسلِّية لبقرةٍ في حفلة عيد ميلاد.
ينتج النظام الجديد فيديوهات لا تتعدّى مدّتها الـ4 ثوانٍ، وبنوعية تبدو باهتة وغير واضحة، عند النظر إليها عن قرب. في بعض الأحيان، تكون صوره غريبة ومشوَّهة ومريبة، خصوصاً أنّ النظام يستطيع دمج حيوانات، كالكلاب والقطط، بأجسام جامدة كالكرات والهواتف المحمولة، لكن عندما يحصل على الطلب الصحيح، ينتج فيديوهات تظهر بوضوح أين تتّجه هذه التقنية.
من جهته، قال فيليب إيزولا، أستاذ متخصص بالذكاء الصناعي في «معهد ماساتشوستس للتقنية»: «في هذه المرحلة، إذا رأيتُ مقطع فيديو عالي الدقّة، فسأثق به على الأرجح، ولكنّ هذا الأمر سيتغيّر بسرعة كبيرة».
وكغيره من تقنيات الذكاء الصناعي التوليدي، يتعلّم نظام «رانوي»، من خلال تحليل البيانات الرقمية - في هذه الحالة، من الصور، والفيديوهات، والملاحظات المرفقة التي توصّف محتوى الصور. يبدي الباحثون ثقة بقدرتهم على تحسين وتوسيع مهارات هذا النظام بسرعة، من خلال تدريبه على كميات متنامية من البيانات. ويعتقد الخبراء أن هذا النوع من التقنيات سيستطيع قريباً صناعة أفلامٍ قصيرة عالية الجودة، مع موسيقى وحوارات.
من الصعب تحديد ما يبتكره هذا النظام، في الوقت الحالي؛ لأنه ليس صورة ولا رسوماً متحركة، بل مجموعة من البيكسلات الكثيرة الممزوجة مع بعضها لتشكيل فيديو واقعي. تخطّط «رانوي» لتوفير تقنيتها، مع مجموعة من الأدوات الأخرى التي تعتقد أنّها ستسرِّع عمل الفنّانين المحترفين.
وعمدت شركات ناشئة أخرى؛ من بينها «أوبن إيه.آي.»، إلى إطلاق تقنيات مشابهة تنتج صوراً جامدة من طلبات قصيرة، كـ«صورة دبّ محشوّ يركب لوح تزلّج في تايمز سكوير». ويرجّح التقدّم السريع، الذي تشهده الصور المصنوعة بالذكاء الصناعي، أن تقنية الفيديو الجديدة ستسير في الاتجاه نفسه.
وقد عجّت وسائل التواصل الاجتماعي، الشهر الماضي، بصورٍ للبابا فرنسيس يرتدي معطفاً منفوخاً من علامة «بالنسياغا» يبدو عصرياً جداً، بالنسبة لرجل دين في السادسة والثمانين من عمره، ولكن هذه الصور لم تكن حقيقية، بل من تركيب عامل بناء (31 عاماً)، من شيكاغو، استخدم أداة ذكاء صناعي شهيرة اسمها «ميدجورني» لهذه الغاية.
تعتمد «ميدجورني Midjourney» على شبكة عصبية تتعلّم مهاراتها من خلال تحليل كميات هائلة من البيانات، وتبحث عن أنماط معيّنة في ملايين الصور الرقمية والنصوص التي توصّف ما يظهر في الصور.
عندما يوصّف أحدهم صورة ما للنظام، يولّد الأخير لائحة من المزايا التي قد تتضمّنها الصورة.
يلفت فالنزويلا إلى أنّ «الفيديو هو مجموعة من الإطارات - الصور الجامدة - المدمجة بطريقة توحي بالحركة. الحيلة هنا تكمن في تدريب نموذج يفهم العلاقة والتماسك بين كلّ إطار وإطار». وكما في الإصدارات الأولى من أدوات كـ«دال-إي»، و«ميدجورني»، تجمع التقنية أحياناً الأفكار والصور بأشكال مثيرة للفضول. فإذا طلبتم دبّاً محشوّاً يلعب كرة السلّة، فقد يعطيكم نوعاً من الحيوانات المحشوة الغريبة، مع كرة سلّة في يده، وإذا طلبتم كلباً مع هاتف محمول في الحديقة، فقد تحصلون على هاتف في يد كائن بشري بجسم غريب.
• خدمة «نيويورك تايمز».


مقالات ذات صلة

المدير التنفيذي لـ«سيسكو» السعودية: استثماراتنا بالمملكة مستمرة لدعم جهودها في التحول الرقمي

الاقتصاد المدير التنفيذي لشركة «سيسكو السعودية» سلمان فقيه (تصوير: تركي العقيلي) play-circle 01:37

المدير التنفيذي لـ«سيسكو» السعودية: استثماراتنا بالمملكة مستمرة لدعم جهودها في التحول الرقمي

في ظل ما يشهده قطاع التقنية السعودي من تطور، حقَّقت «سيسكو» أداءً قوياً ومتسقاً مع الفرص المتاحة وقرَّرت مواصلة استثماراتها لدعم جهود السعودية في التحول الرقمي.

زينب علي (الرياض)
عالم الاعمال «بلاك هات» تعود إلى الرياض بنسختها الثالثة

«بلاك هات» تعود إلى الرياض بنسختها الثالثة

تعود فعالية الأمن السيبراني الأبرز عالمياً «بلاك هات» في نسختها الثالثة إلى «مركز الرياض للمعارض والمؤتمرات» ببلدة ملهم شمال العاصمة السعودية الرياض.

تكنولوجيا «غوغل» تطلق النسخة الأولية من آندرويد 16 للمطورين مع ميزات جديدة لتعزيز الخصوصية ومشاركة البيانات الصحية (غوغل)

«غوغل» تطلق النسخة الأولية من آندرويد 16 للمطورين مع ميزات جديدة

أطلقت «غوغل» النسخة التجريبية الأولية من آندرويد 16 للمطورين، وهي خطوة تمهد الطريق للتحديثات الكبيرة المقبلة في هذا النظام.

عبد العزيز الرشيد (الرياض)
تكنولوجيا «أبل» تؤكد مشكلة اختفاء الملاحظات بسبب خلل بمزامنة (iCloud) وتوضح خطوات استعادتها مع توقع تحديث (iOS) قريب (أبل)

اختفاء الملاحظات في أجهزة آيفون... المشكلة والحلول

وفقاً لتقرير رسمي من «أبل»، فإن المشكلة تتعلق بإعدادات مزامنة الآيكلاود (iCloud).

عبد العزيز الرشيد (الرياض)
تكنولوجيا تمكنك «دورا» من تصميم مواقع ثلاثية الأبعاد مذهلة بسهولة تامة باستخدام الذكاء الاصطناعي دون الحاجة لأي معرفة برمجية (دورا)

صمم موقعك ثلاثي الأبعاد بخطوات بسيطة ودون «كود»

تتيح «دورا» للمستخدمين إنشاء مواقع مخصصة باستخدام الذكاء الاصطناعي عبر إدخال وصف نصي بسيط.

عبد العزيز الرشيد (الرياض)

أحدث نزعات الذكاء الاصطناعي المقبلة من مؤتمر «مايكروسوفت إغنايت 2024»

يستعرض مؤتمر «مايكروسوفت إغنايت 2024» أبرز تقنيات الذكاء الاصطناعي المقبلة
يستعرض مؤتمر «مايكروسوفت إغنايت 2024» أبرز تقنيات الذكاء الاصطناعي المقبلة
TT

أحدث نزعات الذكاء الاصطناعي المقبلة من مؤتمر «مايكروسوفت إغنايت 2024»

يستعرض مؤتمر «مايكروسوفت إغنايت 2024» أبرز تقنيات الذكاء الاصطناعي المقبلة
يستعرض مؤتمر «مايكروسوفت إغنايت 2024» أبرز تقنيات الذكاء الاصطناعي المقبلة

انطلقت قبل قليل فعاليات مؤتمر «مايكروسوفت إغنايت 2024» Microsoft Ignite 2024 من مدينة شيكاغو الأميركية، الذي يستمر إلى نهاية الخميس 21 نوفمبر (تشرين الثاني). وحصلت «الشرق الأوسط» على نظرة استباقية حول «عملاء الذكاء الاصطناعي» AI Agents، ونذكرها في هذا الموضوع.

بداية، تتوجه «مايكروسوفت» نحو تبني الذكاء الاصطناعي على صعيد أوسع في جميع خدماتها، وذلك من خلال ما يعرف بـ«عملاء الذكاء الاصطناعي» و«كوبايلوت» Copilot لتسريع عمليات الشركات والموظفين وتطوير البرامج والتحول إلى الذكاء الاصطناعي على جميع الصعد.

يمكن إيجاد «عميل ذكي» بكل سهولة باستخدام اللغة البشرية

مَن هم «عملاء الذكاء الاصطناعي»؟

«عملاء الذكاء الاصطناعي» هي أدوات لأتمتة الأعمال اليومية بذكاء باستخدام تقنيات الذكاء الاصطناعي، يمكن تطويرها بسهولة كبيرة وباستخدام النصوص البشرية وليس البرمجية. ويمكن لـ«العملاء» الرد على استفسارات الزبائن عبر الإنترنت بشكل آلي طوال الوقت وتنظيم الجداول المالية والبحث في آلاف الوثائق عن إجابة محددة للزبون، ومن ثم اتخاذ الإجراءات التالية آلياً أو رفعها إلى المستخدم ليعالج الحالات الخاصة يدويا. ويمكن تلخيص تعريف هذه الأدوات على أنها تطبيقات المستقبل المعتمدة على الذكاء الاصطناعي.

قدرات فائقة

ويستطيع «العملاء الأذكياء» مراجعة سجل منتجات الشركة وتحليلها وتلخيصها للمهتمين الذين يرسلون رسائل البريد الإلكتروني إلى الشركة للاستفسار عن منتج أو خدمة محددة، أو الذين يسألون عن ذلك عبر نظام الدردشة في موقع الشركة. ويمكنها كذلك إكمال سلسلة العمل لدى طلب منتج ما وإصدار وإرسال فاتورة الشراء إلى الزبون وطلب استلام المنتج من شركة التوصيل ومتابعة حالة الطلب، دون أي تدخل من المستخدم.

كما يمكنهم البحث في ملفات الشركة الموجودة في SharePoint أو في مجلدات خاصة فيها، والإجابة عن أسئلة الموظفين أنفسهم، مثل سؤال موظف: «ما عدد المنتجات التي تم تسليمها في آخر أسبوعين؟» أو «ما هو إجراء طلب نقل موظف إلى فرع آخر؟»، ليجيب «العميل الذكي» وكأن المتحدث يدردش مع خدمة ذكاء اصطناعي تقليدية، وبالأسلوب نفسه.

تحويل النصوص لغاتٍ مختلفة

ويستطيع بعض «العملاء» تحويل النصوص بين اللغات المختلفة في اجتماعات برنامج «تيمز» ومحاكاة صوت المستخدم ونبرته وتحويلها لغة أخرى بشكل مباشر دون أن يشعر أي شخص بذلك، ليستطيع المشاركون التحدث بلغات العالم وكسر حواجز اللغة بينهم خلال الاجتماعات والتركيز على المسائل المهمة في كل اجتماع. ويستطيع البعض الآخر حل المشاكل التقنية في كومبيوترات المستخدمين. ويستطيع البعض الآخر مساعدة المستخدم في ترتيب جدول أعماله، حيث يمكنه ملاحظة أن اجتماعاً ما قد تجاوز مدته المطلوبة، ليقوم بإعادة جدولة الاجتماع التالي آلياً، أو تلخيص رسائل البريد الإلكتروني غير المقروءة التي وصلت المستخدم خلال اجتماعه وذكر نقاط العمل التالية لكل رسالة.

هذا، وتمت إضافة «العملاء الأذكياء» إلى شبكة «لينكدإن» LinkedIn لمساعدة مديري التوظيف في العثور على الموظفين ذوي المهارات المناسبة وبكل سهولة.

كيفية إعداد «عميل ذكي»

ويمكن إعداد «عميل ذكي» جديد بشكل سهل وباستخدام اللغة البشرية، مع وضع تسلسل العمليات المطلوبة («مثل البحث عن المعلومة، ومن ثم الإجابة عن السؤال، ومن ثم إرسال بريد إلكتروني في حال طلب المستخدم ذلك، أو تحويل الطلب إلى شخص محدد في حال عدم العثور على المعلومة»، وغيرها) وتفعيل «العميل الذكي» فوراً.

ولا يحتاج المستخدم إلى أي خبرة برمجية لإعداد «عميل ذكي» جديد، وكأنه وثيقة نصية جديدة في برنامج «وورد» أو جدول حسابات في «إكسل». يكفي إعداد آلية العمل وكتابة ما الذي ينبغي القيام به في «مايكروسوفت 360 كوبايلوت» لبدء العمل.

برامج «تفهم» المستقبل الذكي

ويمكن للمطورين استخدام خدمة «أزور إيه آي إغنايت» Azure AI Agent Service لدمج «العملاء الأذكياء» مع نصوصهم البرمجية للحصول على برامج متقدمة مدعمة بالذكاء الاصطناعي دون الحاجة إلى كتابة نصوص برمجية معقدة مرتبطة بلغات الذكاء الاصطناعي، حيث يستطيع «العملاء الأذكياء» فهم وإدراك السياق الذي تعمل فيه وتقوم بتقسيم العمل أجزاء وخطوات عدّة والعمل على كل منها وإكمالها بشكل سريع وأكثر كفاءة مما سابق.

كما سيستطيع «العملاء الأذكياء» تقييم المخاطر وخفضها أو تجاوزها وتقديم تقارير الأداء ومتابعة تنفيذ التوصيات، مع وجود الإشراف البشري على الخطوات الأخيرة للتأكد من دقتها وصحتها وضمان عدم حدوث أي خطأ قد يتسبب بضرر على سير العمل.