أدوات جديدة من «يوتيوب» لصناع المحتوى مدعومة بالذكاء الاصطناعي

«يوتيوب» تكشف عن ميزات مدعومة بالذكاء الاصطناعي لدعم الفنانين وصناع المحتوى (يوتيوب)
«يوتيوب» تكشف عن ميزات مدعومة بالذكاء الاصطناعي لدعم الفنانين وصناع المحتوى (يوتيوب)
TT

أدوات جديدة من «يوتيوب» لصناع المحتوى مدعومة بالذكاء الاصطناعي

«يوتيوب» تكشف عن ميزات مدعومة بالذكاء الاصطناعي لدعم الفنانين وصناع المحتوى (يوتيوب)
«يوتيوب» تكشف عن ميزات مدعومة بالذكاء الاصطناعي لدعم الفنانين وصناع المحتوى (يوتيوب)

في وقت تتقاطع فيه التكنولوجيا بشكل متزايد مع كل المجالات، يبرز الذكاء الاصطناعي بوصفه أداة تغير قواعد اللعبة. ويُعدّ إنشاء المحتوى أحد المجالات التي يظهر فيها هذا التأثير بشكل واضح. لقد أحدثت منصات مثل «يوتيوب» تحولاً في كيفية إنتاج المحتوى ومشاركته واستهلاكه عالمياً. واليوم، مع كشف «يوتيوب» عن الأدوات التي تعتمد على الذكاء الاصطناعي ضمن فعالية «Made On YouTube»، أصبح من الواضح أن الذكاء الاصطناعي ليس مجرد أداة، ولكنه حليف قوي للمبدعين في الشرق الأوسط وشمال أفريقيا.

ما الجديد؟

«Dream Screen»

تسعى «يوتيوب» لإطلاق «Dream Screen» بالنسخة التجريبية لمساعدة صناع المحتوى على إطلاق العنان للتعبير الإبداعي في الفيديوهات القصيرة «Shorts» من خلال إضافة خلفيات للفيديوهات، أو صور يتم إنشاؤها بواسطة الذكاء الاصطناعي بمجرد كتابة بعض الأفكار البسيطة.

«Aloud»

وهي أداة دبلجة مدعومة بالذكاء الاصطناعي، وسيتم إطلاقها على «يوتيوب» بهدف تمكين صناع المحتوى من الوصول بسهولة إلى مشاهدين ناطقين بلغات غير لغتهم الأساسية. سيتم إطلاق هذه الميزة في عام 2024، وستكون الأداة متاحة لعدد محدود من صناع المحتوى لتجربة الأداة باللغة الإنجليزية في البداية.

«استوديو YouTube»

العام المقبل، سيعتمد «استوديو YouTube» على الذكاء الاصطناعي التوليدي في إنتاج أفكار مبتكرة للفيديوهات وصياغة خطط مبدئية للنصوص، حيث ستكون الاقتراحات المقدمة مخصصة لكل قناة وفقاً لمحتواها، والجمهور الذي يتابعها.

مليارات المشاهدات يومياً

وصل عدد مشاهدات الفيديوهات القصيرة «YouTube Shorts» إلى أكثر من 70 مليار مشاهدة يومياً على مستوى العالم منذ إطلاقها في عام 2020، كما وصل عدد المستخدمين إلى نحو مليارَي مستخدم تم تسجيل دخولهم بشكل شهري. وقد تم اختبار وتجربة النسخ الأولى من الأدوات المتوفرة على «استوديو YouTube» حيث عبّر 70 في المائة من المشاركين وفقاً للاستطلاع عن مدى فاعلية هذه الأدوات ومساعدتها على تطوير وتجربة الأفكار.

وتعليقاً على الأدوات الجديدة، قال طارق أمين، رئيس «يوتيوب» في الشرق الأوسط وشمال أفريقيا: «إن الشركة ملتزمة بدعم صناع المحتوى في المنطقة للنجاح على (يوتيوب) عبر تنمية إبداعاتهم وإيصالها لمستويات جديدة من خلال هذه الأدوات المدعومة بالذكاء الاصطناعي، التي صمّمت وفقاً لاحتياجات صناع المحتوى واهتماماتهم».


مقالات ذات صلة

دراسة: إدمان تطبيقات التواصل يمثل تهديداً أكبر من الكحوليات

صحتك الألعاب الإلكترونية تشكل جزءاً كبيراً من حياة كثير من المراهقين (جامعة فلندرز)

دراسة: إدمان تطبيقات التواصل يمثل تهديداً أكبر من الكحوليات

تمثل التطبيقات الإلكترونية مثل «تيك توك» و«إنستغرام» و«يوتيوب»، والألعاب الإلكترونية تهديداً أكثر خطورة بالنسبة للمراهقين مقارنةً بتعاطي الكحوليات والقنب.

«الشرق الأوسط» (برلين )
يوميات الشرق لقطة من كواليس التصوير (حساب زاهي حواس على فيسبوك)

مصر: تفاعل واسع مع أول أفلام «مستر بيست» عن الأهرامات

حظي أول أفلام «اليوتيوبر» الأميركي «مستر بيست» عن الأهرامات بتفاعل واسع على مواقع التواصل الاجتماعي، محققاً ما يزيد على 40 مليون مشاهدة خلال ساعات.

«الشرق الأوسط» (القاهرة )
شؤون إقليمية عناصر من الشرطة الإيرانية (أرشيفية - رويترز)

إيران تعتقل مغنية بثت حفلاً على «يوتيوب» دون حجاب

اعتقلت السلطات الإيرانية مغنية بعد أن أدت حفلاً افتراضياً على «يوتيوب»، حسبما أفاد محامٍ. 

«الشرق الأوسط» (طهران)
تكنولوجيا لأول مرة تكشف «يوتيوب» عن «المواضيع الرائجة» التي جذبت اهتمام المشاهدين خلال العام (يوتيوب)

ما المواضيع الرائجة وصنّاع المحتوى والأغاني المفضلة حسب «يوتيوب» في 2024؟

شرحت «يوتيوب» لـ«الشرق الأوسط» سبب إطلاق فئة «المواضيع الرائجة» لأول مرة.

نسيم رمضان (لندن)
الولايات المتحدة​ تحظر «ميتا» و«تيك توك» و«يوتيوب» و«إكس» المنشورات التي تسعى إلى ترهيب الناخبين (رويترز)

كيف تعمل «ميتا» و«تيك توك» و«يوتيوب» و«إكس» على إدارة التهديدات الانتخابية؟

أكثر شبكات التواصل الاجتماعي نفوذاً -بما في ذلك «ميتا» و«تيك توك» و«يوتيوب» و«إكس»- لديها سياسات وخطط جاهزة لإدارة التهديدات الانتخابية والمعلومات المضللة.

«الشرق الأوسط» (واشنطن)

جامعة «جونز هوبكنز»: نماذج الذكاء الاصطناعي تفشل في فهم التفاعلات البشرية

أظهرت الدراسة أن البشر يتفقون بدرجة عالية على تقييم مشاهد التفاعل الاجتماعي في حين فشل أكثر من 350 نموذجاً للذكاء الاصطناعي في محاكاتهم
أظهرت الدراسة أن البشر يتفقون بدرجة عالية على تقييم مشاهد التفاعل الاجتماعي في حين فشل أكثر من 350 نموذجاً للذكاء الاصطناعي في محاكاتهم
TT

جامعة «جونز هوبكنز»: نماذج الذكاء الاصطناعي تفشل في فهم التفاعلات البشرية

أظهرت الدراسة أن البشر يتفقون بدرجة عالية على تقييم مشاهد التفاعل الاجتماعي في حين فشل أكثر من 350 نموذجاً للذكاء الاصطناعي في محاكاتهم
أظهرت الدراسة أن البشر يتفقون بدرجة عالية على تقييم مشاهد التفاعل الاجتماعي في حين فشل أكثر من 350 نموذجاً للذكاء الاصطناعي في محاكاتهم

في سباق تطوير أنظمة ذكاء اصطناعي أكثر ذكاءً وتفاعلاً مع البشر، تكشف دراسة جديدة من جامعة «جونز هوبكنز» حقيقة مقلقة؛ أنه حتى أكثر تقنيات الذكاء الاصطناعي تقدماً لا تزال تعاني من فهم أحد أبسط الأمور التي يجيدها البشر بالفطرة، وهو تفسير التفاعلات الاجتماعية.

من السيارات ذاتية القيادة إلى الروبوتات المساعدة والمساعدين الافتراضيين، يعتمد مستقبل الذكاء الاصطناعي على قدرته على قراءة السلوك البشري في السياقات الحقيقية. لكن وفقاً لهذه الدراسة الرائدة، لا يزال الذكاء الاصطناعي غير قادر على «قراءة المشهد».

تقول ليلى إيشيك، الأستاذة المساعدة في علم الإدراك بجامعة جونز هوبكنز، والمؤلفة الرئيسية للدراسة: «إن هذه الأنظمة تعاني من قيود أساسية عندما يتعلق الأمر بفهم كيفية تفاعل البشر بعضهم مع بعض». وتضيف: «إذا كنت تصمم ذكاءً اصطناعياً لسيارة ذاتية القيادة، فأنت بحاجة إلى أن يتنبأ بحركة المشاة. كأن يعرف ما إذا كان أحدهم على وشك العبور، أو ما إذا كان شخصان يتحدثان فقط. في الوقت الحالي، الذكاء الاصطناعي لا يستطيع القيام بذلك بدقة كافية».

دراسة «جونز هوبكنز»: لا تزال نماذج الذكاء الاصطناعي رغم تطورها غير قادرة على فهم التفاعلات الاجتماعية كما يفعل البشر

تطبيق عملي

تم عرض الدراسة في مؤتمر التعلم التمثيلي الدولي (ICLR) حيث حاول الباحثون اختبار قدرة الذكاء الاصطناعي على فهم الديناميكيات الاجتماعية، مقارنة بالبشر. صمّم الفريق تجربة بسيطة، لكنها فعّالة، فطُلب من المشاركين البشريين مشاهدة مقاطع فيديو قصيرة، مدتها 3 ثوانٍ لأشخاص، إما يتفاعل بعضهم مع بعض، أو يؤدون أنشطة متجاورة، أو يعملون بشكل مستقل. بعد ذلك، طُلب منهم تقييم مدى التفاعل الاجتماعي في كل مقطع على مقياس من 1 إلى 5.

ثم طُبّق التقييم نفسه على أكثر من 350 نموذج ذكاء اصطناعي، بما في ذلك نماذج متقدمة لمعالجة الصور والفيديو واللغة. وكانت النتائج واضحة.

نتائج مقلقة

اتفق المشاركون من البشر إلى حدّ كبير في تقييماتهم، لكن نماذج الذكاء الاصطناعي بغضّ النظر عن مدى تطورها أو حجم بياناتها فشلت في الوصول إلى نفس الدقة. النماذج المعتمدة على الفيديو كانت الأسوأ أداءً، إذ لم تتمكن من التعرف على التفاعلات الاجتماعية في المشاهد الديناميكية. حتى النماذج المعتمدة على الصور الثابتة لم تستطع بدقة التنبؤ بما إذا كان الأشخاص يتواصلون أم لا.

أما النماذج اللغوية، التي أُعطيت أوصافاً مكتوبة للمشاهد، فقد أظهرت أداءً أفضل إلى حد ما، خصوصاً في محاولة التنبؤ بكيفية تفسير البشر للمشاهد. لكنها لم تتمكن من التقاط الصورة الكاملة لسياق المشهد المرئي المتغير. وترى كاثي غارسيا، الباحثة في مختبر إيشيك والمؤلفة المشاركة الأولى، التي عرضت النتائج في المؤتمر، أن هذا يعكس قصوراً بنيوياً في الطريقة التي تُبنى بها أنظمة الذكاء الاصطناعي.

تقول: «إن القدرة على التعرف على الوجوه أو الأجسام في الصور الثابتة كانت إنجازاً مهماً في مسار الذكاء الاصطناعي، لكنها ليست كافية. الحياة ليست صورة جامدة. الناس يتحركون، يتفاعلون، يتجاوب بعضهم مع بعض. وهذا المستوى من الفهم هو ما نحتاج من الذكاء الاصطناعي أن يصل إليه. ودراستنا تظهر أننا لم نصل بعد».

سبب القصور يعود إلى أن بنية الشبكات العصبية للذكاء الاصطناعي مستوحاة من مناطق الدماغ التي تعالج الصور الثابتة وليس التفاعلات الاجتماعية المعقدة (شاترستوك)

ما السبب؟

يعتقد الباحثون أن السبب يعود إلى الأساس الذي بُنيت عليه الشبكات العصبية للذكاء الاصطناعي، وهو جزء الدماغ المسؤول عن معالجة الصور الثابتة. أما التفاعلات الاجتماعية، فهي تتطلب فهماً أعمق للحركة والسياق والنية، وهي عمليات يعالجها جزء مختلف تماماً في دماغ الإنسان. توضح إيشيك أن هناك تفاصيل كثيرة، لكن الرسالة الكبرى هي أن أياً من نماذج الذكاء الاصطناعي التي اختبرناها لم تتمكن من مطابقة استجابات الدماغ البشري أو السلوك الإنساني لمشاهد متحركة، كما تفعل مع الصور الثابتة. هناك شيء أساسي في طريقة معالجة البشر للمشاهد الديناميكية، لا تزال هذه النماذج تفتقده.

تأثيرات بعيدة المدى

مع دخول الذكاء الاصطناعي إلى حياتنا اليومية، سواء في السيارات أو المستشفيات حتى الأماكن العامة، يصبح من الضروري أن يفهم سلوك البشر في السياق الاجتماعي بشكل دقيق. تردد بسيط من أحد المشاة، لغة جسد خفية، حتى تبادل نظرات، كلها إشارات يفسرها الإنسان دون تفكير، لكنها لا تزال لغزاً للذكاء الاصطناعي. هذه الدراسة لا تدعو إلى إيقاف استخدام الذكاء الاصطناعي في هذه السياقات، بل تؤكد على الحاجة إلى إعادة التفكير في كيفية تدريب وتصميم هذه الأنظمة، لتتشابه أكثر مع طريقة تفكير الدماغ البشري.

تختتم غارسيا قائلة إن هذه دعوة للاستيقاظ. وتضيف: «إذا أردنا أن نبني ذكاءً اصطناعياً يفهمنا فعلاً، فعلينا أن نعيد النظر في الطريقة التي نصمم بها هذه النماذج، من الأساس».

في نهاية المطاف، ربما يكون أحد أكبر تحديات الذكاء الاصطناعي ليس الفوز على البشر في الألعاب أو تأليف القصائد، بل أن يفهم نظرة أو إيماءة أو لحظة صامتة بين اثنين.

وعلى الأقل حتى الآن، يبقى البشر هم الأفضل في ذلك.