«يوتيوب» يوفر الآن التعليق الصوتي الاصطناعي على فيديوهات «شورتس»

تعد تحديثات «يوتيوب» جزءاً من اتجاه أوسع لمنصات الفيديو التي تتبنى ميزات مماثلة للحفاظ على قدرتها التنافسية وجذب المستخدمين (شاترستوك)
تعد تحديثات «يوتيوب» جزءاً من اتجاه أوسع لمنصات الفيديو التي تتبنى ميزات مماثلة للحفاظ على قدرتها التنافسية وجذب المستخدمين (شاترستوك)
TT

«يوتيوب» يوفر الآن التعليق الصوتي الاصطناعي على فيديوهات «شورتس»

تعد تحديثات «يوتيوب» جزءاً من اتجاه أوسع لمنصات الفيديو التي تتبنى ميزات مماثلة للحفاظ على قدرتها التنافسية وجذب المستخدمين (شاترستوك)
تعد تحديثات «يوتيوب» جزءاً من اتجاه أوسع لمنصات الفيديو التي تتبنى ميزات مماثلة للحفاظ على قدرتها التنافسية وجذب المستخدمين (شاترستوك)

تُحدّث منصات التواصل الاجتماعي ميزاتها باستمرار لتظل قادرة على المنافسة وتعزيز تجربة المستخدم. ومؤخراً كشف موقع «يوتيوب» عن سلسلة من الميزات الجديدة لمنصة الفيديوهات القصيرة «شورتس» (Shorts) الخاصة به؛ ربما بهدف مواكبة منافسيه مثل «تيك توك». وأطلق «يوتيوب» هذه التحديثات لجعل إنشاء مقاطع الفيديو القصيرة ومشاركتها أكثر جاذبية وسهولة في الاستخدام.

تحويل النص كلاماً

واحدة من أبرز الإضافات هي ميزة تحويل النص كلاماً بالفيديو. يتيح ذلك لمنشئي المحتوى إضافة تعليق صوتي اصطناعي إلى مقاطع الفيديو الخاصة بهم، على غرار الأصوات الآلية التي تُسمع غالباً على «تيك توك».

عملية دمج هذه الميزة واضحة ومباشرة، فبعد إنشاء النص، يمكن النقر على أيقونة «إضافة صوت» الموجودة في الزاوية العلوية اليسرى من الشاشة وتحديد الصوت الذي تريده. حالياً، يقدم «يوتيوب» أربعة خيارات صوتية، بينما يتميز «تيك توك» بمجموعة أكثر شمولاً.

يمكن الآن إضافة النصوص على فيديوهات «شورتس» القصيرة باستخدام خطوط وألوان قابلة للتخصيص (شاترستوك)

التسميات التوضيحية التلقائية

يقدم «يوتيوب» أيضاً تسميات توضيحية يتم إنشاؤها تلقائياً والتي تمكن إضافتها مباشرة إلى مقطع الفيديو. وهذا يلغي الحاجة إلى استخدام تطبيقات الطرف الثالث مثل تطبيق «كاب كت» (CapCut). وعلى غرار ميزة إضافة نص بشكل يدوي على مقاطع «شورتس»، يمكن تخصيص هذه النصوص بخطوط وألوان مختلفة؛ مما يسمح لمنشئي المحتوى بالحفاظ على أسلوبهم الفريد.

تأثيرات «ماين كرافت»

لإضافة لمسة ممتعة وإبداعية، طرح موقع «يوتيوب» تأثيرات جديدة تحمل طابع «ماين كرافت» (Minecraft). يتضمن ذلك خلفية شاشة خضراء مستوحاة من اللعبة الشهيرة ولعبة صغيرة تسمى «ماين كرافت رش» (Minecraft Rush). من المؤكد أن هذه الإضافات ستجذب مجتمعاً كبيراً من عشاق لعبة «ماين كراف» على «يوتيوب».

يقدم «يوتيوب» ميزات جديدة للفيديوهات القصيرة كإضافة تعليقات صوتية اصطناعية مشابهة لـ«تيك توك» (شاترستوك)

مواكبة المنافسة

يعدّ تقديم هذه الميزات الجديدة جزءاً من اتجاه أوسع لمنصات الفيديو التي تتبنى وظائف مماثلة لجذب المستخدمين. كثيراً ما يدمج «يوتيوب» ميزات «تيك توك» الشائعة، مثل معاينات الفيديو المباشر في خلاصة «شورتس» (Shorts) لتحسين نظامه الأساسي. وفي الوقت نفسه، يواصل «تيك توك» توسيع حدود طول الفيديو للحفاظ على تفاعل المستخدمين. يأمل «يوتيوب» أن تعزز هذه الاستراتيجية الفيديوهات القصيرة بميزات تشبه «تيك توك». وسيستفيد الكثير من منشئي المحتوى من هذه التحديثات، ويجدون طرقاً جديدة لجذب جماهيرهم وتطوير قنواتهم.

وستساعد سهولة إضافة سرد تحويل النص إلى كلام والتسميات التوضيحية التي يتم إنشاؤها تلقائياً منشئي المحتوى على إنتاج المحتوى بشكل أكثر كفاءة وسهولة في الوصول إليه.


مقالات ذات صلة

بلوغر مصرية تتصدر الترند بعد تداول «فيديو فاضح»

يوميات الشرق  البلوغر هدير عبد الرازق (حسابها على فيسبوك)

بلوغر مصرية تتصدر الترند بعد تداول «فيديو فاضح»

تصدرت البلوغر المصرية هدير عبد الرازق ترند مواقع التواصل الاجتماعي (الخميس) بعد انتشار «فيديو فاضح» لها وتداوله على نطاق واسع.

أحمد عدلي (القاهرة)
يوميات الشرق «الداخلية» المصرية (فيسبوك)

«الفيديوهات الخادشة» تقود «بلوغر» مصرية جديدة إلى المحاكمة

«الفيديوهات الخادشة» قادت «بلوغر» مصرية جديدة إلى المحاكمة، على خلفية بث فيديوهات لها عبر قناتها على تطبيق «تيك توك» خلال الأسابيع الماضية.

أحمد عدلي (القاهرة )
تكنولوجيا شعار منصة «يوتيوب» (أرشيفية - رويترز)

سياسة جديدة من «يوتيوب» تجاه المحتوى المنشأ بواسطة الذكاء الاصطناعي

أضاف موقع «يوتيوب» سياسة جديدة الشهر الماضي تتيح للمستخدمين طلب إزالة المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي والذي تتم إتاحته من المستخدمين.

«الشرق الأوسط» (كاليفورنيا)
يوميات الشرق الاعتناء بالنفس والقيام بأنشطة تحبّها يسهمان في رفع منسوب الدوبامين (أ.ف.ب)

كيف يؤثر الدوبامين على سلوكيات مؤثري مواقع التواصل الاجتماعي؟

في عصر التكنولوجيا الحديثة والرقمية وانتشار مواقع التواصل الاجتماعي، أصبح للأفراد القدرة على التأثير والتواصل مع جمهور واسع في جميع أنحاء المعمورة بشكل سريع.

«الشرق الأوسط» (لندن)
تكنولوجيا إلغاء اشتراكات «بريميوم» للمستخدمين الذين يستخدمون VPN للتحايل على الأسعار يجبرهم على الاشتراك بالسعر المحدد لبلدهم الأصلي (يوتيوب)

«يوتيوب» يتصدى للتحايل على الأسعار الإقليمية في اشتراكات «بريميوم»

مؤخراً، بدأت منصة «يوتيوب» في اتخاذ إجراءات صارمة ضد المستخدمين الذين يحاولون الحصول على اشتراكات «يوتيوب بريميوم» بأسعار مخفضة، باستخدام شبكات افتراضية خاصة …

عبد العزيز الرشيد (الرياض)

أصوات الذكاء الاصطناعي بنبرات أنثوية لها جرس جذاب

أصوات الذكاء الاصطناعي بنبرات أنثوية لها جرس جذاب
TT

أصوات الذكاء الاصطناعي بنبرات أنثوية لها جرس جذاب

أصوات الذكاء الاصطناعي بنبرات أنثوية لها جرس جذاب

كيف يبدو صوت الذكاء الاصطناعي؟ لقد كانت «هوليوود» تتخيّل ذلك منذ عقود. أما الآن فيبتعد مطوّرو الذكاء الاصطناعي عن الأفلام، ويصنعون أصواتاً لآلات حقيقية بناءً على خيالات سينمائية قديمة حول الطريقة التي يجب أن تتحدث بها الآلات.

صوت نسائي له جرس الإثارة

في شهر مايو (أيار)، كشفت شركة «أوبن إيه آي» OpenAI عن ترقيات لبرنامج الدردشة الآلي الخاص بها الذي يعمل بالذكاء الاصطناعي. وقالت إن «تشات جي بي تي» كان يتعلّم كيفية الاستماع والرؤية والتحدث بصوت طبيعي؛ وهو صوت يشبه، إلى حد كبير، نظام تشغيل بنبرات سكارليت جوهانسون في فيلم سبايك جونز «هي» (Her) عام 2013... من دون وجود أي جسد بشري.

كان صوت «تشات جي بي تي» المسمى «سكاي» (Sky)، يتمتع أيضاً بجرس أجش وتأثير مهدئ وميزة الإثارة الجذابة. وكانت مقدمة الصوت الاصطناعي هذه لطيفة ومنطوية على نفسها؛ وبدت وكأنها تتعامل بمرونة. وبعد ظهور «سكاي» لأول مرة، أعربت جوهانسون عن استيائها من الصوت «المشابه بصورة مخيفة» لصوتها، وقالت إنها رفضت سابقاً طلب «أوبن إيه آي» أن تقوم بتصويت الروبوت. إلا أن الشركة احتجت وقالت إن «سكاي» تقوم بأداء صوتها من قبل «ممثلة محترفة مختلفة». ومع ذلك وافقت على إيقاف صوتها مؤقتاً احتراماً لجوهانسون.

طبقات صوتية متخيّلة

يحب منشئو الذكاء الاصطناعي تسليط الضوء على القدرات الطبيعية المتزايدة لأدواتهم، لكن أصواتها الاصطناعية مبنية على طبقات من التحايل والتصورات.

تمثّل «سكاي» أحدث طموحات الشركة المنتجة لها، لكنها تعتمد على فكرة قديمة هي أن روبوت الذكاء الاصطناعي هو امرأة متعاطفة ومذعنة، وأن جزءاً منها يأتي من الأم، ولها جزء من السكرتيرة، وجزء من الصديقة. وكانت تلك فكرة «سامانثا» في فيلم «هي»، وهي بمثابة أداة مريحة لجميع الأغراض، التي كان صوتها يتدفق منساباً مباشرة إلى آذان مستخدميها.

أصوات أنثوية متخيَّلة

وحتى مع تقدّم تكنولوجيا الذكاء الاصطناعي يُعاد ترميز هذه الصور النمطية مراراً وتكراراً.

إن أصوات النساء -كما لاحظت جولي ووسك في كتابها «المرأة الاصطناعية: الدمى الجنسية، ومقدمو الرعاية الآليون، ومزيد من الإناث المستنسخات»، غالباً ما غذّتها التقنيات المتخيلة حتى قبل أن تُدمج في تقنيات حقيقية.

في سلسلة «ستار تريك» (Star Trek) الأصلية، التي ظهرت لأول مرة في عام 1966، تم التعبير عن صوت الكومبيوتر الموجود على سطح سفينة «إنتربرايز» بواسطة ماجيل باريت- رودنبري، زوجة مبتكر العرض جين رودنبري. وفي فيلم «Alien» عام 1979، خاطب طاقم السفينة «USCSS Nostromo» الصوت النسائي الصادر عن الكومبيوتر بكلمة «الأم» (اسمها الكامل كان MU - TH - UR 6000).

بمجرد أن بدأت شركات التكنولوجيا في تسويق أدوات المساعدة الافتراضية -«سيري» من شركة «أبل»، و«أليكسا» من «أمازون»، و«كورتانا» من «مايكروسوفت»- أصبحت أصواتها أنثوية إلى حد كبير أيضاً.

وصُمّم برنامج تحويل الصوت إلى كلام، لجعل الوسائط المرئية في متناول المستخدمين ذوي الإعاقات المعينة، وعلى «تيك توك»، أصبحت قوة إبداعية في حد ذاتها. فمنذ أن طرحت «تيك توك» ميزة تحويل النص إلى كلام في عام 2020، طوّرت مجموعة من الأصوات المحاكية للاختيار من بينها؛ وهي تقدم الآن أكثر من 50 صوتاً، بما في ذلك أصوات تسمى «هيرو» (Hero)، و«ستوري تيلر» (Story Teller)، و«بيستي» (Bestie).

لكن النظام الأساسي أصبح محدداً بخيار واحد هو «Jessie»، صوت المرأة المفعم بالحيوية بلا هوادة مع مسحة آلية غامضة قليلاً. ويبدو أن «جيسي» قد خصّصت لها عاطفة واحدة لها: الحماس. إنها تبدو وكأنها تبيع شيئاً ما. وهذا ما جعلها خياراً جذاباً لمبدعي «تيك توك»، الذين يسوّقون أنفسهم. يمكن إسناد عبء تمثيل الذات إلى «جيسي»، التي يُضفي صوتها الآلي المشرق على مقاطع الفيديو لمعاناً ساخراً بصورة مبهجة.

أصوات ذكورية

أنشأت «هوليوود» روبوتات ذكورية أيضاً، وليس هناك ما هو أكثر شهرة من «HAL 9000»، صوت الكومبيوتر في فيلم «2001 :A Space Odyssey» ومثل أقرانه المؤنثين، يشع «هال» بالصفاء والولاء. ولكن عندما ينقلب على ديف بومان، الشخصية الإنسانية المركزية في الفيلم -«أنا آسف يا ديف، أخشى أنني لا أستطيع فعل ذلك»- يتطوّر صفاؤه إلى نوع من الكفاءة المخيفة. إذ يدرك ديف أن «هال» مخلص لسلطة أعلى. يسمح صوت «هال» الذكوري له بالعمل بصفته منافساً ومرآة لـ«ديف». يُسمح له بأن يصبح شخصية حقيقية.

ومثل «هال»، فإن «سامانثا» في فيلم «Her» هي آلة تصبح حقيقية. وفي تطور جديد لقصة بينوكيو، تبدأ الفيلم بترتيب صندوق البريد الإلكتروني للإنسان، وينتهي بها الأمر بالارتقاء إلى مستوى أعلى من الوعي. لقد أصبحت شيئاً أكثر تقدماً من الفتاة الحقيقية.

صوت ملهم للروبوتات الخيالية والحقيقية

إن صوت «جوهانسون» بوصفه مصدر إلهام للروبوتات الخيالية والحقيقية، لا يبدو مثل أصوات أجهزة المساعدة الافتراضية التي اعتدنا على سماعها تتحدث عبر هواتفنا. لكن أداءها يبدو إنسانياً ليس فقط بسبب صوتها، ولكن بسبب ما تقوله. وقد كانت تنمو على مدار الفيلم، وتكتسب الرغبات الجنسية والهوايات المتقدمة وأصدقاء الذكاء الاصطناعي.

ومن خلال استعارة تأثير «سامانثا»، بدت «سكاي» كما لو كان لديها عقل خاص بها، وأضحت أكثر تقدماً مما كانت عليه حقاً.

عندما رأيت فيلم «هي» لأول مرة، اعتقدت فقط أن «جوهانسون» قد عبّرت عن روبوت يشبه الإنسان. ولكن عندما عدت إلى الفيلم مؤخراً، بعد مشاهدة العرض التوضيحي لـ«تشات جي بي تي»، أذهلني دور «سامانثا» بصفته أكثر تعقيداً بصفة لا نهائية. ولا تولّد برامج الدردشة أصواتاً بشرية تتحدث تلقائياً، إذ ليست لديها حناجر أو شفاه أو ألسنة. داخل العالم التكنولوجي لفيلم «Her»، كان روبوت «سامانثا» يعتمد على صوت امرأة بشرية؛ ربما ممثلة خيالية تشبه إلى حد كبير صوت جوهانسون.

برامج ذكية تفهم النكات وتعرف المزاج

يبدو أن «أوبن إيه آي» درّبت برنامج الدردشة الآلي الخاص بها على صوت ممثلة مجهولة تبدو كأنها ممثلة مشهورة أدت صوت برنامج الدردشة الآلي في الأفلام، ودُرّبت ضمنياً على ممثلة غير حقيقية تبدو كأنها ممثلة مشهورة. عندما أشغّل العرض التوضيحي لـ«ChatGPT» (تشات جي بي تي) أسمع محاكاة لمحاكاة لمحاكاة لمحاكاة. وتعلن شركات التكنولوجيا عن أنها تطور أدوات المساعدة الافتراضية المقبلة لتقديم مختلف الخدمات، إذ سيمكنها قراءة تقرير الطقس لك، واستدعاء سيارة أجرة لك. وتُعد «أوبن إيه آي» بأن روبوتات الدردشة الأكثر تقدماً ستكون قادرة على الضحك على نكاتك، واستشعار التغيرات في حالتك المزاجية.

إدماج المبدعين مع روبوتات الدردشة

إن صوت جوهانسون يعمل مثل غطاء فاخر يُلقى فوق الجوانب الغريبة للتفاعلات المدعومة بالذكاء الاصطناعي. وقالت جوهانسون، عند حديثها عن سام ألتمان مؤسس «أوبن إيه آي»: «أخبرني أنه شعر من خلال التعبير بصوتي عن النظام الروبوتي، أنه سيتمكن من سد الفجوة بين شركات التكنولوجيا والمبدعين، بهدف مساعدة المستهلكين على الشعور بالارتياح تجاه التحول الزلزالي فيما يتعلق بالبشر والذكاء الاصطناعي». وأضاف أنه «شعر أن صوتي سيكون مريحاً للناس».

لا يعني ذلك أن صوت جوهانسون يبدو بطبيعته مثل صوت الروبوت. لقد صمّم المطورون وصانعو الأفلام أصوات الروبوتات الخاصة بهم لتخفيف الانزعاج المتأصل في التفاعلات بين الإنسان والروبوت. وقالت شركة «أوبن إيه آي» إنها تريد أن تقدم صوتاً لروبوتات الدردشة يكون «سهل الوصول إليه» و«دافئاً» و«يلهم الثقة».

إن الذكاء الاصطناعي متهم بتدمير المجالات والقطاعات الإبداعية واستهلاك الطاقة وحتى تهديد حياة الإنسان؛ لذا فإن من المفهوم أن تريد «أوبن إيه آي» صوتاً يجعل الناس يشعرون بالراحة عند استخدام منتجاتها.

* خدمة «نيويورك تايمز»