نظم الذكاء الاصطناعي لاستخدام أصوات الفنانين المشهورين في فيديوهات «يوتيوب»

سهولة كبيرة في تحرير الصور والفيديوهات عبر منصات الفيديو والكومبيوتر الشخصي... وتطبيقات متقدمة على أجهزة الجوال

أداة «غوغل دريم سكرين» لإيجاد الصور وعروض الفيديو من الأوامر النصية
أداة «غوغل دريم سكرين» لإيجاد الصور وعروض الفيديو من الأوامر النصية
TT

نظم الذكاء الاصطناعي لاستخدام أصوات الفنانين المشهورين في فيديوهات «يوتيوب»

أداة «غوغل دريم سكرين» لإيجاد الصور وعروض الفيديو من الأوامر النصية
أداة «غوغل دريم سكرين» لإيجاد الصور وعروض الفيديو من الأوامر النصية

تطورت استخدامات تقنيات الذكاء الاصطناعي، وأصبحت مدمجة في كثير من البرامج والتطبيقات والخدمات. وكشفت «يوتيوب» عن عملها على تدريب أداة على أصوات المغنين للسماح لأصحاب القنوات بإيجاد عروض جديدة باستخدام أصوات فنانين مشهورين، إلى جانب تقديمها لمجموعة من الأدوات لتسهيل تحرير عروض الفيديو عبر منصة «يوتيوب». ونذكر كذلك مشروعاً لتحرير الصور باستخدام الذكاء الاصطناعي من «أدوبي»، ومجموعة من التطبيقات المجانية للجوال تُسهل تحرير عروض الفيديو من خلال تقنيات الذكاء الاصطناعي.

تطبيق «فيلمورا» لتحرير الفيديوهات بتقنيات الذكاء الاصطناعي على الجوال

أصوات الموسيقيين لفيديوهات «يوتيوب»

تعمل منصة «يوتيوب» على تطوير أداة ذكاء اصطناعي تسمح لصناع المحتوى بتسجيل الصوت باستخدام أصوات الموسيقيين المشهورين، وذلك بالتواصل مع شركات إنتاج وتوزيع الموسيقى للحصول على حقوق الأغاني والمغنين التي يمكن استخدامها لتدريب تلك الأداة.

هذا الأمر سيسهل إنتاج محتوى إبداعي يعود على الموسيقيين والفنانين بالعوائد المالية الإضافية، ولكنه قد يضعهم في متاعب تؤثر على سمعتهم سلباً، حيث يمكن تسجيل مؤلفات بأصوات الفنانين وبكلمات قد لا تتناسب مع توجهاتهم، وقد يتطور الأمر إلى مشاكل قانونية إلى حين تطوير آلية قانونية لهذا النوع من الاستخدامات.

وهناك مشكلة أخرى مرتبطة هي آلية توزيع العوائد المالية جراء هذه الفئة الجديدة من الأغاني، حيث إن الفنان الأصلي لم يبذل أي جهد ليستحق مشاركة الأرباح مع المؤلف الجديد للأغاني، ولكن مؤلف الأغاني قد يجني المال بسبب استخدام صوت ذلك الفنان. وفي حال وجود ضريبة على بيع تلك الأغاني في بلد ما، فكيف سيتم احتسابها ومن سيدفع تلك الضريبة وما هي نسبتها؟

الجدير ذكره أن «يوتيوب» مليء بأغانٍ قام معجبون بتطويرها تستخدم موسيقى لفرقة ما، وصوت فنان من فرقة أخرى يغني الكلمات نفسها وبأسلوب غناء هجين بين أسلوبه الحقيقي وأسلوب مغن لفرقة أخرى، وكثيراً ما تكون النتيجة جميلة وغريبة، حيث توجد فيديوهات صنعها الذكاء الاصطناعي لفنانين من نوع موسيقى معين يغنون أغاني لفرق من نوع موسيقى بعيد تماماً عنهم، مثل مغني موسيقى «روك» حديث يؤدي أغنية هادئة من سبعينات القرن الماضي، أو مغن قديم يؤدي أغنية حديثة بأسلوبه الخاص.

ودعا بعض الموسيقيين إلى وضع لوائح تنظيمية لحماية استخدام أصواتهم دون موافقتهم. وليس واضحاً إذا ما كانت هذه الأداة الجديدة من «يوتيوب» لاستنساخ الصوت بالذكاء الاصطناعي ستساعد في تهدئة مشاكل حقوق التأليف المحتملة التي تثيرها شركات إنتاج الموسيقى أم لا. وليس من الواضح كذلك إن كان تدريب هذه الفئة من الأدوات يصل إلى مستوى انتهاك حقوق التأليف أم لا، وما إذا كانت الشركة تستطيع تزويد صناع المحتوى بشكل قانوني بهذه الأداة دون إثارة دعاوى قضائية متعلقة بحقوق التأليف.

أدوات «يوتيوب» الجديدة

وطرحت «يوتيوب» كذلك مجموعة من الأدوات المعتمدة على الذكاء الاصطناعي بهدف دعم ومساندة صُناع المحتوى وأصحاب القنوات في صناعة وتعديل ومشاركة المحتوى بطرق جديدة، وذلك بتقديم أشكال جديدة للتعبير الإبداعي وخفض المهام المكلفة والمستهلكة للوقت، والسماح لهم الوصول إلى مزيد من المشاهدين.

ومن تلك الأدوات «دريم سكرين Dream Screen» التي توجِد صورة أو عرض فيديو من خلال أوامر نصية فقط، وذلك لإضافتها إلى عروض الفيديو القصيرة «Shorts». وأطلقت «يوتيوب» كذلك تطبيق «يوتيوب كرييت YouTube Create» المجاني الذي يمكن من خلاله إنشاء وتعديل وإنتاج عروض الفيديو على الجوالات الذكية، إلى جانب تقديم إمكانية الدبلجة الصوتية لعروض الفيديو من خلال ميزة «بصوت مرتفع» Aloud، حيث تستخدم الدبلجة تقنيات الذكاء الاصطناعي للعمل بشكل مباشر، والسماح للمشاهد بسماع الدبلجة الصوتية بتغيير إعدادات الملف الصوتي المرفق مع الفيديو من إعدادات المشاهدة.

وأضافت «يوتيوب» كذلك ميزة «أفكار الذكاء الاصطناعي» AI Insights التي توفر لأصحاب القنوات أفكاراً لعروض الفيديو واقتراحات تفصيلية بناء على ما يشاهده جمهور القناة. كما كشفت الشركة عن القدرة على توظيف الذكاء الاصطناعي في البحث عن المقاطع الموسيقية الملائمة لاستخدامها داخل عروض الفيديو وفق عوامل كثيرة، الأمر الذي يُسهل على صُنّاع المحتوى البحث عن موسيقى مرتبطة دون المخاطرة بحذف تلك العروض جراء انتهاك حقوق الملكية الفكرية لصاحب الموسيقى.

برنامج «ذكي» من «أدوبي»

ومن جهتها كشفت «أدوبي» Adobe عن محرر الصور باستخدام الذكاء الاصطناعي باسم «مشروع ستارداست» Project Stardust بوصفه نظرة أولية على مستقبل أدوات تحرير الصور بالذكاء الاصطناعي. ويسمح هذا المحرر بحذف العناصر والأشخاص الموجودين في الصورة وتغيير الخلفيات بسهولة، مع القدرة على إيجاد الصور بتقديم أوامر نصية، مثل طلب إيجاد صورة حقيقية لرجل كبير بالسن يجلس على مقعد في حديقة ومعه كلب وقطة بفصل الربيع، ليفهم النظام هذه الأوامر ويُوجِد الصورة المطلوبة بسرعة.

كما يمكن طلب حذف عنصر ما من الصورة من خلال تقديم أوامر نصية، واختيار عنصر ما وتحريكه من مكانه بكل سهولة، ليوجد ذلك الأداء العناصر المطلوبة لتعويض الفراغ الناجم عن تحريك ذلك العنصر من موضعه الأساسي، الأمر الذي يسمح للمستخدم بالتعامل مع الصور وعناصرها بشكل سهل.

ويمكن من خلال «مشروع ستارداست» لأي شخص الإبداع بإيجاد وتحرير الصور باستخدام أدوات الذكاء الاصطناعي والأوامر النصية البسيطة. وأوضحت الشركة أنها تستخدم أكثر من عشرة نماذج مختلفة للذكاء الاصطناعي لتشغيل مزايا «مشروع ستارداست» المتنوعة. ويشابه هذا المشروع ما تحاول «غوغل» تنفيذه باستخدام ميزة «المحرر السحري» Magic Editor في نظام التشغيل «آندرويد» لتسهيل التحرير الاحترافي للصور على جميع فئات المستخدمين.

تطبيقات «ذكية» لتحرير الفيديو

وبإمكانك إيجاد وتحرير عروض الفيديو باحترافية عالية وبسرعة دون الحاجة لوجود مهارات تحريرية وفنية، ومن ثم مشاركتها مع الأهل والأصدقاء وعبر الشبكات الاجتماعية، وذلك باستخدام مجموعة من تطبيقات التحرير المجانية على الأجهزة التي تعمل بنظامي التشغيل «آندرويد» و«آي أو إس» تعتمد على تقنيات الذكاء الاصطناعي.

* التطبيق الأول هو «فيلمورا» الذي يقدم كثيراً من المزايا لتحرير عروض الفيديو باحترافية وبسهولة ومن خلال واجهة استخدام بسيطة. ويسمح التطبيق بإيجاد صور بالذكاء الاصطناعي، ويقدم أداة كتابة تعمل بالذكاء الاصطناعي تساعد على إيجاد أنواع مختلفة من المحتوى النصي. ويقدم التطبيق قوالب معدة مسبقاً وملصقات ومؤثرات صوتية وموسيقى خالية من حقوق الملكية يمكن استخدامها في عروض الفيديو، إلى جانب تقديمه أداة لتوليد الموسيقى تعمل بالذكاء الاصطناعي، وتتيح للمستخدم إيجاد مقطوعات موسيقية خاصة بعرض الفيديو. ويتضمن التطبيق كذلك أدوات متعددة لتحسين جودة الفيديو وعناصر للتحكم بالوضوح والسطوع والتباين وتشبع الألوان، وهو يدعم امتدادات الفيديو المتعددة، ويسمح بحفظ عروض الفيديو بامتدادات وأبعاد مناسبة للنشر في يوتيوب و«فيميو».

* التطبيق الثاني هو «ماجيستو» Magisto المجاني وسهل الاستخدام، الذي يستطيع تحديد اللقطات المميزة في عروض الفيديو، ويضيف التعديلات المناسبة لتحسين جودة الفيديو تلقائياً. ويسمح التطبيق استيراد عروض فيديو من الجوال أو من تطبيق صور «غوغل»، وتغيير أبعاد عروض الفيديو لتصبح مناسبة للنشر في الشبكات الاجتماعية المختلفة. ويدعم التطبيق إيجاد عروض فيديو تصل مدتها إلى 10 دقائق، وإضافة الملصقات والتعليقات التوضيحية والمقاطع الصوتية إليها.

* ونذكر «لايت كات» LightCut الذي يتضمن مجموعة متنوعة من القوالب الاحترافية لتطوير العروض وتعديل أبعادها بسهولة. ويستطيع التطبيق تحديد اللقطات الأفضل في عروض الفيديو وتحريرها بسرعة، ورفع جودة عروض الفيديو ودمج أكثر من عرض فيديو، وإضافة الموسيقى والملصقات والمؤثرات المختلفة. كما يسمح التطبيق بتصدير عروض فيديو بدقة 720 أو 1080 بكسل أو بالدقة الفائقة 4K، وبمعدل يبلغ 30 أو 60 صورة في الثانية، إلى جانب تقديمه القدرة على مشاركة الفيديو النهائي مع الآخرين عبر «واتساب» و«فيسبوك» و«إنستغرام»، وغيرها.

* التطبيق التالي هو «باور دايركتر» PowerDirector الذي يقدم كثيراً من مزايا الذكاء الاصطناعي لتحرير عروض الفيديو ورفع الدقة والسطوع، وإضافة المؤثرات المتعددة، وإضافة التعليق الصوتي. ويدعم التطبيق حفظ عروض الفيديو بدقة تصل إلى 4K وتغيير الخلفية بسهولة لدى استخدام الشاشات الزرقاء أو الخضراء، وهو يسمح بتعديل الصور أيضاً.

* وننتقل إلى تطبيق «فيديو ليب» Videoleap الذي يسمح بإجراء تعديلات احترافية لعروض الفيديو المختلفة، ويحتوي على قسم خاص بأدوات التحرير المبنية على تقنيات الذكاء الاصطناعي ويتكون من فئات متعددة، وذلك لتحرير فيديوهات الألعاب الإلكترونية والرسوم المتحركة والرسوم اليابانية والرسومات الطريفة والصور الذاتية «سيلفي»، وغيرها. ويقدم التطبيق كذلك مؤثرات بصرية مبنية على الذكاء الاصطناعي تسمح بإضافة المؤثرات البصرية والموسيقى إلى عروض الفيديو.


مقالات ذات صلة

دراسة: 20 % من فيديوهات «يوتيوب» مولّدة بالذكاء الاصطناعي

تكنولوجيا محتوى على «يوتيوب» تم إنشاؤه بواسطة الذكاء الاصطناعي يصوّر قطاً يتم القبض عليه بواسطة رجال الشرطة

دراسة: 20 % من فيديوهات «يوتيوب» مولّدة بالذكاء الاصطناعي

أظهرت دراسة أن أكثر من 20 % من الفيديوهات التي يعرضها نظام يوتيوب للمستخدمين الجدد هي «محتوى رديء مُولّد بالذكاء الاصطناعي»، مُصمّم خصيصاً لزيادة المشاهدات.

«الشرق الأوسط» (لندن)
يوميات الشرق المطربة السورية بيسان إسماعيل (إنستغرام)

مطربو «جيل زد» يسيطرون على قائمة الأكثر مشاهدة بـ«يوتيوب» في 2025

فرضت أغنيات أبرز مطربي «جيل زد» حضورها القوي على قائمة أكثر 50 أغنية عربية استماعاً ومشاهدة خلال عام 2025 عبر منصة الفيديوهات العالمية «يوتيوب».

محمود إبراهيم (القاهرة )
يوميات الشرق  فتى يبلغ من العمر 13 عاماً داخل منزله وهو يتصفح مواقع التواصل الاجتماعي على هاتفه المحمول في سيدني بأستراليا (أ.ف.ب)

بعد دخول الحظر حيز التنفيذ… أستراليا تطالب المنصات بكشف حسابات ما دون 16 عاماً

طالبت السلطات الأسترالية، اليوم (الخميس)، بعضاً من أكبر منصات التواصل الاجتماعي في العالم بالكشف عن عدد الحسابات التي قامت بتعطيلها.

«الشرق الأوسط» (ملبورن)
الاقتصاد شعار «غوغل» على هاتف ذكي أمام علم الاتحاد الأوروبي في بروكسل (أ.ف.ب)

الاتحاد الأوروبي يحقق مع «غوغل» بشأن استخدام المحتوى لتدريب الذكاء الاصطناعي

أعلنت المفوضية الأوروبية يوم الثلاثاء أن شركة «غوغل»، التابعة لشركة «ألفابت»، تواجه تحقيقاً من قِبل الاتحاد الأوروبي لمكافحة الاحتكار.

«الشرق الأوسط» (بروكسل)
تكنولوجيا شكل تسارع التحول الرقمي واتساع تأثير الذكاء الاصطناعي ملامح المشهد العربي في عام 2025 (شاترستوك)

بين «غوغل» و«يوتيوب»... كيف بدا المشهد الرقمي العربي في 2025؟

شهد عام 2025 تحوّلًا رقميًا واسعًا في العالم العربي، مع هيمنة الذكاء الاصطناعي على بحث غوغل وصعود صنّاع المحتوى على يوتيوب، وتقدّم السعودية في الخدمات الرقمية.

نسيم رمضان (لندن)

«تشات جي بي تي» يستعد لعرض إعلانات بناءً على محادثات المستخدمين

شعار تطبيق «تشات جي بي تي» (رويترز)
شعار تطبيق «تشات جي بي تي» (رويترز)
TT

«تشات جي بي تي» يستعد لعرض إعلانات بناءً على محادثات المستخدمين

شعار تطبيق «تشات جي بي تي» (رويترز)
شعار تطبيق «تشات جي بي تي» (رويترز)

قد يبدأ تطبيق الدردشة المدعم بالذكاء الاصطناعي «تشات جي بي تي» قريباً بعرض إعلانات لمنتجات وخدمات يُرجّح أنها تهم المستخدمين، وذلك استناداً إلى طبيعة محادثاتهم مع المنصة.

وأعلنت شركة «أوبن إيه آي»، أمس (الجمعة)، أنها ستختبر هذه الإعلانات في النسخة المجانية من تطبيق «تشات جي بي تي» للمستخدمين البالغين المسجلين في الولايات المتحدة. كما كشفت عن إطلاق باقة اشتراك جديدة تحمل اسم «Go» بسعر 8 دولارات شهرياً، تتضمن بعض الميزات المحسّنة، مثل ذاكرة أكبر وإمكانات أوسع لإنشاء الصور، وبسعر أقل من باقتي «Plus» (20 دولاراً شهرياً) و«Pro» (200 دولار شهرياً).

وبحسب شبكة «سي إن إن»، سيشاهد مشتركو باقة «Go» أيضاً إعلانات داخل الخدمة، في حين لن تُعرض أي إعلانات لمشتركي باقتي «Plus» و«Pro»، ولا لعملاء «أوبن إيه آي» من الشركات.

وكان سام ألتمان، الرئيس التنفيذي لشركة «أوبن إيه آي»، قد أعرب في وقت سابق، عن تحفظاته إزاء إدخال الإعلانات إلى «تشات جي بي تي». غير أن هذه الخطوة تأتي في سياق سعي الشركة الحثيث إلى إيجاد مصادر جديدة لزيادة الإيرادات من قاعدة مستخدميها التي تُقدَّر بنحو 800 مليون مستخدم شهرياً، وذلك للمساعدة في تغطية تكلفة البنية التحتية للذكاء الاصطناعي، التي تعتزم الشركة استثمار نحو 1.4 تريليون دولار فيها على مدى السنوات الثماني المقبلة.

وفي هذا السياق، قال ألتمان في نوفمبر (تشرين الثاني) الماضي، إن «أوبن إيه آي» تتوقع إنهاء عام 2025 بإيرادات سنوية تقارب 20 مليار دولار.

وكانت الشركة قد أطلقت العام الماضي، أداة تُعرف باسم «الدفع الفوري»، تتيح للمستخدمين شراء المنتجات مباشرةً من متاجر تجزئة مثل «وول مارت» و«إتسي» عبر «تشات جي بي تي». كما قدّمت أدوات في مجالات الصحة والتعليم وغيرها، في إطار مساعيها لجعل «تشات جي بي تي» جزءاً أساسياً من الحياة اليومية للمستخدمين، وربما تحفيزهم على الترقية إلى اشتراكات مدفوعة.

وقد تُثبت الإعلانات أنها استراتيجية مربحة لشركة «أوبن إيه آي»، إذ يمكن استغلال المعلومات المستخلصة من محادثات المستخدمين مع «تشات جي بي تي» لإنشاء إعلانات عالية الاستهداف. فعلى سبيل المثال، إذا طلب أحد المستخدمين المساعدة في التخطيط لرحلة، فقد تظهر له إعلانات متعلقة بفنادق أو أنشطة ترفيهية في الوجهة المقصودة.

وكجزء من هذا الاختبار، ستظهر الإعلانات أسفل إجابات «تشات جي بي تي» على استفسارات المستخدمين، مع تصنيفها بوضوح على أنها «إعلانات ممولة». وأكدت «أوبن إيه آي» أن هذه الإعلانات لن تؤثر في محتوى إجابات «تشات جي بي تي»، مشددة على أن المستخدمين «يجب أن يثقوا بأن الإجابات تستند إلى ما هو مفيد موضوعياً».

كما أوضحت الشركة أنها لن تبيع بيانات المستخدمين أو محادثاتهم للمعلنين، مؤكدةً أن بإمكان المستخدمين تعطيل تخصيص الإعلانات المبنية على محادثاتهم في أي وقت.


دراسة جديدة تكشف حدود الذكاء الاصطناعي في إنجاز مشاريع العمل عن بُعد

الدراسة تقدم «مؤشر العمل عن بُعد» كأول مقياس واقعي لقدرة الذكاء الاصطناعي على إنجاز مشاريع عمل حقيقية متكاملة (شاترستوك)
الدراسة تقدم «مؤشر العمل عن بُعد» كأول مقياس واقعي لقدرة الذكاء الاصطناعي على إنجاز مشاريع عمل حقيقية متكاملة (شاترستوك)
TT

دراسة جديدة تكشف حدود الذكاء الاصطناعي في إنجاز مشاريع العمل عن بُعد

الدراسة تقدم «مؤشر العمل عن بُعد» كأول مقياس واقعي لقدرة الذكاء الاصطناعي على إنجاز مشاريع عمل حقيقية متكاملة (شاترستوك)
الدراسة تقدم «مؤشر العمل عن بُعد» كأول مقياس واقعي لقدرة الذكاء الاصطناعي على إنجاز مشاريع عمل حقيقية متكاملة (شاترستوك)

أعاد التطور السريع في تقنيات الذكاء الاصطناعي طرح أسئلة قديمة متجددة حول الأتمتة ومستقبل العمل. فمن تطوير البرمجيات إلى إنتاج المحتوى، باتت أنظمة الذكاء الاصطناعي تُظهر قدرات لافتة في الاختبارات البحثية والمعايير التقنية. لكن فجوة أساسية ما زالت قائمة تتعلق بقدرة هذه الأنظمة على تنفيذ أعمال حقيقية ذات قيمة اقتصادية، كما هي مطلوبة في سوق العمل الفعلي.

دراسة جديدة تسعى للإجابة عن هذا السؤال عبر إطار قياس مبتكر يُعرف باسم «مؤشر العمل عن بُعد» (Remote Labor Index – RLI)، وهو أول معيار تجريبي يقيس بشكل منهجي قدرة وكلاء الذكاء الاصطناعي على أتمتة مشاريع عمل متكاملة مأخوذة من أسواق العمل الحر الحقيقية. وتأتي النتائج مفاجئة، وأكثر واقعية مما توحي به كثير من السرديات المتداولة حول قرب الاستغناء عن الوظائف البشرية.

ما بعد المعايير الاصطناعية

تركز معظم اختبارات الذكاء الاصطناعي الحالية على مهام محددة أو معزولة ككتابة شيفرات قصيرة أو الإجابة عن أسئلة تقنية أو تصفح الإنترنت أو تنفيذ أوامر حاسوبية مبسطة. ورغم أهمية هذه المعايير، فإنها غالباً لا تعكس التعقيد والتكامل والغموض الذي يميز العمل المهني الحقيقي.

من هنا جاء تطوير «مؤشر العمل عن بُعد»، الذي لا يختبر مهارات منفصلة، بل يقيس قدرة أنظمة الذكاء الاصطناعي على إنجاز مشاريع كاملة من البداية إلى النهاية، تماماً كما تُسند إلى محترفين يعملون لحساب عملاء حقيقيين. وتشمل هذه المشاريع مجالات مثل التصميم والهندسة المعمارية وإنتاج الفيديو وتحليل البيانات وتطوير الألعاب وإعداد الوثائق وغيرها من أشكال العمل عن بُعد التي تشكل جوهر الاقتصاد الرقمي المعاصر. وبهذا، تنقل الدراسة النقاش من مستوى القدرات النظرية إلى مستوى الأداء الفعلي القابل للقياس في السوق.

نتائج المؤشر تظهر أن الذكاء الاصطناعي ما زال عاجزاً عن أتمتة معظم مشاريع العمل عن بُعد بمستوى مهني مقبول (غيتي)

قياس مؤشر العمل عن بُعد

تتكون قاعدة بيانات المؤشر من 240 مشروع عمل حر مكتمل، يحتوي كل مشروع على ثلاثة عناصر رئيسية هي وصف تفصيلي للمهمة والملفات المدخلة اللازمة لتنفيذها ومخرجات نهائية أنجزها محترفون بشريون باعتبارها مرجعاً قياسياً. ولم تكتفِ الدراسة بالمخرجات فقط، بل جمعت أيضاً بيانات عن الوقت والتكلفة اللازمين لتنفيذ كل مشروع. وقد استغرق إنجاز المشروع الواحد، في المتوسط، نحو 29 ساعة من العمل البشري، بينما تجاوزت بعض المشاريع حاجز 100 ساعة. وتراوحت تكاليف المشاريع بين أقل من 10 دولارات وأكثر من 10 آلاف دولار، بإجمالي قيمة تتجاوز 140 ألف دولار وأكثر من 6 آلاف ساعة عمل فعلي.

ويعكس هذا التنوع والتعقيد المتعمد طبيعة العمل الحقيقي، بعيداً عن المهام المبسطة أو المتخصصة.

تقييم أداء الذكاء الاصطناعي

اختبر الباحثون عدة نماذج متقدمة من وكلاء الذكاء الاصطناعي باستخدام عملية تقييم بشرية دقيقة حيث مُنحت الأنظمة نفس أوصاف المشاريع والملفات التي حصل عليها المحترفون، وطُلب منها إنتاج مخرجات كاملة. ثم قام مقيمون مدربون بمقارنة نتائج الذكاء الاصطناعي بالمخرجات البشرية المرجعية، مع التركيز على سؤال جوهري يتعلق بمدى قبول العميل الحقيقي لهذا العمل باعتباره مكافئاً أو أفضل من عمل محترف بشري.

المقياس الأساسي في الدراسة هو «معدل الأتمتة» أي النسبة المئوية للمشاريع التي نجح الذكاء الاصطناعي في إنجازها بمستوى احترافي مقبول. كما استخدمت الدراسة نظام تصنيف شبيهاً بنظام «إيلو» لإجراء مقارنات دقيقة بين النماذج المختلفة، حتى في الحالات التي لم تصل فيها أي منها إلى مستوى الأداء البشري.

الأتمتة ما زالت محدودة جداً

على الرغم من التطورات الكبيرة في قدرات التفكير والتعامل متعدد الوسائط، تكشف النتائج أن أنظمة الذكاء الاصطناعي الحالية ما تزال بعيدة عن أتمتة العمل عن بُعد بشكل واسع. فقد بلغ أعلى معدل أتمتة تحقق 2.5 في المائة فقط، أي أن أقل من ثلاثة مشاريع من كل مائة وصلت إلى مستوى مقبول مقارنة بالعمل البشري. وتتحدى هذه النتيجة الافتراض السائد بأن التحسن في المعايير التقنية يعني بالضرورة قدرة فورية على استبدال العمل البشري. فحتى النماذج المتقدمة القادرة على كتابة الشيفرات أو توليد الصور والنصوص، غالباً ما تفشل عندما يُطلب منها دمج مهارات متعددة، أو الالتزام بتفاصيل معقدة أو تسليم ملفات متكاملة بجودة احترافية.

مستقبل العمل القريب يتجه نحو دعم الإنتاجية البشرية بالذكاء الاصطناعي بدلاً من استبدال الوظائف بالكامل (شاترستوك)

تعثر الذكاء الاصطناعي... ونجاحه

يكشف التحليل النوعي لأسباب الفشل عن مشكلات متكررة، أبرزها أخطاء تقنية أساسية مثل ملفات تالفة أو غير قابلة للاستخدام أو صيغ غير صحيحة أو مخرجات ناقصة وغير متسقة. وفي حالات أخرى، كانت المشاريع مكتملة شكلياً لكنها لا ترقى إلى المستوى المهني المتوقع في سوق العمل الحر.

في المقابل، رصدت الدراسة مجالات محدودة أظهر فيها الذكاء الاصطناعي أداءً أفضل نسبياً، لا سيما في المهام التي تتركز على معالجة النصوص أو توليد الصور أو التعامل مع الصوت كبعض أعمال التحرير الصوتي والتصميم البصري البسيط وكتابة التقارير وتصور البيانات المعتمد على الشيفرة البرمجية. وتشير هذه النتائج إلى أن الذكاء الاصطناعي يلعب بالفعل دوراً داعماً في بعض أنواع العمل، وإن لم يصل بعد إلى مرحلة الأتمتة الكاملة.

قياس التقدم دون تهويل

رغم انخفاض معدلات الأتمتة المطلقة، يُظهر المؤشر تحسناً نسبياً واضحاً بين النماذج المختلفة. فتصنيفات «إيلو» وهي نظام رياضي لتقييم الأداء النسبي، تشير إلى أن الأنظمة الأحدث تتفوق بشكل منهجي على سابقاتها، ما يعني أن التقدم حقيقي وقابل للقياس، حتى وإن لم يترجم بعد إلى إنجاز مشاريع كاملة. وتكمن قيمة «مؤشر العمل عن بُعد» في كونه أداة طويلة الأمد لمتابعة التطور، بعيداً عن التوقعات المبالغ فيها أو الأحكام الثنائية.

تشير نتائج الدراسة إلى أن الاستغناء الواسع عن العاملين في وظائف العمل عن بُعد ليس وشيكاً في الوقت الراهن. وبدلاً من ذلك، يُرجّح أن يكون الأثر القريب للذكاء الاصطناعي متمثلاً في تعزيز الإنتاجية على مستوى المهام، لا استبدال الوظائف بالكامل.

وسيظل الحكم البشري والقدرة على الدمج وضبط الجودة عناصر مركزية في العمل المهني. ومع ذلك، تحذر الدراسة من أن الذكاء الاصطناعي يختلف عن تقنيات الأتمتة السابقة؛ إذ يسعى إلى محاكاة قدرات معرفية عامة. وإذا تمكنت الأنظمة المستقبلية من سد الفجوة التي يكشفها المؤشر دون التكيّف المصطنع معه، فقد تكون الآثار على سوق العمل أعمق بكثير.

خط أساس جديد للنقاش

لا تدّعي هذه الدراسة التنبؤ بالمستقبل، لكنها تقدم خط أساس علمي وعملي لفهم موقع الذكاء الاصطناعي اليوم. ومن خلال ربط التقييم بعمل حقيقي وتكلفة فعلية ومعايير مهنية واقعية، تضع إطاراً أكثر دقة لنقاشات الأتمتة والعمل. ومع استمرار تطور الذكاء الاصطناعي، ستصبح أدوات مثل «مؤشر العمل عن بُعد» ضرورية للفصل بين التقدم الحقيقي والضجيج الإعلامي، وضمان أن يُبنى النقاش حول مستقبل العمل على الأدلة لا الافتراضات.


بيانات الصوت البيومترية... هل تهدد الخصوصية في زمن الخوارزميات؟

تقنيات الذكاء الاصطناعي أصبحت قادرة على استخراج معلومات حساسة من الصوت دون علم المتحدث (أدوبي)
تقنيات الذكاء الاصطناعي أصبحت قادرة على استخراج معلومات حساسة من الصوت دون علم المتحدث (أدوبي)
TT

بيانات الصوت البيومترية... هل تهدد الخصوصية في زمن الخوارزميات؟

تقنيات الذكاء الاصطناعي أصبحت قادرة على استخراج معلومات حساسة من الصوت دون علم المتحدث (أدوبي)
تقنيات الذكاء الاصطناعي أصبحت قادرة على استخراج معلومات حساسة من الصوت دون علم المتحدث (أدوبي)

نحن نتحدث يومياً دون أن نفكر كثيراً في مقدار ما تكشفه أصواتنا عنّا. فإلى جانب الكلمات التي نختارها، يحمل الصوت إشارات دقيقة عن هويتنا قد تكشف معلومات صحية وخلفيات ثقافية وحالات عاطفية، ومستوى التعليم وربما حتى ميولاً فكرية. وحتى وقت قريب، كان هذا الإدراك يقتصر على الحدس البشري؛ إذ يمكننا غالباً أن نميّز تعب صديق أو سعادته أو توتره من نبرة صوته فقط. لكن اليوم، باتت الأنظمة الحاسوبية قادرة على فعل ذلك وأكثر بدقة متزايدة.

ويحذّر باحثون في تقنيات الكلام واللغة من أن هذه القدرات تمثل تحدياً حقيقياً للخصوصية. فالصوت لم يعد مجرد وسيلة لإعطاء الأوامر للمساعدات الرقمية أو أداة للحوار، بل أصبح وعاءً غنياً بالمعلومات الشخصية التي تستطيع الخوارزميات الحديثة استخراجها، غالباً دون علم المتحدث أو موافقته.

لماذا يُعد الصوت بيانات شخصية؟

عندما نتحدث، لا تنتقل الرسالة اللغوية وحدها. فإيقاع الكلام ودرجة الصوت والتوقفات بين الكلمات وأنماط التنفس والخصائص الصوتية الأخرى، جميعها تحمل طبقات متعددة من المعلومات الشخصية. ويشير خبراء تقنيات الكلام إلى أن هذه المعلومات مدمجة مباشرة في الإشارة الصوتية نفسها، أي أنها تُفصح تلقائياً عن صاحبها بمجرد التحدث، دون أي نية واعية للكشف عنها.

وتستطيع هذه الخصائص الصوتية أن تعكس مؤشرات تتعلق بالصحة الجسدية أو النفسية، مثل الإرهاق أو مشكلات في الجهاز التنفسي. كما يمكن أن تشير إلى خلفية المتحدث الثقافية أو الجغرافية من خلال اللهجة ونمط النطق. إضافة إلى ذلك، تحمل الأصوات دلائل عاطفية تُمكّن الأنظمة المتقدمة من استنتاج ما إذا كان الشخص متوتراً أو هادئاً أو متحمساً أو مضطرباً. ولهذا، يُصنَّف الصوت ضمن فئة البيانات البيومترية أي البيانات الشخصية العميقة، الفريدة غالباً، والتي يصعب تغييرها أو استبدالها.

وبسبب هذه الحساسية، تُعامل البيانات الصوتية في العديد من التشريعات الحديثة باعتبارها بيانات محمية. ففي الاتحاد الأوروبي، على سبيل المثال، يمكن أن يندرج الصوت ضمن البيانات البيومترية الخاضعة لقواعد صارمة بموجب اللائحة العامة لحماية البيانات (GDPR)، ما يستلزم توفير ضمانات إضافية والحصول على موافقة صريحة في كثير من الحالات.

تحليل الصوت يطرح مخاطر تتعلق بالخصوصية قد تمتد إلى التوظيف والتأمين والتسويق والمراقبة (شاترستوك)

مخاطر الإفراط في كشف المعلومات

تثير القدرة على استخراج سمات شخصية من الصوت مخاوف تتجاوز مسألة الراحة أو التخصيص. فمع تطور تقنيات تحليل الصوت وانتشارها، قد تمتد آثارها إلى مجالات حساسة في حياة الأفراد. فقد تُستخدم الاستنتاجات المستخلصة من أنماط الكلام يوماً ما للتأثير في قرارات التوظيف أو تقييمات التأمين إذا أسيء استخدامها. كما يمكن للمعلنين استغلال الإشارات العاطفية أو السلوكية المستخلصة من الصوت لتقديم رسائل تسويقية شديدة الاستهداف، وربما ذات طابع تلاعبي.

وتتفاقم المخاطر مع احتمالات سوء الاستخدام، مثل المراقبة غير المشروعة أو التحرش أو تتبع الأفراد دون علمهم. ورغم أن هذه السيناريوهات ليست شائعة على نطاق واسع بعد، يؤكد الباحثون أن سرعة تطور التكنولوجيا تستدعي دق ناقوس الخطر مبكراً، قبل أن تصبح هذه الممارسات أمراً واقعاً يصعب احتواؤه.

قياس ما يكشفه صوتك

أحد التحديات الأساسية في حماية خصوصية الصوت هو فهم مقدار المعلومات التي يحتويها تسجيل صوتي واحد. ولهذا يعمل الباحثون على تطوير أدوات وأساليب لقياس مدى قابلية ربط عيّنة صوتية بسمات تعريفية محددة. وتهدف هذه المقاييس إلى تحديد مدى سهولة نسب الصوت إلى شخص بعينه أو إلى فئة ضيقة من الأشخاص، اعتماداً فقط على الخصائص الصوتية.

وتُعد هذه الأدوات ضرورية لتصميم أنظمة تراعي الخصوصية منذ البداية. فإذا تمكن المطورون من تقدير مستوى المخاطر المرتبطة بتسجيل صوتي معين، يصبح بإمكانهم اتخاذ قرارات مدروسة بشأن كيفية تخزينه أو معالجته أو مشاركته. ويدعم هذا التوجه مفهوم «الخصوصية بحكم التصميم»؛ حيث تُؤخذ المخاطر المحتملة في الحسبان قبل طرح التكنولوجيا للاستخدام الواسع.

الصوت ليس وسيلة تواصل فقط بل يحمل أيضاً بيانات شخصية عميقة تكشف الصحة والحالة النفسية والخلفية الثقافية (شاترستوك)

كيف يمكن حماية خصوصية الصوت؟

لا يدعو الخبراء إلى التخلي عن تقنيات الصوت، بل إلى تقليل التعرض غير الضروري للمعلومات الشخصية. ومن بين أكثر الاستراتيجيات فعالية تقليص كمية البيانات الصوتية الخام التي يتم مشاركتها. فبدلاً من إرسال تسجيلات كاملة، يمكن للأنظمة استخراج الحد الأدنى من المعلومات اللازمة لأداء مهمة محددة كتحويل الكلام إلى نص، ثم التخلص من بقية البيانات.

كما تُعد المعالجة المحلية للصوت خطوة مهمة في هذا السياق. فعندما يُحلل الصوت مباشرة على الجهاز، بدلاً من إرساله إلى خوادم سحابية بعيدة، تقل فرص إساءة الاستخدام أو الاعتراض أو الاستغلال الثانوي للبيانات. ويمنح هذا النهج المستخدمين قدراً أكبر من التحكم فيما يغادر أجهزتهم ومتى.

وتلعب الضوابط الفيزيائية والبيئية دوراً مكملاً. فالتقنيات التي تُظهر بوضوح متى يكون التسجيل نشطاً، أو التي تحصر التقاط الصوت في نطاقات محددة، أو تتطلب تفعيلاً مقصوداً من المستخدم، تساعد في منع التسجيل العرضي أو الخفي. ومجتمعةً، تسهم هذه الإجراءات في جعل التفاعل الصوتي مقصوداً لا متطفلاً.

الثقة والشفافية وتجربة المستخدم

الخصوصية ليست مسألة تقنية فحسب، بل هي قضية نفسية أيضاً. فمجرد الشعور بالمراقبة قد يؤثر في سلوك الأفراد وطريقة تعبيرهم عن أنفسهم. ويحذّر الباحثون من أن الإحساس الدائم بالرصد سواء أكان حقيقياً أم متوهماً، يمكن أن يقوّض الشعور بالكرامة والاستقلالية.

ومن هنا تبرز أهمية الشفافية؛ إذ ينبغي إبلاغ المستخدمين بوضوح متى يتم تسجيل أصواتهم، وما نوع المعلومات التي قد تُستخلص، وكيف ستُستخدم هذه البيانات. فالأنظمة التي تقدم إشارات واضحة وتحكماً مفهوماً في إعدادات الخصوصية تكون أقدر على كسب ثقة المستخدمين من تلك التي تعمل بصمت في الخلفية.

مستقبل مسؤول لتقنيات الصوت

توفر التقنيات المعتمدة على الصوت فوائد لا يمكن إنكارها، بدءاً من أدوات الوصول لذوي الإعاقة، مروراً بالحوسبة دون استخدام اليدين، ووصولاً إلى تفاعل أكثر طبيعية بين الإنسان والآلة. غير أن تعاظم حضور هذه التقنيات في الحياة اليومية يفرض مسؤولية متزايدة لحماية البيانات الصوتية.

ويواصل الباحثون تطوير أساليب لقياس المعلومات الشخصية الكامنة في الصوت وتقليلها والتحكم بها. وفي الوقت ذاته، يتعين على المطورين وصنّاع السياسات والمصممين العمل معاً لضمان تطور أطر الخصوصية بالتوازي مع الابتكار. فالتحدي ليس في إسكات التكنولوجيا، بل في ضمان أن تكون أصواتنا حين نتحدث مصدر تمكين لنا، لا بوابة لانتهاك خصوصيتنا.