تقنيات متطورة للتعرف على الوجوه

تصمم بنظم الذكاء الصناعي والتعلم العميق وتوظّف في استخدامات أمنية وطبية وتجارية

تطور كبير في تقنيات التعرف على الوجوه مع مرور الزمن
تطور كبير في تقنيات التعرف على الوجوه مع مرور الزمن
TT

تقنيات متطورة للتعرف على الوجوه

تطور كبير في تقنيات التعرف على الوجوه مع مرور الزمن
تطور كبير في تقنيات التعرف على الوجوه مع مرور الزمن

بعد بدء انتشار تقنيات التزييف العميق DeepFake في العام 2019 بدأت المخاوف تزداد حول تقنيات التعرف على الوجه والآفاق الضارة التي يمكن استخدامها فيها. وعلى الرغم من وجود هذه التقنية في الكثير من الهواتف الجوالة والكومبيوترات المحمولة، فإننا سنركز على الجانب الذي يتطلب تحليلا لملايين الصور والذي يُعتبر أكثر تقدما ويقدم نتائج أكثر دقة.
تحليل الوجه
> ما هي تقنيات التعرف على الوجه؟
تعمل تقنيات التعرف على الوجه بتحليل الوجه البشري في الصور، ومن ثم تحويل ذلك إلى بيانات رقمية وفقا لمزايا موجودة في كل وجه (مثل المسافة بين العينين، وطول الأنف، وشكل محيط الشفاه، وتباعد الأذنين وعرض الذقن، وغيرها)، ومن ثم مطابقة الوجه مع صورة لصاحب الجهاز إن كان فردا، أو مع صور في قاعدة بيانات للوجوه في القطاعات الأخرى. ويمكن استخدام هذه التقنية للتعرف على شخصية صاحب الوجه أو للتأكد من أنه يمتلك الصلاحيات الكافية للدخول إلى موقع ما أو استخدام جهاز ما. وتتم هذه العملية في أجزاء من الثانية، وصولا إلى بضع ثوان وفقا لدرجة التحليل التي يقوم بها النظام.
ولكن لمَ انتشرت هذه التقنية أكثر من تقنيات التعرف الأخرى، مثل بصمة العين والإصبع ونبرة الصوت، وغيرها؟ يعود السبب إلى سهولة قراءة بيانات الوجه عن بُعد مقارنة ببصمة العين أو الإصبع، ناهيك عن الضجيج المصاحب للتعرف على نبرة الصوت في المناطق العامة، وسهولة تغيّر هذه العوامل، مثل احتراق بصمة إصبع المستخدم، أو إصابته بالزكام أو وجود فيروس أدى إلى حدوث التهاب في العين، وغيرها. ومن السهل استخدام هذه التقنية لمراقبة المشاة والتعرف على زوار المتاجر بسهولة، وخصوصا في حالات الاعتداءات أو السرقة مقارنة بضرورة وجود المجرم بالقرب من جهاز ما للتعرف على بصمة إصبعه أو عينه أو نبرة صوته.
تطور التقنية
ويعمل الكثير من كبرى الشركات على أبحاث في هذا المجال وتنشر اكتشافاتها النظرية فيما يتعلق بتحليل الذكاء الصناعي لهذه البيانات وتحليل الصور والوجوه، ومن بينها «مايكروسوفت» و«آبل» و«فيسبوك» و«غوغل». واستطاعت خوارزمية (الخوارزمية هي نهج عمل برنامج ما لتحقيق الهدف المرغوب) GaussianFace التي طورها باحثون في جامعة هونغ كونغ الصينية في العام 2014 التفوق على قدرات التعرف البشرية، حيث استطاع النظام النجاح بالتعرف على الوجوه بنسبة 98.52 في المائة مقارنة بـ97.53 في المائة للتعرف البشري. واستطاعت «غوغل» في العام 2015 تحقيق نسبة 99.63 في المائة من التعرف الصحيح على الوجوه بعد مقارنتها بعدة صور وربط صاحب الصورة بصوره الأخرى، وهي تقنية تستخدمها الشركة في تطبيق Google Photos للصور في هواتفها الجوالة لفرزها وترتيبها وفقا للأشخاص الموجودين فيها.
وفي العام 2018، نشرت دائرة التقنية والعلوم التابعة لمركز الأمن القومي الأميركية نتائج اختبارات لـ12 تقنية للتعرف على الوجه، حصل أعلاها على نسبة 99.44 في المائة في أقل من 5 ثوان. وتم تطوير هذه التقنيات لدرجة أعلى، حيث بات بإمكانها التعرف على مشاعر صاحب الوجه من صورة ثابتة له، وتحديد ما إذا كان سعيدا أم غاضبا أم مضطربا أم حزينا أم خائفا، وغيرها من المشاعر الأخرى.
ولكن جميع هذه التقنيات تشترك باستخدامها لتقنيات الذكاء الصناعي والتعلم العميق من البيانات الواردة له. وينجم عن استخدام الذكاء الصناعي التقدم المستمر مع مرور الوقت وازدياد حجم عينة الصور التي تيم مطابقتها، حيث يتعلم الذكاء الصناعي من الأخطاء التي يرتكبها والتي يصححها له البشر، ومن النجاحات التي يقوم بها التي تعزز من إدراكه لآلية التحليل الصحيحة في كل حالة، مثل اختلاف تحليل وجوه السيدات عن الرجال، وأصحاب البشرة الداكنة مقارنة بالبشرة الفاتحة، وتقارب وجوه سكان جنوب شرقي آسيا من حيث الملامح، وتغير كمية الدهون الموجودة في وجوه المستخدمين بعد اكتساب أو فقدان الوزن، وغيرها من العوامل والمتغيرات الأخرى.
ونجم عن ذلك أن جميع الخوارزميات المستخدمة في الفترة بين 2013 و2018 كانت ذات نتائج أفضل مقارنة بخوارزميات الفترة الممتدة بين 2010 و2013. وللمقارنة، وجد تقرير للهيئة الوطنية الأميركية للمعايير والتقنية NIST صدر في العام 2018 بأن 0.2 في المائة من البحث من قاعدة بيانات يبلغ حجمها 26.6 مليون صورة كانت خاطئة، مقارنة بنسبة 4 في المائة في العام 2014 أي أن نسبة النجاح والتقدم قد ازدادت بنحو 20 ضعفا في 4 أعوام فقط.
استخدامات متنوعة
ويُتوقع أن يصل حجم سوق تقنيات التعرف على الوجوه إلى 7 مليارات دولار في العام 2024، وبنسبة نمو تبلغ 16 في المائة في الفترة بين عامي 2019 و2024. وللمقارنة، فإن حجم هذا السوق في العام الماضي كان 3.2 مليار دولار. وتتمحور كبرى الاستخدامات لهذه التقنية في المراقبة الأمنية للقطاع العام، مثل إصدار الوثائق الثبوتية، والحدود بين الدول، ودوريات الشرطة الأمنية، وللتعرف على هوية مرتكبي الحوادث الإجرامية والإرهابية من التسجيلات أو الصور الملتقطة. كما يمكن استخدامها في الطائرات المُسيّرة ذاتية القيادة Drones التي تستطيع حمل كاميرات بوزن 10 كيلوغرامات والتعرف على المشتبه بهم في التجمعات الكبيرة من مسافات تصل إلى 800 متر بعيدا عنهم وارتفاع 100 متر ومن زوايا مختلفة. ويمكن ربط هذه الطائرة المُسيّرة بكابل متصل بمصدر للطاقة على الأرض لتعمل لفترات طويلة جدا، مع نقلها للبيانات عبر كابلات متصلة بكومبيوترات على الأرض لحماية البيانات وضمان عدم اختراقها.
وبالحديث عن الأمن، فإن الصين تقود الدول التي تراقب المارة والمشاة باستخدام 200 مليون كاميرا مراقبة في العام 2018، مع خطتها لرفع العدد ليصل إلى 626 مليونا في العام 2020. ويبلغ معدل الكاميرات لكل ألف شخص في مدينة تشونغكنغ الصينية 168، بينما يبلغ العدد 68 لكل ألف شخص في لندن (الترتيب السادس)، وينخفض إلى 16 لكل ألف شخص في مدينة أتلانتا الأميركية (الترتيب العاشر). وتجدر الإشارة إلى أن 8 مدن من أصل أكثر 10 مدن استخداما لكاميرات المراقبة هي مدن صينية، إضافة إلى المدينتين المذكورتين. وثبتت مدينة موسكو 200 مليون كاميرا بنهاية العام 2019 تستطيع التعرف على وجوه المارة لرفع مستويات الأمن العام.
ويمكن أن يستفيد القطاع الصحي من هذه التقنيات من خلال تحليل وجه المستخدم والتعرف على تطور حالته المرضية أو تعافيه منها وفقا لملامح وجهه في الأمراض التي تظهر علاماتها على وجه المستخدم، إلى جانب قدرتها على التعرف على بعض الأمراض الجينية، واستخدامها خلال التخدير الموضعي في العمليات الجراحية للتعرف على حالة المريض وشعوره بالألم وتغيير جرعة المخدر فورا وفقا لتحليل النظام، وخصوصا لمرضى القلب الذين لا يمكنهم الحصول على جرعات كبيرة من المخدر.
ويمكن للمتاجر الاستفادة من هذه التقنيات بتحليل وجوه ومشاعر المستخدمين لدى المرور أمام منتجات معينة للتعرف ما إذا كانت تعجبهم أم لا، أو لتحديد هوية الزوار ومقارنتها بمن لديهم سجل إجرامي في سرقة المتاجر، وإخطار فريق الأمن في ذلك المتجر لمراقبة أولئك الزوار أكثر من غيرهم. كما يمكن استخدام هذه التقنية للتعرف على المنتجات التي تفضلها مجموعات مختلفة من المستخدمين، وفقا لجنسهم أو عمرهم أو عِرقهم، وذلك لتطوير ما يقدمه المتجر بشكل أفضل.
وسيتم استخدام هذه التقنيات في أولمبياد طوكيو هذا العام للتعرف على وجوه الناس والسماح لهم بالدخول إلى المناطق المرغوبة وفقا لتذاكرهم، وذلك لتسهيل مرورهم ورفع مستويات الأمان. وتقوم مدينة سيدني الأسترالية باختبار هذه التقنية في مطاراتها لتسريع مرور المسافرين عبر نقاط التفتيش الأمني.
مخاوف على الخصوصية
وفي ظل تقدم التقنية وجمع الحكومات لصور مواطنيها وزوارها، ووجود هجمات أمنية مستمرة على أجهزة القطاع الحكومي حول العالم، بدأت مخاوف الناس تتزايد حول إمكانية سرقة بياناتهم الحيوية التي تشمل بصمة وجههم، واستخدامها في سبل غير مشروعة التي قد تشمل تزييف الجرائم وربطها بأشخاص أبرياء.
وتمنع دول الاتحاد الأوروبي جمع المعلومات المرتبطة بالناس (بما في ذلك بصمة وجههم) والتحقيق في أمورهم الشخصية أو سفرهم دون الحصول على موافقتهم، وتعتبر ذلك خرقا لخصوصيتهم، مع منع السويد لاستخدام هذه التقنية في المدارس وتغريم من لا يمتثل منها. وفي الولايات المتحدة، تمنع 4 ولايات جمع البيانات الحيوية (واشنطن وتكساس وإلينوي وكاليفورنيا). ومن جهتها منعت مدينة سان فرنسيسكو استخدام تقنيات التعرف على الوجه على جميع المؤسسات الحكومية، إضافة إلى مدن سان دييغو وأوكلاند وسومرفيل، مع دراسة مدينة بورتلاند لمنع هذه التقنية أيضا في العام 2020، وقد تُوسّع نطاق المنع ليشمل المتاجر الخاصة وشركات الطيران ومواقع الفعاليات.

خداع تقنية التعرف على الوجوه
> انطلاقا من خوف المستخدمين على خصوصيتهم، استطاع شاب روسي تطوير خوارزمية تقترح وضع مساحيق التجميل بطرق وأنماط معينة تستطيع خداع خوارزميات التعرف على الوجه، ولكنه لم ينشرها حتى لا يستخدمها المجرمون. كما وطور شاب ألماني جهازا يستطيع حياكة أنسجة لارتدائها على الوجه بهدف خداع نظم المراقبة، مثل وضع شال يغطي الفم يحتوي على رسومات لعيني وشفاه. وكشفت مجلة «فوربس» عن وجود قدرة على إجراء تعديلات بسيطة على مربعات Pixel في الصور لخداع نظم المراقبة لا يمكن تحديدها بالعين البشرية ولكنها مربكة للخوارزميات.
ولتجاوز هذه الاختراقات، يعمل قطاع التعرف على الوجه على تطوير آلية لحماية النظم، والتي تشمل التأكد من أن صورة المستخدم مأخوذة وهو موجود أمام الكاميرا في تلك اللحظة، وليس من خلال صورة مطبوعة أو قناع، والتأكد من عدم دمج أجزاء من صور لأفراد مختلفين لإيجاد صورة جديدة لشخص وهمي، وخصوصا في صور جوازات السفر. ولكن الحل المثالي قد يكون باستخدام نظام هجين لا يعتمد على تقنيات التعرف على الوجه فقط، بل على مجموعة من العوامل، مثل الوجه وبصمة الإصبع وتسلسل إدخاله للمعلومات أو الإجابة عن سلسلة من الأسئلة بطريقته الفريدة، أو استخدام عنوانه في الإنترنت IP وموقعه الجغرافي (مثلما تقوم به شركات البطاقات الائتمانية لدى استخدام البطاقة في دولة جديدة ذات نسبة عالية في سرقة البطاقات أو بياناتها).



صاروخ إعادة البشر إلى القمر يُنقل لمنصة الإطلاق بفلوريدا

مركبة «أرتميس 2» الفضائية موجودة في الحجرة رقم 3 بمبنى تجميع المركبات بمركز كينيدي للفضاء في كيب كانافيرال (أ.ف.ب)
مركبة «أرتميس 2» الفضائية موجودة في الحجرة رقم 3 بمبنى تجميع المركبات بمركز كينيدي للفضاء في كيب كانافيرال (أ.ف.ب)
TT

صاروخ إعادة البشر إلى القمر يُنقل لمنصة الإطلاق بفلوريدا

مركبة «أرتميس 2» الفضائية موجودة في الحجرة رقم 3 بمبنى تجميع المركبات بمركز كينيدي للفضاء في كيب كانافيرال (أ.ف.ب)
مركبة «أرتميس 2» الفضائية موجودة في الحجرة رقم 3 بمبنى تجميع المركبات بمركز كينيدي للفضاء في كيب كانافيرال (أ.ف.ب)

نقلت وكالة الفضاء الأميركية (ناسا) صاروخها العملاق «إس إل إس»، الذي من المفترض أن يحمل روّاد فضاء إلى مدار القمر في أوّل مهمّة منذ أكثر من 50 سنة، إلى منصّة إطلاق لإجراء تجارب تمهيداً لرحلة «أرتيميس 2».

واستغرقت العمليّة، أمس (السبت)، نحو 12 ساعة، وتعدّ من الخطوات الأخيرة المتبقّية قبل إقلاع المهمّة المرتقب بين مطلع فبراير (شباط) وأواخر أبريل (نيسان).

ونقل الصاروخ الضخم الأبيض والبرتقالي فجراً من مبنى تركيب القطع في اتجاه مجمّع إطلاق الصواريخ «39 بي» في مركز كيندي الفضائي في فلوريدا حيث وصل عصراً، ومن المرتقب أن يخضع لسلسلة من الفحوص.

إن كانت النتائج مرضية، فسيكون في وسع الصاروخ الإقلاع بدءاً من السادس من فبراير، حسب التقديرات الأوّلية لـ«ناسا»، في مهمّة هي الأولى منذ «أبولو» في 1972 تحمل أربعة روّاد، ثلاثة أميركيين وكندي، إلى مدار القمر.

وقال جون هانيكات المشرف على برنامج الصاروخ خلال مؤتمر صحافي، الجمعة: «نحن بصدد كتابة التاريخ»، وفق ما أفادت «وكالة الصحافة الفرنسية».

صاروخ «ناسا» العملاق أرتميس «إس إل إس» في مركز كيندي الفضائي (أ.ف.ب)

«جعل المستحيل ممكناً»

حضر الروّاد الأربعة، وهم ريد وايزمن وكريستينا هاموك كوك وفيكتور غلوفر وجيريمي هانسن، عمليّة نقل الصاروخ، السبت.

ومع كبسولة «أوريون» التي سيتمركز فيها الروّاد، يبلغ طول الصاروخ 98 متراً، أي أنّه أعلى من تمثال الحرّية، لكنه أقصر بقليل من صاروخ «ساتورن 5» الذي نقل مهمّات «أبولو» المأهولة إلى القمر والممتدّ على 110 أمتار.

وقال الرائد الكندي جيريمي هانسن في تصريحات للإعلام: «أنا متحمّس جدّاً. وفي خلال أسابيع قليلة، ستشهدون على تحليق أربعة أشخاص في مدار القمر. وإن كنّا قادرين على أمر مماثل اليوم، فتخيّلوا ما سيكون في وسعنا فعله غداً». وصرّح زميله فيكتور غلوفر: «نبذل ما في وسعنا لجعل المستحيل ممكناً».

ومن المفترض أن تمتدّ هذه المهمّة نحو عشرة أيّام يدور خلالها الطاقم حول القمر، تمهيداً للرحلة المقبلة التي ستشكّل العودة المنتظرة للبشر إلى سطح القمر بهدف إقامة وجود دائم هذه المرّة.

صاروخ أرتميس العملاق «إس إل إس» التابع لشركة «ناسا» في مركز كيندي الفضائي (أ.ف.ب)

لكن هذه المهمّة تشكّل في ذاتها سابقة على مستويات عدّة. فهي أوّل رحلة إلى مدار القمر تشارك فيها امرأة ورائد غير أبيض وآخر غير أميركي.

«سباق ثان إلى الفضاء»

وقبل الانطلاق، يتحقّق مهندسو «ناسا» من أمن الصاروخ ومتانته. ومن المفترض إجراء سلسلة من الفحوص قبل تدريب عام على عملية محاكاة.

وأطلقت مهمّة «أرتيميس 1» غير المأهولة في نوفمبر (تشرين الثاني) 2022 بعد عدّة تأجيلات ومحاولتين سابقتين غير ناجحتين.

ويهدف برنامج «أرتيميس» الذي كشف عنه النقاب خلال الولاية الأولى لدونالد ترمب إلى إقامة وجود بشري دائم على القمر في نهاية المطاف، والتمهيد لرحلات مقبلة نحو المريخ، لكنه تعرض لتأخيرات كثيرة في السنوات الأخيرة، غير أن «ناسا» أحدثت مفاجأة في أواخر 2025 مع إعلانها عن احتمال إطلاق «أرتيميس 2» في «مطلع فبراير» بدلاً من أبريل.

وقد يعزى تقريب الموعد إلى ضغوط من إدارة ترمب الطامعة بكسب «سباق ثان إلى الفضاء» ضدّ بكين بعد ذاك الذي تواجهت فيه الولايات المتحدة مع الاتحاد السوفياتي إبّان الحرب الباردة.

وبات محور المنافسة اليوم إرسال البشر إلى القمر بحلول 2030 وإقامة قاعدة على سطحه. ومن المرتقب أن يتمّ تأجيل مهمّة «أرتيميس 3» المحدّد موعدها راهناً في منتصف 2027. ويشير خبراء الملاحة الفضائية إلى أن جهاز الهبوط على القمر الذي طوّرته شركة «سبايس إكس»، التابعة لإيلون ماسك، غير جاهز بعد، ما يؤشّر إلى أن الصين قد تسحب البساط من تحت قدمي الولايات المتحدة.


«تشات جي بي تي» يستعد لعرض إعلانات بناءً على محادثات المستخدمين

شعار تطبيق «تشات جي بي تي» (رويترز)
شعار تطبيق «تشات جي بي تي» (رويترز)
TT

«تشات جي بي تي» يستعد لعرض إعلانات بناءً على محادثات المستخدمين

شعار تطبيق «تشات جي بي تي» (رويترز)
شعار تطبيق «تشات جي بي تي» (رويترز)

قد يبدأ تطبيق الدردشة المدعم بالذكاء الاصطناعي «تشات جي بي تي» قريباً بعرض إعلانات لمنتجات وخدمات يُرجّح أنها تهم المستخدمين، وذلك استناداً إلى طبيعة محادثاتهم مع المنصة.

وأعلنت شركة «أوبن إيه آي»، أمس (الجمعة)، أنها ستختبر هذه الإعلانات في النسخة المجانية من تطبيق «تشات جي بي تي» للمستخدمين البالغين المسجلين في الولايات المتحدة. كما كشفت عن إطلاق باقة اشتراك جديدة تحمل اسم «Go» بسعر 8 دولارات شهرياً، تتضمن بعض الميزات المحسّنة، مثل ذاكرة أكبر وإمكانات أوسع لإنشاء الصور، وبسعر أقل من باقتي «Plus» (20 دولاراً شهرياً) و«Pro» (200 دولار شهرياً).

وبحسب شبكة «سي إن إن»، سيشاهد مشتركو باقة «Go» أيضاً إعلانات داخل الخدمة، في حين لن تُعرض أي إعلانات لمشتركي باقتي «Plus» و«Pro»، ولا لعملاء «أوبن إيه آي» من الشركات.

وكان سام ألتمان، الرئيس التنفيذي لشركة «أوبن إيه آي»، قد أعرب في وقت سابق، عن تحفظاته إزاء إدخال الإعلانات إلى «تشات جي بي تي». غير أن هذه الخطوة تأتي في سياق سعي الشركة الحثيث إلى إيجاد مصادر جديدة لزيادة الإيرادات من قاعدة مستخدميها التي تُقدَّر بنحو 800 مليون مستخدم شهرياً، وذلك للمساعدة في تغطية تكلفة البنية التحتية للذكاء الاصطناعي، التي تعتزم الشركة استثمار نحو 1.4 تريليون دولار فيها على مدى السنوات الثماني المقبلة.

وفي هذا السياق، قال ألتمان في نوفمبر (تشرين الثاني) الماضي، إن «أوبن إيه آي» تتوقع إنهاء عام 2025 بإيرادات سنوية تقارب 20 مليار دولار.

وكانت الشركة قد أطلقت العام الماضي، أداة تُعرف باسم «الدفع الفوري»، تتيح للمستخدمين شراء المنتجات مباشرةً من متاجر تجزئة مثل «وول مارت» و«إتسي» عبر «تشات جي بي تي». كما قدّمت أدوات في مجالات الصحة والتعليم وغيرها، في إطار مساعيها لجعل «تشات جي بي تي» جزءاً أساسياً من الحياة اليومية للمستخدمين، وربما تحفيزهم على الترقية إلى اشتراكات مدفوعة.

وقد تُثبت الإعلانات أنها استراتيجية مربحة لشركة «أوبن إيه آي»، إذ يمكن استغلال المعلومات المستخلصة من محادثات المستخدمين مع «تشات جي بي تي» لإنشاء إعلانات عالية الاستهداف. فعلى سبيل المثال، إذا طلب أحد المستخدمين المساعدة في التخطيط لرحلة، فقد تظهر له إعلانات متعلقة بفنادق أو أنشطة ترفيهية في الوجهة المقصودة.

وكجزء من هذا الاختبار، ستظهر الإعلانات أسفل إجابات «تشات جي بي تي» على استفسارات المستخدمين، مع تصنيفها بوضوح على أنها «إعلانات ممولة». وأكدت «أوبن إيه آي» أن هذه الإعلانات لن تؤثر في محتوى إجابات «تشات جي بي تي»، مشددة على أن المستخدمين «يجب أن يثقوا بأن الإجابات تستند إلى ما هو مفيد موضوعياً».

كما أوضحت الشركة أنها لن تبيع بيانات المستخدمين أو محادثاتهم للمعلنين، مؤكدةً أن بإمكان المستخدمين تعطيل تخصيص الإعلانات المبنية على محادثاتهم في أي وقت.


دراسة جديدة تكشف حدود الذكاء الاصطناعي في إنجاز مشاريع العمل عن بُعد

الدراسة تقدم «مؤشر العمل عن بُعد» كأول مقياس واقعي لقدرة الذكاء الاصطناعي على إنجاز مشاريع عمل حقيقية متكاملة (شاترستوك)
الدراسة تقدم «مؤشر العمل عن بُعد» كأول مقياس واقعي لقدرة الذكاء الاصطناعي على إنجاز مشاريع عمل حقيقية متكاملة (شاترستوك)
TT

دراسة جديدة تكشف حدود الذكاء الاصطناعي في إنجاز مشاريع العمل عن بُعد

الدراسة تقدم «مؤشر العمل عن بُعد» كأول مقياس واقعي لقدرة الذكاء الاصطناعي على إنجاز مشاريع عمل حقيقية متكاملة (شاترستوك)
الدراسة تقدم «مؤشر العمل عن بُعد» كأول مقياس واقعي لقدرة الذكاء الاصطناعي على إنجاز مشاريع عمل حقيقية متكاملة (شاترستوك)

أعاد التطور السريع في تقنيات الذكاء الاصطناعي طرح أسئلة قديمة متجددة حول الأتمتة ومستقبل العمل. فمن تطوير البرمجيات إلى إنتاج المحتوى، باتت أنظمة الذكاء الاصطناعي تُظهر قدرات لافتة في الاختبارات البحثية والمعايير التقنية. لكن فجوة أساسية ما زالت قائمة تتعلق بقدرة هذه الأنظمة على تنفيذ أعمال حقيقية ذات قيمة اقتصادية، كما هي مطلوبة في سوق العمل الفعلي.

دراسة جديدة تسعى للإجابة عن هذا السؤال عبر إطار قياس مبتكر يُعرف باسم «مؤشر العمل عن بُعد» (Remote Labor Index – RLI)، وهو أول معيار تجريبي يقيس بشكل منهجي قدرة وكلاء الذكاء الاصطناعي على أتمتة مشاريع عمل متكاملة مأخوذة من أسواق العمل الحر الحقيقية. وتأتي النتائج مفاجئة، وأكثر واقعية مما توحي به كثير من السرديات المتداولة حول قرب الاستغناء عن الوظائف البشرية.

ما بعد المعايير الاصطناعية

تركز معظم اختبارات الذكاء الاصطناعي الحالية على مهام محددة أو معزولة ككتابة شيفرات قصيرة أو الإجابة عن أسئلة تقنية أو تصفح الإنترنت أو تنفيذ أوامر حاسوبية مبسطة. ورغم أهمية هذه المعايير، فإنها غالباً لا تعكس التعقيد والتكامل والغموض الذي يميز العمل المهني الحقيقي.

من هنا جاء تطوير «مؤشر العمل عن بُعد»، الذي لا يختبر مهارات منفصلة، بل يقيس قدرة أنظمة الذكاء الاصطناعي على إنجاز مشاريع كاملة من البداية إلى النهاية، تماماً كما تُسند إلى محترفين يعملون لحساب عملاء حقيقيين. وتشمل هذه المشاريع مجالات مثل التصميم والهندسة المعمارية وإنتاج الفيديو وتحليل البيانات وتطوير الألعاب وإعداد الوثائق وغيرها من أشكال العمل عن بُعد التي تشكل جوهر الاقتصاد الرقمي المعاصر. وبهذا، تنقل الدراسة النقاش من مستوى القدرات النظرية إلى مستوى الأداء الفعلي القابل للقياس في السوق.

نتائج المؤشر تظهر أن الذكاء الاصطناعي ما زال عاجزاً عن أتمتة معظم مشاريع العمل عن بُعد بمستوى مهني مقبول (غيتي)

قياس مؤشر العمل عن بُعد

تتكون قاعدة بيانات المؤشر من 240 مشروع عمل حر مكتمل، يحتوي كل مشروع على ثلاثة عناصر رئيسية هي وصف تفصيلي للمهمة والملفات المدخلة اللازمة لتنفيذها ومخرجات نهائية أنجزها محترفون بشريون باعتبارها مرجعاً قياسياً. ولم تكتفِ الدراسة بالمخرجات فقط، بل جمعت أيضاً بيانات عن الوقت والتكلفة اللازمين لتنفيذ كل مشروع. وقد استغرق إنجاز المشروع الواحد، في المتوسط، نحو 29 ساعة من العمل البشري، بينما تجاوزت بعض المشاريع حاجز 100 ساعة. وتراوحت تكاليف المشاريع بين أقل من 10 دولارات وأكثر من 10 آلاف دولار، بإجمالي قيمة تتجاوز 140 ألف دولار وأكثر من 6 آلاف ساعة عمل فعلي.

ويعكس هذا التنوع والتعقيد المتعمد طبيعة العمل الحقيقي، بعيداً عن المهام المبسطة أو المتخصصة.

تقييم أداء الذكاء الاصطناعي

اختبر الباحثون عدة نماذج متقدمة من وكلاء الذكاء الاصطناعي باستخدام عملية تقييم بشرية دقيقة حيث مُنحت الأنظمة نفس أوصاف المشاريع والملفات التي حصل عليها المحترفون، وطُلب منها إنتاج مخرجات كاملة. ثم قام مقيمون مدربون بمقارنة نتائج الذكاء الاصطناعي بالمخرجات البشرية المرجعية، مع التركيز على سؤال جوهري يتعلق بمدى قبول العميل الحقيقي لهذا العمل باعتباره مكافئاً أو أفضل من عمل محترف بشري.

المقياس الأساسي في الدراسة هو «معدل الأتمتة» أي النسبة المئوية للمشاريع التي نجح الذكاء الاصطناعي في إنجازها بمستوى احترافي مقبول. كما استخدمت الدراسة نظام تصنيف شبيهاً بنظام «إيلو» لإجراء مقارنات دقيقة بين النماذج المختلفة، حتى في الحالات التي لم تصل فيها أي منها إلى مستوى الأداء البشري.

الأتمتة ما زالت محدودة جداً

على الرغم من التطورات الكبيرة في قدرات التفكير والتعامل متعدد الوسائط، تكشف النتائج أن أنظمة الذكاء الاصطناعي الحالية ما تزال بعيدة عن أتمتة العمل عن بُعد بشكل واسع. فقد بلغ أعلى معدل أتمتة تحقق 2.5 في المائة فقط، أي أن أقل من ثلاثة مشاريع من كل مائة وصلت إلى مستوى مقبول مقارنة بالعمل البشري. وتتحدى هذه النتيجة الافتراض السائد بأن التحسن في المعايير التقنية يعني بالضرورة قدرة فورية على استبدال العمل البشري. فحتى النماذج المتقدمة القادرة على كتابة الشيفرات أو توليد الصور والنصوص، غالباً ما تفشل عندما يُطلب منها دمج مهارات متعددة، أو الالتزام بتفاصيل معقدة أو تسليم ملفات متكاملة بجودة احترافية.

مستقبل العمل القريب يتجه نحو دعم الإنتاجية البشرية بالذكاء الاصطناعي بدلاً من استبدال الوظائف بالكامل (شاترستوك)

تعثر الذكاء الاصطناعي... ونجاحه

يكشف التحليل النوعي لأسباب الفشل عن مشكلات متكررة، أبرزها أخطاء تقنية أساسية مثل ملفات تالفة أو غير قابلة للاستخدام أو صيغ غير صحيحة أو مخرجات ناقصة وغير متسقة. وفي حالات أخرى، كانت المشاريع مكتملة شكلياً لكنها لا ترقى إلى المستوى المهني المتوقع في سوق العمل الحر.

في المقابل، رصدت الدراسة مجالات محدودة أظهر فيها الذكاء الاصطناعي أداءً أفضل نسبياً، لا سيما في المهام التي تتركز على معالجة النصوص أو توليد الصور أو التعامل مع الصوت كبعض أعمال التحرير الصوتي والتصميم البصري البسيط وكتابة التقارير وتصور البيانات المعتمد على الشيفرة البرمجية. وتشير هذه النتائج إلى أن الذكاء الاصطناعي يلعب بالفعل دوراً داعماً في بعض أنواع العمل، وإن لم يصل بعد إلى مرحلة الأتمتة الكاملة.

قياس التقدم دون تهويل

رغم انخفاض معدلات الأتمتة المطلقة، يُظهر المؤشر تحسناً نسبياً واضحاً بين النماذج المختلفة. فتصنيفات «إيلو» وهي نظام رياضي لتقييم الأداء النسبي، تشير إلى أن الأنظمة الأحدث تتفوق بشكل منهجي على سابقاتها، ما يعني أن التقدم حقيقي وقابل للقياس، حتى وإن لم يترجم بعد إلى إنجاز مشاريع كاملة. وتكمن قيمة «مؤشر العمل عن بُعد» في كونه أداة طويلة الأمد لمتابعة التطور، بعيداً عن التوقعات المبالغ فيها أو الأحكام الثنائية.

تشير نتائج الدراسة إلى أن الاستغناء الواسع عن العاملين في وظائف العمل عن بُعد ليس وشيكاً في الوقت الراهن. وبدلاً من ذلك، يُرجّح أن يكون الأثر القريب للذكاء الاصطناعي متمثلاً في تعزيز الإنتاجية على مستوى المهام، لا استبدال الوظائف بالكامل.

وسيظل الحكم البشري والقدرة على الدمج وضبط الجودة عناصر مركزية في العمل المهني. ومع ذلك، تحذر الدراسة من أن الذكاء الاصطناعي يختلف عن تقنيات الأتمتة السابقة؛ إذ يسعى إلى محاكاة قدرات معرفية عامة. وإذا تمكنت الأنظمة المستقبلية من سد الفجوة التي يكشفها المؤشر دون التكيّف المصطنع معه، فقد تكون الآثار على سوق العمل أعمق بكثير.

خط أساس جديد للنقاش

لا تدّعي هذه الدراسة التنبؤ بالمستقبل، لكنها تقدم خط أساس علمي وعملي لفهم موقع الذكاء الاصطناعي اليوم. ومن خلال ربط التقييم بعمل حقيقي وتكلفة فعلية ومعايير مهنية واقعية، تضع إطاراً أكثر دقة لنقاشات الأتمتة والعمل. ومع استمرار تطور الذكاء الاصطناعي، ستصبح أدوات مثل «مؤشر العمل عن بُعد» ضرورية للفصل بين التقدم الحقيقي والضجيج الإعلامي، وضمان أن يُبنى النقاش حول مستقبل العمل على الأدلة لا الافتراضات.