تقنيات متطورة للتعرف على الوجوه

تصمم بنظم الذكاء الصناعي والتعلم العميق وتوظّف في استخدامات أمنية وطبية وتجارية

تطور كبير في تقنيات التعرف على الوجوه مع مرور الزمن
تطور كبير في تقنيات التعرف على الوجوه مع مرور الزمن
TT

تقنيات متطورة للتعرف على الوجوه

تطور كبير في تقنيات التعرف على الوجوه مع مرور الزمن
تطور كبير في تقنيات التعرف على الوجوه مع مرور الزمن

بعد بدء انتشار تقنيات التزييف العميق DeepFake في العام 2019 بدأت المخاوف تزداد حول تقنيات التعرف على الوجه والآفاق الضارة التي يمكن استخدامها فيها. وعلى الرغم من وجود هذه التقنية في الكثير من الهواتف الجوالة والكومبيوترات المحمولة، فإننا سنركز على الجانب الذي يتطلب تحليلا لملايين الصور والذي يُعتبر أكثر تقدما ويقدم نتائج أكثر دقة.
تحليل الوجه
> ما هي تقنيات التعرف على الوجه؟
تعمل تقنيات التعرف على الوجه بتحليل الوجه البشري في الصور، ومن ثم تحويل ذلك إلى بيانات رقمية وفقا لمزايا موجودة في كل وجه (مثل المسافة بين العينين، وطول الأنف، وشكل محيط الشفاه، وتباعد الأذنين وعرض الذقن، وغيرها)، ومن ثم مطابقة الوجه مع صورة لصاحب الجهاز إن كان فردا، أو مع صور في قاعدة بيانات للوجوه في القطاعات الأخرى. ويمكن استخدام هذه التقنية للتعرف على شخصية صاحب الوجه أو للتأكد من أنه يمتلك الصلاحيات الكافية للدخول إلى موقع ما أو استخدام جهاز ما. وتتم هذه العملية في أجزاء من الثانية، وصولا إلى بضع ثوان وفقا لدرجة التحليل التي يقوم بها النظام.
ولكن لمَ انتشرت هذه التقنية أكثر من تقنيات التعرف الأخرى، مثل بصمة العين والإصبع ونبرة الصوت، وغيرها؟ يعود السبب إلى سهولة قراءة بيانات الوجه عن بُعد مقارنة ببصمة العين أو الإصبع، ناهيك عن الضجيج المصاحب للتعرف على نبرة الصوت في المناطق العامة، وسهولة تغيّر هذه العوامل، مثل احتراق بصمة إصبع المستخدم، أو إصابته بالزكام أو وجود فيروس أدى إلى حدوث التهاب في العين، وغيرها. ومن السهل استخدام هذه التقنية لمراقبة المشاة والتعرف على زوار المتاجر بسهولة، وخصوصا في حالات الاعتداءات أو السرقة مقارنة بضرورة وجود المجرم بالقرب من جهاز ما للتعرف على بصمة إصبعه أو عينه أو نبرة صوته.
تطور التقنية
ويعمل الكثير من كبرى الشركات على أبحاث في هذا المجال وتنشر اكتشافاتها النظرية فيما يتعلق بتحليل الذكاء الصناعي لهذه البيانات وتحليل الصور والوجوه، ومن بينها «مايكروسوفت» و«آبل» و«فيسبوك» و«غوغل». واستطاعت خوارزمية (الخوارزمية هي نهج عمل برنامج ما لتحقيق الهدف المرغوب) GaussianFace التي طورها باحثون في جامعة هونغ كونغ الصينية في العام 2014 التفوق على قدرات التعرف البشرية، حيث استطاع النظام النجاح بالتعرف على الوجوه بنسبة 98.52 في المائة مقارنة بـ97.53 في المائة للتعرف البشري. واستطاعت «غوغل» في العام 2015 تحقيق نسبة 99.63 في المائة من التعرف الصحيح على الوجوه بعد مقارنتها بعدة صور وربط صاحب الصورة بصوره الأخرى، وهي تقنية تستخدمها الشركة في تطبيق Google Photos للصور في هواتفها الجوالة لفرزها وترتيبها وفقا للأشخاص الموجودين فيها.
وفي العام 2018، نشرت دائرة التقنية والعلوم التابعة لمركز الأمن القومي الأميركية نتائج اختبارات لـ12 تقنية للتعرف على الوجه، حصل أعلاها على نسبة 99.44 في المائة في أقل من 5 ثوان. وتم تطوير هذه التقنيات لدرجة أعلى، حيث بات بإمكانها التعرف على مشاعر صاحب الوجه من صورة ثابتة له، وتحديد ما إذا كان سعيدا أم غاضبا أم مضطربا أم حزينا أم خائفا، وغيرها من المشاعر الأخرى.
ولكن جميع هذه التقنيات تشترك باستخدامها لتقنيات الذكاء الصناعي والتعلم العميق من البيانات الواردة له. وينجم عن استخدام الذكاء الصناعي التقدم المستمر مع مرور الوقت وازدياد حجم عينة الصور التي تيم مطابقتها، حيث يتعلم الذكاء الصناعي من الأخطاء التي يرتكبها والتي يصححها له البشر، ومن النجاحات التي يقوم بها التي تعزز من إدراكه لآلية التحليل الصحيحة في كل حالة، مثل اختلاف تحليل وجوه السيدات عن الرجال، وأصحاب البشرة الداكنة مقارنة بالبشرة الفاتحة، وتقارب وجوه سكان جنوب شرقي آسيا من حيث الملامح، وتغير كمية الدهون الموجودة في وجوه المستخدمين بعد اكتساب أو فقدان الوزن، وغيرها من العوامل والمتغيرات الأخرى.
ونجم عن ذلك أن جميع الخوارزميات المستخدمة في الفترة بين 2013 و2018 كانت ذات نتائج أفضل مقارنة بخوارزميات الفترة الممتدة بين 2010 و2013. وللمقارنة، وجد تقرير للهيئة الوطنية الأميركية للمعايير والتقنية NIST صدر في العام 2018 بأن 0.2 في المائة من البحث من قاعدة بيانات يبلغ حجمها 26.6 مليون صورة كانت خاطئة، مقارنة بنسبة 4 في المائة في العام 2014 أي أن نسبة النجاح والتقدم قد ازدادت بنحو 20 ضعفا في 4 أعوام فقط.
استخدامات متنوعة
ويُتوقع أن يصل حجم سوق تقنيات التعرف على الوجوه إلى 7 مليارات دولار في العام 2024، وبنسبة نمو تبلغ 16 في المائة في الفترة بين عامي 2019 و2024. وللمقارنة، فإن حجم هذا السوق في العام الماضي كان 3.2 مليار دولار. وتتمحور كبرى الاستخدامات لهذه التقنية في المراقبة الأمنية للقطاع العام، مثل إصدار الوثائق الثبوتية، والحدود بين الدول، ودوريات الشرطة الأمنية، وللتعرف على هوية مرتكبي الحوادث الإجرامية والإرهابية من التسجيلات أو الصور الملتقطة. كما يمكن استخدامها في الطائرات المُسيّرة ذاتية القيادة Drones التي تستطيع حمل كاميرات بوزن 10 كيلوغرامات والتعرف على المشتبه بهم في التجمعات الكبيرة من مسافات تصل إلى 800 متر بعيدا عنهم وارتفاع 100 متر ومن زوايا مختلفة. ويمكن ربط هذه الطائرة المُسيّرة بكابل متصل بمصدر للطاقة على الأرض لتعمل لفترات طويلة جدا، مع نقلها للبيانات عبر كابلات متصلة بكومبيوترات على الأرض لحماية البيانات وضمان عدم اختراقها.
وبالحديث عن الأمن، فإن الصين تقود الدول التي تراقب المارة والمشاة باستخدام 200 مليون كاميرا مراقبة في العام 2018، مع خطتها لرفع العدد ليصل إلى 626 مليونا في العام 2020. ويبلغ معدل الكاميرات لكل ألف شخص في مدينة تشونغكنغ الصينية 168، بينما يبلغ العدد 68 لكل ألف شخص في لندن (الترتيب السادس)، وينخفض إلى 16 لكل ألف شخص في مدينة أتلانتا الأميركية (الترتيب العاشر). وتجدر الإشارة إلى أن 8 مدن من أصل أكثر 10 مدن استخداما لكاميرات المراقبة هي مدن صينية، إضافة إلى المدينتين المذكورتين. وثبتت مدينة موسكو 200 مليون كاميرا بنهاية العام 2019 تستطيع التعرف على وجوه المارة لرفع مستويات الأمن العام.
ويمكن أن يستفيد القطاع الصحي من هذه التقنيات من خلال تحليل وجه المستخدم والتعرف على تطور حالته المرضية أو تعافيه منها وفقا لملامح وجهه في الأمراض التي تظهر علاماتها على وجه المستخدم، إلى جانب قدرتها على التعرف على بعض الأمراض الجينية، واستخدامها خلال التخدير الموضعي في العمليات الجراحية للتعرف على حالة المريض وشعوره بالألم وتغيير جرعة المخدر فورا وفقا لتحليل النظام، وخصوصا لمرضى القلب الذين لا يمكنهم الحصول على جرعات كبيرة من المخدر.
ويمكن للمتاجر الاستفادة من هذه التقنيات بتحليل وجوه ومشاعر المستخدمين لدى المرور أمام منتجات معينة للتعرف ما إذا كانت تعجبهم أم لا، أو لتحديد هوية الزوار ومقارنتها بمن لديهم سجل إجرامي في سرقة المتاجر، وإخطار فريق الأمن في ذلك المتجر لمراقبة أولئك الزوار أكثر من غيرهم. كما يمكن استخدام هذه التقنية للتعرف على المنتجات التي تفضلها مجموعات مختلفة من المستخدمين، وفقا لجنسهم أو عمرهم أو عِرقهم، وذلك لتطوير ما يقدمه المتجر بشكل أفضل.
وسيتم استخدام هذه التقنيات في أولمبياد طوكيو هذا العام للتعرف على وجوه الناس والسماح لهم بالدخول إلى المناطق المرغوبة وفقا لتذاكرهم، وذلك لتسهيل مرورهم ورفع مستويات الأمان. وتقوم مدينة سيدني الأسترالية باختبار هذه التقنية في مطاراتها لتسريع مرور المسافرين عبر نقاط التفتيش الأمني.
مخاوف على الخصوصية
وفي ظل تقدم التقنية وجمع الحكومات لصور مواطنيها وزوارها، ووجود هجمات أمنية مستمرة على أجهزة القطاع الحكومي حول العالم، بدأت مخاوف الناس تتزايد حول إمكانية سرقة بياناتهم الحيوية التي تشمل بصمة وجههم، واستخدامها في سبل غير مشروعة التي قد تشمل تزييف الجرائم وربطها بأشخاص أبرياء.
وتمنع دول الاتحاد الأوروبي جمع المعلومات المرتبطة بالناس (بما في ذلك بصمة وجههم) والتحقيق في أمورهم الشخصية أو سفرهم دون الحصول على موافقتهم، وتعتبر ذلك خرقا لخصوصيتهم، مع منع السويد لاستخدام هذه التقنية في المدارس وتغريم من لا يمتثل منها. وفي الولايات المتحدة، تمنع 4 ولايات جمع البيانات الحيوية (واشنطن وتكساس وإلينوي وكاليفورنيا). ومن جهتها منعت مدينة سان فرنسيسكو استخدام تقنيات التعرف على الوجه على جميع المؤسسات الحكومية، إضافة إلى مدن سان دييغو وأوكلاند وسومرفيل، مع دراسة مدينة بورتلاند لمنع هذه التقنية أيضا في العام 2020، وقد تُوسّع نطاق المنع ليشمل المتاجر الخاصة وشركات الطيران ومواقع الفعاليات.

خداع تقنية التعرف على الوجوه
> انطلاقا من خوف المستخدمين على خصوصيتهم، استطاع شاب روسي تطوير خوارزمية تقترح وضع مساحيق التجميل بطرق وأنماط معينة تستطيع خداع خوارزميات التعرف على الوجه، ولكنه لم ينشرها حتى لا يستخدمها المجرمون. كما وطور شاب ألماني جهازا يستطيع حياكة أنسجة لارتدائها على الوجه بهدف خداع نظم المراقبة، مثل وضع شال يغطي الفم يحتوي على رسومات لعيني وشفاه. وكشفت مجلة «فوربس» عن وجود قدرة على إجراء تعديلات بسيطة على مربعات Pixel في الصور لخداع نظم المراقبة لا يمكن تحديدها بالعين البشرية ولكنها مربكة للخوارزميات.
ولتجاوز هذه الاختراقات، يعمل قطاع التعرف على الوجه على تطوير آلية لحماية النظم، والتي تشمل التأكد من أن صورة المستخدم مأخوذة وهو موجود أمام الكاميرا في تلك اللحظة، وليس من خلال صورة مطبوعة أو قناع، والتأكد من عدم دمج أجزاء من صور لأفراد مختلفين لإيجاد صورة جديدة لشخص وهمي، وخصوصا في صور جوازات السفر. ولكن الحل المثالي قد يكون باستخدام نظام هجين لا يعتمد على تقنيات التعرف على الوجه فقط، بل على مجموعة من العوامل، مثل الوجه وبصمة الإصبع وتسلسل إدخاله للمعلومات أو الإجابة عن سلسلة من الأسئلة بطريقته الفريدة، أو استخدام عنوانه في الإنترنت IP وموقعه الجغرافي (مثلما تقوم به شركات البطاقات الائتمانية لدى استخدام البطاقة في دولة جديدة ذات نسبة عالية في سرقة البطاقات أو بياناتها).



ميزة جديدة في «شات جي بي تي» تُخطر المقربين عند الأزمات النفسية

عبارة «مرحباً بكم في أوبن إيه آي» تظهر على الصفحة الرئيسية لـ«شات جي بي تي» (د.ب.أ)
عبارة «مرحباً بكم في أوبن إيه آي» تظهر على الصفحة الرئيسية لـ«شات جي بي تي» (د.ب.أ)
TT

ميزة جديدة في «شات جي بي تي» تُخطر المقربين عند الأزمات النفسية

عبارة «مرحباً بكم في أوبن إيه آي» تظهر على الصفحة الرئيسية لـ«شات جي بي تي» (د.ب.أ)
عبارة «مرحباً بكم في أوبن إيه آي» تظهر على الصفحة الرئيسية لـ«شات جي بي تي» (د.ب.أ)

ضمن خطوة تعكس تنامي الاهتمام بسلامة المستخدمين في الفضاء الرقمي، أعلنت «أوبن إيه آي» عن إطلاق ميزة أمان جديدة ضمن تطبيق «شات جي بي تي»، تهدف إلى التدخل المبكر في حالات الطوارئ المرتبطة بالصحة النفسية. وتأتي هذه المبادرة استجابةً لمخاوف متزايدة بشأن تأثير تقنيات الذكاء الاصطناعي على المستخدمين، لا سيما في الظروف النفسية الحساسة؛ إذ تسعى إلى ربط الدعم الرقمي بالدعم الواقعي من خلال إشعار أشخاص موثوقين عند الحاجة.

ووفقاً لما أوردته صحيفة «إندبندنت»، تتيح ميزة «جهة الاتصال الموثوقة» للمستخدمين، اختيار شخص من الأصدقاء أو أفراد العائلة، ليتم إخطاره في حال أظهرت محادثاتهم مع النظام إشارات إلى إيذاء النفس، أو التفكير في الانتحار.

ويأتي هذا التحديث في سياق تزايد القلق حيال أدوات الذكاء الاصطناعي؛ مثل «شات جي بي تي»، التي يرى بعض المنتقدين أنها قد تسهم في تفاقم حالات الهوس أو الذهان، أو حتى المخاطر المرتبطة بالحياة.

وكشفت «أوبن إيه آي» العام الماضي، أن نحو 0.07 في المائة من المستخدمين المنتظمين لـ«شات جي بي تي»، أظهروا مؤشرات على «حالات طوارئ نفسية مرتبطة بالذهان أو الهوس». ومع وجود ما يقارب 900 مليون مستخدم نشط أسبوعياً، فإن هذه النسبة تعادل أكثر من نصف مليون شخص.

كما أفاد 0.15 في المائة من المستخدمين - أي ما يقارب 1.3 مليون شخص - بأنهم عبّروا عن مخاطر تتعلق بإيذاء النفس أو التفكير في الانتحار، وهو ما يعكس حجم التحدي الذي تحاول هذه الميزة الجديدة التعامل معه.

وتعتمد الخاصية المستحدثة على أنظمة مراقبة آلية داخل «شات جي بي تي»، ترصد الأنماط والسلوكيات التي قد تشير إلى وجود خطر حقيقي يهدد سلامة المستخدم. وعند اكتشاف مثل هذه المؤشرات، يتولى فريق متخصص مراجعة سجل المحادثات لتقييم الحالة، وتحديد ما إذا كان ينبغي إخطار «جهة الاتصال الموثوقة» للتدخل، أم لا.

وفي هذا السياق، قال آرثر إيفانز، الرئيس التنفيذي للجمعية الأميركية لعلم النفس: «يُظهر علم النفس باستمرار أن التواصل الاجتماعي يُعدّ عاملاً وقائياً قوياً، خصوصاً خلال فترات الضيق النفسي». وأضاف: «إن مساعدة الأفراد في تحديد شخص موثوق به مسبقاً، مع الحفاظ على استقلاليتهم وحقهم في الاختيار، يمكن أن يُسهّل وصولهم إلى الدعم في العالم الحقيقي عندما يكونون في أمسّ الحاجة إليه».

وتُبنى ميزة «جهة الاتصال الموثوقة» على منظومة الأمان الحالية في «شات جي بي تي»، التي تشمل أيضاً تقديم معلومات حول خطوط المساعدة المحلية عندما تشير التفاعلات إلى أن المستخدم يمرّ بأزمة نفسية


بحث يحذر: محادثاتك مع الذكاء الاصطناعي قد لا تكون بالخصوصية التي تعتقدها

الدراسة تقول إن بعض منصات الذكاء الاصطناعي ترسل بيانات محادثات إلى أدوات تتبع خارجية (د.ب.أ)
الدراسة تقول إن بعض منصات الذكاء الاصطناعي ترسل بيانات محادثات إلى أدوات تتبع خارجية (د.ب.أ)
TT

بحث يحذر: محادثاتك مع الذكاء الاصطناعي قد لا تكون بالخصوصية التي تعتقدها

الدراسة تقول إن بعض منصات الذكاء الاصطناعي ترسل بيانات محادثات إلى أدوات تتبع خارجية (د.ب.أ)
الدراسة تقول إن بعض منصات الذكاء الاصطناعي ترسل بيانات محادثات إلى أدوات تتبع خارجية (د.ب.أ)

كشفت دراسة بحثية منشورة على موقع «LeakyLM» عن مخاطر خصوصية قالت إنها تطول عدداً من أبرز منصات الذكاء الاصطناعي التوليدي، من بينها «شات جي بي تي» و«كلود» و«غروك» و«بيربلكسيتي»، عبر ما وصفه الباحثون بتسرب بيانات المحادثات والبيانات التعريفية إلى خدمات تتبع وإعلانات تابعة لجهات خارجية. ووفقاً للبحث، فإن المشكلة لا تتعلق فقط بوجود أدوات تحليل ومتابعة داخل هذه الخدمات، بل أيضاً بالطريقة التي يمكن أن ترتبط بها روابط المحادثات وبيانات المستخدمين بمعرفات إعلانية وملفات تعريف على الإنترنت.

ويقول القائمون على الدراسة إنهم اختبروا أربع منصات للذكاء الاصطناعي، ووجدوا أكثر من 13 أداة تتبع خارجية، مع الإشارة إلى أن جميع المنصات الأربع التي شملها الاختبار كانت متأثرة بدرجات مختلفة. كما يذكر الموقع أن هذه الممارسات لا تُشرح للمستخدمين بشكل مباشر وواضح، رغم أن سياسات الخصوصية الخاصة بالشركات تؤكد جمع المحادثات وبيانات الاستخدام والاعتماد على ملفات تعريف الارتباط الخاصة بجهات خارجية لأغراض تتعلق بالتحليلات والإعلانات.

الباحثون رصدوا أكثر من 13 أداة تتبع داخل أربع منصات شهيرة للذكاء الاصطناعي (أ.ف.ب)

روابط تكشف المحادثات

تتركز إحدى أكثر النقاط حساسية في الدراسة حول روابط المحادثات نفسها. فالباحثون يعدون أن روابط بعض المحادثات تُرسل إلى خدمات تتبع مثل «Meta Pixel» و«Google Analytics»، في حين قد تكون هذه الروابط، في بعض الحالات، كافية للوصول إلى محتوى المحادثة أو إلى معلومات تكشف موضوعها. ويضيف التقرير أن العناوين أو عناوين الصفحات الخاصة بالمحادثات يمكن أن تحمل بدورها مؤشرات حساسة حول اهتمامات المستخدم أو مشكلاته أو طبيعة الموضوع الذي يناقشه مع المساعد الذكي.

ووجد الباحثون أن «شات جي بي تي» كان يرسل رابط المحادثة الكامل وعنوان الصفحة إلى «Google Analytics» عند تحميل الصفحة للمستخدمين المسجلين ضمن الفئة المجانية، بصرف النظر عن قبول أو رفض ملفات تعريف الارتباط، وفقاً لما أورده التقرير. كما رصدوا في «Grok» تسرب رابط المحادثة وعنوانها إلى «Google Analytics» و«DoubleClick»، وفي بعض الحالات إلى «TikTok» و«Meta»، مع ملاحظة أن بعض المحادثات أو الصور المرتبطة بها قد تكون متاحة علناً في سياقات المشاركة.

أما في حالة «Claude»، فتشير الدراسة إلى وجود تسربات من نوع مختلف، منها إرسال عناوين البريد الإلكتروني وعنوان المحادثة إلى «Intercom»، إضافة إلى إشارات لربط نشاط المستخدم عبر أدوات متعددة على الجانب الخادمي عند قبول ملفات تعريف الارتباط غير الأساسية. وفي «Perplexity»، تقول الدراسة إن الشركة أوقفت «Meta Pixel» في أبريل (نيسان) 2026، لكن الباحثين رصدوا استمرار إرسال بيانات أخرى مثل عنوان البريد الإلكتروني الخام أو عنوان المحادثة وبيانات وصفية إلى أدوات مثل «Datadog» و«Singular».

التقرير يحذر من إمكانية ربط المحادثات بهوية المستخدم وملفه الإعلاني (رويترز)

ربط المحادثة بالهوية

يذهب التقرير إلى أن الخطر لا يتوقف عند نقل رابط أو عنوان صفحة فقط، بل يمتد إلى إمكانية الربط بين المحادثة وهوية المستخدم. ويشرح الباحثون أن بعض خدمات التتبع تتلقى مع روابط المحادثات ملفات تعريف ارتباط ومعرفات أخرى يمكن أن تساعد، وفق سياسات تلك الشركات نفسها، في ربط النشاط الإلكتروني بملفات تعريف سلوكية أو إعلانية. وفي بعض الحالات، يقول التقرير إن عمليات التتبع تتضمن أيضاً تجزئات للبريد الإلكتروني أو آليات مزامنة ملفات تعريف، بما قد يسهّل إعادة التعرف على المستخدم أو إزالة هويته المجهولة.

وتكتسب هذه النتائج حساسية أكبر، بحسب الدراسة؛ لأن مستخدمي المساعدات الذكية يشاركون معها كثيراً من المعلومات الشخصية والحساسة باعتبارها مساعدات موثوقة. ويشير الموقع إلى أبحاث سابقة أظهرت أن المستخدمين يكشفون للأنظمة التوليدية بيانات شخصية في سياقات غير متوقعة، تشمل مسائل صحية أو نفسية أو شخصية. ويرى الباحثون أن هذه المخاطر لا تقتصر على الأفراد، بل تمتد أيضاً إلى الشركات والقطاع العام؛ إذ يمكن أن تتسرب ملكية فكرية أو معلومات مؤسسية حساسة.

بعض روابط المحادثات قد تكشف موضوع النقاش أو تتيح الوصول إلى محتواه (الشركة)

ضبابية في الخصوصية

ينتقد البحث ما يصفه بالضبابية في أدوات الخصوصية. ويفيد بأن المنصات المدروسة توفر إعدادات للتحكم في الخصوصية ورؤية المحادثات، لكنها قد توحي بحماية أقوى مما يتم تطبيقه فعلياً في بعض السيناريوهات. ويضيف أن نماذج الموافقة على ملفات تعريف الارتباط نفسها تعاني من نقص في الشفافية؛ لأن الباحثين رصدوا حالات يحدث فيها التتبع رغم خيارات المستخدم، أو بطريقة يصعب رصدها عبر المتصفح بسبب استخدام قنوات تتبع خادمية.

ولا يزعم التقرير أنه يملك دليلاً على أن هذه الجهات الخارجية «تقرأ» المحادثات فعلاً، لكنه يقول إن إمكانية الوصول أو الربط موجودة من الناحية التقنية، وهذا في حد ذاته يخلق خطراً هيكلياً على الخصوصية. ومن هنا، يخلص الباحثون إلى أن ما يحدث يعكس انتقال نموذج الويب القائم على التتبع والإعلانات إلى بيئة المساعدات التوليدية أيضاً، في وقت تتوسع فيه هذه الخدمات بسرعة، وتصبح جزءاً أساسياً من حياة المستخدمين اليومية والعملية.

وتسلط الدراسة بذلك الضوء على جانب أقل بروزاً في سباق الذكاء الاصطناعي متعلق بأنه ليس فقط ماذا تستطيع هذه المنصات فعله، بل أيضاً بكيفية بنية اقتصاداتها الرقمية، وكيف تُدار محادثات المستخدمين داخلها، وإلى أي مدى تبقى هذه المحادثات خاصة بالفعل.


من التجارب إلى التشغيل... ماذا تقول «IBM» عن المرحلة التالية للذكاء الاصطناعي المؤسسي؟

ترى «آي بي إم» أن المرحلة التالية من الذكاء الاصطناعي المؤسسي لن تُحسم بعدد النماذج بل بقدرة الشركات على تشغيله فعلياً داخل الأعمال
ترى «آي بي إم» أن المرحلة التالية من الذكاء الاصطناعي المؤسسي لن تُحسم بعدد النماذج بل بقدرة الشركات على تشغيله فعلياً داخل الأعمال
TT

من التجارب إلى التشغيل... ماذا تقول «IBM» عن المرحلة التالية للذكاء الاصطناعي المؤسسي؟

ترى «آي بي إم» أن المرحلة التالية من الذكاء الاصطناعي المؤسسي لن تُحسم بعدد النماذج بل بقدرة الشركات على تشغيله فعلياً داخل الأعمال
ترى «آي بي إم» أن المرحلة التالية من الذكاء الاصطناعي المؤسسي لن تُحسم بعدد النماذج بل بقدرة الشركات على تشغيله فعلياً داخل الأعمال

في مؤتمر «IBM Think 2026» ببوسطن الذي يختتم فعالياته، الخميس، بدا جلياً أن المرحلة التالية من الذكاء الاصطناعي المؤسسي لن تُحسم بمن يملك الوصول إلى أكبر عدد من النماذج، بل بمَن يستطيع تشغيل الذكاء الاصطناعي فعلياً داخل الأعمال.

وفي حديثين منفصلين مع «الشرق الأوسط»، قدّم محمد علي، نائب الرئيس الأول ورئيس «IBM Consulting»، ومارك هيوز، الشريك الإداري العالمي لخدمات الأمن السيبراني في «IBM Consulting»، صورةً عن انتقال الشركات من مرحلة التجارب إلى مرحلة أصعب. يصفها الرجلان بمرحلة إعادة تصميم سير العمل، وتنظيم البيانات والسياق، وإدارة القوى العاملة الرقمية، وبناء الحوكمة والأمن اللازمين لإبقاء الذكاء الاصطناعي تحت السيطرة حين يبدأ التأثير في العمليات الفعلية.

محمد علي نائب الرئيس الأول ورئيس «IBM Consulting»

ما بعد التجارب

يقوم طرح محمد علي على فكرة أن كثيراً من المؤسسات لم تعد تتعثر بسبب نقص الأدوات، بل بسبب عدم تغيير طريقة تنظيم العمل داخلها. وقال: «ما أراه تحدياً لدى كثير من العملاء هو كيف يعيدون هندسة عملياتهم فعلاً من أجل تحقيق قيمة أفضل لأعمالهم».

وأوضح أن المرحلة الأولى من الذكاء الاصطناعي كانت تدور حول «أمور محددة جداً لوكلاء يؤدون مهام بسيطة فقط»، في حين تتطلب المرحلة التالية أن «تجمع» المؤسسات هؤلاء الوكلاء «بطريقة آمنة ومحكومة»، بما يُتيح تحويلهم إلى قيمة أعمال حقيقية داخل سير العمل الجديد.

وفي رأيه، هذا يُفسر سبب عجز كثير من الجهود المؤسسية في الذكاء الاصطناعي عن تجاوز مرحلة التجارب. وعدّ محمد علي أن واحدة من أكثر المشكلات شيوعاً هي أن الطموحات الأولى تكون واسعة أكثر من اللازم. وأضاف: «غالباً ما يُوعَد الذكاء الاصطناعي بالقيام بأشياء كثيرة، في حين يكون الوعد، من حيث النطاق الأولي، واسعاً أكثر مما ينبغي».

وفي شرحه، تبدأ المؤسسات الناجحة بحالات استخدام أضيق وأكثر ارتباطاً بالقيمة، ثم تربطها لاحقاً داخل سير عمل أوسع. وأشار أيضاً إلى أن مشكلة متكررة أخرى تتمثل في أن الشركات لا تُفكر بشكل منهجي في الحوكمة، وهي تنقل الذكاء الاصطناعي إلى الإنتاج. أما المشكلة الثالثة فهي ظهور ما سمّاه «الذكاء الاصطناعي الظلّي»، حين تتبنى بعض أجزاء المؤسسة أدوات أو وكلاء على نحو منفصل من دون رؤية كاملة لكيفية إعادة تصميم العملية المؤسسية الأوسع. وفي تلك الحالات، كما قال: «يكون هناك غالباً تدمير للقيمة» بدلاً من خلقها.

نموذج تشغيل جديد

من هنا، تنطلق الرسالة الأوسع التي تطرحها «آي بي إم» هذا العام تحت عنوان ما تسميه «نموذج تشغيل الذكاء الاصطناعي». الفكرة ليست ببساطة أن المؤسسات تحتاج إلى مزيد من الذكاء الاصطناعي، بل أن تتوقف عن التعامل معه على أنه مجموعة تجارب منفصلة، وأن تبدأ بدمجه في كيفية عمل المؤسسة نفسها.

وقال علي إن نضج الذكاء الاصطناعي جعل «حالات الاستخدام الفردية» تُربط الآن «بطريقة عاملية» تسمح للمؤسسات بأن «تُعيد هندسة طريقة إنجاز العمل على مستوى تأسيسي». وبرأيه، هنا يكمن الخط الفاصل الحقيقي بين الشركات التي لا تزال تختبر الأدوات وتلك التي بدأت تحوّل الذكاء الاصطناعي إلى قدرة تشغيلية.

وضرب علي مثالاً داخلياً من «آي بي إم» نفسها، مشيراً إلى أن الشركة بدأت قبل 3 سنوات في نشر الذكاء الاصطناعي على نطاق واسع داخل أعمالها، عبر تفكيك المؤسسة إلى 490 سير عمل، واختيار أهم 70 منها، وبناء 220 عاملاً رقمياً عبر تلك المسارات. وكان الهدف إعادة تصميم مجالات مثل الموارد البشرية والمالية وسلسلة الإمداد لتصبح «بشرية + رقمية». والنتيجة، وفقاً له، أن «آي بي إم» خفّضت إنفاقاً كان يقارب 25 مليار دولار في 2022 لمستوى «أقرب إلى 20 مليار دولار» بحلول 2025، بما يُعادل «نحو 4.5 مليار دولار» من الوفورات. وأضاف: «هذا لا يحدث إلا عندما تجعل الذكاء الاصطناعي جزءاً من نموذج التشغيل».

يقدم «طيران الرياض» مثالاً على بناء الذكاء الاصطناعي داخل نموذج التشغيل منذ اليوم الأول لا بوصفه طبقة تُضاف لاحقاً (الشركة)

«طيران الرياض» نموذجاً

وأشار محمد علي أيضاً إلى «طيران الرياض»، الذي وصفه بأنه «شركة طيران أولاً بالذكاء الاصطناعي تقريباً»، بوصفه حالة يمكن فيها بناء الذكاء الاصطناعي داخل نموذج التشغيل منذ اليوم الأول بدلاً من إضافته لاحقاً. وأهمية هذا المثال، في روايته، لا تعود فقط إلى أن «طيران الرياض» شركة طيران جديدة، بل إلى أنها تُبنى من دون ثقل الأنظمة القديمة التي تقيّد كثيراً من الشركات القائمة.

وقال إن عمل «آي بي إم» هناك بدأ ليس من الاستخدامات البرّاقة الموجهة للعميل، بل من العمليات المالية والداخلية، وتساءل: «كيف تُدير شركة طيران بوظائف مؤسسية أكثر كفاءة بكثير؟». وكانت الفكرة هي إعادة تصميم هذه المسارات أولاً، حتى يمكن لاحقاً توجيه مزيد من الموارد نحو الخدمة وتجربة العميل. ومن هناك، كما قال، يمكن للناقلة أن تبدأ استخدام وكلاء الذكاء الاصطناعي عبر رحلة العميل كلها، من شراء التذكرة إلى الوصول إلى المطار، ثم الصعود إلى الطائرة.

وقارن ذلك بأنظمة الطيران التقليدية التي وصفها بأنها قائمة على هياكل تعود إلى عقود مضت، معتبراً أن لدى «طيران الرياض» فرصة للبناء على نموذج رقمي مختلف منذ البداية. وفي لحظة لخص رؤيته للمشروع بهذه العبارة: «إنه يبني تجربة تجارة إلكترونية لديها 200 طائرة».

التغيير قبل التقنية

لكن حتى في هذه الأمثلة، كرر علي مراراً أن المسألة ليست ما إذا كانت الشركة تنشر الذكاء الاصطناعي أم لا، بل ما إذا كانت تُغيّر طريقة عملها. وعدّ أن أصعب حديث مع العملاء الآن لم يعد غالباً يتعلق فقط بما يستطيع الذكاء الاصطناعي فعله، ولا حتى بمن يتحمل المسؤولية، بل بشيء أكثر جوهرية: «كيف أغيّر نموذج التشغيل لديَّ؟ وكيف يمكنكم أن تدعموني في إدارة هذا التغيير؟». ونقل عن أحد العملاء تلخيصه المسألة بالقول إن «30 في المائة منها تقنية، و70 في المائة منها تتعلق بتحقيق التبني، وتغيير سير العمل، وتغيير كيفية إنجاز الناس للعمل».

وهذا هو أيضاً السبب الذي يجعل البشر، لا التقنية وحدها، في قلب القصة. فقد قال علي إن الذكاء الاصطناعي سيُغيّر سوق العمل بدلاً من أن يلغيها ببساطة. وأضاف: «أعتقد حقاً أن هناك مجموعة كاملة من الوظائف التي ستنشأ بسبب وجود الذكاء الاصطناعي»، معتبراً أن «الذين يتبنون الذكاء الاصطناعي ويستخدمونه أداةً سيتفوقون». ولاحقاً، حين سُئل عن المقاومة الثقافية، قال إن وجود راعٍ رفيع المستوى داخل المؤسسة يبقى غالباً شرطاً لا غنى عنه لنجاح التغيير واسع النطاق. وأضاف: «من المهم للغاية أن يكون هناك شخص كبير جداً في المؤسسة يرعى هذا، وإلا فلن يحدث».

مارك هيوز الشريك الإداري العالمي لخدمات الأمن السيبراني في «IBM Consulting»

الوكلاء تحت السيطرة

أما إذا كان حديث محمد علي يركز سبب مواجهة الشركات صعوبة في تحويل الذكاء الاصطناعي إلى تشغيل فعلي، فإن مارك هيوز شرح ما يحدث حين تبدأ هذه الشركات فعلاً في التوسع. ففكرته المركزية كانت أن الذكاء الاصطناعي المؤسسي يصبح أكثر صعوبة وأكثر حساسية حين ينتقل من استخدامات ضيقة إلى عدد كبير من الوكلاء المزروعين في سير العمل والتطبيقات واتخاذ القرار.

وفي هذا السياق، قال إن القضية لم تعد فقط ما إذا كانت أداة الذكاء الاصطناعي تعمل، بل ما إذا كان نشرها محكوماً. وأضاف: «يجب أن تكون الحوكمة موجودة»، مشيراً إلى ضوابط تتعلق بالتشفير والهوية والوصول والصلاحيات والبيانات والمراقبة وقت التشغيل. ومن دون هذا الغلاف حول نشر الوكلاء، كما قال، فإن «خطر عدم القيام بذلك كبير».

ورأى هيوز أن الفرق بين جهود التوسع الناجحة والفاشلة لا يكمن غالباً في النموذج نفسه، بل في انضباط النشر. وهو يلتقي هنا مع محمد علي في القول إن كثيراً من مشروعات الذكاء الاصطناعي تفشل؛ لأن النطاق الأولي واسع أكثر من اللازم، لكنه يضيف أن ضعف الحوكمة قد يكون بالقدر نفسه من الضرر.

ونوه إلى أن بعض المؤسسات لا تفهم جيداً «ما الذي يفعله الوكلاء، وكيف يؤدون»، وهذا يمكن أن «يضغط على فرامل تنفيذ الذكاء الاصطناعي لديها». وأردف أن بعضها الآخر تضعفه ظاهرة الذكاء الاصطناعي الظلّي والنشر المتشظي. وفي رأيه، فإن المؤسسات التي تنجح هي تلك التي «تفكر بشكل أكثر منهجية في كيفية إدخال الذكاء الاصطناعي إلى الإنتاج وتبني الحوكمة حوله». ومراده هنا ليس أن الذكاء الاصطناعي يخلق الخطر بحد ذاته، بل إن الذكاء الاصطناعي غير المحكوم هو الذي يفعل ذلك.

تعتبر «آي بي إم» أن الانتقال من التجارب إلى الإنتاج يبدأ من حالات استخدام ضيقة وواضحة القيمة لا من وعود واسعة أكثر من اللازم (غيتي)

إدارة الوكلاء الرقميين

تزداد هذه المسألة إلحاحاً مع انتقال الشركات من عدد محدود من المساعدين إلى أعداد كبيرة من الوكلاء داخل سير العمل الحقيقي. وفسّر هيوز أن أول مشكلة تحكم تظهر عادة هي «الرؤية». فقد تجد المؤسسات نفسها أمام وكلاء مختلفين من مزودين ومنصات مختلفة من «ساب» (SAP) و«سايلزفورس» (Salesforce) وأنظمة داخلية وغيرها من دون رؤية موحدة لما يفعله كل هؤلاء الوكلاء.

وتابع: «أنت غير قادر على رؤية كل هؤلاء في الوقت نفسه». وفي روايته، فإن المشكلة الإدارية الناشئة لا تتمثل فقط في إدارة العمال البشريين، بل أيضاً في إدارة عمال رقميين ينبغي فهم سلوكهم ومراقبته وضبطه. وقال: «مدير الغد سيتعين عليه فعلاً أن يعرف كيف يدير عمالاً بشريين وعمالاً رقميين»، واصفاً ذلك بأنه «مهارة لا يوجد تخطيط لها اليوم».

البيانات ثم الضوابط

وتقع البيانات في قلب طرح الرجُلين معاً. فقد قال محمد علي بوضوح إن «البيانات أساسية جداً جداً»، مضيفاً أن «النماذج نفسها جيدة جداً»، لكن ما يصنع النتيجة هو «خط أنابيب البيانات والسياق والعملية الذي يستفيد من النماذج».

وشرح كيف تُحاول «آي بي إم» تحسين ذلك، من خلال أدوات مثل «Context Studio»، التي لا تكتفي بمتجهة كميات كبيرة من بيانات الشركة، بل تبني طبقة من الأنطولوجيا والعلاقات يمكن للوكلاء استهلاكها بوصفها سياقاً. والمقصود برأيه ليس امتلاك البيانات فحسب، بل معالجتها على نحو يسمح للوكلاء بالعمل جيداً حتى عندما تكون البيانات المؤسسية الخام غير مكتملة أو غير مرتبة. وأضاف: «البيانات مهمة كثيراً، لكن الأمر يعتمد أيضاً على كيفية معالجتك للبيانات من أجل الحصول على وكيل جيد».

أما هيوز، فقد تناول المسألة من زاوية مختلفة، فبالنسبة إليه، لا يمكن فصل الحوكمة حول البيانات عن الحوكمة حول الوكلاء. وفي القطاعات الأكثر تنظيماً، أوضح أن البيانات نفسها وسلوك الوكيل حولها مهمان معاً. وأضاف: «كلاهما»، حين سُئل عما إذا كان التحكم في مكان البيانات أو التحكم في النماذج والوكلاء هو السؤال الأهم الآن. وأشار إلى طبقة السياق التي بنتها «آي بي إم» وإلى الجهد الأوسع في إدارة البيانات بوصفه جزءاً من الجواب. لكن تركيزه بقي منصباً على ضرورة وجود ضوابط ما قبل الإنتاج وضوابط وقت التشغيل، حتى تتمكن المؤسسات من مراقبة سلوك الوكلاء بعد دخولهم الخدمة.

«آي بي إم»: الخطر لا يكمن في الذكاء الاصطناعي نفسه بل في نشره من دون حوكمة واضحة ورؤية موحدة وضبط للصلاحيات والبيانات (رويترز)

الأمن والمساءلة

في رواية هيوز، لم يعد الأمن مجرد طبقة تضاف بعد نشر الذكاء الاصطناعي، بل أصبح جزءاً من نموذج التشغيل نفسه. وقال إن المؤسسات يجب ألا تنظر إلى الذكاء الاصطناعي على أنه يجعل الأمن «أصعب» فقط، بل على أنه يجعله مختلفاً. فمن جهة، يوسع الذكاء الاصطناعي سطح الهجوم بسبب زيادة عدد الأنظمة والوكلاء والعمليات الذاتية. واستشهد بأبحاث تشير إلى احتمال نشر 1.5 مليار وكيل داخل البيئات المؤسسية بحلول 2028. ومن جهة أخرى، قال إن الذكاء الاصطناعي يمنح المؤسسات أيضاً فرصة لإدارة الأمن «بصورة أسرع وأكثر ذاتية بكثير مما فعلناه في الماضي». والمعنى هنا أن التحول نفسه الذي يُغيّر سير العمل والعمليات يفرض أيضاً إعادة تصميم الأمن نفسه.

ولهذا السبب أيضاً عاد هيوز مراراً إلى مسألة المساءلة، فإذا ولّدت قرارات الذكاء الاصطناعي خطراً، فإن المسؤولية حسب اعتقاده يجب أن تبقى في مكان واضح. وقال: «لا يزال هناك الكثير مما يمكن أن نستفيد منه من الخبرات التي اكتسبناها في مجال عمليات تقنية المعلومات المؤسسية على مدى سنوات طويلة»، مضيفاً أنه كما أن للتطبيقات مالكين محددين، ينبغي أن يكون للوكلاء أيضاً مالكون واضحون، مع وجود خطة تحدد الجهة التي وفّرتهم والجهة التي تظل مسؤولة عنهم. وبمعنى آخر، قد تتوسع الأتمتة، لكن المسؤولية لا يمكن أن تختفي.

في هذا السياق، لم تعد قيمة الذكاء الاصطناعي في المؤسسات تُقاس بعدد المبادرات التي تُعلن أو بسرعة إطلاق التجارب، بل بقدرته على الدخول إلى العمليات الفعلية، والعمل داخلها بصورة منضبطة، وتحقيق أثر يمكن قياسه. هنا تحديداً يبدو أن المرحلة التالية بدأت.