لماذا تُخطئ كاميرات المراقبة المُزودة بالذكاء الاصطناعي باستمرار؟

الرؤية الحاسوبية تُفسر السلوكيات العادية بشكل روتيني على أنها تهديدات

لماذا تُخطئ كاميرات المراقبة المُزودة بالذكاء الاصطناعي باستمرار؟
TT

لماذا تُخطئ كاميرات المراقبة المُزودة بالذكاء الاصطناعي باستمرار؟

لماذا تُخطئ كاميرات المراقبة المُزودة بالذكاء الاصطناعي باستمرار؟

في العام الماضي، حلَّلت هيئة النقل في لندن كاميرات بيانات مراقبة لدائرة تلفزيونية مغلقة مُزودة بالذكاء الاصطناعي، في محطة مترو ويلسدن غرين، حيث تم تشغيل البث عبر أنظمة آلية، من أكتوبر (تشرين الأول) 2022 إلى سبتمبر (أيلول) 2023.

نصف التنبيهات خاطئة

وكان الهدف هو الكشف عن التهرُّب من دفع أجرة النقل، والحركات والإيماءات العدوانية، ومخاطر السلامة. لكن النظام الذي أصدر أكثر من 44000 تنبيه - لم يكن مصيباً في الرصد حيث ظهر أن نصف التنبيهات تقريباً كانت إما خاطئة أو مُضلّلة، كما كتب كولاول سامويل أديبايو(*).

فقد أدَّت حالات تعقب الأطفال لآبائهم عبر حواجز التذاكر، إلى إطلاق إنذارات حول التهرُّب من دفع الأجرة، كما واجهت الخوارزميات صعوبة في التمييز بين الدراجات الهوائية القابلة للطي والدراجات العادية.

رصد فوري.. مقابل خلل عميق

كان التأثير فورياً؛ إذ واجه الموظفون أكثر من 19000 تنبيه فوري تتطلب مراجعة بشرية، لا بسبب وجود مشكلات حقيقية، ولكن لأن الذكاء الاصطناعي لم يستطع التمييز بين المظهر والقصد؛ إذ إن النظام التقني وبتدريبه على رصد الحركة والوضعية، لا على السياق، كشف عن خلل أعمق في جوهر كثير من أدوات الذكاء الاصطناعي اليوم.

سلوك بشري عادي يتحول إلى تهديد

ومع انتشار الذكاء الاصطناعي في الحياة اليومية - من المتاجر إلى المطارات - فإن عجزه عن تفسير سبب تحركنا، بدلاً من مجرد كيفية تحركنا، يُهدد بتحويل السلوك البشري العادي إلى إنذارات كاذبة.

حدود ما يمكن للكاميرات «رؤيته»

تتفوق معظم تقنيات الذكاء الاصطناعي في رصد الأنماط، مثل: تجاوز الحدود، ودخول منطقة معينة، وكسر الروتين. لكن الفروق الدقيقة والغموض والاختلاف الثقافي تُعيقها.

يقول توان لي آنه، الرئيس التنفيذي لشركة Advanced Technology Innovations (ATIN) ومقرها فيتنام: «في البيئات الديناميكية أو المزدحمة، يتمثل أحد أكبر التحديات في حجب الأشخاص أو الأشياء عن الرؤية... فعندما يتداخل الأشخاص أو يتحركون بسرعة في الإضاءة الخافتة، قد يدمجهم النظام في شخص واحد، أو الأسوأ من ذلك: أن يُكررهم. ومن السهل على الكاميرات أن تُغفل الأحداث الرئيسية أو تُخطئ في تصنيف ما يحدث بالكامل».

الذكاء الاصطناعي يرى الفعل لا السبب

لهذا النقص في السياق عواقب وخيمة؛ فقد يكون الشخص الذي يركض يمارس الرياضة، أو يهرب من الخطر، أو يطارد حافلة، لكن الذكاء الاصطناعي لا يرى إلا الفعل نفسه، لا السبب.

تعالج معظم الأنظمة مقاطع بصرية موجزة دون مراعاة الوقت، أو ديناميكيات الحشود، أو الصوت. ويشير لي آنه إلى أنها «يمكنها تحديد ما يحدث (مثل شخص يركض)، ولكن دون تحديد السبب». ويضيف: «هذا النقص في التفكير السببي يخلق نقاطاً عمياء».

في الممارسة العملية، أدى هذا إلى خلط كاميرات المتاجر بين حركات الوصول والسرقة، وإلى ممارسة التمييز في أنظمة النقل العام للركاب ذوي البشرة الملونة بشكل غير متناسب، وخلط أجهزة مراقبة الرعاية الصحية بين الإيماءات الروتينية وعلامات الاستغاثة، ما يؤدي أحياناً إلى تفويت الالتفات إلى حالات طوارئ حقيقية.

يجادل لي آنه بأن الحل يكمن في تدريب الذكاء الاصطناعي على رؤية المشهد بأكمله. ويضيف: «عندما تجمع مصادر بيانات متعددة وتسمح للنموذج بالتعلم من الأنماط بمرور الوقت، تقترب من نظام يفهم النية... هنا يمكن لهذه التقنية أن تتوقف عن ارتكاب الأخطاء نفسها وتبدأ في أن تصبح مفيدة حقاً».

أنماط زائفة وعواقب حقيقية

تعكس هذه المشكلة ما يُطلِق عليه ساجي بن موشيه، الرئيس التنفيذي لشركة «لومانا»: «فخ مطابقة الأنماط». فالذكاء الاصطناعي المُدرّب على تصنيف البكسلات (نقاط الصورة) غالباً ما يرصد تفاصيل سطحية دون أي معنى حقيقي.

ويضيف: «أحد الأمثلة الكلاسيكية على ذلك جاء من مشاريع التعرف على الصور العسكرية؛ عندما درب الخبراء النظام على اكتشاف الدبابات باستخدام صور التُقِطت صدفة بالقرب من الأشجار. وما حدث هو أن النظام تعلم اكتشاف الأشجار، وليس الدبابات. وقد نجح النظام بشكل رائع في الاختبار، لكنه فشل في الميدان».

وتصمم شركة «لومانا» ذكاءً اصطناعياً للفيديو لتجنب هذه المشكلات. وتتتبع «نماذج التعلُّم المستمر» الخاصة بها الحركة بمرور الوقت وفي السياق.

فرق شاسع بين الرؤية... والفهم

ويقول بن موشيه: «هناك فرق شاسع بين الرؤية والفهم». يستطيع الذكاء الاصطناعي حالياً اكتشاف هوية الشخص، لكنه لا يعرف ما إذا كان في حالة من الضيق أو التشتت أو ينتظر وصول سيارة. وعندما تعمل الأنظمة بناءً على هذه الرؤية غير المكتملة، فإننا نخاطر بحالة «أتمتة سوء الفهم» على نطاق واسع.

تبلغ المخاطر ذروتها في المدارس والمستشفيات والملاعب الرياضية، وهي أماكن تعتمد فيها السلامة على التصنيف الدقيق، وقد تؤدي النتائج الخاطئة إلى تفاقم المشكلة أو إغفال التهديدات.

فهم القواعد الفيزيائية

لماذا يحتاج الذكاء الاصطناعي إلى الفيزياء، وليس فقط البكسلات؟ يجادل الخبراء بأن الفهم الحقيقي يتطلب أكثر من مجرد رؤية ثنائية الأبعاد. يجب أن يتعلم الذكاء الاصطناعي نفس القواعد الفيزيائية والمكانية التي يستوعبها البشر في طفولتهم: الجاذبية، والحركة، والسبب، والنتيجة.

يقول بن موشيه: «أنظمة رؤية الذكاء الاصطناعي اليوم لا تمتلك حساً مدمجاً بالمنطق الفيزيائي؛ فالطفل الصغير يعرف أنه إذا دفعت كرة، فإنها تتدحرج. أما نموذج الذكاء الاصطناعي فلا يعرف ذلك، إلا إذا شاهد ملايين مقاطع الفيديو للكرات وهي تتدحرج بطرق مماثلة». لذا تتجه جهود الصناعة في هذا الاتجاه؛ إذ تبني «لومانا» نماذج منظمة للأجسام والقوى والمشاهد، بينما تستكشف «ATIN» الرؤية القائمة على المحولات والرسوم البيانية للمشاهد ثلاثية الأبعاد لالتقاط العمق والسياق في العلاقات. لكن التفسير عالي الدقة والفوري يتطلب قوة معالجة هائلة، لا يمكن تفسيره بسهولة.

بناء ذكاء اصطناعي «يفهم»

مع تسابق الشركات لأتمتة المساحات المادية، تتضح المخاطر: ما لم يتعلم الذكاء الاصطناعي السياق، فإننا نخاطر بتحويل نقاط ضعف البشر إلى نقاط ضعف آلية.

ربط الحركة بالمعنى والقصد

ويتفق بن موشيه ولي آنه على أن مستقبل الذكاء الاصطناعي لن يعتمد على كاميرات أكثر دقة أو تصنيفات أفضل، بل على التفكير المنطقي - ربط الحركة بالمعنى والوقت بالقصد. إذا كان للذكاء الاصطناعي أن يتعايش مع البشر، فعليه أولاً أن يفهمنا ويفهم عالمنا.

ويحدث التقدُّم هماً، بعدما طُورت نماذج تدمج الوقت والصوت والإشارات البيئية. لكن الثقة الحقيقية ستعتمد على أنظمة ليست أكثر ذكاءً فحسب، بل أيضاً شفافة وقابلة للتفسير ومتوافقة مع سمات التعقيد البشري.

عندما يأتي هذا التحول، لن يقتصر دور الذكاء الاصطناعي على التعرف على الوجه أو تتبع الحركة، بل سيستوعب السياق الكامن وراءها. وهذا يفتح الباب أمام التكنولوجيا التي لا تراقبنا فحسب، بل تعمل معنا من أجل إنشاء مساحات عامة أكثر أماناً وعدالة واستجابة.

* مجلة «فاست كومباني»، خدمات «تريبيون ميديا»


مقالات ذات صلة

دراسة: 20 % من فيديوهات «يوتيوب» مولّدة بالذكاء الاصطناعي

تكنولوجيا محتوى على «يوتيوب» تم إنشاؤه بواسطة الذكاء الاصطناعي يصوّر قطاً يتم القبض عليه بواسطة رجال الشرطة

دراسة: 20 % من فيديوهات «يوتيوب» مولّدة بالذكاء الاصطناعي

أظهرت دراسة أن أكثر من 20 % من الفيديوهات التي يعرضها نظام يوتيوب للمستخدمين الجدد هي «محتوى رديء مُولّد بالذكاء الاصطناعي»، مُصمّم خصيصاً لزيادة المشاهدات.

«الشرق الأوسط» (لندن)
تكنولوجيا امرأة في معرض حول الذكاء الاصطناعي وعالم الإنترنت بمقاطعة جيجيانغ الصينية (رويترز)

الصين تصدر مسوّدة قواعد لتنظيم الذكاء الاصطناعي المحاكي للتفاعل البشري

أصدرت هيئة الفضاء الإلكتروني الصينية مسودة ​قواعد لتشديد الرقابة على خدمات الذكاء الاصطناعي المصممة لمحاكاة الشخصيات البشرية والتفاعل العاطفي مع المستخدمين.

«الشرق الأوسط» (بكين)
تكنولوجيا سام ألتمان رئيس شركة «أوبن إيه آي» (رويترز)

ما الاختراق القادم في مجال الذكاء الاصطناعي الذي يتوقعه رئيس «أوبن إيه آي»؟

توقع سام ألتمان، رئيس شركة «أوبن إيه آي»، أن يكون الإنجاز الكبير التالي نحو تحقيق ذكاء اصطناعي فائق القدرة هو اكتساب هذه الأنظمة «ذاكرة لا نهائية، ومثالية».

«الشرق الأوسط» (واشنطن)
الاقتصاد شعار شركة «أوبن إيه آي» في رسم توضيحي (رويترز)

حمّى الذكاء الاصطناعي... مليارات الدولارات تُعيد تشكيل صناعة التكنولوجيا

يشهد قطاع التكنولوجيا العالمي أضخم موجة استثمارية في تاريخه الحديث؛ إذ تحولت حمى الذكاء الاصطناعي من مجرد ابتكارات برمجية إلى معركة وجودية على البنية التحتية.

«الشرق الأوسط» (لندن)
الاقتصاد منتزه على نهر هان في سيول (أرشيفية - رويترز)

اقتصاد كوريا الجنوبية 2026: رهان «أشباه الموصلات» في مواجهة الحمائية العالمية

مع توقع استمرار حالة عدم اليقين في الاقتصاد العالمي وتأثيرها على رابع أكبر اقتصاد في آسيا خلال عام 2026، من المتوقع أن تسعى كوريا الجنوبية لمواجهة هذه التحديات.

«الشرق الأوسط» (سيول)

دراسة: 20 % من فيديوهات «يوتيوب» مولّدة بالذكاء الاصطناعي

محتوى على «يوتيوب» تم إنشاؤه بواسطة الذكاء الاصطناعي يصوّر قطاً يتم القبض عليه بواسطة رجال الشرطة
محتوى على «يوتيوب» تم إنشاؤه بواسطة الذكاء الاصطناعي يصوّر قطاً يتم القبض عليه بواسطة رجال الشرطة
TT

دراسة: 20 % من فيديوهات «يوتيوب» مولّدة بالذكاء الاصطناعي

محتوى على «يوتيوب» تم إنشاؤه بواسطة الذكاء الاصطناعي يصوّر قطاً يتم القبض عليه بواسطة رجال الشرطة
محتوى على «يوتيوب» تم إنشاؤه بواسطة الذكاء الاصطناعي يصوّر قطاً يتم القبض عليه بواسطة رجال الشرطة

أظهرت دراسة أن أكثر من 20 في المائة من الفيديوهات التي يعرضها نظام يوتيوب للمستخدمين الجدد هي «محتوى رديء مُولّد بالذكاء الاصطناعي»، مُصمّم خصيصاً لزيادة المشاهدات.

وبحسب صحيفة «الغارديان» البريطانية، فقد أجرت شركة تحرير الفيديو «كابوينغ» استطلاعاً شمل 15 ألف قناة من أشهر قنوات يوتيوب في العالم - أفضل 100 قناة في كل دولة - ووجدت أن 278 قناة منها تحتوي فقط على محتوى رديء مُصمم بتقنية الذكاء الاصطناعي.

وقد حصدت هذه القنوات مجتمعةً أكثر من 63 مليار مشاهدة و221 مليون مشترك، مُدرّةً إيرادات تُقدّر بنحو 117 مليون دولار سنوياً، وفقاً للتقديرات.

كما أنشأ الباحثون حساباً جديداً على «يوتيوب»، ووجدوا أن 104 من أول 500 فيديو تم التوصية به في الصفحة الرئيسية لهذا الحساب كانت ذات محتوى رديء مولد بالذكاء الاصطناعي، تم تطويره بهدف الربح المادي.

وتُقدّم هذه النتائج لمحةً عن صناعةٍ سريعة النمو تُهيمن على منصات التواصل الاجتماعي الكبرى، من «إكس» إلى «ميتا» إلى «يوتيوب»، وتُرسّخ حقبةً جديدةً من المحتوى، وهو المحتوى التافه الذي يحفز على إدمان هذه المنصات.

وسبق أن كشف تحليل أجرته صحيفة «الغارديان» هذا العام أن ما يقرب من 10في المائة من قنوات «يوتيوب» الأسرع نمواً هي قنوات مُولّدة بواسطة الذكاء الاصطناعي، حيث حققت ملايين المشاهدات رغم جهود المنصة للحد من «المحتوى غير الأصلي».

وتُعدّ القنوات التي رصدتها شركة كابوينغ عالمية الانتشار وتحظى بمتابعة واسعة من ملايين المشتركين في مختلف أنحاء العالم.

وتعتبر قناة «بندر أبنا دوست»، هي القناة الأكثر مشاهدة في الدراسة، ومقرها الهند، ويبلغ عدد مشاهداتها حالياً 2.4 مليار مشاهدة. وتعرض القناة مغامرات قرد ريسوس وشخصية مفتولة العضلات مستوحاة من شخصية «هالك» الخارقة، يحاربان الشياطين ويسافران على متن مروحية مصنوعة من الطماطم. وقدّرت كابوينغ أن القناة قد تُدرّ أرباحاً تصل إلى 4.25 مليون دولار.

أما قناة «بوتى فرينشي»، ومقرها سنغافورة، والتي تروي مغامرات كلب بولدوغ فرنسي، فقد حصدت ملياري مشاهدة، ويبدو أنها تستهدف الأطفال. وتشير تقديرات كابوينغ إلى أن أرباحها تقارب 4 ملايين دولار سنوياً.

كما يبدو أن قناة «كوينتوس فاسينانتس»، ومقرها الولايات المتحدة، تستهدف الأطفال أيضاً بقصص كرتونية، ولديها 6.65 مليون مشترك.

في الوقت نفسه، تعرض قناة «ذا إيه آي وورلد»، ومقرها باكستان، مقاطع فيديو قصيرة مُولّدة بالذكاء الاصطناعي عن الفيضانات الكارثية التي ضربت باكستان، تحمل عناوين مثل «الفقراء»، و«العائلات الفقيرة»، و«مطبخ الفيضان». وقد حصدت القناة وحدها 1.3 مليار مشاهدة.

وتعليقاً على هذه الدراسة، صرح متحدث باسم «يوتيوب» قائلاً: «الذكاء الاصطناعي التوليدي أداة، وكأي أداة أخرى، يمكن استخدامه لإنتاج محتوى عالي الجودة وآخر منخفض الجودة. نركز جهودنا على ربط مستخدمينا بمحتوى عالي الجودة، بغض النظر عن طريقة إنتاجه. يجب أن يتوافق المحتوى المرفوع على (يوتيوب) مع إرشاداتنا، وإذا وجدنا أن المحتوى ينتهك أياً من سياساتنا، فسنحذفه».


الصين تصدر مسوّدة قواعد لتنظيم الذكاء الاصطناعي المحاكي للتفاعل البشري

امرأة في معرض حول الذكاء الاصطناعي وعالم الإنترنت بمقاطعة جيجيانغ الصينية (رويترز)
امرأة في معرض حول الذكاء الاصطناعي وعالم الإنترنت بمقاطعة جيجيانغ الصينية (رويترز)
TT

الصين تصدر مسوّدة قواعد لتنظيم الذكاء الاصطناعي المحاكي للتفاعل البشري

امرأة في معرض حول الذكاء الاصطناعي وعالم الإنترنت بمقاطعة جيجيانغ الصينية (رويترز)
امرأة في معرض حول الذكاء الاصطناعي وعالم الإنترنت بمقاطعة جيجيانغ الصينية (رويترز)

أصدرت هيئة الفضاء الإلكتروني الصينية، اليوم (السبت)، مسودة ​قواعد لتشديد الرقابة على خدمات الذكاء الاصطناعي المصممة لمحاكاة الشخصيات البشرية والتفاعل العاطفي مع المستخدمين.

وتؤكد هذه الخطوة ما تبذله بكين من جهود للسيطرة على الانتشار السريع لخدمات ‌الذكاء الاصطناعي ‌المقدمة للجمهور ‌من ⁠خلال ​تشديد معايير ‌السلامة والأخلاقيات.

وستطبق القواعد المقترحة على منتجات وخدمات الذكاء الاصطناعي المقدمة للمستهلكين في الصين، والتي تعرض سمات شخصيات بشرية وأنماط تفكير وأساليب تواصل تتم محاكاتها، وتتفاعل ⁠مع المستخدمين عاطفياً من خلال النصوص ‌أو الصور أو الصوت أو الفيديو، أو غيرها من الوسائل.

وتحدد المسودة نهجاً تنظيمياً يلزم مقدمي الخدمات بتحذير المستخدمين من الاستخدام المفرط، وبالتدخل عندما تظهر على المستخدمين ​علامات الإدمان.

وبموجب هذا المقترح، سيتحمل مقدمو الخدمات مسؤوليات ⁠السلامة طوال دورة حياة المنتج، ووضع أنظمة لمراجعة الخوارزميات وأمن البيانات وحماية المعلومات الشخصية.

وتحدد هذه الإجراءات الخطوط الحمراء للمحتوى والسلوك، وتنص على أنه يجب ألا ينشئ مقدمو الخدمات محتوى من شأنه تهديد الأمن القومي، أو نشر الشائعات، أو الترويج ‌للعنف أو الفحشاء.


ما الاختراق القادم في مجال الذكاء الاصطناعي الذي يتوقعه رئيس «أوبن إيه آي»؟

سام ألتمان رئيس شركة «أوبن إيه آي» (رويترز)
سام ألتمان رئيس شركة «أوبن إيه آي» (رويترز)
TT

ما الاختراق القادم في مجال الذكاء الاصطناعي الذي يتوقعه رئيس «أوبن إيه آي»؟

سام ألتمان رئيس شركة «أوبن إيه آي» (رويترز)
سام ألتمان رئيس شركة «أوبن إيه آي» (رويترز)

توقع سام ألتمان، رئيس شركة «أوبن إيه آي»، أن يكون الإنجاز الكبير التالي نحو تحقيق ذكاء اصطناعي فائق القدرة هو اكتساب هذه الأنظمة «ذاكرة لا نهائية، ومثالية».

وقد ركزت التطورات الأخيرة التي حققها مبتكر «تشات جي بي تي»، بالإضافة إلى منافسيه، على تحسين قدرات الذكاء الاصطناعي على الاستدلال، وفقاً لصحيفة «إندبندنت».

لكن في حديثه ضمن بودكاست، قال ألتمان إن التطور الذي يتطلع إليه بشدة هو قدرة الذكاء الاصطناعي على تذكر «كل تفاصيل حياتك»، وأن شركته تعمل على الوصول إلى هذه المرحلة بحلول عام 2026.

شرح ألتمان: «حتى لو كان لديك أفضل مساعد شخصي في العالم... فلن يستطيع تذكر كل كلمة نطقت بها في حياتك».

وأضاف: «لا يمكنه قراءة كل وثيقة كتبتها. ولا يمكنه الاطلاع على جميع أعمالك يومياً، وتذكر كل تفصيل صغير. ولا يمكنه أن يكون جزءاً من حياتك إلى هذا الحد. ولا يوجد إنسان يمتلك ذاكرة مثالية لا متناهية».

وأشار ألتمان إلى أنه «بالتأكيد، سيتمكن الذكاء الاصطناعي من فعل ذلك. نتحدث كثيراً عن هذا الأمر، لكن الذاكرة لا تزال في مراحلها الأولى جداً».

تأتي تصريحاته بعد أسابيع قليلة من إعلانه حالة طوارئ قصوى في شركته عقب إطلاق «غوغل» لأحدث طراز من برنامج «جيميناي».

وصفت «غوغل» برنامج «جيميناي 3» بأنه «عهد جديد من الذكاء» عند إطلاقها تطبيق الذكاء الاصطناعي المُحدّث في نوفمبر (تشرين الثاني)، حيث حقق النموذج نتائج قياسية في العديد من اختبارات الأداء المعيارية في هذا المجال.

قلّل ألتمان من خطورة التهديد الذي يمثله مشروع «جيميناي 3»، مدعياً ​​أن ردّ شركة «أوبن إيه آي» الحازم على المنافسة الجديدة ليس بالأمر غير المألوف.

وقال: «أعتقد أنه من الجيد توخي الحذر، والتحرك بسرعة عند ظهور أي تهديد تنافسي محتمل».

وتابع: «حدث الشيء نفسه لنا في الماضي، حدث ذلك في وقت سابق من هذا العام مع (ديب سيك)... لم يكن لـ(جيميناي 3) التأثير الذي كنا نخشى أن يحدث، ولكنه حدد بعض نقاط الضعف في منتجاتنا واستراتيجيتنا، ونحن نعمل على معالجتها بسرعة كبيرة».

يبلغ عدد مستخدمي «تشات جي بي تي» حالياً نحو 800 مليون، وفقاً لبيانات «أوبن إيه آي»، وهو ما يمثل نحو 71 في المائة من حصة سوق تطبيقات الذكاء الاصطناعي. ويقارن هذا الرقم بنسبة 87 في المائة في الفترة نفسها من العام الماضي.