كاميرا تكشف المشاة والعوائق أسرع 100 مرة من كاميرات السيارات الحالية

طوّرها باحثون في جامعة زيوريخ

تُظهر المربعات المحيطة اكتشاف السيارات بواسطة الخوارزمية (جامعة زيوريخ)
تُظهر المربعات المحيطة اكتشاف السيارات بواسطة الخوارزمية (جامعة زيوريخ)
TT

كاميرا تكشف المشاة والعوائق أسرع 100 مرة من كاميرات السيارات الحالية

تُظهر المربعات المحيطة اكتشاف السيارات بواسطة الخوارزمية (جامعة زيوريخ)
تُظهر المربعات المحيطة اكتشاف السيارات بواسطة الخوارزمية (جامعة زيوريخ)

في مسعى لتطوير سلامة السيارات وتكنولوجيا القيادة الذاتية، يعمل باحثون في جامعة زيوريخ على نظام متطور يجمع بين الذكاء الاصطناعي (AI) وكاميرا مستوحاة من الحياة لتحقيق سرعات الكشف عن المشاة والعوائق أسرع 100 مرة من كاميرات السيارات الحالية. هذا الإنجاز، بقيادة دانييل جيريج وديفيد سكاراموزا من قسم المعلوماتية في الجامعة السويسرية، لديه القدرة على تحسين موثوقية وسلامة السيارات ذاتية القيادة وأنظمة مساعدة السائق بشكل كبير.

مشكلة الأنظمة الحالية

تخيل هذا السيناريو: يقف أحد المشاة فجأة أمام السيارة، ولا يترك سوى جزء من الثانية للسائق أن يتدارك الموقف. في حين أن السيارات الحديثة المجهّزة بأنظمة الكاميرات المتقدمة يمكنها تنبيه السائقين أو بدء الكبح في حالات الطوارئ، إلا أن هذه الأنظمة ليست سريعة أو موثوقة بدرجة كافية حتى الآن. بالنسبة للمركبات ذاتية القيادة، التي تفتقر إلى وجود سائق بشري للاستجابة لحالات الطوارئ، فإن الحاجة إلى أنظمة كشف سريعة يمكن الاعتماد عليها أصبحت أكثر أهمية، إذاً ما الحل؟

ألوان من الكاميرا الملونة والأحداث (النقاط الزرقاء والحمراء) من كاميرا الأحداث التي تم إنشاؤها بواسطة أحد المشاة (جامعة زيوريخ)

كاميرا مبتكرة... وتكامل الذكاء الاصطناعي

واجه الباحثان هذا التحدي من خلال دمج كاميرا جديدة مع خوارزميات الذكاء الاصطناعي المتقدمة. تعرض دراستهما، المنشورة في مجلة «نايتشور (Nature)»، نظاماً قادراً على اكتشاف العوائق المحيطة بالسيارة بسرعة أكبر وبقوة حسابية أقل من الأنظمة الحالية.

تعمل كاميرات السيارات التقليدية على نظام قائم على الإطار، حيث تلتقط لقطات على فترات زمنية منتظمة، تتراوح عادةً بين 30 و50 إطاراً في الثانية. تتم معالجة هذه الصور بواسطة شبكات عصبية اصطناعية مدربة على التعرف على الأشياء المختلفة، مثل المشاة والمركبات. ومع ذلك، إذا وقع حدث معين بين هذه الإطارات، فقد تفوته الكاميرا، مما يؤدي إلى تأخير الاكتشاف. يمكن أن تؤدي زيادة معدل الإطارات إلى حل هذه المشكلة، ولكنها تؤدي أيضاً إلى زيادة كبيرة في البيانات التي ستتم معالجتها في الوقت الفعلي، مما يتطلب مزيداً من القوة الحسابية.

مميزات كاميرات المناسبات

تقدم كاميرات الأحداث نهجاً مختلفاً. على عكس الكاميرات القائمة على الإطار، فهي تحتوي على وحدات بكسل ذكية تسجل التغييرات كلما اكتشفت الحركة، مما يزيل الفجوات بين الإطارات ويسمح باكتشاف العوائق بشكل أسرع. هذه الكاميرات العصبية، المستوحاة من الطريقة التي تعمل بها عيون الإنسان، يمكنها اكتشاف الحركات السريعة دون وجود نقاط عمياء. ومع ذلك، فإنها تواجه صعوبة في التعامل مع الأجسام بطيئة الحركة وتنتج بيانات لا يمكن استخدامها بسهولة بواسطة خوارزميات الذكاء الاصطناعي التقليدية.

النظام قادر على اكتشاف العوائق المحيطة بالسيارة بسرعة أكبر وبقوة حسابية أقل من الأنظمة الحالية (شاترستوك)

نظام هجين لأداء متفوق

للتغلب على هذه القيود، طوّر الباحثان جيريج وسكاراموزا نظاماً هجيناً يعزز نقاط القوة في كل من الكاميرات التقليدية وكاميرات الأحداث أو المراقبة. يستخدم هذا النظام كاميرا قياسية تلتقط 20 صورة في الثانية، والتي تتم معالجتها بواسطة شبكة عصبية تلافيفية (CNN) مدربة على التعرف على الأشياء مثل السيارات والمشاة. وفي الوقت نفسه، تتم معالجة البيانات الواردة من كاميرا الأحداث بواسطة شبكة عصبية بيانية غير متزامنة (AGNN)، والتي تتفوق في تحليل البيانات الديناميكية ثلاثية الأبعاد.

يتيح هذا المزيج للاكتشافات السريعة لكاميرا الأحداث تحسين أداء الكاميرا القياسية، والتنبؤ بملاحظاتها واستكمالها بشكل فعال. والنتيجة هي نظام يمكنه اكتشاف الأشياء بسرعة مثل الكاميرا التقليدية التي تعمل بسرعة 5000 إطار في الثانية، ولكن مع عرض النطاق الترددي للبيانات ومتطلبات الطاقة الحسابية لكاميرا ذات 50 إطاراً في الثانية.

الاختبار والإمكانات المستقبلية

تم اختبار النظام الهجين بدقة مقابل أفضل كاميرات السيارات المتوفرة والخوارزميات المرئية، مما أظهر اكتشافات أسرع 100 مرة مع تقليل نقل البيانات والمتطلبات الحسابية بشكل كبير. والأهم من ذلك، أن هذا النظام يمكنه اكتشاف الأشياء التي تظهر بين إطارات الكاميرا القياسية، مما يوفر أماناً معززاً للسائقين ومستخدمي الطريق الآخرين.

ويعتقد الباحثون بأن دمج هذا النظام الهجين مع أجهزة استشعار «ليدار (LiDAR)» المستخدمة عادة في المركبات ذاتية القيادة، يمكن أن يزيد من تعزيز قدراته. يقول سكاراموزا: «إن الأنظمة الهجينة مثل هذه قد تكون حاسمة لتمكين القيادة الذاتية، وضمان السلامة دون زيادة كبيرة في البيانات والمتطلبات الحسابية».

يمثل التكامل المبتكر للذكاء الاصطناعي مع الكاميرات المستوحاة من الحياة قفزة كبيرة إلى الأمام في مجال سلامة السيارات وتطوير المركبات ذاتية القيادة. ومن خلال تلبية الحاجة الماسة للكشف عن العوائق بشكل أسرع وأكثر موثوقية، فإن هذا الإنجاز لا يعزز أنظمة مساعدة السائق الحالية فحسب، بل يمهّد الطريق أيضاً لسيارات ذاتية القيادة أكثر أماناً.


مقالات ذات صلة

حتى ماسك انتقده... إعلان ترويجي لسيارات «جاغوار» يثير غضباً

يوميات الشرق شعار العلامة التجارية للسيارات الفارهة «جاغوار» (أ.ب)

حتى ماسك انتقده... إعلان ترويجي لسيارات «جاغوار» يثير غضباً

أثار مقطع فيديو ترويجي لتغيير العلامة التجارية للسيارات الفارهة «جاغوار» انتقادات واسعة بظهور فتيات دعاية يرتدين ملابس زاهية الألوان دون وجود سيارة.

«الشرق الأوسط» (لندن)
الولايات المتحدة​ حادث تصادم وقع نتيجة عاصفة ترابية بكاليفورنيا (أ.ب)

عاصفة ترابية شديدة تتسبب بتصادم سيارات جماعي في كاليفورنيا

كشفت السلطات في ولاية كاليفورنيا الأميركية عن أن عاصفة ترابية شديدة تعرف باسم الهبوب تسببت في تصادم عدة مركبات على طريق سريع بوسط كاليفورنيا.

«الشرق الأوسط» (واشنطن)
الاقتصاد الرئيس الأميركي دونالد ترمب خلال زيارة لبروكسل 25 مايو 2017 (رويترز)

أوروبا تستعد لوصول ترمب... أسوأ كابوس اقتصادي بات حقيقة

كانت التوقعات الاقتصادية لمنطقة اليورو مصدر قلق لبعض الوقت، ولكن منذ فوز ترمب بالرئاسة ساء الوضع بشكل كبير.

«الشرق الأوسط» (نيويورك)
رياضة عالمية غابرييل بورتوليتو (رويترز)

ساوبر يكمل تشكيلته لموسم 2025 بالبرازيلي بورتوليتو

أعلن فريق ساوبر المنافس في بطولة العالم لسباقات «فورمولا 1» للسيارات، اليوم الأربعاء، تعاقده مع السائق البرازيلي غابرييل بورتوليتو ليكمل تشكيلته لموسم 2025.

«الشرق الأوسط» (بيرن)
رياضة عالمية تستضيف مدينة ساو باولو البرازيلية السباق الأول في شهر ديسمبر ومن بعدها المكسيك في شهر يناير (فورمولا إي)

فورمولا إي تعلن انطلاق اختبارات ما قبل الموسم في مدريد

تنطلق اختبارات بطولة العالم للفورمولا إي هذا الأسبوع في العاصمة الإسبانية مدريد على مدار أربعة أيام، وذلك استعداداً لانطلاق الموسم الحادي عشر.

«الشرق الأوسط» (جدة)

هل وصل الذكاء الاصطناعي إلى حدوده القصوى؟

لوغو تطبيق «شات جي بي تي» (رويترز)
لوغو تطبيق «شات جي بي تي» (رويترز)
TT

هل وصل الذكاء الاصطناعي إلى حدوده القصوى؟

لوغو تطبيق «شات جي بي تي» (رويترز)
لوغو تطبيق «شات جي بي تي» (رويترز)

هل وصلت نماذج الذكاء الاصطناعي التوليدي إلى طريق مسدود؟ منذ إطلاق «تشات جي بي تي» قبل عامين، بعث التقدم الهائل في التكنولوجيا آمالاً في ظهور آلات ذات ذكاء قريب من الإنسان... لكن الشكوك في هذا المجال تتراكم.

وتعد الشركات الرائدة في القطاع بتحقيق مكاسب كبيرة وسريعة على صعيد الأداء، لدرجة أن «الذكاء الاصطناعي العام»، وفق تعبير رئيس «أوبن إيه آي» سام ألتمان، يُتوقع أن يظهر قريباً.

وتبني الشركات قناعتها هذه على مبادئ التوسع، إذ ترى أنه سيكون كافياً تغذية النماذج عبر زيادة كميات البيانات وقدرة الحوسبة الحاسوبية لكي تزداد قوتها، وقد نجحت هذه الاستراتيجية حتى الآن بشكل جيد لدرجة أن الكثيرين في القطاع يخشون أن يحصل الأمر بسرعة زائدة وتجد البشرية نفسها عاجزة عن مجاراة التطور.

وأنفقت مايكروسوفت (المستثمر الرئيسي في «أوبن إيه آي»)، و«غوغل»، و«أمازون»، و«ميتا» وغيرها من الشركات مليارات الدولارات وأطلقت أدوات تُنتج بسهولة نصوصاً وصوراً ومقاطع فيديو عالية الجودة، وباتت هذه التكنولوجيا الشغل الشاغل للملايين.

وتعمل «إكس إيه آي»، شركة الذكاء الاصطناعي التابعة لإيلون ماسك، على جمع 6 مليارات دولار، بحسب «سي إن بي سي»، لشراء مائة ألف شريحة من تصنيع «نفيديا»، المكونات الإلكترونية المتطورة المستخدمة في تشغيل النماذج الكبيرة.

وأنجزت «أوبن إيه آي» عملية جمع أموال كبيرة بقيمة 6.6 مليار دولار في أوائل أكتوبر (تشرين الأول)، قُدّرت قيمتها بـ157 مليار دولار.

وقال الخبير في القطاع غاري ماركوس «تعتمد التقييمات المرتفعة إلى حد كبير على فكرة أن النماذج اللغوية ستصبح من خلال التوسع المستمر، ذكاء اصطناعياً عاماً». وأضاف «كما قلت دائماً، إنه مجرد خيال».

- حدود

وذكرت الصحافة الأميركية مؤخراً أن النماذج الجديدة قيد التطوير تبدو وكأنها وصلت إلى حدودها القصوى، ولا سيما في «غوغل»، و«أنثروبيك» (كلود)، و«أوبن إيه آي».

وقال بن هورويتز، المؤسس المشارك لـ«a16z»، وهي شركة رأسمال استثماري مساهمة في «أوبن إيه آي» ومستثمرة في شركات منافسة بينها «ميسترال»: «إننا نزيد (قوة الحوسبة) بالمعدل نفسه، لكننا لا نحصل على تحسينات ذكية منها».

أما «أورايون»، أحدث إضافة لـ«أوبن إيه آي» والذي لم يتم الإعلان عنه بعد، فيتفوق على سابقيه لكن الزيادة في الجودة كانت أقل بكثير مقارنة بالقفزة بين «جي بي تي 3» و«جي بي تي 4»، آخر نموذجين رئيسيين للشركة، وفق مصادر أوردتها «ذي إنفورميشن».

ويعتقد خبراء كثر أجرت «وكالة الصحافة الفرنسية» مقابلات معهم أن قوانين الحجم وصلت إلى حدودها القصوى، وفي هذا الصدد، يؤكد سكوت ستيفنسون، رئيس «سبيلبوك»، وهي شركة متخصصة في الذكاء الاصطناعي القانوني التوليدي، أن «بعض المختبرات ركزت كثيراً على إضافة المزيد من النصوص، معتقدة أن الآلة ستصبح أكثر ذكاءً».

وبفضل التدريب القائم على كميات كبيرة من البيانات المجمعة عبر الإنترنت، باتت النماذج قادرة على التنبؤ، بطريقة مقنعة للغاية، بتسلسل الكلمات أو ترتيبات وحدات البكسل. لكن الشركات بدأت تفتقر إلى المواد الجديدة اللازمة لتشغيلها.

والأمر لا يتعلق فقط بالمعارف: فمن أجل التقدم، سيكون من الضروري قبل كل شيء أن تتمكن الآلات بطريقة أو بأخرى من فهم معنى جملها أو صورها.

- «تحسينات جذرية»

لكنّ المديرين في القطاع ينفون أي تباطؤ في الذكاء الاصطناعي. ويقول داريو أمودي، رئيس شركة «أنثروبيك»، في البودكاست الخاص بعالم الكمبيوتر ليكس فريدمان «إذا نظرنا إلى وتيرة تعاظم القدرات، يمكننا أن نعتقد أننا سنصل (إلى الذكاء الاصطناعي العام) بحلول عام 2026 أو 2027».

وكتب سام ألتمان الخميس على منصة «إكس»: «ليس هناك طريق مسدود». ومع ذلك، أخّرت «أوبن إيه آي» إصدار النظام الذي سيخلف «جي بي تي - 4».

وفي سبتمبر (أيلول)، غيّرت الشركة الناشئة الرائدة في سيليكون فالي استراتيجيتها من خلال تقديم o1، وهو نموذج من المفترض أن يجيب على أسئلة أكثر تعقيداً، خصوصاً في مسائل الرياضيات، وذلك بفضل تدريب يعتمد بشكل أقل على تراكم البيانات مرتكزاً بدرجة أكبر على تعزيز القدرة على التفكير.

وبحسب سكوت ستيفنسون، فإن «o1 يمضي وقتاً أطول في التفكير بدلاً من التفاعل»، ما يؤدي إلى «تحسينات جذرية».

ويشبّه ستيفنسون تطوّر التكنولوجيا باكتشاف النار: فبدلاً من إضافة الوقود في شكل بيانات وقدرة حاسوبية، حان الوقت لتطوير ما يعادل الفانوس أو المحرك البخاري. وسيتمكن البشر من تفويض المهام عبر الإنترنت لهذه الأدوات في الذكاء الاصطناعي.