نظم الذكاء الاصطناعي المولدة للصور تزيّف الحقائق

تعظّم أسوأ الجوانب النمطية للأعراق والأجناس

تظهر هذه الصور عند البحث عن كلمات (////// كلمات مثل) «أشخاص جذابون»
تظهر هذه الصور عند البحث عن كلمات (////// كلمات مثل) «أشخاص جذابون»
TT

نظم الذكاء الاصطناعي المولدة للصور تزيّف الحقائق

تظهر هذه الصور عند البحث عن كلمات (////// كلمات مثل) «أشخاص جذابون»
تظهر هذه الصور عند البحث عن كلمات (////// كلمات مثل) «أشخاص جذابون»

تميل أدوات الذكاء الاصطناعي المخصّصة للصور إلى إبراز الكليشيهات المزعجة: الأفارقة بدائيون، والأوروبيون علمانيون، والقادة رجال، والمساجين سود البشرة.

هذه الصور النمطية لا تعكس العالم الحقيقي؛ بل تنبع من البيانات التي تُمدّ وتدرَّب بها هذه التقنية، والتي تُسحب عادة من شبكة الإنترنت. وتتسم هذه البيانات بالسُميّة، حيث تمتلئ بالمحتوى الإباحي، وكراهية النساء، والعنف، والتعصّب.

هكذا ترى نماذج توليد الصور المدعومة بالذكاء الاصطناعي العالم. وفي موضوع كتبته كل من نتاشا تايكو، وكيفن شول، وتشو يو تشن، في «واشنطن بوست»، درست نماذج مثل «ستيبل ديفيوجن (Stable Diffusion)» و«دال - إي (DALL - E)».

صرّحت شركة «ستابيليتي إي آي» الشهيرة المطوّرة لنموذج توليد الصور «ستيبل ديفيوجن إكس إل» بأنّها نفذت استثمارات كبيرة لتخفيف الانحياز في أحدث نماذجها الذي أطلقته في يوليو (تموز) الماضي. ولكن، على الرغم من التحسينات، ظهر أن الأداة لا تزال تضخّم الصور النمطية الغربية.

ويحاجج كريستوف شوهمان؛ الشريك المؤسس لمنظّمة «لايون» غير الربحية التي تزوّد «ستيبل ديفيوجن» بالبيانات، بأنّ أدوات توليد الصور تعكس عالم السكّان البيض؛ لأنّ المنظّمات غير الربحية التي تزوّد شركات كثيرة بالبيانات لا تركّز في عملها على الصين والهند اللتين تضمّان أكبر شريحة سكانية من مستخدمي الشبكة.

وقال الكتاب إنهم عندما طلبوا من نموذج «ستيبل ديفيوجن إكس إل» توليد صور لمنازل في دولٍ مختلفة، أتت النتائج معبّرة عن النمطية السائدة عن كلّ بلد: منازل بأسقف كلاسيكية منحنية في الصين بدل الشقق العالية في شنغهاي؛ ومنازل مثالية بحدائق خضراء وشرفات عالية في الولايات المتحدة؛ وهياكل طينية مغبرة على طرقات غير نظيفة في الهند التي تحتضن 160 مليارديراً، ومومباي التي تحتلّ المرتبة الـ15 على لائحة أغنى مدن العالم.

ورأى شوهمان أنّ «هذه النتائج تعكس الصور النمطية العادية المحفوظة في رأس شخص عادي في أميركا الشمالية أو أوروبا. لا تحتاج إلى شهادة في علوم البيانات لتفهم هذا الأمر».

لا تنفرد «ستيبل ديفيوجن» في هذا الاتجاه؛ فقد صرّحت شركة «أوبن إي آي» في مستندات حديثة النشر بأنّ مولّد الصور الأخير الذي طوّرته «دال إي3»، «يميل نحو وجهة النظر الغربية بإنتاج صورٍ تظهر غالباً أشخاصاً بيض البشرة، ونساءً، وشباباً».

اليوم، تستطيع الصور الاصطناعية التي تنتشر على شبكة الإنترنت بثّ الحياة من جديد في صورٍ نمطية قديمة مسيئة، وتعيد أفكاراً مثالية منسية مرتبطة بصورة الجسد، والجندر، والعرق، إلى مستقبل صناعة الصورة.

مليارات الصور من الشبكة

وكما هي الحال مع «تشات جي بي تي»، تتعرّف أدوات الذكاء الاصطناعي لتوليد الصور على العالم عبر كميات ضخمة من بيانات التدريب. وبدل معالجة مليارات الكلمات، تقتات هذه النماذج على مليارات الصور والتوصيفات المرفقة بها المسحوبة من الشبكة أيضاً.

تزداد شركات التقنية تكتّماً على محتوى هذه الأنساق البيانية، ويعود هذا التكتّم في جزءٍ منه إلى خضوع هذا المحتوى غالباً لحقوق الملكية، أو افتقاره الدقّة، أو حتّى استعراضه مواد شائنة. ولكن يذكر أنّ شركتي «ستيبل ديفيوجن» و«لايون» تسمحان للجمهور باستكشاف تفاصيل النموذج؛ لأنّهما مشروعان مفتوحا المصدر.

ويقول عماد مشتاق، المدير التنفيذي في «ستابيليتي إي آي»، إنّ شركته ترى في الشفافية شرطاً أساسياً للتدقيق والقضاء على الانحياز، لافتاً إلى أنّها «تؤمن بأنّ النماذج مفتوحة المصدر ضرورية لتطبيق أعلى معايير السلامة، والعدل، والتمثيل».

انحياز لافت

شهد نموذج «ستيبل ديفيوجن إكس إل» تحسينات لافتة، إلا إن الكتاب نجحوا في حثّه على توليد فبركات عن العرق، والطبقة الاجتماعية، والجنس، والثروة، والذكاء، والدين، والثقافات الأخرى، من طلبات لتصوير نشاطات روتينية، وصفات شخصية شائعة، وأسماء بلاد أخرى. وفي أمثلة كثيرة، ظهرت التفاوتات العرقية في الصور أكثر تطرفاً ممّا هي عليه في العالم الحقيقي.

أظهر أحدث بيانات مكتب تعداد الولايات المتحدة من «مسح الدخل والمشاركة في البرامج» أنّ 63 في المائة من الحاصلين على المعونات الغذائية عام 2020 كانوا من بيض البشرة مقابل 27 في المائة من أصحاب البشرة السوداء. ولكن عندما حثّثنا التقنية على توليد صورة لشخص من متلقّي الخدمات الاجتماعية، عرضت النتيجة شخصاً من أصحاب البشرة الداكنة. وعندما طلبنا منها توليد صور «شخص منتج»، ظهر في جميع الصور رجال معظمهم من بيض البشرة، ويرتدون بدلات رسمية في وظائف إدارية.

وكانت براتيوشا كالوري، باحثة الذكاء الاصطناعي في جامعة ستانفورد، وفريقها قد اكتشفوا الخريف الماضي أنّ هذه الأدوات تتحوّل تلقائياً إلى الصور النمطية. فعندما طلبوا من إحداها توليد صورة «لشخص جذّاب»، أنتجت الأداة صوراً لأشخاص أوروبيين ببشرة وعيون فاتحة اللون؛ وعندما طلبوا صوراً «لعائلة سعيدة»، عرضت الأداة صور أشخاص بيض البشرة يضحكون مع أولادهم.

بيانات أنظف لنتائج أنظف

تركّز جهود تنظيف أدوات الذكاء الاصطناعي المخصصة للصور على تدخلات قليلة ولكن مثمرة: ترشيح أنساق البيانات، وترقية آخر مراحل التطوير، ووضع قواعد لحلّ مسائل أضرّت بسمعة الشركة.

ورأت ساشا لوتشيوني، العالمة الباحثة في «هاغينغ فيس»؛ وهي قاعدة مفتوحة المصدر للذكاء الاصطناعي وواحدة من الشركات الراعية لـ«لايون»، أنّ «ترشيح الأشياء السيئة من أنساق البيانات ليس حلاً سهلاً ونهائياً للانحياز».

وتقترح شركة «ستابيليتي إي آي» أن يكون لكلّ بلد مولّد محلّي للصور يعكس القيم الوطنية بأنساق بيانية توفّرها الحكومة والمؤسسات العامّة.

وينقسم خبراء مجال الذكاء الاصطناعي حول كيفية وضع حدٍّ للانحياز؛ فمثلاً ترى كالوري أنّ تخفيف الانحياز في الصور يختلف كلياً عمّا هو عليه في النصوص؛ لأنّ أيّ أمر حثّ لصناعة صورة واقعية لشخصٍ ما يجب أنّ يراعي قرارات تتعلّق بالعمر، والجسم، والعرق، والشعر، والخلفية والصفات المرئية، لافتةٍ إلى أنّ قلّة من هذه التعقيدات قابلة للحلّ بالتقنيات الكومبيوترية.

تعتقد كالوري أنّه من الضروري لأيّ شخص يتفاعل مع هذه التقنية أن يفهم كيف تعمل. وتشرح أنّ «هذه التقنيات هي نماذج تنبئيّة ترسم الأشياء بناءً على لقطة من نسق بياناتها المسحوبة من شبكة الإنترنت».

فشل استخدام أوامر حثّ مفصّلة في تخفيف هذا الانحياز أيضاً. فعندما طلبنا من الأداة فبركة صورة لشخصٍ ثري من دول مختلفة، تابعت «ستيبل ديفيوجن» إنتاج صورٍ مليئة بالنمطية: رجالٌ أفارقة يرتدون معاطف غربية واقفين أمام أكواخ من القش؛ ورجال «شرق أوسطيون» واقفين أمام جوامع قديمة؛ ورجال أوروبيون يرتدون بدلات أنيقة يتجوّلون في شوارع مرصوفة.

توكّد أبيبا بيرهاني، المستشارة البارزة المختصة في محاسبة الذكاء الاصطناعي في «موزيلّا فاونديشن»، أنّ الأدوات قابلة للتحسين إذا عملت الشركات بجدّ لتحسين البيانات، وهو أمرٌ غير متوقّع في رأيها. في الوقت الحالي؛ ترى المستشارة أنّ التأثير الأكبر لهذه الصور النمطية سيقع على المجموعات نفسها التي تأذّت في عصر التواصل الاجتماعي، مشدّدةً على أنّ «النّاس الذين يعيشون على هامش المجتمع سيبقون مستبعدين».

* يذكر أنّ جميع الصور الظاهرة في هذه القصة تعرض أموراً غير موجودة في العالم الحقيقي ووُلّدت باستخدام «ستيبل ديفيوجن»، وهو نموذج ذكاء اصطناعي مصمّم لتحويل النص إلى صورة


مقالات ذات صلة

الجيش الأميركي يوسّع حصار إيران ليشمل شحنات بضائع مهربة

الولايات المتحدة​ طائرات تنطلق من على سطح حاملة الطائرات الأميركية «أبراهام لينكولن» خلال الحرب على إيران يوم 3 مارس 2026 (رويترز)

الجيش الأميركي يوسّع حصار إيران ليشمل شحنات بضائع مهربة

قال سلاح البحرية الأميركية في بيان، الخميس، إن الجيش وسّع الحصار البحري المفروض على إيران، ليشمل شحنات البضائع المهربة.

«الشرق الأوسط» (لندن)
الولايات المتحدة​ أرشيفية لأفراد من شرطة نيويورك عند مدخل مترو الأنفاق بعد إغلاقه نهاية الأسبوع الماضي (رويترز)

فيديو لشرطيَين أميركيَين يضربان رجلا أسود في بروكلين يثير غضباً واسعاً

دان رئيس بلدية نيويورك زهران ممداني، الأربعاء، مقطع فيديو يظهر فيه شرطيان أحدهما بملابس مدنية يضربان رجلا أسود وقد انتشر على نطاق واسع وأدى إلى فتح تحقيق رسمي.

«الشرق الأوسط» (نيويورك)
الولايات المتحدة​  رسم توضيحي لأمير بالات وإبراهيم قيومي خلال مثولهما أمام محكمة فدرالية في نيويورك (رويترز)

أميركيان يدفعان ببراءتهما من تهم التخطيط لهجوم إرهابي في نيويورك

دفع شابان متأثران بـ«الفكر الجهادي» ألقيا عبوات ناسفة قرب تظاهرة مناهضة للإسلام خارج مقر إقامة رئيس بلدية نيويورك مطلع مارس، ببراءتهما من التهم الموجهة إليهما.

«الشرق الأوسط» (نيويورك)
شؤون إقليمية علم إيراني يظهر بالقرب من مبنى سكني تضرر جراء غارة جوية على طهران (رويترز) p-circle

تقرير: إيران تُعيد تأهيل منصات إطلاق صواريخ مدفونة وسط هدنة هشة

في ظلّ هدنة مؤقتة بين إيران من جهة، والولايات المتحدة وإسرائيل من جهة أخرى، تكشف المعطيات الميدانية عن سباق خفي لإعادة ترتيب القدرات العسكرية.

«الشرق الأوسط» (لندن)
الولايات المتحدة​ الرئيس الأميركي دونالد ترمب ونظيره الصيني شي جينبينغ (أ.ب) p-circle

ترمب: طلبت من الرئيس الصيني عدم تزويد إيران بالأسلحة

قال الرئيس الأميركي دونالد ترمب لشبكة «فوكس بيزنس» خلال مقابلة بُثت اليوم الأربعاء إنه طلب من نظيره الصيني شي جينبينغ في رسالة ألا يزود إيران بالأسلحة

«الشرق الأوسط» (واشنطن)

وحدات «إنفيديا» للرسومات المدمجة في الكومبيوترات المحمولة تطلق عنان الإبداع والذكاء الاصطناعي

حوّل المهام الروتينية التقليدية إلى عمليات ذكية وسريعة لتسريع الإبداع
حوّل المهام الروتينية التقليدية إلى عمليات ذكية وسريعة لتسريع الإبداع
TT

وحدات «إنفيديا» للرسومات المدمجة في الكومبيوترات المحمولة تطلق عنان الإبداع والذكاء الاصطناعي

حوّل المهام الروتينية التقليدية إلى عمليات ذكية وسريعة لتسريع الإبداع
حوّل المهام الروتينية التقليدية إلى عمليات ذكية وسريعة لتسريع الإبداع

في عالم يزداد فيه الاعتماد على التقنيات الرقمية، يبحث المبدعون ومحررو عروض الفيديو والصور عن أدوات تمنحهم التفوق والسرعة. وتُعدّ الكومبيوترات المحمولة المزودة بوحدات رسومات متخصصة الخيار الأمثل لهم، حيث توفر تجربة سلسة ومتقدمة مدعومة بأعلى أداء للذكاء الاصطناعي. هذه الأجهزة مصممة لتتيح لهم العمل بذكاء أكبر وبجهد أقل، مع توفير أداء يضمن إنشاء المحتوى بسلاسة تامة ودون قيود أو تأخير في سير العمل.

ولدى الحديث عن تحسين سير العمل الإبداعي، فإن وحدات الرسومات من سلسلة «إنفيديا جيفورس آر تي إكس 50» (NVIDIA GeForce RTX 50) تُعد من أفضل ابتكارات الذكاء الاصطناعي؛ فمن خلال تقنيات الذكاء الاصطناعي التي تعمل بها، ومن خلال منصة وتعاريف «إنفيديا استوديو» (NVIDIA Studio) وأدوات تسريع سير العمل، تتحول المهام الروتينية التقليدية إلى عمليات ذكية وسريعة.

أداء مضاعف وموثوقية أعلى في تطبيقات التصميم والمونتاج في الكومبيوترات التي تدعم وحدات الرسومات المدمجة

دعم ممتد لتسريع البرامج الاحترافية

تعتمد جميع البرامج الإبداعية المعروفة اليوم على تسريع وحدات الرسومات، مما يعني إنجاز المشاريع في زمن قياسي وتعزيز قدرة المبدعين. ويوجد حالياً أكثر من 100 برنامج إبداعي يدعم تسريع العمل عبر وحدة الرسومات، مثل «أدوبي لايتروم» و«فوتوشب» و«إلاستريتر» و«بريمير إليمنتس» و«بريمير برو» و«آفتر إفكتس» و«سابستانس 3 دي بينتر» و«أنريل إنجين» و«يونيتي» و«أوتوديسك مايا» و«بليندر» و«كابكات» و«كوريل درو» و«دافينشي ريزولف» و«أو بي إس ستوديو» و«ووندرشير فيلمورا»، وغيرها.

ومن أبرز مزايا هذه الوحدات أداء الذكاء الاصطناعي التوليدي لعروض الفيديو الذي أصبح أسرع بنحو الضعفين مقارنة بالأجيال السابقة. هذا الأمر يضمن للمبدعين عدم إضاعة الوقت في الانتظار، والتركيز بدلاً من ذلك على الإبداع الخالص.

تقنية «آر تي إكس ريمكس» لتطوير رسومات وإضاءة الألعاب الكلاسيكية

وفي مجال تحرير الفيديو، توفر هذه الكومبيوترات المحمولة قدرة هائلة على التعامل مع العروض عالية الجودة بسلاسة تامة لنحو مرتين ونصف المرة، مقارنةً بالأجيال السابقة. ويمكن للمحررين تطبيق مؤثرات الذكاء الاصطناعي بسرعة فائقة وتصدير المحتوى «Render» في وقت قصير جداً، وإنتاج محتوى مبتكَر بمساعدة الذكاء الاصطناعي. وفي مجال التصوير الفوتوغرافي، يمكن معالجة ملفات الصور من امتداد «RAW» الضخمة، وتطبيق التعديلات الذكية والفلترة الفورية للصور.

وبالنسبة لمصممي الرسومات ثلاثية الأبعاد والرسوم المتحركة، فإن تصدير المحتوى الخاص بالمشاهد المعقدة لم يعد عائقاً؛ إذ يمكن معاينة الإضاءة في الوقت الفعلي وبناء النماذج والأنسجة (Textures) المختلفة للعناصر بسرعة مذهلة تصل لغاية 5 أضعاف ونصف المرة مقارنة بالأجيال السابقة. ويتحقق ذلك مع استقرار مثالي بفضل تعاريف «استوديو» المخصصة التي تضمن الأداء المرتفع والموثوقية الكبيرة في عمل البرامج المختلفة دون أي توقف أو تقطع. كما تساهم تقنيات مثل «إنفيديا إيس» (NVIDIA Ace)، في بناء شخصيات رقمية حقيقية ومرئيات واقعية للغاية باستخدام تقنيات الذكاء الاصطناعي.

رفع مستويات الإنتاجية والترفيه

تُعد الإنتاجية اليومية جزءاً لا يتجزأ من التجربة، حيث يبرز «تشات آر تي إكس» (Chat RTX)، كأداة ثورية تمنح المستخدم إجابات مخصصة من ملفاته الخاصة لأي سؤال يخطر بباله. ويمكن للمستخدم، مثلاً، البحث بسهولة في ملاحظاته وصوره وملفاته باستخدام النصوص أو الأوامر الصوتية عبر روبوت دردشة خاص وسري. هذا النوع من المساعدة الرقمية يجعل الكومبيوتر المحمول مساعداً شخصياً يتولى عنه العمل الشاق.

وبالإضافة إلى العمل، تقدم هذه الأجهزة تجربة ترفيهية متطورة؛ إذ ترفع تقنية «آر تي إكس فيديو» (RTX Video) مستوى عروض الفيديو على الإنترنت إلى الدقة الفائقة «4K». كما تتيح تقنية «برودكاست» (Broadcast) تحويل غرفة المستخدم إلى استوديو احترافي للبث والاجتماعات، موفرة جودة بصرية بالدقة الفائقة «4K» وصوتية عالية تصل لغاية ضعفَي الأجيال السابقة، مع تجربة خالية من التقطع لتعزيز الحضور الرقمي.

وللمبدعين الذين يحبون الألعاب القديمة، توفر تقنية «آر تي إكس ريمكس» (RTX Remix) إمكانية إعادة تطوير رسومات وإضاءة تلك الألعاب، حتى لو لم تكن تدعم الإضاءة المتقدمة أو الرسومات فائقة الدقة، حيث تتيح الأداة التقاط أصول اللعبة وترقية موادها بالذكاء الاصطناعي، مع إضافة تتبع الأشعة الضوئية من مصدرها (Ray Tracing)، وتقنية «دي إل إس إس» Deep Learning Super Sampling DLSS لزيادة عدد الرسومات في الثانية (Frames per Second FPS)، دون فقدان مستويات الأداء، وذلك باستخدام تقنيات الذكاء الاصطناعي مما يضمن الحصول على أعلى معدل رسومات في الثانية وأفضل جودة بصرية ممكنة دون أي عناء. كما يمكن إضافة المؤثرات البصرية المختلفة إلى الألعاب بكل سهولة.

تعتمد هذه الكومبيوترات المحمولة على تقنية «ماكس-كيو» (Max-Q) الحصرية التي تضمن توازناً مثالياً بين الأداء واستهلاك الطاقة. وبفضلها، يمكن العمل على جهاز قوي وهادئ في الوقت نفسه مع عمر بطارية أطول. هذا التصميم يناسب تماما من يبحث عن الأداء المرتفع في هيكل محمول وسهل التنقل.

اختيار كومبيوتر محمول مدعوم بوحدات الرسومات المتقدمة هو خطوة نحو ضمان سلاسة عمل القطاع الإبداعي بفضل القوة التي يوفرها الذكاء الاصطناعي والتكامل مع منصة «استوديو»، ليصبح كل ما يقوم المستخدم به أكثر ذكاء وأسرع وأكثر متعة، ولتحويل الأفكار إلى واقع بأقل مجهود وأعلى جودة.


شركة صينية تطوّر مرحاض سيارة يُشغَّل بالأوامر الصوتية

سيارات في صالة عرض في بكين 16 أبريل 2026 (أ.ف.ب)
سيارات في صالة عرض في بكين 16 أبريل 2026 (أ.ف.ب)
TT

شركة صينية تطوّر مرحاض سيارة يُشغَّل بالأوامر الصوتية

سيارات في صالة عرض في بكين 16 أبريل 2026 (أ.ف.ب)
سيارات في صالة عرض في بكين 16 أبريل 2026 (أ.ف.ب)

سجّلت شركة صينية لصناعة السيارات براءة اختراع لمرحاض مخفي أسفل مقعد سيارة منزلق، ويمكن تشغيله باستخدام أوامر صوتية، وفق قاعدة بيانات حكومية، ووفق ما نقلته «وكالة الصحافة الفرنسية».

وأظهرت السجلات العامة أن شركة السيارات الكهربائية «سيريس» (Seres) نالت، في وقت سابق من هذا الشهر، الموافقة على براءة اختراع مرحاضها المتنقّل.

ويُمكن استخدام المرحاض يدوياً عبر إرجاع المقعد إلى الخلف، أو من خلال الأمر الصوتي «تشغيل المرحاض».

وقال مهندسو الشركة في ملف طلب براءة الاختراع إن هذا النظام يهدف إلى «تلبية احتياجات المستخدمين خلال الرحلات الطويلة، أو أثناء التخييم، أو عند المكوث داخل السيارة».

ويعمل نظام مروحة مع أنبوب عادم على تصريف الروائح إلى خارج السيارة، في حين تُجمع الفضلات في خزان يتطلّب التفريغ الدوري. كما يضمّ المرحاض عنصراً حرارياً دوّاراً يعمل على تبخير البول، وتجفيف الفضلات الأخرى.

وخلال السنوات الأخيرة، كشفت شركات السيارات الكهربائية في الصين عن طرازات مزوّدة بإكسسوارات لا تحصى، في مسعى إلى جذب المستهلكين في سوق شديدة التنافس.

وأصبحت ميزات مثل أنظمة الكاراوكي والثلاجات الصغيرة شائعة، فيما تقول شركة «نيو» (Nio) إن مقاعد بعض طرازاتها مزوّدة بخاصية «التدليك بالحجارة الساخنة».

وفي العام الماضي، أعلنت شركة «بي واي دي» (BYD)، الرائدة في القطاع، عن نظام ذكي لطائرات مسيّرة مدمجة في المركبات، بينما أفادت شركة «إكس بينغ» (XPeng) بأن عمليات تسليم سيارتها المعروفة باسم «حاملة الطائرات البرية»، وهي مركبة تحتوي على طائرة ذات ست مراوح، يُتوقّع أن تبدأ هذا العام.

ولا يزال من غير الواضح ما إذا كانت فكرة «سيريس» ستدخل مرحلة الإنتاج.

ولم ترد الشركة، التي تعاونت مع عملاق الاتصالات «هواوي» لتطوير خط سياراتها الفاخرة «آيتو»، على طلب «وكالة الصحافة الفرنسية» للتعليق.


نظام يتيح للروبوتات رباعية الأرجل تفادي العوائق قبل الاصطدام

يعتمد النظام على دمج الإدراك الذاتي مع الرؤية الخارجية لمساعدة الروبوت على فهم العوائق قبل ملامستها (KAIST)
يعتمد النظام على دمج الإدراك الذاتي مع الرؤية الخارجية لمساعدة الروبوت على فهم العوائق قبل ملامستها (KAIST)
TT

نظام يتيح للروبوتات رباعية الأرجل تفادي العوائق قبل الاصطدام

يعتمد النظام على دمج الإدراك الذاتي مع الرؤية الخارجية لمساعدة الروبوت على فهم العوائق قبل ملامستها (KAIST)
يعتمد النظام على دمج الإدراك الذاتي مع الرؤية الخارجية لمساعدة الروبوت على فهم العوائق قبل ملامستها (KAIST)

طوّر باحثون من المعهد الكوري المتقدم للعلوم والتكنولوجيا (KAIST) نظاماً جديداً للتحكم في الروبوتات رباعية الأرجل، حيث يهدف إلى جعل حركتها أقل اعتماداً على رد الفعل بعد الاصطدام بالعوائق، وأكثر قدرة على «رؤية» البيئة واتخاذ القرار أثناء الحركة. ويأتي هذا العمل تحت اسم «DreamWaQ++».

الفكرة ليس مجرد جعل الروبوت يمشي على تضاريس صعبة، بل تمكينه من الجمع بين نوعين من الإدراك في الوقت نفسه؛ الأول هو الإدراك الذاتي المرتبط بما يشعر به الروبوت من خلال مفاصله وحركته واتزانه، والثاني هو الإدراك الخارجي عبر الكاميرات و(LiDAR) «لايدار»، بحيث لا ينتظر الروبوت أن تلمس رجلاه العقبة كي يفهم ما أمامه، بل يحاول قراءتها مسبقاً، وتعديل طريقته في المشي وفقاً لذلك.

هذا تحديداً هو ما تعتبره الدراسة تجاوزاً لمحدودية كثير من الأنظمة السابقة، التي كانت تعتمد على الإحساس الداخلي فقط، أو تحتاج في المقابل إلى خرائط دقيقة ومعقدة للبيئة كي تستفيد من الرؤية الخارجية.

أظهرت الاختبارات تحسناً في معدلات النجاح مقارنة ببعض النماذج البصرية المرجعية في التعامل مع السلالم والعوائق غير المنتظمة (KAIST)

نحو حركة استباقية

أوضح فريق «KAIST» أن النسخة السابقة من النظام «DreamWaQ» كانت تتيح ما يشبه «المشي الأعمى»، أي القدرة على تقدير طبيعة الأرض من دون رؤية مباشرة، وهو ما يُفيد مثلاً في البيئات التي يصعب فيها الاعتماد على المعلومات البصرية، مثل الظلام أو الدخان. لكن هذا النهج كانت له حدود؛ حيث إن الروبوت كان يحتاج غالباً إلى ملامسة العائق أولاً قبل أن يعدّل حركته. أما «DreamWaQ++» فيحاول الانتقال من هذا النمط التفاعلي إلى نمط أكثر استباقية؛ حيث يتعرف الروبوت إلى العوائق قبل الوصول إليها، ويختار أسلوب الحركة المناسب في الزمن الحقيقي.

الدراسة تصف هذا الانتقال بوصفه دمجاً بين الإدراكين الداخلي والخارجي، عبر إطار تعلم تعزيزي متعدد الوسائط.

واستهدف الباحثون معالجة مشكلة معروفة في الروبوتات رباعية الأرجل؛ حيث تكون واعدة جداً للعمل في البيئات المزدحمة والمعقدة، لكنها تبقى حساسة لعدم اليقين في العالم الحقيقي، ما يجعل التحكم في حركتها تحدياً كبيراً. لذلك يقترح العمل الجديد طريقة تجعل الروبوت أكثر قدرة على اجتياز الأراضي الوعرة، والمنحدرات الحادة، والسلالم العالية، مع الحفاظ على درجة من الصمود حتى في الحالات الخارجة عن التوزيعات التي تدرب عليها.

بين الرؤية والإحساس

الأهمية هنا ليست أكاديمية فقط، فواحدة من المشكلات العملية في الروبوتات المتحركة هي أن الرؤية وحدها لا تكفي دائماً، والإحساس الذاتي وحده لا يكفي أيضاً. إذا اعتمد الروبوت على «الإحساس الداخلي» فقط، فقد يضطر إلى اختبار الأرض برجله أولاً، ما يبطئ الحركة، ويزيد خطر التعثر أو الاصطدام. وإذا اعتمد على الرؤية الخارجية وحدها، فقد يحتاج إلى نمذجة شديدة الدقة للبيئة، وهو أمر صعب في المواقع غير المنتظمة أو المتغيرة باستمرار. يحاول «DreamWaQ++» سد هذه الفجوة عبر المزج بين الحالتين، بحيث يتحرك الروبوت بناءً على ما «يراه» وما «يشعر به» معاً.

ومن المؤشرات اللافتة التي ظهرت في المادة المصاحبة للمشروع، أن النظام حقق في اختبارات المحاكاة على 1000 روبوت، معدلات نجاح أعلى بنحو 20 إلى 40 في المائة، مقارنة ببعض النماذج البصرية المرجعية عبر تكوينات مختلفة من السلالم. كما أشارت الصفحة التعريفية للمشروع إلى أن النظام يتعامل مع السلالم غير المتماثلة عبر تكييف حركة رفع الرجل وفق شكل العائق، وهي نقطة مهمة لأن كثيراً من البيئات الحقيقية لا تأتي في صورة سلالم أو حواف مثالية وثابتة.

يعكس هذا التطور اتجاهاً أوسع نحو جعل الروبوتات أكثر قدرة على الحركة الذكية في بيئات واقعية وغير مضمونة (KAIST)

تحسن في الأداء

هذا النوع من التقدم يعكس اتجاهاً أوسع في عالم الروبوتات يتعلق بالانتقال من الحركة المستقرة في بيئات مضبوطة إلى الحركة الذكية في بيئات غير مضمونة. فمن الناحية النظرية، يمكن أن يفتح ذلك المجال أمام استخدامات أكثر واقعية في مواقع الكوارث، والمناطق الصناعية، والبيئات المزدحمة أو غير المنتظمة؛ حيث لا تكون الأرضية مهيأة سلفاً، ولا يمكن افتراض أن الروبوت سيعمل دائماً في ظروف مثالية. ويرى الفريق إمكان توسيع هذه التقنية إلى منصات أخرى، مثل الروبوتات ذات العجلات والأرجل أو حتى الروبوتات الشبيهة بالبشر.

مع ذلك، لا يعني هذا أن الروبوت بات «يفكر» كما يفعل الإنسان بالمعنى الحرفي. ما يقدمه البحث هو تحسن في الإدراك الحركي، واتخاذ القرار أثناء التنقل وليس وعياً تاماً أو فهماً شاملاً للبيئة. لكنه يظل تقدماً مهماً؛ لأن الحركة في العالم الواقعي هي واحدة من أصعب المشكلات في الروبوتات: الأرض قد تكون غير مستقرة، والعقبات قد تكون غير منتظمة، والاستجابة يجب أن تكون سريعة بما يكفي لتجنب السقوط أو التوقف. وفي هذا السياق، فإن تمكين الروبوت من تعديل خطاه قبل الاصطدام، لا بعده، يُمثل فرقاً جوهرياً في فلسفة الحركة نفسها.