«تشات جي بي تي 4.5» و«غوغل جيميناي 2.0»: صراع العمالقة في عالم الذكاء الاصطناعي

مقارنة بين النموذجين الأحدث... ونظرة على قدراتهما

منافسة حادة بين نموذجي «تشات جي بي تي 4.5» و«غوغل جيميناي 2.0» للتربع على عرش الذكاء الاصطناعي
منافسة حادة بين نموذجي «تشات جي بي تي 4.5» و«غوغل جيميناي 2.0» للتربع على عرش الذكاء الاصطناعي
TT

«تشات جي بي تي 4.5» و«غوغل جيميناي 2.0»: صراع العمالقة في عالم الذكاء الاصطناعي

منافسة حادة بين نموذجي «تشات جي بي تي 4.5» و«غوغل جيميناي 2.0» للتربع على عرش الذكاء الاصطناعي
منافسة حادة بين نموذجي «تشات جي بي تي 4.5» و«غوغل جيميناي 2.0» للتربع على عرش الذكاء الاصطناعي

في سباق محموم نحو تطوير الذكاء الاصطناعي، تطل علينا شركتا «أوبن إيه آي» و«غوغل» بإصدارين جديدين يعدان بنقلة نوعية في عالم نماذج اللغة الكبيرة: «تشات جي بي تي 4.5» Chat GPT 4.5 و«غوغل جيميناي 2.0» Google Gemini 2.0، وهما نموذجان يقدِّمان ميزات وقدرات متطورة تجعل منهما أداتين قويتين ومتنوعتين قادرتين على التعامل مع مهام معقدة بكفاءة ودقة عالية.

وسنستعرض في هذا الموضوع أبرز المزايا التي يقدمها هذان النموذجان ونقارن بينهما في جوانب عدة، لنكشف عن نقاط القوة والضعف في كل منهما ونسلط الضوء على الفروقات التي قد تكون حاسمةً في اختيار النموذج الأنسب لكم.

قفزة «جي بي تي» النوعية

يتجسَّد في «تشات جي بي تي 4.5»، الفهم المحسَّن للسياق. وهو يمثل قفزةً نوعيةً في عالم نماذج اللغة الكبيرة، حيث يأتي بتحسينات ملحوظة في الأداء والقدرات مقارنة بالإصدارات السابقة. وهذه التحسينات تجعله أداةً أكثر قوةً وتنوعاً، قادرةً على التعامل مع مجموعة واسعة من المهام بكفاءة ودقة عالية.

وسنستعرض فيما يلي أبرز المزايا التي يقدِّمها هذا النموذج المطور.

• الميزة الأولى: الفهم المُحسَّن للسياق، حيث يتمتع «تشات جي بي تي 4.5» بقدرة مُحسَّنة على فهم السياق في المحادثات المعقدة والطويلة. وهذا الأمر يعني أنه يمكنه تتبع التفاصيل الدقيقة للمحادثة وفهم العلاقات بين الأفكار المختلفة وتقديم استجابات أكثر دقةً وملاءمة.

وهذه الميزة تجعل النظام أكثر فاعليةً في المهام التي تتطلب فهماً عميقاً للنصوص، مثل تلخيص المستندات الطويلة أو الإجابة عن الأسئلة المعقدة.

• الميزة الثانية: تقديم دقة أعلى في الإجابات، حيث تم تحسينه لتقديم إجابات أكثر دقةً وموثوقيةً، مع خفض الهلوسة أو توليد معلومات خاطئة. وهذا التحسين يجعله أداةً أكثر موثوقيةً للاستخدام في مجموعة متنوعة من المهام المتخصصة، مثل البحث عن المعلومات أو كتابة المحتوى.

• الميزة الثالثة التي يتمتع بها «تشات جي بي تي 4.5»، هي تقديم قدرات إبداعية محسنة، إذ يتمتع بقدرات إبداعية مُطوَّرة تسمح له بتوليد نصوص أكثر إبداعاً وتنوعاً. ويمكن استخدام هذه الميزة لكتابة القصص والشعر والنصوص المتقدمة والمحتوى الإبداعي.

• الميزة الرابعة هي دعم قدرات الوسائط المتعددة؛ حيث تتكامل مع أحدث ميزات «تشات جي بي تي»، بما في ذلك تحميل الملفات والصور وقدرات البحث، وغيرها. ومع ذلك، لا تزال قدرات الوسائط المتعددة مثل الوضع الصوتي ومعالجة الفيديو ومشاركة الشاشة غير مدعومة في هذا الإصدار الجديد.

«جيميناي 2.0»: تكامل مع «غوغل»

يمثل «غوغل جيميناي 2.0» خطوةً ثوريةً في مجال نماذج الذكاء الاصطناعي، حيث يجمع بين قوة التعلم العميق، وقدرات معالجة البيانات الهائلة؛ لتقديم أداء غير مسبوق في مجموعة متنوعة من المهام. ويتميز هذا الإصدار الجديد بقدرته على فهم وتوليد النصوص والصور والصوتيات وعروض الفيديو، مما يجعله نموذجاً متعدد الوسائط، قادراً على التكيف مع احتياجات المستخدمين في مختلف المجالات.

• الميزة الأولى لـ«غوغل جيميناي 2.0» هي دعم الوسائط المتعددة، حيث إن له قدرةً فائقةً على فهم وتوليد المحتوى عبر مختلف الوسائط، بما في ذلك النصوص والصور والصوتيات وعروض الفيديو. ويمكنه تحليل الصور والفيديوهات بدقة عالية وفهم محتواها وتوليد أوصاف نصية دقيقة لها. كما يمكنه توليد الصوتيات وتحويل النصوص إلى كلام منطوق، والعكس. هذه القدرات المتعددة الوسائط تجعله أداةً متقدمةً جداً للإبداع والتواصل والتعلم.

• الميزة الثانية، هي الفهم المتقدم للغات؛ ما يسمح له بتحليل النصوص المعقدة وفهم العلاقات بين الكلمات والجمل بدقة عالية، حيث يمكنه فهم السياق واستخلاص المعلومات المهمة والإجابة عن الأسئلة المعقدة بدقة وموضوعية. وهذا الفهم المتقدم للغة (يشمل فهم اللغة العربية) يجعله أداةً قيّمة للبحث عن المعلومات وتلخيص النصوص والترجمة بين اللغات المختلفة وكتابة المحتوى.

• الميزة الثالثة: تحسن الإصدار من حيث قدرات كتابة النصوص البرمجية، وذلك نتيجة تحسينه للتعامل مع المهام البرمجية المعقدة، حيث يمكنه فهم وتوليد النصوص البرمجية بلغات البرمجة المختلفة وتصحيح الأخطاء واقتراح التحسينات للنصوص الحالية. وهذه القدرات البرمجية تجعله مرجعاً مهماً للمطورين والمبرمجين، حيث يمكنهم استخدامه لكتابة النصوص بشكل أسرع وأكثر كفاءة.

• الميزة الرابعة، وهي تكامله السلس مع خدمات «غوغل»، حيث يتكامل الإصدار الجديد بسلاسة مع مجموعة واسعة من خدمات «غوغل»؛ ما يجعله متاحاً للمستخدمين في مختلف التطبيقات والمنصات. ويمكن استخدامه في محرك البحث و«مساعد غوغل» والخدمات السحابية لـ«غوغل» التي تشمل «وثائق غوغل» وجداول الحسابات وعروض التقديم، وغيرها من الخدمات الأخرى. هذا التكامل السلس يجعل من الإصدار الجديد أداةً عالية الكفاءة للبحث عن المعلومة وإنجاز المهام والتواصل مع الآخرين.

مقارنة بين الإصدارين الجديدين

ولدى طلب التخطيط لقضاء إجازة في منطقة، قدَّم «تشات جي بي تي 4.5» خط سير مفصلاً مع اقتراحات للسير لمسافات طويلة، وأماكن لتناول الطعام، وخيارات للسكن، إلى جانب نصائح حول كيفية الوصول إلى الوجهة. وفي المقابل، قدَّم «غوغل جيميناي 2.0» مقترحات جيدة للسير لمسافات طويلة وتناول الطعام، ولكنه كان أقل تحديداً حول أماكن السكن.

وفي ما يتعلق بالترجمة، قدم كلا النموذجين ترجمات دقيقة بين اللغات العربية والإنجليزية والفرنسية. وكان الفارق الوحيد هو أن «تشات جي بي تي 4.5» قدَّم روابط مع الترجمة. أما لدى سؤال الإصدارين حول حالة الطقس في مدينة الرياض، فقدَّم «غوغل جيميناي 2.0» حالة الطقس الحالي، بينما قدم «تشات جي بي تي 4.5» توقعات لكل ساعة مع صور وكلمات تصف حالة الطقس.

وفي الخلاصة، لا يمكن اعتبار أي منهما أفضل بشكل قاطع من الآخر، على الرغم من وجود بعض الاختلافات الطفيفة بينهما، والتي قد لا تكون ملحوظةً في الاستخدامات اليومية العادية. ويُنصح بالتحقق من جميع النتائج حتى لا يقع المستخدم في مشكلة الهلوسة (تأليف الذكاء الاصطناعي للمعلومة التي لا يعرفها لتبدو وكأنها حقيقية).

النموذجان متقدمان والاختيار بينهما يعتمد على تفضيلات المستخدمين بشكل فردي. ولكن يبقى فارق أخير بينهما يستحق الذكر، وهو أن «غوغل جيميناي 2.0» يسمح بتحميل الملفات والوثائق الكبيرة وتلخيصها والإجابة عن أي استفسارات مرتبطة بها بشكل مجاني، مقارنة باشتراك مدفوع في «تشات جي بي تي 4.5» وقيوده فيما يتعلق بحجم الملفات وعدد مرات استخدام هذا الميزة في اليوم الواحد.

«أبل» تؤجّل ميزات الذكاء الاصطناعي الجديدة

من جهتها أعلنت «أبل» تأجيل إطلاق النسخة المُحدَّثة من مساعدها الصوتي «سيري» التي كان من المفترض أن تُقدِّم قدرات متطورة لفهم السياق الشخصي وتنفيذ المهام داخل التطبيقات. وأوضحت الشركة أنها ستطلق هذه التحديثات خلال العام المقبل دون تحديد موعد دقيق لذلك. ويأتي هذا التأجيل نتيجة لصعوبات واجهت «أبل» في تطوير «سيري» المحدث، وإدراكها أن خططها لربط المساعد الصوتي بنموذج لغة كبير لتعزيز قدراته قد تستغرق سنوات عدة لتنضج بالشكل المرغوب، مقارنة بقدرات «سامسونغ» للذكاء الاصطناعي التي أطلقتها في سلسلة هواتفها «غالاكسي إس 25»، التي أطلقتها في شهر فبراير (شباط) الماضي، والتي تدعم تنفيذ المهام داخل التطبيقات بشكل مدمج.

وكانت «أبل» قد قدَّمت «سيري» المطور بوصفه جزءاً أساسياً من رؤيتها لـ«ذكاء أبل»، حيث وعدت بقدرة المساعد الصوتي على فهم ما يحدث في الجوال وتنفيذ الإجراءات داخل التطبيقات. ولكن ما تم إطلاقه حتى الآن يقتصر على ميزات مبسطة مثل الكتابة إلى «سيري» وفهم وشرح ميزات منتجات «أبل» وتحسينات بصرية، وتكامل مع «تشات جي بي تي».


مقالات ذات صلة

نظم ذكاء اصطناعي... لجميع اللغات والثقافات

علوم نظم ذكاء اصطناعي... لجميع اللغات والثقافات

نظم ذكاء اصطناعي... لجميع اللغات والثقافات

جهود حثيثة من أميركا اللاتينية إلى آسيا

كريس ستوكل - والكر (واشنطن)
علوم «الذكاء المُتذبذب» أهم سمات الذكاء الاصطناعي

«الذكاء المُتذبذب» أهم سمات الذكاء الاصطناعي

بخلاف الدماغ البشري حيث تترابط المعارف وقدرات حل المشكلات..

كيد ميتز (نيويورك)
الاقتصاد شعار شركة «تي إس إم سي» في هذا الرسم التوضيحي (رويترز)

قفزة بـ58 % في الأرباح... «تي إس إم سي» تُحكم قبضتها على مستقبل الذكاء الاصطناعي

أعلنت شركة تايوان لصناعة أشباه الموصلات (تي إس إم سي)، يوم الخميس عن قفزة بنسبة 58 في المائة في أرباح الربع الأول، مسجِّلة مستويات قياسية فاقت توقعات السوق.

«الشرق الأوسط» (تايبيه )
المشرق العربي أشخاص يمرون أمام لافتة تعرض صور الصحافييَن فاطمة فتوني وعلي شعيب اللذين قُتلا في غارة إسرائيلية في جنوب لبنان خلال مظاهرة في بغداد 7 أبريل 2026 (أ.ف.ب)

«رابطة الصحافة الأجنبية» تتهم الجيش الإسرائيلي بفبركة صورة لصحافي لبناني لتبرير قتله

هاجمت «رابطة الصحافة الأجنبية» الجيش الإسرائيلي بسبب صورة مفبركة بالذكاء الاصطناعي استخدمها لاتهام صحافي لبناني قتله الشهر الماضي بأنه عضو في «حزب الله».

«الشرق الأوسط» (تل أبيب)

وحدات «إنفيديا» للرسومات المدمجة في الكومبيوترات المحمولة تطلق عنان الإبداع والذكاء الاصطناعي

حوّل المهام الروتينية التقليدية إلى عمليات ذكية وسريعة لتسريع الإبداع
حوّل المهام الروتينية التقليدية إلى عمليات ذكية وسريعة لتسريع الإبداع
TT

وحدات «إنفيديا» للرسومات المدمجة في الكومبيوترات المحمولة تطلق عنان الإبداع والذكاء الاصطناعي

حوّل المهام الروتينية التقليدية إلى عمليات ذكية وسريعة لتسريع الإبداع
حوّل المهام الروتينية التقليدية إلى عمليات ذكية وسريعة لتسريع الإبداع

في عالم يزداد فيه الاعتماد على التقنيات الرقمية، يبحث المبدعون ومحررو عروض الفيديو والصور عن أدوات تمنحهم التفوق والسرعة. وتُعدّ الكومبيوترات المحمولة المزودة بوحدات رسومات متخصصة الخيار الأمثل لهم، حيث توفر تجربة سلسة ومتقدمة مدعومة بأعلى أداء للذكاء الاصطناعي. هذه الأجهزة مصممة لتتيح لهم العمل بذكاء أكبر وبجهد أقل، مع توفير أداء يضمن إنشاء المحتوى بسلاسة تامة ودون قيود أو تأخير في سير العمل.

ولدى الحديث عن تحسين سير العمل الإبداعي، فإن وحدات الرسومات من سلسلة «إنفيديا جيفورس آر تي إكس 50» (NVIDIA GeForce RTX 50) تُعد من أفضل ابتكارات الذكاء الاصطناعي؛ فمن خلال تقنيات الذكاء الاصطناعي التي تعمل بها، ومن خلال منصة وتعاريف «إنفيديا استوديو» (NVIDIA Studio) وأدوات تسريع سير العمل، تتحول المهام الروتينية التقليدية إلى عمليات ذكية وسريعة.

أداء مضاعف وموثوقية أعلى في تطبيقات التصميم والمونتاج في الكومبيوترات التي تدعم وحدات الرسومات المدمجة

دعم ممتد لتسريع البرامج الاحترافية

تعتمد جميع البرامج الإبداعية المعروفة اليوم على تسريع وحدات الرسومات، مما يعني إنجاز المشاريع في زمن قياسي وتعزيز قدرة المبدعين. ويوجد حالياً أكثر من 100 برنامج إبداعي يدعم تسريع العمل عبر وحدة الرسومات، مثل «أدوبي لايتروم» و«فوتوشب» و«إلاستريتر» و«بريمير إليمنتس» و«بريمير برو» و«آفتر إفكتس» و«سابستانس 3 دي بينتر» و«أنريل إنجين» و«يونيتي» و«أوتوديسك مايا» و«بليندر» و«كابكات» و«كوريل درو» و«دافينشي ريزولف» و«أو بي إس ستوديو» و«ووندرشير فيلمورا»، وغيرها.

ومن أبرز مزايا هذه الوحدات أداء الذكاء الاصطناعي التوليدي لعروض الفيديو الذي أصبح أسرع بنحو الضعفين مقارنة بالأجيال السابقة. هذا الأمر يضمن للمبدعين عدم إضاعة الوقت في الانتظار، والتركيز بدلاً من ذلك على الإبداع الخالص.

تقنية «آر تي إكس ريمكس» لتطوير رسومات وإضاءة الألعاب الكلاسيكية

وفي مجال تحرير الفيديو، توفر هذه الكومبيوترات المحمولة قدرة هائلة على التعامل مع العروض عالية الجودة بسلاسة تامة لنحو مرتين ونصف المرة، مقارنةً بالأجيال السابقة. ويمكن للمحررين تطبيق مؤثرات الذكاء الاصطناعي بسرعة فائقة وتصدير المحتوى «Render» في وقت قصير جداً، وإنتاج محتوى مبتكَر بمساعدة الذكاء الاصطناعي. وفي مجال التصوير الفوتوغرافي، يمكن معالجة ملفات الصور من امتداد «RAW» الضخمة، وتطبيق التعديلات الذكية والفلترة الفورية للصور.

وبالنسبة لمصممي الرسومات ثلاثية الأبعاد والرسوم المتحركة، فإن تصدير المحتوى الخاص بالمشاهد المعقدة لم يعد عائقاً؛ إذ يمكن معاينة الإضاءة في الوقت الفعلي وبناء النماذج والأنسجة (Textures) المختلفة للعناصر بسرعة مذهلة تصل لغاية 5 أضعاف ونصف المرة مقارنة بالأجيال السابقة. ويتحقق ذلك مع استقرار مثالي بفضل تعاريف «استوديو» المخصصة التي تضمن الأداء المرتفع والموثوقية الكبيرة في عمل البرامج المختلفة دون أي توقف أو تقطع. كما تساهم تقنيات مثل «إنفيديا إيس» (NVIDIA Ace)، في بناء شخصيات رقمية حقيقية ومرئيات واقعية للغاية باستخدام تقنيات الذكاء الاصطناعي.

رفع مستويات الإنتاجية والترفيه

تُعد الإنتاجية اليومية جزءاً لا يتجزأ من التجربة، حيث يبرز «تشات آر تي إكس» (Chat RTX)، كأداة ثورية تمنح المستخدم إجابات مخصصة من ملفاته الخاصة لأي سؤال يخطر بباله. ويمكن للمستخدم، مثلاً، البحث بسهولة في ملاحظاته وصوره وملفاته باستخدام النصوص أو الأوامر الصوتية عبر روبوت دردشة خاص وسري. هذا النوع من المساعدة الرقمية يجعل الكومبيوتر المحمول مساعداً شخصياً يتولى عنه العمل الشاق.

وبالإضافة إلى العمل، تقدم هذه الأجهزة تجربة ترفيهية متطورة؛ إذ ترفع تقنية «آر تي إكس فيديو» (RTX Video) مستوى عروض الفيديو على الإنترنت إلى الدقة الفائقة «4K». كما تتيح تقنية «برودكاست» (Broadcast) تحويل غرفة المستخدم إلى استوديو احترافي للبث والاجتماعات، موفرة جودة بصرية بالدقة الفائقة «4K» وصوتية عالية تصل لغاية ضعفَي الأجيال السابقة، مع تجربة خالية من التقطع لتعزيز الحضور الرقمي.

وللمبدعين الذين يحبون الألعاب القديمة، توفر تقنية «آر تي إكس ريمكس» (RTX Remix) إمكانية إعادة تطوير رسومات وإضاءة تلك الألعاب، حتى لو لم تكن تدعم الإضاءة المتقدمة أو الرسومات فائقة الدقة، حيث تتيح الأداة التقاط أصول اللعبة وترقية موادها بالذكاء الاصطناعي، مع إضافة تتبع الأشعة الضوئية من مصدرها (Ray Tracing)، وتقنية «دي إل إس إس» Deep Learning Super Sampling DLSS لزيادة عدد الرسومات في الثانية (Frames per Second FPS)، دون فقدان مستويات الأداء، وذلك باستخدام تقنيات الذكاء الاصطناعي مما يضمن الحصول على أعلى معدل رسومات في الثانية وأفضل جودة بصرية ممكنة دون أي عناء. كما يمكن إضافة المؤثرات البصرية المختلفة إلى الألعاب بكل سهولة.

تعتمد هذه الكومبيوترات المحمولة على تقنية «ماكس-كيو» (Max-Q) الحصرية التي تضمن توازناً مثالياً بين الأداء واستهلاك الطاقة. وبفضلها، يمكن العمل على جهاز قوي وهادئ في الوقت نفسه مع عمر بطارية أطول. هذا التصميم يناسب تماما من يبحث عن الأداء المرتفع في هيكل محمول وسهل التنقل.

اختيار كومبيوتر محمول مدعوم بوحدات الرسومات المتقدمة هو خطوة نحو ضمان سلاسة عمل القطاع الإبداعي بفضل القوة التي يوفرها الذكاء الاصطناعي والتكامل مع منصة «استوديو»، ليصبح كل ما يقوم المستخدم به أكثر ذكاء وأسرع وأكثر متعة، ولتحويل الأفكار إلى واقع بأقل مجهود وأعلى جودة.


شركة صينية تطوّر مرحاض سيارة يُشغَّل بالأوامر الصوتية

سيارات في صالة عرض في بكين 16 أبريل 2026 (أ.ف.ب)
سيارات في صالة عرض في بكين 16 أبريل 2026 (أ.ف.ب)
TT

شركة صينية تطوّر مرحاض سيارة يُشغَّل بالأوامر الصوتية

سيارات في صالة عرض في بكين 16 أبريل 2026 (أ.ف.ب)
سيارات في صالة عرض في بكين 16 أبريل 2026 (أ.ف.ب)

سجّلت شركة صينية لصناعة السيارات براءة اختراع لمرحاض مخفي أسفل مقعد سيارة منزلق، ويمكن تشغيله باستخدام أوامر صوتية، وفق قاعدة بيانات حكومية، ووفق ما نقلته «وكالة الصحافة الفرنسية».

وأظهرت السجلات العامة أن شركة السيارات الكهربائية «سيريس» (Seres) نالت، في وقت سابق من هذا الشهر، الموافقة على براءة اختراع مرحاضها المتنقّل.

ويُمكن استخدام المرحاض يدوياً عبر إرجاع المقعد إلى الخلف، أو من خلال الأمر الصوتي «تشغيل المرحاض».

وقال مهندسو الشركة في ملف طلب براءة الاختراع إن هذا النظام يهدف إلى «تلبية احتياجات المستخدمين خلال الرحلات الطويلة، أو أثناء التخييم، أو عند المكوث داخل السيارة».

ويعمل نظام مروحة مع أنبوب عادم على تصريف الروائح إلى خارج السيارة، في حين تُجمع الفضلات في خزان يتطلّب التفريغ الدوري. كما يضمّ المرحاض عنصراً حرارياً دوّاراً يعمل على تبخير البول، وتجفيف الفضلات الأخرى.

وخلال السنوات الأخيرة، كشفت شركات السيارات الكهربائية في الصين عن طرازات مزوّدة بإكسسوارات لا تحصى، في مسعى إلى جذب المستهلكين في سوق شديدة التنافس.

وأصبحت ميزات مثل أنظمة الكاراوكي والثلاجات الصغيرة شائعة، فيما تقول شركة «نيو» (Nio) إن مقاعد بعض طرازاتها مزوّدة بخاصية «التدليك بالحجارة الساخنة».

وفي العام الماضي، أعلنت شركة «بي واي دي» (BYD)، الرائدة في القطاع، عن نظام ذكي لطائرات مسيّرة مدمجة في المركبات، بينما أفادت شركة «إكس بينغ» (XPeng) بأن عمليات تسليم سيارتها المعروفة باسم «حاملة الطائرات البرية»، وهي مركبة تحتوي على طائرة ذات ست مراوح، يُتوقّع أن تبدأ هذا العام.

ولا يزال من غير الواضح ما إذا كانت فكرة «سيريس» ستدخل مرحلة الإنتاج.

ولم ترد الشركة، التي تعاونت مع عملاق الاتصالات «هواوي» لتطوير خط سياراتها الفاخرة «آيتو»، على طلب «وكالة الصحافة الفرنسية» للتعليق.


نظام يتيح للروبوتات رباعية الأرجل تفادي العوائق قبل الاصطدام

يعتمد النظام على دمج الإدراك الذاتي مع الرؤية الخارجية لمساعدة الروبوت على فهم العوائق قبل ملامستها (KAIST)
يعتمد النظام على دمج الإدراك الذاتي مع الرؤية الخارجية لمساعدة الروبوت على فهم العوائق قبل ملامستها (KAIST)
TT

نظام يتيح للروبوتات رباعية الأرجل تفادي العوائق قبل الاصطدام

يعتمد النظام على دمج الإدراك الذاتي مع الرؤية الخارجية لمساعدة الروبوت على فهم العوائق قبل ملامستها (KAIST)
يعتمد النظام على دمج الإدراك الذاتي مع الرؤية الخارجية لمساعدة الروبوت على فهم العوائق قبل ملامستها (KAIST)

طوّر باحثون من المعهد الكوري المتقدم للعلوم والتكنولوجيا (KAIST) نظاماً جديداً للتحكم في الروبوتات رباعية الأرجل، حيث يهدف إلى جعل حركتها أقل اعتماداً على رد الفعل بعد الاصطدام بالعوائق، وأكثر قدرة على «رؤية» البيئة واتخاذ القرار أثناء الحركة. ويأتي هذا العمل تحت اسم «DreamWaQ++».

الفكرة ليس مجرد جعل الروبوت يمشي على تضاريس صعبة، بل تمكينه من الجمع بين نوعين من الإدراك في الوقت نفسه؛ الأول هو الإدراك الذاتي المرتبط بما يشعر به الروبوت من خلال مفاصله وحركته واتزانه، والثاني هو الإدراك الخارجي عبر الكاميرات و(LiDAR) «لايدار»، بحيث لا ينتظر الروبوت أن تلمس رجلاه العقبة كي يفهم ما أمامه، بل يحاول قراءتها مسبقاً، وتعديل طريقته في المشي وفقاً لذلك.

هذا تحديداً هو ما تعتبره الدراسة تجاوزاً لمحدودية كثير من الأنظمة السابقة، التي كانت تعتمد على الإحساس الداخلي فقط، أو تحتاج في المقابل إلى خرائط دقيقة ومعقدة للبيئة كي تستفيد من الرؤية الخارجية.

أظهرت الاختبارات تحسناً في معدلات النجاح مقارنة ببعض النماذج البصرية المرجعية في التعامل مع السلالم والعوائق غير المنتظمة (KAIST)

نحو حركة استباقية

أوضح فريق «KAIST» أن النسخة السابقة من النظام «DreamWaQ» كانت تتيح ما يشبه «المشي الأعمى»، أي القدرة على تقدير طبيعة الأرض من دون رؤية مباشرة، وهو ما يُفيد مثلاً في البيئات التي يصعب فيها الاعتماد على المعلومات البصرية، مثل الظلام أو الدخان. لكن هذا النهج كانت له حدود؛ حيث إن الروبوت كان يحتاج غالباً إلى ملامسة العائق أولاً قبل أن يعدّل حركته. أما «DreamWaQ++» فيحاول الانتقال من هذا النمط التفاعلي إلى نمط أكثر استباقية؛ حيث يتعرف الروبوت إلى العوائق قبل الوصول إليها، ويختار أسلوب الحركة المناسب في الزمن الحقيقي.

الدراسة تصف هذا الانتقال بوصفه دمجاً بين الإدراكين الداخلي والخارجي، عبر إطار تعلم تعزيزي متعدد الوسائط.

واستهدف الباحثون معالجة مشكلة معروفة في الروبوتات رباعية الأرجل؛ حيث تكون واعدة جداً للعمل في البيئات المزدحمة والمعقدة، لكنها تبقى حساسة لعدم اليقين في العالم الحقيقي، ما يجعل التحكم في حركتها تحدياً كبيراً. لذلك يقترح العمل الجديد طريقة تجعل الروبوت أكثر قدرة على اجتياز الأراضي الوعرة، والمنحدرات الحادة، والسلالم العالية، مع الحفاظ على درجة من الصمود حتى في الحالات الخارجة عن التوزيعات التي تدرب عليها.

بين الرؤية والإحساس

الأهمية هنا ليست أكاديمية فقط، فواحدة من المشكلات العملية في الروبوتات المتحركة هي أن الرؤية وحدها لا تكفي دائماً، والإحساس الذاتي وحده لا يكفي أيضاً. إذا اعتمد الروبوت على «الإحساس الداخلي» فقط، فقد يضطر إلى اختبار الأرض برجله أولاً، ما يبطئ الحركة، ويزيد خطر التعثر أو الاصطدام. وإذا اعتمد على الرؤية الخارجية وحدها، فقد يحتاج إلى نمذجة شديدة الدقة للبيئة، وهو أمر صعب في المواقع غير المنتظمة أو المتغيرة باستمرار. يحاول «DreamWaQ++» سد هذه الفجوة عبر المزج بين الحالتين، بحيث يتحرك الروبوت بناءً على ما «يراه» وما «يشعر به» معاً.

ومن المؤشرات اللافتة التي ظهرت في المادة المصاحبة للمشروع، أن النظام حقق في اختبارات المحاكاة على 1000 روبوت، معدلات نجاح أعلى بنحو 20 إلى 40 في المائة، مقارنة ببعض النماذج البصرية المرجعية عبر تكوينات مختلفة من السلالم. كما أشارت الصفحة التعريفية للمشروع إلى أن النظام يتعامل مع السلالم غير المتماثلة عبر تكييف حركة رفع الرجل وفق شكل العائق، وهي نقطة مهمة لأن كثيراً من البيئات الحقيقية لا تأتي في صورة سلالم أو حواف مثالية وثابتة.

يعكس هذا التطور اتجاهاً أوسع نحو جعل الروبوتات أكثر قدرة على الحركة الذكية في بيئات واقعية وغير مضمونة (KAIST)

تحسن في الأداء

هذا النوع من التقدم يعكس اتجاهاً أوسع في عالم الروبوتات يتعلق بالانتقال من الحركة المستقرة في بيئات مضبوطة إلى الحركة الذكية في بيئات غير مضمونة. فمن الناحية النظرية، يمكن أن يفتح ذلك المجال أمام استخدامات أكثر واقعية في مواقع الكوارث، والمناطق الصناعية، والبيئات المزدحمة أو غير المنتظمة؛ حيث لا تكون الأرضية مهيأة سلفاً، ولا يمكن افتراض أن الروبوت سيعمل دائماً في ظروف مثالية. ويرى الفريق إمكان توسيع هذه التقنية إلى منصات أخرى، مثل الروبوتات ذات العجلات والأرجل أو حتى الروبوتات الشبيهة بالبشر.

مع ذلك، لا يعني هذا أن الروبوت بات «يفكر» كما يفعل الإنسان بالمعنى الحرفي. ما يقدمه البحث هو تحسن في الإدراك الحركي، واتخاذ القرار أثناء التنقل وليس وعياً تاماً أو فهماً شاملاً للبيئة. لكنه يظل تقدماً مهماً؛ لأن الحركة في العالم الواقعي هي واحدة من أصعب المشكلات في الروبوتات: الأرض قد تكون غير مستقرة، والعقبات قد تكون غير منتظمة، والاستجابة يجب أن تكون سريعة بما يكفي لتجنب السقوط أو التوقف. وفي هذا السياق، فإن تمكين الروبوت من تعديل خطاه قبل الاصطدام، لا بعده، يُمثل فرقاً جوهرياً في فلسفة الحركة نفسها.