ذكاء اصطناعي لعمليات «التفكير» والاستدلال المنطقي

شرح لطريقة عمل برامج الدردشة المطورة

نظام "ديب سيك"
نظام "ديب سيك"
TT

ذكاء اصطناعي لعمليات «التفكير» والاستدلال المنطقي

نظام "ديب سيك"
نظام "ديب سيك"

تعرض شركات مثل «أوبن إيه آي» و«ديب سيك» الصينية، روبوتات دردشة مصممة «للتأمل والتفكير» قبل الإجابة على طلبات المستخدمين. وفيما يلي شرح لأسلوب عملها.

«تفكير» الذكاء الاصطناعي

وكانت شركة «أوبن إيه آي»، كشفت في سبتمبر (أيلول) الماضي، عن إصدار جديد من «تشات جي بي تي» مصمم لتنفيذ عمليات الاستدلال المنطقي اللازمة لإنجاز مهام على صلة بالرياضيات والعلوم وبرمجة الحاسوب.

وعلى عكس الإصدارات السابقة من روبوت الدردشة، يمكن لهذه النسخة الجديدة قضاء وقت في «التفكير» في مسائل معقدة قبل التوصل إلى حل.

وسرعان ما أعلنت الشركة أن تقنية الاستدلال المنطقي الجديدة الخاصة بها، تفوقت على الأنظمة الرائدة في هذا المجال، خلال سلسلة من الاختبارات المعنية بتتبع تقدم الذكاء الاصطناعي.

والآن، تطرح شركات أخرى، مثل «غوغل» و«أنثروبيك» و«ديب سيك» الصينية، تقنيات مماثلة.

وهنا، ثمة تساؤلات تطرح نفسها: هل يمكن للذكاء الاصطناعي أن يفكر منطقياً مثل الإنسان؟ وماذا يعني أن يفكر الكومبيوتر؟ هل تقترب هذه الأنظمة حقاً من عتبة الذكاء الحقيقي؟

إليك الدليل المرشد للإجابة عن هذه التساؤلات.

«تفكير منطقي»

* ماذا يعني أن يفكر نظام للذكاء الاصطناعي على نحو منطقي؟

يعني الاستدلال المنطقي ببساطة، أن يقضي روبوت الدردشة وقتاً إضافياً في العمل على حل مشكلة ما.

في هذا الصدد، شرح دان كلاين، بروفسور علوم الكمبيوتر بجامعة كاليفورنيا، بيركلي، وكبير مسؤولي التكنولوجيا لدى مؤسسة «سكيلد كوغنيشن»، الناشئة بمجال الذكاء الاصطناعي: «يُقصد بالتفكير المنطقي بذل النظام مجهوداً إضافياً بعد طرح سؤال ما عليه».

في هذه الحالة، يقسم النظام المشكلة إلى عدد من الخطوات الفردية، أو يحاول حلها عبر أسلوب التجربة والخطأ.

وفي حين تجيب النسخة الأصلية من «تشات جي بي تي» عن الأسئلة فوراً، فإن أنظمة الاستدلال المنطقي الجديدة، يمكنها العمل على حل المشكلة في غضون ثوانٍ عديدة وكثيرة، أو حتى دقائق، قبل الإجابة.

وفي بعض الحالات، يُحسّن نظام الاستدلال المنطقي منهجه تجاه حل مسألة ما، محاولاً مراراً وتكراراً تحسين الطريقة التي اختارها للوصول إلى حل. وفي أحيانٍ أخرى، قد يجرب عدة طرق مختلفة لمعالجة المسألة، قبل أن يستقر على إحداها، أو قد يعود ويراجع بعض الحلول التي أنجزها قبل ثوانٍ قليلة، فقط للتأكد من صحتها.

ببساطة، يبذل النظام كل ما في وسعه للإجابة عن سؤالك. ويشبه هذا إلى حد ما طالباً في المدرسة الابتدائية يُكافح لإيجاد طريقة لحل مسألة رياضية، فيُدوّن عدة خيارات مختلفة على ورقة.

* ما نوع الأسئلة التي تتطلب من نظام الذكاء الاصطناعي الاعتماد إلى الاستدلال المنطقي؟ يمكن للذكاء الاصطناعي اللجوء إلى الاستدلال المنطقي في أي شيء، لكن هذا التفكير المنطقي يبدي فعالية أكبر عند طرح أسئلة تتعلق بالرياضيات والعلوم وبرمجة الحاسوب.

نظام "تشات جي بي تي"

الفروق بين النظم السابقة و«المفكرة»

* ما الفرق بين الروبوتات المعتمدة على الاستدلال المنطقي وربوتات المحادثة السابقة؟ يمكنك أن تطلب من روبوتات المحادثة السابقة أن توضح لك كيفية وصولها إلى إجابة معينة أو أن تتحقق من عملها. ونظراً لأن روبوت المحادثة الأصلي ChatGPT كان يتعلم من النصوص على الإنترنت، حيث يعرض الناس كيفية وصولهم إلى إجابة أو التحقق من عملهم، فإنه يستطيع القيام بهذا النوع من التأمل الذاتي كذلك.

ومع ذلك، يذهب نظام الاستدلال المنطقي إلى أبعد من ذلك، ويمكنه الاضطلاع بهذه الأمور حتى من دون أن يُطلب منه ذلك. ويمكنه إنجاز الأمر عبر سبل أكثر شمولاً وتعقيدًا.

وتطلق الشركات على نظام استدلال المنطقي لأنها تبدو وكأنها تعمل بشكل أشبه بشخص يفكر بجد في مشكلة صعبة.

* ما أهمية الذكاء الاصطناعي الاستدلالي الآن؟ تنظر شركات مثل «أوبن إيه آي»، إلى الذكاء الاصطناعي الاستدلالي باعتباره السبيل الأمثل لتحسين أداء روبوتات الدردشة لديها. على امتداد سنوات، اعتمدت هذه الشركات على مفهوم بسيط: كلما زادت بيانات الإنترنت التي يجري ضخها في روبوتات الدردشة الخاصة بها، كان أداء هذه الأنظمة أفضل.

إلا أنه عام 2024، استنفدت مثل هذه الشركات تقريباً جميع النصوص الموجودة على الإنترنت. ويعني ذلك أنها بحاجة إلى طريقة جديدة لتحسين روبوتات الدردشة الخاصة بها. لذلك بدأت في بناء أنظمة تفكير الاستدلال المنطقي.

بناء نظم الاستدلال المنطقي

* كيف تبني نظاماً للتفكير الاستدلالي المنطقي؟ العام الماضي، بدأت شركات، مثل «أوبن إيه آي»، في تبني تكنولوجيا تسمى التعلم المعزز.

عبر هذه العملية - التي قد تمتد لأشهر - يمكن لنظام الذكاء الاصطناعي تعلم أنماط السلوك، من خلال تجارب واختبارات مكثفة. مثلاً، عبر حل آلاف المسائل الرياضية، يمكن لنظام الذكاء الاصطناعي معرفة أي الطرق تؤدي إلى الإجابة الصحيحة، وأيها لا.

من جهتهم، صمم الباحثون آليات تغذية استرجاعية معقدة تكشف أمام النظام متى أحسن التصرف ومتى أخطأ.

وقال جيري توريك، الباحث لدى «أوبن إيه آي»: «يشبه الأمر تدريب كلب. إذا نجح النظام، تُقدم له كعكة. وإذا لم ينجح، تقول له: (كلب سيء)».

* هل التعلم المعزز مجدٍ؟ يُجدي التعلم المعزز نفعاً في مجالات مُعينة، مثل الرياضيات والعلوم وبرمجة الحاسوب، هذه المجالات التي يُمكن للشركات فيها رسم الحدود الفاصلة بين السلوك الجيد والرديء بوضوح. كما تحمل مسائل الرياضيات إجابات قاطعة.

في المقابل، لا يُجدي التعلم المعزز نفعاً في مجالات مثل الكتابة الإبداعية والفلسفة والأخلاق، حيث يصعب التمييز بين الجيد والرديء. وشرح باحثون أن هذه العملية يُمكن أن تُحسّن أداء نظام الذكاء الاصطناعي بشكل عام، حتى عندما يُجيب عن أسئلة خارج نطاق الرياضيات والعلوم.

في ذلك الصدد، أوضح جاريد كابلان، كبير مسؤولي شؤون العلوم في «أنثروبيك»: «يتعلم روبوت الدردشة تدريجياً أنماط التفكير، التي تقوده نحو الاتجاه الصحيح وتلك التي لا تقوده».

* هل التعلم المعزز وأنظمة تفكير الاستدلال المنطقي هما الشيء نفسه؟ لا. التعلم المعزز يمثل الأسلوب الذي تستخدمه الشركات لبناء أنظمة التفكير المنطقي لديها. بمعنى آخر، فإنه يشكل مرحلة التدريب، التي تسمح في النهاية لروبوتات الدردشة بالتفكير المنطقي الاستدلالي.

أخطاء الذكاء الاصطناعي «المفكر»

* هل لا تزال أنظمة التفكير المنطقي هذه ترتكب أخطاء؟ بالتأكيد. كل ما يفعله روبوت الدردشة المنطقي قائم على الاحتمالات، وهو يختار مساراً أشبه بالبيانات التي تعلم منها - سواء كانت تلك البيانات من الإنترنت أو وُلدت من خلال التعلم المعزز. بعض الأحيان، يقع اختياره على خيار خاطئ أو منافي للمنطق.

* هل هذا هو المسار المفضي إلى آلة تُضاهي الذكاء البشري؟

يختلف خبراء الذكاء الاصطناعي حول إجابة هذا السؤال. إذ لا تزال هذه الأساليب جديدة نسبياً، ولا يزال الباحثون يحاولون فهم حدودها. وفي مجال الذكاء الاصطناعي، غالباً ما تتطور الأساليب الجديدة بسرعة كبيرة في البداية، ثم تبدأ في التباطؤ.

* خدمة «نيويورك تايمز».


مقالات ذات صلة

ماذا يعني أن تصبح «سيري» شبيهة بـ«ChatGPT»؟

تكنولوجيا تعمل «أبل» على إعادة تصميم «سيري» لتتحول من منفذة أوامر إلى مساعد حواري سياقي شبيه بـ«ChatGPT» (شاترستوك)

ماذا يعني أن تصبح «سيري» شبيهة بـ«ChatGPT»؟

تعمل «أبل» على تحويل «سيري» إلى مساعد شبيه بـ«ChatGPT»، يركز على السياق والتنفيذ والخصوصية، في خطوة تعكس تغير تفاعل المستخدمين مع الذكاء الاصطناعي.

نسيم رمضان (لندن)
الاقتصاد السواحة يتحدث خلال الجلسة الحوارية بـ«المنتدى الاقتصادي العالمي» في دافوس (الشرق الأوسط)

السعودية تستهدف المساهمة في إضافة 100 تريليون دولار للاقتصاد العالمي

أكد المهندس عبد الله السواحة، وزير الاتصالات وتقنية المعلومات السعودي، أن بلاده تتبنى طموحات عالمية لقيادة عصر الذكاء الاصطناعي.

«الشرق الأوسط» (الرياض)
تكنولوجيا نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)

روبوتات تفكر وتتحرك: ما الذي يميّز «Rho-Alpha» من «مايكروسوفت»؟

تستعرض أبحاث «مايكروسوفت» نموذجاً جديداً يمكّن الروبوتات من فهم العالم والتكيّف معه عبر دمج الرؤية واللغة والفعل في ذكاء متجسّد واحد.

نسيم رمضان (لندن)
تكنولوجيا الجهاز المرتقب قد يعمل بلا شاشة معتمداً على الحوار الصوتي باعتباره نموذجاً جديداً للحوسبة اليومية (شاترستوك)

تقارير: هل سيعتمد أول جهاز استهلاكي من «أوبن إيه آي» على الصوت؟

«أوبن إيه آي» تستكشف جهازاً صوتياً غامضاً بلا شاشة، قد يعيد تعريف التفاعل مع الذكاء الاصطناعي ويفتح سباقاً جديداً على مستقبل الحوسبة اليومية.

نسيم رمضان (لندن)
تكنولوجيا التحول نحو المستندات متعددة الوسائط يعكس تغير توقعات المستخدمين في بيئات العمل والتعليم (شاترستوك)

«أدوبي» تتيح تحويل ملفات «PDF» إلى عروض تقديمية وبودكاست صوتي

«أدوبي» توسّع دور «PDF» بإضافة ذكاء اصطناعي يحوّل المستندات إلى عروض تقديمية وبودكاست، ما يعكس تحولاً نحو محتوى مرن متعدد الوسائط في العمل.

نسيم رمضان (لندن)

ماذا يعني أن تصبح «سيري» شبيهة بـ«ChatGPT»؟

تعمل «أبل» على إعادة تصميم «سيري» لتتحول من منفذة أوامر إلى مساعد حواري سياقي شبيه بـ«ChatGPT» (شاترستوك)
تعمل «أبل» على إعادة تصميم «سيري» لتتحول من منفذة أوامر إلى مساعد حواري سياقي شبيه بـ«ChatGPT» (شاترستوك)
TT

ماذا يعني أن تصبح «سيري» شبيهة بـ«ChatGPT»؟

تعمل «أبل» على إعادة تصميم «سيري» لتتحول من منفذة أوامر إلى مساعد حواري سياقي شبيه بـ«ChatGPT» (شاترستوك)
تعمل «أبل» على إعادة تصميم «سيري» لتتحول من منفذة أوامر إلى مساعد حواري سياقي شبيه بـ«ChatGPT» (شاترستوك)

تستعد «سيري»، المساعد الصوتي من شركة «أبل»، لأكبر تحول في تاريخها منذ إطلاقها قبل أكثر من عقد. فحسب تقارير متطابقة من وسائل إعلام تقنية، تعمل «أبل» على إعادة تصميم «سيري» لتتحول من أداة تعتمد على الأوامر الصوتية البسيطة إلى مساعد حواري متقدم، قادر على إجراء محادثات سياقية طويلة، على غرار «شات جي بي تي» (ChatGPT) وغيره من روبوتات الدردشة التوليدية.

لطالما واجهت «سيري» انتقادات بسبب محدودية فهمها للغة الطبيعية مقارنة بمنافسين مثل مساعد «غوغل» ونماذج الذكاء الاصطناعي التوليدي الحديثة. ففي الوقت الذي أصبحت فيه روبوتات الدردشة قادرة على تلخيص المعلومات وشرح المفاهيم المعقدة، والتفاعل مع المستخدمين بسلاسة، بقيت «سيري» مرتبطة بمهام أساسية، مثل ضبط المنبهات أو فتح التطبيقات، مع تحسينات تدريجية لم تغيّر جوهر التجربة.

اليوم، يبدو أن «أبل» تعترف بأن هذا النهج لم يعد كافياً.

من الأوامر إلى الحوار

تُشير التقارير إلى أن «أبل» تعمل على تحويل «سيري» إلى مساعد حواري متكامل، يستطيع متابعة السياق والرد عبر الصوت أو النص، والتعامل مع الأسئلة المركبة بطريقة أكثر طبيعية. ويُمثل هذا التحول قطيعة مع التصميم التقليدي لـ«سيري»، الذي بُني أساساً على تنفيذ أوامر محددة بدلاً من إجراء حوار مفتوح.

ووفق ما نُشر، تعتمد «أبل» في هذه المرحلة على دمج تقنيات ذكاء اصطناعي توليدي متقدمة، من بينها نماذج مثل «جيميناي» من «غوغل» ضمن إطارها الخاص المعروف باسم «ذكاء أبل» (Apple Intelligence). ولا يعني ذلك التخلي عن تطويرها الداخلي، بل الاستفادة من أفضل النماذج المتاحة لتعزيز قدرات «سيري» اللغوية والحوارية. الهدف هو جعل التفاعل مع «سيري» أقرب إلى محادثة حقيقية، بدلاً من سلسلة أوامر منفصلة، وهو ما أصبح معياراً جديداً في عالم المساعدات الذكية.

«سيري» ستستفيد من «غوغل جيميناي» لتعزيز الحوار والسياق ضمن توجه «أبل» لمواكبة الذكاء الاصطناعي التفاعلي (شاترستوك)

استجابة متأخرة

يأتي هذا التحول فيما تتسارع المنافسة على الذكاء الاصطناعي الحواري، فقد اعتاد المستخدمون خلال العامين الماضيين أدوات قادرة على إنتاج نصوص وشرح أفكار والمساعدة في التخطيط واتخاذ القرار. وفي المقابل، بدا أن «أبل» تتحرك بوتيرة أبطأ، مع تركيز واضح على الخصوصية والاستقرار بدل السبق التقني.

ورغم أن الشركة بدأت سابقاً دمج «ChatGPT» خياراً مساعداً ضمن بعض ميزات «ذكاء أبل»، فإن هذه الخطوة أبرزت الفجوة بين «سيري» التقليدية وتجربة الدردشة التوليدية الحديثة. ومع تزايد الاعتماد اليومي على هذه الأدوات، بات من الصعب على «أبل» تجاهل التحول الجاري في طريقة تفاعل المستخدمين مع التقنية.

الخصوصية في التصميم

على عكس بعض المنافسين، لا يبدو أن «أبل» تسعى إلى تحويل «سيري» إلى مجرد واجهة لخدمة سحابية خارجية، فالتقارير تشير إلى أن جزءاً كبيراً من المعالجة سيجري على الجهاز نفسه أو عبر خوادم خاضعة لسيطرة «أبل»، بما ينسجم مع سياستها التقليدية في تقليل جمع البيانات وحماية خصوصية المستخدم. هذا التوازن بين القدرات المتقدمة والخصوصية قد يكون العامل الفارق في تجربة «سيري» الجديدة، لكنه في الوقت نفسه يفرض قيوداً تقنية قد تؤثر في سرعة التطوير مقارنة بمنافسين يعتمدون بشكل أوسع على الحوسبة السحابية.

«سيري» الجديدة تستهدف التكامل العميق مع النظام لفهم ما على الشاشة وربط التطبيقات وتنفيذ مهام متعددة بطلب واحد (شاترستوك)

أكثر من دردشة

ولا يقتصر طموح «أبل» على جعل «سيري» أكثر بلاغة فحسب، بل على جعلها أكثر فاعلية، فالتقارير تُشير إلى أن النسخة الجديدة ستكون قادرة على فهم ما يجري على شاشة الجهاز، وربط المعلومات بين التطبيقات، وتنفيذ مهام متعددة بناءً على طلب واحد بلغة طبيعية. بهذا المعنى، لا تسعى «أبل» إلى تقديم «روبوت دردشة» فقط، بل إلى مساعد ذكي قادر على التحرك داخل النظام، وإدارة المهام اليومية، والتفاعل مع محتوى المستخدم وسياقه. وهذا يعكس توجهاً أوسع في صناعة التقنية نحو ما يُعرف بـ«الذكاء القابل للتنفيذ»؛ حيث لا يكتفي النظام بالإجابة بل يتخذ إجراءً.

ماذا يعني ذلك للمستخدمين؟

من المتوقع أن تكشف «أبل» عن ملامح هذا التحول خلال مؤتمرها السنوي للمطورين في شهر يونيو (حزيران) المقبل، على أن تُطرح التجربة الجديدة ضمن الإصدارات المقبلة من أنظمة «iOS» و«macOS» و«iPadOS». وإذا نجحت الشركة في تنفيذ رؤيتها، فقد تصبح «سيري» جزءاً أكثر مركزية في الحياة الرقمية اليومية لمستخدمي أجهزة «أبل».

لكن التحدي لا يزال قائماً، فالمستخدمون الذين اعتادوا مرونة وسرعة أدوات مثل «ChatGPT» ستكون لديهم توقعات عالية. وسيُقاس نجاح «سيري» الجديدة بمدى قدرتها على الجمع بين الحوار العميق، والتنفيذ العملي، والخصوصية من دون التضحية بتجربة الاستخدام.


روبوتات تفكر وتتحرك: ما الذي يميّز «Rho-Alpha» من «مايكروسوفت»؟

نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)
نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)
TT

روبوتات تفكر وتتحرك: ما الذي يميّز «Rho-Alpha» من «مايكروسوفت»؟

نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)
نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)

يشهد الذكاء الاصطناعي تقدماً سريعاً في فهم اللغة والصور، إلا أن تحويل هذا الذكاء إلى أفعال ملموسة في العالم الحقيقي لا يزال أحد أكثر التحديات تعقيداً في مجال الحوسبة. وفي هذا السياق، تخطو أبحاث «مايكروسوفت» خطوة مهمة نحو سد هذه الفجوة، من خلال الكشف عن أعمال جديدة تهدف إلى تمكين الروبوتات من الإدراك والتفكير والتنفيذ بفاعلية أكبر داخل البيئات المادية الديناميكية.

وفي صميم هذا التوجه يأتي نموذج جديد يُعرف باسم «Rho-Alpha»، وهو نموذج يجمع بين الرؤية واللغة والفعل، ويهدف إلى مساعدة الروبوتات على تجاوز السلوكيات المبرمجة مسبقاً، والعمل بدرجة أعلى من الاستقلالية. ويعكس هذا النموذج طموح «مايكروسوفت» الأوسع في تطوير أنظمة ذكاء اصطناعي لا تكتفي بفهم المعلومات الرقمية، بل قادرة أيضاً على التفاعل مع العالم الفيزيائي بطرق أكثر مرونة وواقعية.

دمج الإدراك والفعل

على عكس الأنظمة الروبوتية التقليدية التي تعتمد على سلاسل هندسية منفصلة حيث تُعالج الرؤية والتخطيط والتحكم كوحدات مستقلة، يدمج نموذج «Rho-Alpha» هذه القدرات ضمن إطار تعلم واحد. ويتم تدريب النموذج على تحليل المدخلات البصرية، وفهم التعليمات باللغة الطبيعية، وتوليد أفعال جسدية مناسبة، ما يسمح للروبوتات بالاستجابة بسلاسة أكبر للمهام المعقدة.

ويعالج هذا النهج أحد التحديات المزمنة في عالم الروبوتات، المعروف بمشكلة «الميل الأخير». فعلى الرغم من قدرة نماذج الذكاء الاصطناعي على التعرف على الأشياء أو تنفيذ أوامر محددة، فإنها غالباً ما تفشل عند حدوث تغييرات غير متوقعة في البيئة. فاختلاف بسيط في الإضاءة أو موقع الأجسام أو سلوك البشر قد يؤدي إلى تعطل الأنظمة التقليدية. وتسعى أبحاث «مايكروسوفت» إلى جعل الروبوتات أكثر قدرة على التكيف من خلال ربط قراراتها بالسياق الواقعي بدلاً من القواعد الجامدة.

تعلم يتجاوز المختبر

يستند نموذج «Rho-Alpha» إلى التطورات الحديثة في النماذج التأسيسية، مستفيداً من مفاهيم النماذج اللغوية الضخمة والأنظمة متعددة الوسائط، مع تكييفها لمتطلبات التفاعل المادي. وبدلاً من تعلم المهام بشكل منفصل، يستطيع النموذج التعميم عبر سيناريوهات مختلفة، ما يمكّن الروبوتات من التعامل مع أشياء أو تعليمات لم تُصادفها صراحة أثناء التدريب. وتُعد هذه القدرة أساسية لنشر الروبوتات خارج المختبرات والبيئات الخاضعة للتحكم. وتصف أبحاث «مايكروسوفت» هذا العمل بأنه جزء من رؤية أوسع لما يُعرف بـ«الذكاء الاصطناعي المتجسد»، حيث يتشكل الذكاء ليس فقط من البيانات، بل من التفاعل المباشر مع العالم المادي. وفي هذا الإطار، تصبح الرؤية والفعل عنصرين متلازمين، ما يسمح للآلات بالتعلم من التجربة بأسلوب أقرب إلى السلوك البشري.

آفاق التطبيق العملي

تتعدد التطبيقات المحتملة لهذه التقنيات عبر قطاعات مختلفة. ففي البيئات الصناعية، يمكن للروبوتات الأكثر مرونة دعم مهام التصنيع والخدمات اللوجيستية التي تتطلب إعادة تهيئة مستمرة. أما في مجالات الرعاية الصحية والخدمات، فقد تساعد هذه الأنظمة في تنفيذ أنشطة يومية تتطلب تفاعلاً مباشراً مع البشر وبيئات غير متوقعة. ورغم أن «مايكروسوفت» لم تعلن عن منتجات تجارية قائمة على «Rho-Alpha»، فإن هذا البحث يسلط الضوء على قدرات أساسية قد تُمهّد لتطبيقات مستقبلية.

تؤكد «مايكروسوفت» أن التقدم في مجال الذكاء الاصطناعي للعالم المادي لا يقتصر على الأداء التقني فحسب، بل يشمل أيضاً اعتبارات السلامة والموثوقية ومواءمة الأنظمة مع النيات البشرية. فالروبوتات ذاتية التشغيل يجب أن تكون قادرة على فهم التعليمات بدقة، والتعامل مع الحالات الاستثنائية، خصوصاً في البيئات المشتركة مع البشر. لذلك، لا تركز الأبحاث على تعزيز القدرات فقط، بل أيضاً على المتانة والتصميم المسؤول.

يعتمد النموذج على مفهوم الذكاء الاصطناعي المتجسّد حيث يتعلم الروبوت من التجربة المباشرة والتفاعل مع البيئة كما يفعل البشر (مايكروسوفت)

من الذكاء إلى الفعل

يعكس إطلاق نموذج «Rho-Alpha» تحولاً أوسع في صناعة التكنولوجيا. فمع تزايد قدرات الذكاء الاصطناعي في السياقات الرقمية، يتجه الاهتمام تدريجياً نحو كيفية تجسيد هذه القدرات في آلات تعمل في العالم الحقيقي. ويطرح هذا التحول أسئلة جديدة حول جمع البيانات والمحاكاة وطرق التقييم، نظراً لأن البيئات المادية أقل قابلية للتنبؤ مقارنة بالبيئات الافتراضية.

وتشير أبحاث «مايكروسوفت» إلى أن المرحلة المقبلة من تطور الذكاء الاصطناعي لن تُقاس فقط بذكاء النماذج، بل بقدرتها على تحويل هذا الذكاء إلى أفعال ملموسة. ومن خلال توحيد الرؤية واللغة والتحكم ضمن إطار واحد، يمثل نموذج «Rho-Alpha» محطة بحثية مهمة في مسار جعل الذكاء الاصطناعي أكثر حضوراً وفاعلية خارج نطاق الشاشات والخوادم.

ومع تلاشي الحدود بين الذكاء الرقمي والأنظمة المادية، قد تُسهم مثل هذه التطورات في إعادة تشكيل طريقة تعاون الروبوتات مع البشر عبر مختلف القطاعات، في تحول تدريجي من آلات مبرمجة إلى شركاء أكثر وعياً بالسياق وقدرة على التكيف مع العالم الحقيقي.


تقارير: هل سيعتمد أول جهاز استهلاكي من «أوبن إيه آي» على الصوت؟

الجهاز المرتقب قد يعمل بلا شاشة معتمداً على الحوار الصوتي باعتباره نموذجاً جديداً للحوسبة اليومية (شاترستوك)
الجهاز المرتقب قد يعمل بلا شاشة معتمداً على الحوار الصوتي باعتباره نموذجاً جديداً للحوسبة اليومية (شاترستوك)
TT

تقارير: هل سيعتمد أول جهاز استهلاكي من «أوبن إيه آي» على الصوت؟

الجهاز المرتقب قد يعمل بلا شاشة معتمداً على الحوار الصوتي باعتباره نموذجاً جديداً للحوسبة اليومية (شاترستوك)
الجهاز المرتقب قد يعمل بلا شاشة معتمداً على الحوار الصوتي باعتباره نموذجاً جديداً للحوسبة اليومية (شاترستوك)

قد تكون شركة «أوبن إيه آي» بصدد الاستعداد لدخول سوق الأجهزة الاستهلاكية للمرة الأولى، وفقاً لتقرير يشير إلى أن الشركة تعمل على تطوير جهاز جديد مدعوم بالذكاء الاصطناعي، مع تركيز واضح على التفاعل الصوتي. ورغم محدودية التفاصيل المتاحة حتى الآن، يوصف المشروع بأنه خروج عن النماذج التقليدية المعتمدة على الشاشات والهواتف الذكية، لصالح نموذج حوسبة قائم على الصوت.

ويُقال إن الجهاز، الذي لا يزال غير رسمي ويُوصف بأنه «غامض»، يتم تطويره بالتعاون مع جوني آيف، الرئيس السابق للتصميم في شركة «أبل». ويُنظر إلى هذه الشراكة، التي جرى الإعلان عنها سابقاً، على أنها محاولة لإعادة التفكير في كيفية تفاعل المستخدمين مع الذكاء الاصطناعي خارج إطار التطبيقات والأجهزة التقليدية.

الصوت أولاً

بدلاً من أن يشبه هاتفاً ذكياً أو جهازاً لوحياً، يُعتقد أن المنتج يعتمد على الصوت بوصفه واجهة التفاعل الأساسية، وقد يأتي على شكل جهاز قابل للارتداء أو أداة محمولة باليد، وذلك وفقاً لتقرير نشره موقع «ITHome» نقلاً عن صحيفة «إيكونوميك ديلي نيوز» التايوانية، في حين لم تؤكد «أوبن إيه آي» بعد الشكل النهائي للجهاز، كما لم تعلن عن موعد لإطلاقه.

ويبدو أن الطموح الأساسي وراء هذا المشروع يتمثل في ابتكار جهاز يتيح للمستخدمين التفاعل مع الذكاء الاصطناعي بطريقة أكثر طبيعية، من خلال الحوار والمحادثة، بدلاً من الاعتماد على الشاشات أو لوحات المفاتيح أو الواجهات اللمسية. ويتماشى هذا التوجه مع سعي «أوبن إيه آي» الأوسع لجعل أنظمة الذكاء الاصطناعي أكثر بساطة واندماجاً في الحياة اليومية.

ويمثل هذا الجهاز المحتمل أول خطوة كبيرة لـ«أوبن إيه آي» خارج نطاق البرمجيات والخدمات السحابية. فحتى الآن، ركزت الشركة على تطوير نماذج لغوية ضخمة، وإتاحتها عبر منصات مثل «تشات جي بي تي» وواجهات برمجية يستخدمها المطورون والشركات. أما الانتقال إلى مجال الأجهزة، فسيعني توسيعاً ملحوظاً لدورها داخل منظومة الذكاء الاصطناعي.

وقد شهدت الأجهزة المعتمدة على التفاعل الصوتي اهتماماً متزايداً في قطاع التكنولوجيا، مدفوعاً بالتقدم في تقنيات التعرف على الصوت، ومعالجة اللغة الطبيعية، والاستدلال الفوري. ورغم الانتشار الواسع للمساعدات الصوتية، فإن معظمها لا يزال مرتبطاً بالهواتف الذكية أو السماعات الذكية. وقد يتيح جهاز مخصص للذكاء الاصطناعي تجربة أكثر استمرارية وتخصيصاً، لكنه في الوقت نفسه يثير تساؤلات تتعلق بالخصوصية والدقة وثقة المستخدمين.

المشروع يُعد رهاناً طويل الأمد على «الحوسبة المحيطة» حيث تصبح التقنية غير مرئية لكنها حاضرة دائماً (شاترستوك)

رهان طويل الأمد

كما أسهمت مشاركة جوني آيف في تسليط مزيد من الضوء على المشروع؛ نظراً لتاريخه في تصميم منتجات استهلاكية مؤثرة وواسعة الانتشار. ويُذكر أن شركته للتصميم تعمل مع «أوبن إيه آي» على تصورات لأجهزة جديدة تهدف إلى تجاوز الفئات التقليدية، مع تأكيد الطرفين أن العمل لا يزال في مرحلة استكشافية.

وبحسب التقرير، وصف مسؤولو «أوبن إيه آي» هذا الجهاز داخلياً بأنه مبادرة طويلة الأمد، وليس منتجاً وشيك الإطلاق. ويشير ذلك إلى أن الشركة لا تزال تختبر كيفية عمل الأجهزة المصممة أساساً للذكاء الاصطناعي، ومدى جاهزية المستهلكين لتبني نموذج جديد من التفاعل.

وفي حال تحقق هذا المشروع، فقد يضع «أوبن إيه آي» ضمن اتجاه أوسع نحو ما يُعرف بالحوسبة المحيطة، حيث تعمل التكنولوجيا في الخلفية وتستجيب للمستخدم عبر الصوت والسياق. ومع ذلك، يبقى نجاح مثل هذا الجهاز على نطاق واسع أمراً غير محسوم، خاصة في سوق مزدحمة بالأجهزة الذكية التي لم تحقق جميعها توقعات المستخدمين.

وفي الوقت الراهن، تعكس مساعي «أوبن إيه آي» في مجال الأجهزة اتجاهاً أوسع في صناعة الذكاء الاصطناعي. فمع ازدياد قدرات النماذج الذكية، قد لا تكون المنافسة المستقبلية محصورة في مستوى الذكاء فحسب، بل في الأجهزة والواجهات التي يختبر المستخدمون من خلالها هذه التقنيات.