الذكاء الاصطناعي لا يزال غير قادر على معرفة الوقت وفهم التقويم

عبارة الذكاء الاصطناعي تظهر إلى جانب لوحة مفاتيح وروبوت في صورة مركبة (رويترز)
عبارة الذكاء الاصطناعي تظهر إلى جانب لوحة مفاتيح وروبوت في صورة مركبة (رويترز)
TT
20

الذكاء الاصطناعي لا يزال غير قادر على معرفة الوقت وفهم التقويم

عبارة الذكاء الاصطناعي تظهر إلى جانب لوحة مفاتيح وروبوت في صورة مركبة (رويترز)
عبارة الذكاء الاصطناعي تظهر إلى جانب لوحة مفاتيح وروبوت في صورة مركبة (رويترز)

وجد باحثون أن الذكاء الاصطناعي لا يزال عاجزاً عن أداء «المهام الأساسية» مثل معرفة الوقت أو فهم التقويم، بحسب صحيفة «التلغراف».

ووفقاً لفريق من جامعة أدنبره في المملكة المتحدة، فإن نماذج الذكاء الاصطناعي المتطورة غير قادرة على تفسير مواقع عقارب الساعة بشكل موثوق، أو الإجابة بشكل صحيح عن أسئلة حول التواريخ في التقويم.

وأوضح الفريق أن فهم الساعات والتقويمات التناظرية يتطلب مزيجاً من الوعي المكاني والسياق والرياضيات الأساسية، وهو أمر لا يزال يمثل تحدياً للذكاء الاصطناعي.

وأشار الباحثون إلى أن التغلب على هذا التحدي يمكن أن يُمكّن أنظمة الذكاء الاصطناعي من تشغيل تطبيقات حساسة للوقت مثل مساعدي الجدولة، والروبوتات ذاتية التشغيل، وأدوات للأشخاص ذوي الإعاقات البصرية.

واختبر الفريق ما إذا كانت أنظمة الذكاء الاصطناعي التي تعالج النصوص والصور - المعروفة باسم نماذج اللغة الكبيرة متعددة الوسائط (MLLMs) - قادرة على الإجابة عن الأسئلة المتعلقة بالوقت من خلال النظر إلى صورة ساعة أو تقويم.

أسئلة تتعلق بالتقويم

درس الفريق تصاميم مختلفة للساعات، بما في ذلك بعض الساعات المزودة بأرقام رومانية، مع أو من دون عقارب للثواني، وأقراص ملونة مختلفة.

وأظهرت نتائجهم أنه في أحسن الأحوال، كانت أنظمة الذكاء الاصطناعي تُصيب مواقع عقارب الساعة في أقل من ربع الحالات. وكانت الأخطاء أكثر شيوعاً عندما كانت الساعات تحمل أرقاماً رومانية أو عقارب منمقة.

وأضاف الفريق أن أداء أنظمة الذكاء الاصطناعي لم يكن أفضل عند إزالة عقرب الثواني، مما يشير إلى وجود مشاكل عميقة في اكتشاف العقارب وتفسير الزوايا.

وطلب الباحثون من نماذج الذكاء الاصطناعي الإجابة عن مجموعة من الأسئلة المتعلقة بالتقويم، مثل تحديد العطلات وحساب التواريخ الماضية والمستقبلية. ووجد الفريق أنه حتى أفضل نماذج الذكاء الاصطناعي أداءً أخطأت في حسابات التواريخ في خُمس الحالات.

وقالت روهيت ساكسينا، من كلية المعلوماتية بجامعة أدنبره، والتي قادت الدراسة، إن هناك «فجوة كبيرة في قدرة الذكاء الاصطناعي على اكتساب مهارات أساسية للغاية».

وأضافت: «يستطيع معظم الناس معرفة الوقت واستخدام التقويمات منذ سن مبكرة. يجب معالجة هذه النواقص إذا أردنا دمج أنظمة الذكاء الاصطناعي بنجاح في التطبيقات الواقعية الحساسة للوقت، مثل الجدولة والأتمتة والتقنيات المساعدة».


مقالات ذات صلة

كوريا الجنوبية تدعو للتعاون مع الولايات المتحدة بعد تصنيفها «دولة حساسة»

الاقتصاد العلمان الكوري الجنوبي والأميركي يرفرفان جنباً إلى جنب في يونغين (رويترز)

كوريا الجنوبية تدعو للتعاون مع الولايات المتحدة بعد تصنيفها «دولة حساسة»

دعا القائم بأعمال رئيس كوريا الجنوبية الوزارات إلى التعاون مع الولايات المتحدة لتفادي أي تأثير سلبي على الشراكة الثنائية في مجالات العلوم والتكنولوجيا.

«الشرق الأوسط» (سيول)
خاص التقارب بين الذكاء الاصطناعي والحوسبة الكمومية يمكن أن يسرع الاكتشافات في مجالات مثل الأدوية والمناخ (أدوبي)

خاص كيف يغير تقارب الذكاء الاصطناعي والحوسبة الكمومية وجه الاكتشافات العلمية؟

الحوسبة الكمومية والذكاء الاصطناعي يجتمعان لقيادة الابتكار العلمي، مع تقدم سريع في التطبيقات التجارية، من اكتشاف الأدوية إلى الأمن السيبراني.

نسيم رمضان (سياتل)
تكنولوجيا شعار تطبيق «ديب سيك» الصيني على أحد الهواتف (رويترز) play-circle

بعد ظهور «ديب سيك» الصيني... هل خسرت شركات الذكاء الاصطناعي الكبرى تفوّقها؟

هزت شركة ديب سيك الصينية الصغيرة قطاع الذكاء الاصطناعي التوليدي، في نهاية يناير (كانون الثاني) الماضي، مع برنامجها منخفض التكلفة وعالي الأداء في الوقت نفسه.

«الشرق الأوسط» (لاس فيغاس (الولايات المتحدة))
الاقتصاد شعار «أوبن إيه آي» أمام صورة إيلون ماسك في رسم توضيحي (رويترز)

«أوبن إيه آي» وماسك يتفقان على تسريع محاكمة بشأن تحول الشركة إلى الربح

اتفقت «أوبن إيه آي» وإيلون ماسك على تسريع محاكمة بشأن تحول الشركة للربح، وهو أحدث تطور في خلاف بين أغنى رجل بالعالم وسام ألتمان الرئيس التنفيذي لـ«أوبن إيه آي».

«الشرق الأوسط» (أوكلاند (كاليفورنيا))
خاص تهدف مبادرات مثل «النطاق العريض اللاسلكي» إلى ضمان اتصال سلس وعالي السرعة للمستخدمين في جميع أنحاء المملكة (شاترستوك)

خاص «نوكيا»: السعودية ستكون رائدة عالمياً في نشر شبكات «الجيل السادس»

في حديث لـ«الشرق الأوسط»، يصف نائب الرئيس الأول لشبكات الهواتف الجوالة في الشرق الأوسط وأفريقيا في «نوكيا» المشهد في السعودية بـ«العاصفة المثالية من النمو».

نسيم رمضان (الرياض)

«تشات جي بي تي 4.5» و«غوغل جيميناي 2.0»: صراع العمالقة في عالم الذكاء الاصطناعي

منافسة حادة بين نموذجي «تشات جي بي تي 4.5» و«غوغل جيميناي 2.0» للتربع على عرش الذكاء الاصطناعي
منافسة حادة بين نموذجي «تشات جي بي تي 4.5» و«غوغل جيميناي 2.0» للتربع على عرش الذكاء الاصطناعي
TT
20

«تشات جي بي تي 4.5» و«غوغل جيميناي 2.0»: صراع العمالقة في عالم الذكاء الاصطناعي

منافسة حادة بين نموذجي «تشات جي بي تي 4.5» و«غوغل جيميناي 2.0» للتربع على عرش الذكاء الاصطناعي
منافسة حادة بين نموذجي «تشات جي بي تي 4.5» و«غوغل جيميناي 2.0» للتربع على عرش الذكاء الاصطناعي

في سباق محموم نحو تطوير الذكاء الاصطناعي، تطل علينا شركتا «أوبن إيه آي» و«غوغل» بإصدارين جديدين يعدان بنقلة نوعية في عالم نماذج اللغة الكبيرة: «تشات جي بي تي 4.5» Chat GPT 4.5 و«غوغل جيميناي 2.0» Google Gemini 2.0، وهما نموذجان يقدِّمان ميزات وقدرات متطورة تجعل منهما أداتين قويتين ومتنوعتين قادرتين على التعامل مع مهام معقدة بكفاءة ودقة عالية.

وسنستعرض في هذا الموضوع أبرز المزايا التي يقدمها هذان النموذجان ونقارن بينهما في جوانب عدة، لنكشف عن نقاط القوة والضعف في كل منهما ونسلط الضوء على الفروقات التي قد تكون حاسمةً في اختيار النموذج الأنسب لكم.

قفزة «جي بي تي» النوعية

يتجسَّد في «تشات جي بي تي 4.5»، الفهم المحسَّن للسياق. وهو يمثل قفزةً نوعيةً في عالم نماذج اللغة الكبيرة، حيث يأتي بتحسينات ملحوظة في الأداء والقدرات مقارنة بالإصدارات السابقة. وهذه التحسينات تجعله أداةً أكثر قوةً وتنوعاً، قادرةً على التعامل مع مجموعة واسعة من المهام بكفاءة ودقة عالية.

وسنستعرض فيما يلي أبرز المزايا التي يقدِّمها هذا النموذج المطور.

• الميزة الأولى: الفهم المُحسَّن للسياق، حيث يتمتع «تشات جي بي تي 4.5» بقدرة مُحسَّنة على فهم السياق في المحادثات المعقدة والطويلة. وهذا الأمر يعني أنه يمكنه تتبع التفاصيل الدقيقة للمحادثة وفهم العلاقات بين الأفكار المختلفة وتقديم استجابات أكثر دقةً وملاءمة.

وهذه الميزة تجعل النظام أكثر فاعليةً في المهام التي تتطلب فهماً عميقاً للنصوص، مثل تلخيص المستندات الطويلة أو الإجابة عن الأسئلة المعقدة.

• الميزة الثانية: تقديم دقة أعلى في الإجابات، حيث تم تحسينه لتقديم إجابات أكثر دقةً وموثوقيةً، مع خفض الهلوسة أو توليد معلومات خاطئة. وهذا التحسين يجعله أداةً أكثر موثوقيةً للاستخدام في مجموعة متنوعة من المهام المتخصصة، مثل البحث عن المعلومات أو كتابة المحتوى.

• الميزة الثالثة التي يتمتع بها «تشات جي بي تي 4.5»، هي تقديم قدرات إبداعية محسنة، إذ يتمتع بقدرات إبداعية مُطوَّرة تسمح له بتوليد نصوص أكثر إبداعاً وتنوعاً. ويمكن استخدام هذه الميزة لكتابة القصص والشعر والنصوص المتقدمة والمحتوى الإبداعي.

• الميزة الرابعة هي دعم قدرات الوسائط المتعددة؛ حيث تتكامل مع أحدث ميزات «تشات جي بي تي»، بما في ذلك تحميل الملفات والصور وقدرات البحث، وغيرها. ومع ذلك، لا تزال قدرات الوسائط المتعددة مثل الوضع الصوتي ومعالجة الفيديو ومشاركة الشاشة غير مدعومة في هذا الإصدار الجديد.

«جيميناي 2.0»: تكامل مع «غوغل»

يمثل «غوغل جيميناي 2.0» خطوةً ثوريةً في مجال نماذج الذكاء الاصطناعي، حيث يجمع بين قوة التعلم العميق، وقدرات معالجة البيانات الهائلة؛ لتقديم أداء غير مسبوق في مجموعة متنوعة من المهام. ويتميز هذا الإصدار الجديد بقدرته على فهم وتوليد النصوص والصور والصوتيات وعروض الفيديو، مما يجعله نموذجاً متعدد الوسائط، قادراً على التكيف مع احتياجات المستخدمين في مختلف المجالات.

• الميزة الأولى لـ«غوغل جيميناي 2.0» هي دعم الوسائط المتعددة، حيث إن له قدرةً فائقةً على فهم وتوليد المحتوى عبر مختلف الوسائط، بما في ذلك النصوص والصور والصوتيات وعروض الفيديو. ويمكنه تحليل الصور والفيديوهات بدقة عالية وفهم محتواها وتوليد أوصاف نصية دقيقة لها. كما يمكنه توليد الصوتيات وتحويل النصوص إلى كلام منطوق، والعكس. هذه القدرات المتعددة الوسائط تجعله أداةً متقدمةً جداً للإبداع والتواصل والتعلم.

• الميزة الثانية، هي الفهم المتقدم للغات؛ ما يسمح له بتحليل النصوص المعقدة وفهم العلاقات بين الكلمات والجمل بدقة عالية، حيث يمكنه فهم السياق واستخلاص المعلومات المهمة والإجابة عن الأسئلة المعقدة بدقة وموضوعية. وهذا الفهم المتقدم للغة (يشمل فهم اللغة العربية) يجعله أداةً قيّمة للبحث عن المعلومات وتلخيص النصوص والترجمة بين اللغات المختلفة وكتابة المحتوى.

• الميزة الثالثة: تحسن الإصدار من حيث قدرات كتابة النصوص البرمجية، وذلك نتيجة تحسينه للتعامل مع المهام البرمجية المعقدة، حيث يمكنه فهم وتوليد النصوص البرمجية بلغات البرمجة المختلفة وتصحيح الأخطاء واقتراح التحسينات للنصوص الحالية. وهذه القدرات البرمجية تجعله مرجعاً مهماً للمطورين والمبرمجين، حيث يمكنهم استخدامه لكتابة النصوص بشكل أسرع وأكثر كفاءة.

• الميزة الرابعة، وهي تكامله السلس مع خدمات «غوغل»، حيث يتكامل الإصدار الجديد بسلاسة مع مجموعة واسعة من خدمات «غوغل»؛ ما يجعله متاحاً للمستخدمين في مختلف التطبيقات والمنصات. ويمكن استخدامه في محرك البحث و«مساعد غوغل» والخدمات السحابية لـ«غوغل» التي تشمل «وثائق غوغل» وجداول الحسابات وعروض التقديم، وغيرها من الخدمات الأخرى. هذا التكامل السلس يجعل من الإصدار الجديد أداةً عالية الكفاءة للبحث عن المعلومة وإنجاز المهام والتواصل مع الآخرين.

مقارنة بين الإصدارين الجديدين

ولدى طلب التخطيط لقضاء إجازة في منطقة، قدَّم «تشات جي بي تي 4.5» خط سير مفصلاً مع اقتراحات للسير لمسافات طويلة، وأماكن لتناول الطعام، وخيارات للسكن، إلى جانب نصائح حول كيفية الوصول إلى الوجهة. وفي المقابل، قدَّم «غوغل جيميناي 2.0» مقترحات جيدة للسير لمسافات طويلة وتناول الطعام، ولكنه كان أقل تحديداً حول أماكن السكن.

وفي ما يتعلق بالترجمة، قدم كلا النموذجين ترجمات دقيقة بين اللغات العربية والإنجليزية والفرنسية. وكان الفارق الوحيد هو أن «تشات جي بي تي 4.5» قدَّم روابط مع الترجمة. أما لدى سؤال الإصدارين حول حالة الطقس في مدينة الرياض، فقدَّم «غوغل جيميناي 2.0» حالة الطقس الحالي، بينما قدم «تشات جي بي تي 4.5» توقعات لكل ساعة مع صور وكلمات تصف حالة الطقس.

وفي الخلاصة، لا يمكن اعتبار أي منهما أفضل بشكل قاطع من الآخر، على الرغم من وجود بعض الاختلافات الطفيفة بينهما، والتي قد لا تكون ملحوظةً في الاستخدامات اليومية العادية. ويُنصح بالتحقق من جميع النتائج حتى لا يقع المستخدم في مشكلة الهلوسة (تأليف الذكاء الاصطناعي للمعلومة التي لا يعرفها لتبدو وكأنها حقيقية).

النموذجان متقدمان والاختيار بينهما يعتمد على تفضيلات المستخدمين بشكل فردي. ولكن يبقى فارق أخير بينهما يستحق الذكر، وهو أن «غوغل جيميناي 2.0» يسمح بتحميل الملفات والوثائق الكبيرة وتلخيصها والإجابة عن أي استفسارات مرتبطة بها بشكل مجاني، مقارنة باشتراك مدفوع في «تشات جي بي تي 4.5» وقيوده فيما يتعلق بحجم الملفات وعدد مرات استخدام هذا الميزة في اليوم الواحد.

«أبل» تؤجّل ميزات الذكاء الاصطناعي الجديدة

من جهتها أعلنت «أبل» تأجيل إطلاق النسخة المُحدَّثة من مساعدها الصوتي «سيري» التي كان من المفترض أن تُقدِّم قدرات متطورة لفهم السياق الشخصي وتنفيذ المهام داخل التطبيقات. وأوضحت الشركة أنها ستطلق هذه التحديثات خلال العام المقبل دون تحديد موعد دقيق لذلك. ويأتي هذا التأجيل نتيجة لصعوبات واجهت «أبل» في تطوير «سيري» المحدث، وإدراكها أن خططها لربط المساعد الصوتي بنموذج لغة كبير لتعزيز قدراته قد تستغرق سنوات عدة لتنضج بالشكل المرغوب، مقارنة بقدرات «سامسونغ» للذكاء الاصطناعي التي أطلقتها في سلسلة هواتفها «غالاكسي إس 25»، التي أطلقتها في شهر فبراير (شباط) الماضي، والتي تدعم تنفيذ المهام داخل التطبيقات بشكل مدمج.

وكانت «أبل» قد قدَّمت «سيري» المطور بوصفه جزءاً أساسياً من رؤيتها لـ«ذكاء أبل»، حيث وعدت بقدرة المساعد الصوتي على فهم ما يحدث في الجوال وتنفيذ الإجراءات داخل التطبيقات. ولكن ما تم إطلاقه حتى الآن يقتصر على ميزات مبسطة مثل الكتابة إلى «سيري» وفهم وشرح ميزات منتجات «أبل» وتحسينات بصرية، وتكامل مع «تشات جي بي تي».