«أبل» تستعد في فبراير لكشف نسخة جديدة من «سيري»

يُرجّح أن يكون ضمن تحديث «iOS 26.4»

شكّل إعلان فبراير معاينة أولية فقط في حين تخطط «أبل» لإطلاق نسخة أكثر تكاملاً من «سيري» لاحقاً هذا العام (شاترستوك)
شكّل إعلان فبراير معاينة أولية فقط في حين تخطط «أبل» لإطلاق نسخة أكثر تكاملاً من «سيري» لاحقاً هذا العام (شاترستوك)
TT

«أبل» تستعد في فبراير لكشف نسخة جديدة من «سيري»

شكّل إعلان فبراير معاينة أولية فقط في حين تخطط «أبل» لإطلاق نسخة أكثر تكاملاً من «سيري» لاحقاً هذا العام (شاترستوك)
شكّل إعلان فبراير معاينة أولية فقط في حين تخطط «أبل» لإطلاق نسخة أكثر تكاملاً من «سيري» لاحقاً هذا العام (شاترستوك)

يبدو أن شهر فبراير (شباط) المقبل سيشكل لحظة مفصلية في مسار «أبل» في مجال الذكاء الاصطناعي. فبعد أسابيع من التكهنات، والتقارير المتتابعة، أفادت وكالة «بلومبرغ» بأن الشركة «تستعد للكشف عن نسخة مطوّرة بشكل جذري من مساعدها الصوتي «سيري»، في خطوة تُعد الأهم منذ إطلاقه قبل أكثر من عقد، وتعكس تسارع جهود «أبل» للحاق بالمنافسين في سباق الذكاء الاصطناعي التوليدي.

ويأتي هذا التطور في وقت واجهت فيه «سيري» انتقادات متزايدة بسبب محدودية قدراتها مقارنة بالمساعدات الحوارية الحديثة، التي باتت قادرة على إجراء محادثات مطوّلة، وفهم السياق، والتعامل مع أسئلة معقّدة. ورغم أن «سيري» كانت من أوائل المساعدات الصوتية في السوق، فإن التحسينات التي أُدخلت عليها خلال السنوات الماضية لم تكن كافية لمجاراة التحولات السريعة في هذا المجال.

يعتمد التحديث الجديد على دمج نماذج ذكاء اصطناعي توليدي متقدمة من بينها «جيميناي» لتعزيز الفهم الحواري والسياقي للمساعد الصوتي (شاترستوك)

استفادة من «جيميناي»

وبحسب تقرير «بلومبرغ»، تعتزم «أبل» استعراض النسخة الجديدة من «سيري» ضمن تحديث مرتقب لأنظمة التشغيل في النصف الثاني من فبراير، يُرجّح أن يكون «iOS 26.4». وسيُظهر هذا التحديث كيف يمكن لـ«سيري» الاستفادة من نماذج لغوية متقدمة، من بينها نماذج «جيميناي» التابعة لـ«غوغل»، وذلك ضمن إطار منظومة «ذكاء أبل» (Apple Intelligence). وتعكس هذه الخطوة تحولاً برغماتياً في استراتيجية الشركة، إذ باتت تميل إلى دمج تقنيات خارجية لتعزيز قدراتها، بدل الاعتماد الحصري على تطويرها الداخلي.

ولا يُتوقع أن يقدم تحديث فبراير الصورة الكاملة لـ«سيري» الجديدة، بل سيكون بمثابة معاينة أولية لمساعد أكثر حوارية، وقادر على فهم السياق ومتابعة الطلبات المتعددة، والرد بأسلوب أقرب إلى المحادثة الطبيعية. ويصف مراقبون هذا التحول بأنه انتقال من نموذج قائم على تنفيذ الأوامر الصوتية المحددة، إلى واجهة حوارية أكثر مرونة، وتفاعلية، وتقترب في طبيعتها من روبوتات الدردشة التوليدية.

أكثر من «سيري»

يأتي هذا التحديث ضمن مراجعة أوسع لطريقة دمج الذكاء الاصطناعي في أنظمة «أبل». وتشير «بلومبرغ» إلى أن الشركة تعيد النظر في موقع الذكاء الاصطناعي داخل منظومتها ككل، من «آي أو إس» و«ماك أو إس» إلى متصفح «سفاري»، والخدمات الأساسية. وتحتل «سيري» موقعاً محورياً في هذه المراجعة، باعتبارها الواجهة الأكثر مباشرة بين المستخدم والذكاء الاصطناعي في أجهزة «أبل».

ورغم التركيز على إعلان فبراير، فإن هذا التحديث يُنظر إليه على نطاق واسع بوصفه خطوة تمهيدية فقط. إذ تشير تقارير إلى أن «أبل» تعمل على نسخة أكثر تقدماً من «سيري» قد تُطرح لاحقاً هذا العام، بالتزامن مع إطلاق iOS 27. ومن المتوقع أن تقترب هذه النسخة من مفهوم «المساعد الحواري المتكامل»، والقادر على معالجة الأسئلة المعقّدة، وتلخيص المعلومات، وتنفيذ مهام مترابطة عبر التطبيقات المختلفة.

ويُعد اعتماد «أبل» الجزئي على نماذج «جيميناي» تطوراً لافتاً، خاصة في ظل تقليدها الراسخ بالتحكم الكامل في تقنياتها. غير أن تقارير «بلومبرغ» تشير إلى أن الشركة تنظر إلى هذا الدمج باعتباره خطوة مكملة، لا بديلاً عن تطوير نماذجها الخاصة، وتهدف إلى سد فجوات محددة في فهم اللغة الطبيعية، وتوليدها.

يأتي هذا التحول ضمن مراجعة أوسع لاستراتيجية «أبل» في الذكاء الاصطناعي لمواجهة تسارع المنافسة في هذا المجال (شاترستوك)

الخصوصية عنصر أساسي

يُتوقع أن تؤكد «أبل» أن تعزيز قدرات «سيري» سيتم بما ينسجم مع نهجها المعروف في حماية بيانات المستخدمين، عبر مزيج من المعالجة على الجهاز نفسه، واستخدام بنية سحابية خاضعة لرقابة صارمة. وسيكون التوازن بين الذكاء المتقدم والخصوصية عاملاً حاسماً في تقبّل المستخدمين للتجربة الجديدة. وبالنسبة للمستخدمين، قد تحمل «سيري» المطوّرة إمكانات واسعة لتغيير أسلوب التفاعل مع أجهزة «أبل». فبدل الاكتفاء بتنفيذ أوامر منفصلة، قد يصبح المساعد شريكاً أكثر فاعلية في التخطيط، والشرح، وإدارة المهام اليومية عبر حوار طبيعي، ومتواصل.

وفي هذا السياق، لا يمثل كشف فبراير مجرد تحديث برمجي، بل إشارة إلى المسار الذي تعتزم «أبل» اتباعه في عصر الذكاء الاصطناعي التوليدي. ومع تصاعد التوقعات، ستتجه الأنظار إلى ما إذا كانت هذه الخطوة كافية لإعادة تعريف مكانة «سيري»، ودور «أبل» في سباق الذكاء الاصطناعي العالمي خلال الأشهر المقبلة.


مقالات ذات صلة

لماذا يختار بعض صُنّاع المحتوى «أبل»… ويتمسّك المحترفون بـ«أدوبي»؟

تكنولوجيا تطبيقات استوديو «أبل» للمبدعين (أبل)

لماذا يختار بعض صُنّاع المحتوى «أبل»… ويتمسّك المحترفون بـ«أدوبي»؟

«أبل» تراهن على التكامل بين الأجهزة والسرعة والبساطة لصانع المحتوى اليومي، بينما ترتكز «أدوبي» على العمق والمرونة والأدوات الاحترافية للمشاريع المعقّدة.

عبد العزيز الرشيد (الرياض)
تكنولوجيا تعمل «أبل» على إعادة تصميم «سيري» لتتحول من منفذة أوامر إلى مساعد حواري سياقي شبيه بـ«ChatGPT» (شاترستوك)

ماذا يعني أن تصبح «سيري» شبيهة بـ«ChatGPT»؟

تعمل «أبل» على تحويل «سيري» إلى مساعد شبيه بـ«ChatGPT»، يركز على السياق والتنفيذ والخصوصية، في خطوة تعكس تغير تفاعل المستخدمين مع الذكاء الاصطناعي.

نسيم رمضان (لندن)
الاقتصاد شعار «غولدمان ساكس» يظهر في هذا الرسم التوضيحي (رويترز)

مكاسب استثنائية وصفقات كبرى ترفع أرباح «غولدمان ساكس» في الربع الأخير

سجّل «غولدمان ساكس» ارتفاعاً بأرباحه خلال الربع الأخير من العام مدفوعاً بزخم إبرام الصفقات وقوة إيرادات التداول في ظل تقلبات الأسواق.

«الشرق الأوسط» (نيويورك )
الاقتصاد مبنى «جيه بي مورغان تشيس» بمقره الجديد في نيويورك أكتوبر 2025 (رويترز)

بسبب رسوم «بطاقات أبل»... أرباح «جي بي مورغان» تتراجع نهاية 2025

تراجعت أرباح بنك «جي بي مورغان تشيس» في الربع الأخير نتيجة رسوم لمرة واحدة تتعلق باتفاقية مع «غولدمان ساكس» للاستحواذ على شراكة بطاقات الائتمان الخاصة بـ«أبل».

«الشرق الأوسط» (نيويورك)
تكنولوجيا باتت منصة «غوغل» للذكاء الاصطناعي «جيميناي» Gemini AI تضم 650 مليون مستخدم شهرياً (رويترز)

«غوغل» و«أبل» تبرمان صفقة ذكاء اصطناعي لنماذج جيميناي

أعلنت شركة «ألفابت» أنها أبرمت ​صفقة مدتها عدة سنوات مع شركة «أبل» تقضي باعتماد الجيل التالي من هواتف آيفون على ‌نماذج جيميناي التابعة ‌لـ«غوغل».

«الشرق الأوسط» (كاليفورنيا)

«باتريوت»: درع صاروخية أميركية قادرة على تتبّع 100 هدف في آن واحد

جندي أمام منظومة الدفاع الجوي «باتريوت» خلال تدريب عسكري على أنظمة الصواريخ داخل مطار في وارسو ببولندا يوم 7 فبراير 2023 (رويترز)
جندي أمام منظومة الدفاع الجوي «باتريوت» خلال تدريب عسكري على أنظمة الصواريخ داخل مطار في وارسو ببولندا يوم 7 فبراير 2023 (رويترز)
TT

«باتريوت»: درع صاروخية أميركية قادرة على تتبّع 100 هدف في آن واحد

جندي أمام منظومة الدفاع الجوي «باتريوت» خلال تدريب عسكري على أنظمة الصواريخ داخل مطار في وارسو ببولندا يوم 7 فبراير 2023 (رويترز)
جندي أمام منظومة الدفاع الجوي «باتريوت» خلال تدريب عسكري على أنظمة الصواريخ داخل مطار في وارسو ببولندا يوم 7 فبراير 2023 (رويترز)

تُعدّ منظومة «باتريوت» من أبرز أنظمة الدفاع الجوي بعيدة المدى في العالم. طوّرت المنظومة في الولايات المتحدة شركتا «رايثيون تكنولوجيز (Raytheon Technologies)» و«لوكهيد مارتن (Lockheed Martin)»، وهي في الخدمة منذ عقود لتصبح نظاماً قتالياً مُجرَّباً في ميادين الحرب، وقادراً على مواجهة طيف واسع من التهديدات؛ من الطائرات المتقدمة إلى الصواريخ الباليستية التكتيكية وصواريخ «كروز» والطائرات المسيّرة.

العمل في كل الظروف الجوية

تتميز منظومة «باتريوت» بقدرتها على العمل في جميع الظروف الجوية وعلى مختلف الارتفاعات، مع مدى اشتباك يصل إلى نحو 70 كيلومتراً وارتفاع اعتراض يتجاوز 24 كيلومتراً. يتكوّن الصاروخ القياسي من هيكل بطول 5.2 متر وقطر 40 سنتيمتراً، مزوّد بـ4 أجنحة «دلتا» قطرها 85 سنتيمتراً، ويحمل رأساً حربياً شديد الانفجار بوزن يبلغ نحو 90 كيلوغراماً، يفجَّر عبر صمام عند الاقتراب من الهدف، وفق موقع «آرمي تكنولوجي (تكنولوجيا الجيش)» المختص.

استُخدمت المنظومة في حروب عدة، منها حرب العراق عام 2003، حيث اعترضت صواريخ أرض - أرض معادية.

قدرات عالية

تعتمد «باتريوت» على رادار متطور قادر على الكشف عن حتى 100 هدف وتتبعها معاً في آن واحد، وتوجيه ما يصل إلى 9 صواريخ بالتوازي. ويصل مدى الرادار إلى نحو 100 كيلومتر، مع قدرات مقاومة للتشويش الإلكتروني. وتُدار عمليات الاشتباك عبر محطة تحكم، وهي المحطة المأهولة الوحيدة في وحدة الإطلاق، ويعمل فيها 3 مشغلين باستخدام واجهات رقمية حديثة.

من الناحية التقنية، يستخدم صاروخ «باتريوت» نظام توجيه يُعرف بـ«التتبع عبر الصاروخ»، حيث يُرسل الرادار الأرضي بيانات الهدف إلى الصاروخ في المرحلة المتوسطة، ثم يعيد الصاروخ إرسال بياناته إلى محطة التحكم لإجراء التصحيحات النهائية. وتتيح هذه الآلية دقة عالية في إصابة الأهداف.

أُطلق صاروخ من منظومة «باتريوت» خلال مناورة على البحر الأسود في كونستانتا برومانيا يوم 15 نوفمبر 2023 (رويترز)

تطوير دائم

شهدت المنظومة تحديثات رئيسية عدة، أبرزها تطوير صاروخ «جام تي (GEM-T)»، وهو نسخة مطوّرة من صاروخ «باك2 (PAC-2)»، زُوّد بصمام تفجير جديد ومذبذب منخفض الضجيج زاد من حساسية الباحث الراداري تجاه الأهداف ذات البصمة الرادارية المنخفضة. وقد جرى تحديث أكثر من ألف صاروخ إلى هذا المعيار لمصلحة الجيش الأميركي وحلفائه، فيما أبرمت دول أوروبية عقوداً ضخمة ضمن مبادرة «الدرع الأوروبية للسماء» لتعزيز قدراتها الدفاعية في ظل الحرب الروسية - الأوكرانية.

أما النسخة الأحدث والأعلى تطوراً من «باتريوت» فهي «باك3 (PAC-3)»، التي تعتمد مبدأ «الضربة المباشرة»، حيث يُدمَّر الهدف بالطاقة الحركية الناتجة عن الاصطدام المباشر دون الحاجة إلى رأس متفجر تقليدي. يتميز صاروخ «باك3» بقدرته على تحميل 16 صاروخاً في منصة إطلاق واحدة مقارنة بـ4 فقط من طراز «باك2». دخل هذا الطراز الإنتاج المحدود أواخر التسعينات، واستخدم ميدانياً في العراق عام 2003.

لاحقاً، جرى تطوير نسخة «باك3 إم إس إيه (PAC-3 MSE)»، المزودة بمحرك صاروخي أقوى وزعانف أكبر لزيادة المدى والقدرة على المناورة ضد أهداف أسرع وأعلى تعقيداً. أُعلن عن الجاهزة التشغيلية الأولية لهذه النسخة عام 2016، ودخلت مرحلة الإنتاج الكامل في 2017. كما دُمجت مع «نظام القيادة والسيطرة المتكامل للدفاع الجوي والصاروخي (IBCS)»؛ مما عزز قدرتها على العمل ضمن شبكة دفاعية متعددة الطبقات.

جنود أميركيون يقفون بجوار بطارية صواريخ «باتريوت» في ليتوانيا عام 2017 (أ.ب)

انتشار واسع

تنتشر منظومة «باتريوت» اليوم في 17 دولة، من بينها ألمانيا واليابان وكوريا الجنوبية وبولندا ورومانيا والسويد وإسبانيا. وقد وقّعت دول عدة عقوداً بمليارات الدولارات لتحديث أو شراء وحدات إطلاق جديدة.

تعكس هذه العقود الضخمة مكانة «باتريوت» بوصفها أحد أعمدة الدفاع الجوي الغربي، لا سيما في ظل تصاعد التهديدات الصاروخية والطائرات المسيّرة منخفضة التكلفة. كما أن استمرار عمليات التطوير؛ سواء أكان عبر تحسين الرادارات بتقنية حديثة أم تطوير باحثات الجيل الجديد، يشير إلى أن المنظومة ستبقى لاعباً محورياً في ميدان الدفاع الجوي لعقود مقبلة، وفق موقع «آرمي تكنولوجي».


شركة بريطانية ناشئة تتحرّك لمنافسة «ستارلينك» بدعم أميركي

«ستارلينك» تعتمد على شبكة من الأقمار الاصطناعية في مدار أرضي منخفض ما يتيح اتصالاً سريعاً وكموناً منخفضاً في أصعب البيئات
«ستارلينك» تعتمد على شبكة من الأقمار الاصطناعية في مدار أرضي منخفض ما يتيح اتصالاً سريعاً وكموناً منخفضاً في أصعب البيئات
TT

شركة بريطانية ناشئة تتحرّك لمنافسة «ستارلينك» بدعم أميركي

«ستارلينك» تعتمد على شبكة من الأقمار الاصطناعية في مدار أرضي منخفض ما يتيح اتصالاً سريعاً وكموناً منخفضاً في أصعب البيئات
«ستارلينك» تعتمد على شبكة من الأقمار الاصطناعية في مدار أرضي منخفض ما يتيح اتصالاً سريعاً وكموناً منخفضاً في أصعب البيئات

تستعد شركة ناشئة مقرّها أكسفورد، وتحظى بدعم من وكالة الاستخبارات المركزية الأميركية، لإنتاج مئات الأقمار الاصطناعية سنوياً، في خطوة طموحة تهدف إلى تقديم بديل بريطاني لخدمة «ستارلينك» التابعة لرجل الأعمال إيلون ماسك. وفقاً لصحيفة «تلغراف».

وأعلنت شركة «OpenCosmos» البريطانية، المتخصصة في تصنيع الأقمار الاصطناعية، عن خطط لإطلاق شبكة مدارية جديدة تحمل اسم «ConnectedCosmos»، مؤكدةً أن المشروع يهدف إلى الحدّ من «الاعتماد الأوروبي المفرط على الكوكبات العملاقة العابرة للقارات».

وقال مؤسس الشركة ورئيسها التنفيذي، رافيل جوردا سيكيير، إن الشركة تقترب سريعاً من بلوغ طاقة إنتاجية مرتفعة في مصانعها، بما في ذلك منشأتها الرئيسية في هاروِل قرب أكسفورد، تمكّنها من تصنيع نحو 200 قمر اصطناعي سنوياً.

وأضاف: «لدينا حالياً القدرة على إنتاج ما يصل إلى 150 قمراً سنوياً، وسنقترب قريباً من 200. وفي منشأة هاروِل تحديداً أصبح متوسط قدرتنا تصنيع قمر اصطناعي واحد كل ثلاثة أيام»، في إشارة تعكس تسارع وتيرة التوسّع الصناعي لدى الشركة.

وأوضح سيكيير أن «OpenCosmos» تسعى إلى تقديم بديل سيادي موثوق للحكومات الأوروبية وشركات الاتصالات، التي وجدت نفسها خلال السنوات الماضية مضطرةً إلى الاعتماد على «ستارلينك» في الاتصالات الحيوية، خصوصاً في البيئات الحسّاسة.

وتُستخدم «ستارلينك»، التي تضم آلاف الأقمار الاصطناعية الصغيرة في المدار الأرضي المنخفض، على نطاق واسع لدعم العمليات في أوكرانيا عبر توفير الاتصال للقوات في الخطوط الأمامية وللهيئات الحكومية. غير أن عدداً من المسؤولين الأوروبيين أبدوا حذراً متزايداً حيال الاعتماد المفرط على الخدمة، في ظل ما يصفونه بالطبيعة المتقلّبة لماسك.

في هذا السياق، قال سيكيير: «من المهم جداً ألا نعتمد على أنظمة يتخذ قراراتها فرد واحد على الجانب الآخر من الأطلسي»، مضيفاً بنبرة تؤكد البعد السيادي للمشروع: «نريد أن نكون حلاً موثوقاً للغاية، للمملكة المتحدة وأوروبا، وكذلك للدول التي ترغب في الشراكة والتعاون من دون الاضطرار إلى الاعتماد على الولايات المتحدة أو الصين».

أحد أجهزة «ستارلينك» (رويترز)

وكانت أوروبا قد درست إنشاء شبكتها السيادية الخاصة من الأقمار الاصطناعية، المعروفة باسم «Iris²»، غير أن المشروع يُتوقّع أن يكلّف مليارات اليوروات، ولن يكون جاهزاً قبل عام 2030، ما يفتح نافذة زمنية أمام مبادرات تجارية أسرع حركة.

وفي يناير (كانون الثاني) الماضي، حصلت «OpenCosmos» على حقوق طيف ترددي مهم للأقمار منخفضة المدار من الجهات التنظيمية في ليختنشتاين، وهو تطوّر قد يمنحها موقعاً تنافسياً متقدّماً في مواجهة شركة «سبيس إكس» التابعة لماسك. وتخوّل الرخصة الشركة إطلاق ما يصل إلى 288 قمراً اصطناعياً ضمن شبكتها بحلول عام 2028.


دراسة: الرموز التعبيرية في المحادثات تربك فهم الذكاء الاصطناعي

الوجوه التعبيرية النصية البسيطة قد تُسبب التباساً دلالياً لدى نماذج اللغة الكبيرة ما يؤدي إلى فهم خاطئ لنية المستخدم (شاترستوك)
الوجوه التعبيرية النصية البسيطة قد تُسبب التباساً دلالياً لدى نماذج اللغة الكبيرة ما يؤدي إلى فهم خاطئ لنية المستخدم (شاترستوك)
TT

دراسة: الرموز التعبيرية في المحادثات تربك فهم الذكاء الاصطناعي

الوجوه التعبيرية النصية البسيطة قد تُسبب التباساً دلالياً لدى نماذج اللغة الكبيرة ما يؤدي إلى فهم خاطئ لنية المستخدم (شاترستوك)
الوجوه التعبيرية النصية البسيطة قد تُسبب التباساً دلالياً لدى نماذج اللغة الكبيرة ما يؤدي إلى فهم خاطئ لنية المستخدم (شاترستوك)

تتركز أغلب النقاشات المرتبطة بالذكاء الاصطناعي التوليدي حول مخاطر كبرى؛ كالتحيز والهلوسة وإساءة الاستخدام أو القرارات الآلية غير القابلة للتفسير. لكن دراسة بحثية جديدة تلفت الانتباه إلى مصدر مختلف تماماً للمخاطر المحتملة. إنها الرموز الصغيرة التي نستخدمها يومياً من دون تفكير مثل الوجوه التعبيرية النصية (emoticons).

الدراسة، المنشورة على منصة «arXiv» تكشف عن أن نماذج اللغة الكبيرة قد تُسيء فهم هذه الرموز البسيطة بطرق تؤدي إلى أخطاء وظيفية صامتة، لا تظهر على شكل أعطال واضحة، بل في مخرجات تبدو صحيحة شكلياً لكنها لا تعكس نية المستخدم الحقيقية.

رموز مألوفة... ومعانٍ ملتبسة

على عكس الرموز التعبيرية الحديثة (emoji) التي تمثل وحدات مرئية موحدة، تعتمد الوجوه التعبيرية النصية مثل «: -)» أو «: P» على تسلسل أحرف «ASCII». ورغم بساطتها ، تحمل هذه الرموز معاني سياقية دقيقة، تختلف باختلاف الثقافة أو سياق الاستخدام. المشكلة، بحسب الباحثين، أن نماذج اللغة لا تتعامل دائماً مع هذه الرموز باعتبارها إشارات دلالية، بل قد تفسرها أحياناً كجزء من الشيفرة البرمجية أو كنص حرفي بلا معنى عاطفي.

هذا الالتباس الدلالي قد يبدو تفصيلاً صغيراً، لكنه يصبح أكثر خطورة عندما تُستخدم نماذج الذكاء الاصطناعي في مهام حساسة، مثل توليد الشيفرات البرمجية أو تحليل التعليمات أو تشغيل وكلاء آليين يتخذون قرارات تلقائية.

يمتد تأثير هذا الالتباس إلى الأنظمة المعتمدة على «الوكلاء الأذكياء» ما قد يضخّم الخطأ عبر سلاسل قرارات آلية متتابعة (شاترستوك)

قياس المشكلة بشكل منهجي

لفهم حجم هذه الظاهرة، طوّر فريق البحث إطاراً آلياً لاختبار تأثير الوجوه التعبيرية النصية على أداء النماذج. واعتمدوا على مجموعة بيانات تضم 3.757 حالة اختبار، ركزت في الغالب على سيناريوهات برمجية متعددة اللغات، حيث قد يؤدي سوء الفهم إلى أخطاء دقيقة ولكن مؤثرة.

حقائق

38 %

هو معدل تجاوز الخطأ الذي سجلته الاختبارات عند وجود رموز تعبيرية نصية رغم بساطة هذه الإشارات وشيوع استخدامها اليومي.

الفشل الصامت

النتيجة الأكثر إثارة للقلق في الدراسة ليست نسبة الخطأ بحد ذاتها، بل طبيعة هذه الأخطاء. فقد وجد الباحثون أن أكثر من 90 في المائة من حالات الإخفاق كانت «فشلاً صامتاً»؛ أي أن النموذج أنتج مخرجات تبدو صحيحة من حيث البنية أو الصياغة، لكنها تنفذ منطقاً مختلفاً عمّا قصده المستخدم.

في البرمجة، على سبيل المثال، قد يؤدي ذلك إلى شيفرة تعمل دون أخطاء، لكنها تنفذ وظيفة غير متوقعة. هذا النوع من الأخطاء يصعب اكتشافه؛ لأنه لا يولد تحذيرات مباشرة، وقد لا يظهر إلا بعد فترة طويلة، أو في ظروف تشغيل محددة.

تجاوز النماذج نفسها

لم تتوقف الدراسة عند اختبار النماذج اللغوية بشكل مباشر، بل امتدت إلى أنظمة قائمة على «الوكلاء» (agent - based frameworks) التي تعتمد على هذه النماذج كعقل مركزي لاتخاذ القرار. ووجد الباحثون أن الالتباس الدلالي ينتقل بسهولة إلى هذه الأنظمة المركبة، ما يعني أن الخطأ لا يبقى محصوراً في إجابة واحدة، بل قد يتضخم عبر سلسلة من القرارات الآلية. هذا الاكتشاف مهم في ظل التوجه المتسارع نحو استخدام وكلاء ذكيين لإدارة مهام معقدة، من أتمتة البرمجيات إلى تشغيل سلاسل عمل كاملة دون تدخل بشري مباشر.

لماذا تفشل الحلول الحالية؟

قد يبدو الحل بديهياً، وهو تعليم النموذج تجاهل الوجوه التعبيرية، أو إضافة تعليمات صريحة في المطالبات (prompts). لكن الدراسة تشير إلى أن هذه المعالجات السطحية ليست كافية. فحتى مع تعليمات إضافية، استمرت النماذج في الوقوع في الالتباس نفسه، ما يدل على أن المشكلة أعمق من مجرد «سوء صياغة» في الطلب.

يرجّح الباحثون أن جذور المشكلة تعود إلى بيانات التدريب نفسها، حيث لا يتم تمثيل الوجوه التعبيرية النصية بشكل متسق، أو يتم التعامل معها أحياناً على أنها ضوضاء لغوية. كما أن البنية الداخلية للنماذج قد لا تميز بوضوح بين الرمز بوصفه إشارة عاطفية أو عنصراً نحوياً أو جزءاً من شيفرة.

الدراسة: جذور المشكلة تعود إلى بيانات التدريب وبنية النماذج نفسها ما يستدعي اختبارات أمان أدق وتحسين تمثيل الإشارات اللغوية الصغيرة (أدوبي)

سلامة الذكاء الاصطناعي

تكشف هذه الدراسة عن جانب مهم من التحديات التي تواجه نشر نماذج الذكاء الاصطناعي في البيئات الواقعية. فالمخاطر لا تنشأ فقط من القرارات الكبرى أو المدخلات الخبيثة، بل قد تأتي من تفاصيل صغيرة ومألوفة ويومية. وفي سياق سلامة الذكاء الاصطناعي، يسلط البحث الضوء على الحاجة إلى اختبارات أكثر دقة، لا تكتفي بتقييم صحة الإجابة من حيث المضمون العام، بل تدرس مدى تطابقها مع نية المستخدم. كما يطرح تساؤلات حول مدى جاهزية هذه النماذج للتعامل مع اللغة كما تُستخدم فعلياً، لا كما تُكتب في الأمثلة المثالية.

الخطوة التالية

لا تقدم الدراسة حلولاً نهائية، لكنها ترسم خريطة واضحة للمشكلة، وتدعو إلى مزيد من البحث في كيفية تمثيل الرموز غير التقليدية داخل النماذج اللغوية. وقد يكون ذلك عبر تحسين بيانات التدريب أو تطوير آليات تفسير دلالي أدق أو دمج اختبارات أمان جديدة تركز على «الإشارات الصغيرة».

تهدف الدراسة إلى القول إن في عصر الذكاء الاصطناعي، لا توجد تفاصيل صغيرة حقاً. حتى رمز ابتسامة بسيط قد يحمل مخاطر أكبر مما نتخيل، إذا أسيء فهمه داخل عقل آلي يعتمد عليه البشر في قرارات متزايدة الحساسية.