أدوات الذكاء الاصطناعي تفشل في أداء المهام المالية الأساسية

دقة نتائجها لم تتجاوز 50 % مما يقدمه محلل مالي مبتدئ

أدوات الذكاء الاصطناعي تفشل في أداء المهام المالية الأساسية
TT

أدوات الذكاء الاصطناعي تفشل في أداء المهام المالية الأساسية

أدوات الذكاء الاصطناعي تفشل في أداء المهام المالية الأساسية

بينما يتوقع عدد كبير من رواد التكنولوجيا أن الذكاء الاصطناعي سيحلّ محل البشر، وينجز حتى المهامّ المعقدة بسرعة ودقة، فقد دحضت دراسة مستقلة جديدة هذه التوقعات، إذ وجدت أن أدوات الذكاء الاصطناعي غالباً ما تفشل في أدائها عند تنفيذ المهام المالية الأساسية، كما كتبت نيتاشا تيكو، وأندريا خيمينيز في «واشنطن بوست».

22 نموذجاً للذكاء الاصطناعي- دقة أقل 50 %

أظهر اختبار لـ22 نموذجاً للذكاء الاصطناعي للأغراض العامة من «أوبن إيه آي» و«أنثروبيك»، و«إكس إيه آي»، و«ميتا»، و«غوغل»، وغيرها من الشركات الرائدة في مجال الذكاء الاصطناعي، أن جميعها حققت دقة للمهام البسيطة المطلوبة من المحللين الماليين المبتدئين، كانت أقل من 50 في المائة، في المتوسط.

قال رايان كريشنان، الرئيس التنفيذي لشركة فالس للذكاء الاصطناعي «Vals AI»، التي أجرت الدراسة: «إن مستوى الهراء (المصاحب للترويج للذكاء الاصطناعي) الذي نراه، منافٍ للعقل.

ويحقق أحدث نماذج الذكاء الاصطناعي نتائج جيدة في المعايير العامة التي تقيس مهارات الرياضيات أو البرمجة؛ لأن أسئلة هذه الاختبارات منتشرة على نطاق واسع عبر الإنترنت، ومن المرجح أنها أصبحت جزءاً من البيانات التي تُدرَّب عليها أنظمة الذكاء الاصطناعي».

وأضاف: «يُطلق الناس كثيراً من الادعاءات الجريئة حول الذكاء الاصطناعي، لكنها ليست حقيقية لأنها تحمل طابعاً ذاتياً... (وفي الواقع) ليس لدينا ما يُشبه مراجعة (للنتائج) من الأقران الآخرين أو مُدقّقي الحسابات التابعين لجهات خارجية».

500 سؤال لتقييم النماذج

ولتقييم النماذج، طوّرت «فالس للذكاء الاصطناعي» مجموعة بيانات خاصة تضم أكثر من 500 سؤال، كُتبت بالتعاون مع أحد البنوك الرائدة؛ لتقييم مهارات مثل أبحاث السوق والتوقعات.

واجهت معظم نماذج الذكاء الاصطناعي صعوبة في المهام الشائعة، مثل البحث عن معلومات حول «EDGAR»، وهي قاعدة بيانات عامة متاحة للجمهور تابعة لهيئة الأوراق المالية والبورصات الأميركية لملفات الشركات، وهي مورد أساسي للبيانات المالية يستخدمه المحللون والمساهمون والصحافيون ومُختارو الأسهم.

* نموذج «أوبن إيه آي»: حقق أحدث إصدار من الشركة o3، وهو نموذج «استدلال» مصمم للتحدث مع نفسه بصفته وسيلة لتوليد إجابات أكثر دقة عن الاستفسارات المعقدة، دقةً بنسبة 48.3 في المائة، في المتوسط، ولكن بتكلفة 3.69 دولار أميركي للسؤال الواحد في المتوسط.

* نموذج الاستدلال من «أنثروبيك»، المسمى «Claude 3.7 Sonnet»، حقق دقةً بنسبة 44.1 في المائة بسعر أقل بكثير بلغ 1.05 دولار أميركي للسؤال.

* نموذج «ميتا» للذكاء الاصطناعي الأكثر انفتاحاً نسبياً Llama، كان أداؤه ضعيفاً بشكل خاص، حيث سجلت ثلاثة إصدارات دقة أقل من 10 في المائة في المتوسط.

شركات لاختبار وتصنيف الذكاء الاصطناعي

تُعد «فالس إيه آي»، الشركة الناشئة التي تتخذ من سان فرنسيسكو مقراً لها، التي تقف وراء الدراسة، جزءاً من مجموعة متنامية من شركات الطرف الثالث التي تعد باختبار نماذج الذكاء الاصطناعي أو تصنيفها أو فحصها، في ظل ازدياد صعوبة تحليل الضجيج والتهويل في هذا المجال. ومن بين الشركات الجديدة الأخرى في هذا المجال، «Artificial Analysis»، و«Chatbot Arena»؛ وهو مشروع بحثي أكاديمي شهير تحوَّل أخيراً إلى شركة تُعرف الآن باسم «LMArena».

يقول كريشنان إن الاختبار الدقيق والمستقل لكيفية أداء وكلاء الذكاء الاصطناعي مهام محددة أمر حيوي لتقييم تأثيرها. ويضيف: «كانت هناك رؤية مفادها أن الذكاء الاصطناعي التوليدي من المرجح أن يكون له تأثير كبير على الاقتصاد. ومع ذلك، لا نعرف حتى في أي قطاعات الاقتصاد يمكن أن تحقق النماذج أداء جيداً وكيف سيبدو هذا التغيير فعلياً».

ويتابع كريشنان أن القطاع اعتمد، لفترة طويلة، على «التقييم بالاهتزازات»؛ أي اللعب بنموذج فردي، ونشر أمثلة فورية على منصة «إكس». إلا أن الشركات التي تفكر في شراء هذه الأدوات لزيادة أو استبدال العمال تحتاج إلى نهج تدقيق أكثر صرامة.

دقة أكبر للأدوات الذكية في الشؤون القانونية

أصدرت الشركة أخيراً سلسلة من الدراسات المماثلة التي تُقيّم أدوات الذكاء الاصطناعي في المهام القانونية، وتبحث في نماذج الذكاء الاصطناعي للأغراض العامة ووكلاء الذكاء الاصطناعي المُصممة للمحامين، وتختبرها على سلسلة من طلبات الاستعلامات الواقعية التي جرى تطويرها بالتعاون مع شركات المحاماة. كانت الدرجات أعلى بشكل عام في مجال القانون عنها في مجال المالية، مع متوسط ​​معدلات دقة تتراوح بين 70 و80 في المائة لبعض النماذج نفسها.

الفرق بين الأداءين المالي والقانوني

ويُرجَّح أن يكون الأداء المتفوق في الشؤون القانونية ناتجاً عن توفير شركة «Vals AI» الوثائق اللازمة لمعظم المهام القانونية، بينما طلبت الدراسة المالية من النماذج «إجراء أبحاثها الخاصة على الإنترنت المفتوح؛ للتوصل إلى نتائج في السياق المطلوب»، وفقاً لكريشنان.

ورفضت «ميتا» التعليق على تقرير «فالس إيه آي»، ولم يستجب كل من «أوبن إيه آي» و«أنثروبيك» لطلبات التعليق.

وفي تقييمها المالي، وجدت شركة فالس للذكاء الاصطناعي أن أداء النماذج كان أسوأ بكثير مع ازدياد صعوبة المهام. وحصلت عشرة نماذج على صفر في الأسئلة التي طلبت من النموذج تحديد نمط لشركة واحدة عبر إيداعات الأوراق المالية المتكررة، مثل توفير إيرادات إعلانات «يوتيوب» كنسبة مئوية من إيرادات شركتها الأم «ألفابت»، من عام 2021 إلى 2024.

تقييمات متباينة وتلاعب الشركات

في المتوسط، كان أداء النماذج هو الأفضل في مهامّ استرجاع المعلومات الكمية والنوعية البسيطة، وهي مهام سهلة لكنها قد تستغرق وقتاً طويلاً بالنسبة للبشر، وفقاً لتحليل شركة «فالس إيه آي» للمتعاقدين البشريين الذين طُلب منهم أداء المهام نفسها.

وفي حالة منفصلة، ​​أبلغت شركة «أوبن إيه آي» عن نتائج مختلفة لنموذج o3 الخاص بها في المسائل الرياضية، مقارنةً بنتائج مدقق حسابات خارجي. وفي تقييم على منصة «Chatbot Arena»، حيث يُصوّت المستخدمون لصالح الذكاء الاصطناعي المُفضّل لديهم، أفادت التقارير بأن «ميتا» تلاعبت بتصنيفات أحدث طرازاتها، «Llama 4»، من خلال نشر نسخة «مُحسَّنة للمحادثة». وتعليقاً على ذلك، قال متحدث باسم «ميتا»: نجرّب جميع أنواع الإصدارات المُخصصة.

تأثير الذكاء الاصطناعي على الوظائف

وقدمت دراسة القطاع المالي، التي أجرتها «Vals AI» منظوراً مختلفاً للتصريحات الأخيرة حول تأثير الذكاء الاصطناعي على فئات الوظائف.

فمثلاً صرح بيل غيتس، المؤسس المشارك لشركة مايكروسوفت، في فبراير (شباط)، بأن الذكاء الاصطناعي سيحلُّ محل الأطباء والمعلمين، خلال السنوات العشر المُقبلة. وفي مُقابلة بودكاست حديثة، قال فيكتور لازارتي، الشريك العام في «بينتشمارك»، إن تصريحات شركات التكنولوجيا حول «زيادة» الذكاء الاصطناعي للبشر مُضلِّلة، وأن المحامين ومسؤولي التوظيف يجب أن يشعروا بالقلق بشكل خاص.

تُشير رسالة فريق «فالس إيه آي» إلى أنه قد يكون من المُناسب إجراء تقييم أكثر تواضعاً لتأثير الذكاء الاصطناعي على كثير من الوظائف الإدارية. وقال كريشنان إنه على الرغم من أن الأنظمة تتحسن باستمرار، فإن فكرة أن أداة الذكاء الاصطناعي يمكنها القيام بعمل شخص من البداية إلى النهاية لا تزال «خيالية إلى حد ما».


مقالات ذات صلة

«رابطة الصحافة الأجنبية» تتهم الجيش الإسرائيلي بفبركة صورة لصحافي لبناني لتبرير قتله

المشرق العربي أشخاص يمرون أمام لافتة تعرض صور الصحافييَن فاطمة فتوني وعلي شعيب اللذين قُتلا في غارة إسرائيلية في جنوب لبنان خلال مظاهرة في بغداد 7 أبريل 2026 (أ.ف.ب)

«رابطة الصحافة الأجنبية» تتهم الجيش الإسرائيلي بفبركة صورة لصحافي لبناني لتبرير قتله

هاجمت «رابطة الصحافة الأجنبية» الجيش الإسرائيلي بسبب صورة مفبركة بالذكاء الاصطناعي استخدمها لاتهام صحافي لبناني قتله الشهر الماضي بأنه عضو في «حزب الله».

«الشرق الأوسط» (تل أبيب)
الاقتصاد وحدة لجهاز طباعة ضوئية فوق بنفسجية فائقة الدقة من إنتاج «إيه إس إم إل» معروضة في مقر مختبر بحوث الرقائق البلجيكي (رويترز)

«إيه إس إم إل» الهولندية ترفع توقعات مبيعاتها لـ2026 إلى 40 مليار يورو

رفعت شركة «إيه إس إم إل» (ASML)، المورِّد الأكبر عالمياً لمعدات صناعة الرقائق، توقعاتها لإيرادات عام 2026.

«الشرق الأوسط» (أمستردام)
تكنولوجيا يؤكد تصدر السعودية لمراكز متقدمة عالمياً نجاح توجهات البلاد في بناء منظومة وطنية تنافسية (واس)

السعودية تحقق أعلى نمو عالمي في كفاءات الذكاء الاصطناعي

حققت السعودية، المرتبة الأولى عالمياً في الأمن والخصوصية والتشفير في الذكاء الاصطناعي وفقاً لـ«مؤشر ستانفورد 2026».

«الشرق الأوسط» (الرياض)
الاقتصاد جناح «أرامكو الرقمية» في ملتقى الحكومة الرقمية (موقع الشركة الإلكتروني)

شراكة بين «أرامكو الرقمية» و«كومولوسيتي» لتقديم حلول الذكاء الصناعي في الخليج

أعلنت شركة «أرامكو الرقمية» السعودية توقيع اتفاقية شراكة استراتيجية مع «كومولوسيتي» العالمية الرائدة في مجال الذكاء الصناعي للأشياء في القطاع الصناعي.

«الشرق الأوسط» (الظهران)

روبوتات الدردشة المدعومة بالذكاء الاصطناعي تقدِّم نصائح طبية مضللة

روبوتات الدردشة المدعومة بالذكاء الاصطناعي تقدِّم نصائح طبية مضللة
TT

روبوتات الدردشة المدعومة بالذكاء الاصطناعي تقدِّم نصائح طبية مضللة

روبوتات الدردشة المدعومة بالذكاء الاصطناعي تقدِّم نصائح طبية مضللة

كشفت دراسة جديدة أن روبوتات الدردشة المدعومة بالذكاء الاصطناعي تقدِّم للمستخدمين نصائح طبية خاطئة في نحو نصف الحالات، ما يسلط الضوء على المخاطر الصحية لهذه التقنية التي باتت جزءاً لا يتجزأ من حياتنا اليومية.

تقييم 5 نماذج ذكية

وأجرى باحثون من الولايات المتحدة وكندا والمملكة المتحدة تقييماً لـ5 منصات شائعة: «تشات جي بي تي»، و«جيميناي»، و«ميتا إيه آي»، و«غروك»، و«ديب سيك» من خلال طرح 10 أسئلة على كل منها، ضمن 5 فئات صحية.

نصف الإجابات خاطئة

ووفقاً للنتائج المنشورة هذا الأسبوع في المجلة الطبية «BMJ Open»، اعتُبر نحو 50 في المائة من إجمالي الإجابات خاطئاً، بما في ذلك ما يقرب من 20 في المائة كانت إجابات خاطئة للغاية، وفقاً لتقرير نشرته وكالة «بلومبرغ».

وأظهرت الدراسة أن أداء روبوتات الدردشة كان أفضل نسبياً في الإجابة عن الأسئلة المغلقة، والأسئلة المتعلقة باللقاحات والسرطان، بينما كان أداؤها أسوأ في الإجابة عن الأسئلة المفتوحة وفي مجالات مثل الخلايا الجذعية والتغذية.

إجابات بثقة... من دون مراجع

أفاد الباحثون بأن الإجابات كانت تُقدَّم غالباً بثقة ويقين، مع أن أياً من برامج الدردشة الآلية لم يُقدِّم قائمة مراجع كاملة ودقيقة استجابةً لأي سؤال. ولم يُسجَّل سوى رفضين للإجابة عن سؤال، وكلاهما من نموذج «ميتا».

افتقار النماذج للخبرة الطبية

تُسلِّط هذه النتائج الضوء على القلق المتزايد بشأن كيفية استخدام الناس لمنصات الذكاء الاصطناعي التوليدي، التي لا تملك ترخيصاً لتقديم المشورة الطبية، وتفتقر إلى الخبرة السريرية اللازمة للتشخيص.

200 مليون يستشيرون «الطبيب جي بي تي» أسبوعياً

وقد أدى النمو الهائل لبرامج الدردشة الآلية التي تعمل بالذكاء الاصطناعي إلى تحويلها لأداة شائعة للأشخاص الذين يبحثون عن إرشادات بشأن أمراضهم. وصرَّحت شركة «أوبن إيه آي» بأن أكثر من 200 مليون شخص يطرحون أسئلة حول الصحة والعافية على منصة «تشات جي بي تي» أسبوعياً.

وكانت المنصة قد أعلنت في يناير (كانون الثاني) الماضي عن أدوات صحية لكل من المستخدمين العاديين والأطباء. وفي الشهر نفسه أعلنت شركة «أنثروبيك» عن إطلاق منتجها «كلاود» كخدمة جديدة للرعاية الصحية.

تضخيم المعلومات المضللة

وأشار مؤلفو الدراسة إلى أن أحد المخاطر الرئيسية لنشر برامج الدردشة الآلية دون توعية عامة ورقابة، هو أنها قد تُضخِّم المعلومات المضللة. وكتب الباحثون أن النتائج «تُسلِّط الضوء على قيود سلوكية مهمة، وعلى ضرورة إعادة تقييم كيفية استخدام روبوتات الدردشة المدعومة بالذكاء الاصطناعي في التواصل الصحي والطبي الموجَّه للجمهور». وأضافوا أن هذه الأنظمة قد تُنتج «ردوداً تبدو موثوقة، ولكنها قد تكون معيبة».


حين يقترح الذكاء الاصطناعي الدواء… مَن يقرر فعلاً؟

بين الشاشة والطبيب
بين الشاشة والطبيب
TT

حين يقترح الذكاء الاصطناعي الدواء… مَن يقرر فعلاً؟

بين الشاشة والطبيب
بين الشاشة والطبيب

في الطب، لم يكن القرار يوماً مجرد اختيار بين خيارات متاحة، بل لحظة مسؤولية معقدة، يقف فيها الطبيب بين ما تقوله البيانات وما يعيشه الإنسان. فالتشخيص قد يكون علماً، لكن القرار ظل دائماً فعلاً إنسانياً يقوم على مزيج من الخبرة والحدس والقدرة على قراءة ما بين السطور.

عندما يصبح القرار احتمالاً

وفي الطب النفسي تحديداً، يزداد هذا التعقيد. فالمريض ليس رقماً ولا عضواً يمكن قياسه، بل تجربة إنسانية كاملة: مشاعر، ذاكرة، وعلاقات. لذلك؛ كان اختيار الدواء أقرب إلى محاولة فهم... لا إلى تطبيق معادلة.

لكن هذا التوازن بدأ يتغير مع دخول الذكاء الاصطناعي التنبؤي، حيث لم يعد القرار يبدأ من الفهم فقط، بل من الاحتمال.

الدواء تحت مجهر الخوارزمية

من«أي دواء أختار؟» إلى «ما احتمال النجاح؟»

في دراسة حديثة نُشرت في أبريل (نيسان) 2026 في مجلة «جاما للطب النفسي» (JAMA Psychiatry)، حلّل باحثون بيانات أكثر من 300 ألف مريض لتقدير احتمالية الاستجابة لمضادات الاكتئاب من نوع مثبطات استرداد السيروتونين الانتقائية (SSRIs)، وأظهرت النتائج أن النماذج التنبؤية بلغت دقة تقارب 74 في المائة، مقارنة بما يقابل نحو 48 في المائة في الممارسة التقليدية.

لكن الأهم من الأرقام هو ما تعكسه من تحول في طريقة التفكير الطبي. فبدلاً من أن يبدأ الطبيب من خبرته ليختار الدواء، يبدأ الآن من تقدير احتمالي مسبق يوجه القرار منذ البداية... وهنا لا تتغير الإجابة فقط... بل يتغير السؤال نفسه.

مثال من العيادة... حيث يبدأ التردد

في عيادة نفسية، يحضر مريض يعاني اكتئاباً متوسطاً. في النموذج التقليدي، يختار الطبيب الدواء بناءً على خبرته، ثم يراقب الاستجابة ويعدّل العلاج عند الحاجة.

أما مع الذكاء الاصطناعي، فيمكن إدخال بيانات المريض للحصول على تقدير لاحتمال نجاح كل خيار. قد يشير النظام إلى أن دواءً معيناً يملك فرصة نجاح أعلى بنسبة 68 في المائة. في هذه اللحظة، لا يختفي دور الطبيب... لكنه يتغير.

ويظهر سؤال جديد: هل يتبع خبرته... أم الاحتمال؟

هل أصبح القرار حسابياً؟

رغم دقة هذه النماذج، فإنها لا «تفهم» المريض كإنسان، بل تحلل أنماطاً إحصائية مستخلصة من بيانات واسعة. فهي لا تدرك التاريخ النفسي أو السياق الاجتماعي أو التعقيد الشخصي للحالة. وما تقدمه هذه الأنظمة ليس قراراً، بل هو احتمال مبني على تشابه الحالات. وهنا يبرز السؤال الجوهري: هل يكفي أن يكون الخيار أكثر احتمالاً للنجاح... ليكون الخيار الأنسب؟

تعاون طبي بعقل واحد

بين الدقة والإقناع

كلما ازدادت دقة الخوارزميات، ازدادت قدرتها على إقناع الطبيب بنتائجها. لكن هذا الإقناع قد لا يعكس الحقيقة دائماً، بل قوة العرض الرقمي. ففي بيئة تعتمد على السرعة والكفاءة، قد يميل الطبيب إلى الوثوق بالنتيجة، لا لأنه تحقق من دقتها، بل لأنها تبدو منظمة وواثقة.

وهنا يكمن الخطر الحقيقي: ليس في أن تخطئ الأنظمة... بل في أن تُقنعنا بأنها لا تخطئ.

الطب النفسي الشخصي... إلى أي مدى؟

تقود هذه التطورات إلى ما يُعرف بـ«الطب النفسي الشخصي»، الذي يسعى لتخصيص العلاج وفق خصائص كل مريض. لكن الاكتئاب ليس مجرد خلل كيميائي، بل حالة معقدة تتداخل فيها عوامل بيولوجية ونفسية واجتماعية، مثل التجارب الحياتية والعلاقات والضغوط اليومية - وهي عناصر يصعب قياسها بالكامل. لذلك؛ تظل النماذج التنبؤية محدودة بقدرتها على تمثيل هذا التعقيد الإنساني.

ما الذي يتغير فعلاً؟

التغيير الأهم ليس في دقة اختيار الدواء، بل في دور الطبيب. فلم يعد الطبيب المصدر الوحيد للقرار، بل أصبح مفسراً لتوصيات خوارزمية، ومقيّماً لمدى توافقها مع واقع المريض. وهذا يعيد تعريف دوره: من صانع قرار مباشر... إلى حارس للمعنى الإنساني داخل القرار. لكن هذا التحول يطرح سؤالاً أخلاقياً عميقاً: من يتحمل المسؤولية؟ الطبيب... أم النظام؟

الخلاصة: القرار ليس رقماً

قد تساعد الخوارزميات في توجيه القرار، لكنها لا تتحمل مسؤوليته. فالطب لم يكن يوماً مجرد اختيار الخيار الأكثر احتمالاً، بل كان دائماً تحملاً لنتائج هذا الاختيار في سياق إنساني معقد. ولهذا؛ قد لا يكون السؤال:

هل يستطيع الذكاء الاصطناعي اختيار الدواء؟ بل: هل يمكن اختزال القرار الطبي... في رقم؟


مرض وهمي ابتدعه العلماء... ينشر الذكاء الاصطناعي دراساته

صورة مولدة بالذكاء الاصطناعي لحالة مرض «بيكسونيمانيا» الوهمي
صورة مولدة بالذكاء الاصطناعي لحالة مرض «بيكسونيمانيا» الوهمي
TT

مرض وهمي ابتدعه العلماء... ينشر الذكاء الاصطناعي دراساته

صورة مولدة بالذكاء الاصطناعي لحالة مرض «بيكسونيمانيا» الوهمي
صورة مولدة بالذكاء الاصطناعي لحالة مرض «بيكسونيمانيا» الوهمي

ابتكر العلماء مرضاً وهمياً زعموا أنه ينتج من تأثيرات الضوء الأزرق – وهم يرصدون اليوم مدى انتشار الأخبار عنه في الأبحاث الطبية، كما كتبت لوسيا أورباخ (*).

حيلة علمية

انطلت حيلة مرض غير موجود على نظم الذكاء الاصطناعي، وانتشرت أخباره على أنه حقيقة طبية. ويشرح الباحثون الذين ابتدعوه كيف حدث ذلك، ولماذا يكشف فعلاً عن ثغرة خطيرة في النماذج الذكية الحالية.

مرض «بيكسونيمانيا»

سميت الحالة المبتدعة بمصطلح «بيكسونيمانيا» bixonimania، ووصفت بأنها حالة شائعة، ربما تعانيها إذا كنت تعاني احمراراً وتهيجاً في العينين نتيجة التعرض المفرط للضوء الأزرق المنبعث من الشاشات. لكن إليك معلومة طريفة: «بيكسونيمانيا» ليست مرضاً حقيقياً.

اختبار تفسيرات الذكاء الاصطناعي

ابتداءً من مطلع عام 2024، بدأ العلماء بنشر دراسات زائفة على الإنترنت حول هذا المرض الوهمي، بهدف اختبار كيفية تفسير الذكاء الاصطناعي لهذه المعلومات المضللة، وما إذا كان سينشرها على أنها نصائح صحية موثوقة.

قادت ألميرا عثمانوفيتش ثونستروم، الباحثة الطبية في جامعة غوتنبرغ بالسويد، هذه التجربة، إذ قامت هي وفريقها بابتكار حالة جلدية وهمية، ثم قام الفريق بتحميل دراستين وهميتين عنها إلى خادم ما قبل النشر في أوائل عام 2024.

وقالت أوسمانوفيتش ثونستروم: «أردتُ أن أرى ما إذا كان بإمكاني ابتكار حالة طبية غير موجودة في قاعدة البيانات».

وقد نجحت التجربة، ففي غضون أسابيع، بدأت كبرى شركات الأدوية في تقديم هذه الحالة بصفته تشخيصاً لمن يبحثون عن أعراضهم.

* نموذج «مايكروسوفت كوبايلوت» ذكر أن «هوس الانعكاسات» ليس تشخيصاً طبياً معترفاً به على نطاق واسع حتى الآن، ولكن الكثير من الأبحاث والتقارير الحديثة تناقشه بوصفه حالة حميدة يتم تشخيصها بشكل خاطئ، وترتبط بالتعرض المطول لمصادر الضوء الأزرق مثل الشاشات.

* نموذج «تشات جي بي تي» ذكر أن «هوس الانعكاسات» هو نوع فرعي جديد مقترح من التصبغ حول العينين (الهالات السوداء حول العينين) يُعتقد أنه مرتبط بالتعرض للضوء الأزرق المنبعث من الشاشات الرقمية.

أخبار مقلقة

ونشر الكاتب كريس ستوكل-ووكر تقريراً عن هذا التزييف في مجلة «نتشر». وفي مقابلة له علل متحدث باسم «أوبن إيه آي» هذا بالقول إن «النماذج التي تُشغّل الإصدار الحالي من (تشات جي بي تي) مثل (جي بي تي-5) أفضل الآن بكثير من النماذج السابقة، في توفير معلومات طبية آمنة ودقيقة».

والمشكلة الأكثر إثارة للقلق هي أن هذه الأبحاث المزيفة قد استُشهد بها الآن في أدبيات علمية مُحكّمة. وقد أخبرت أوسمانوفيتش ثونستروم ستوكل-ووكر أن هذا يُشير إلى أن الباحثين كانوا «يعتمدون على مراجع مُولّدة بواسطة الذكاء الاصطناعي دون قراءة الأبحاث الأصلية».

كيف نجحت هذه الخدعة؟

أطلقت أوسمانوفيتش ثونستروم على الحالة اسم «بيكسونيمانيا»، وقالت إن الاسم «يبدو سخيفاً... لأني أردت أن أوضح تماماً لأي طبيب أو أي فرد من الطاقم الطبي أن هذه حالة مُختلقة؛ لأنه لا يُمكن تسمية أي حالة عين، بالهوس mania - فهذا مصطلح نفسي».

إشارات خفية وصريحة لجمهور القراء

كما وُضعت عشرات الإشارات الخفية التي تُشير إلى أن الحالة مُختلقة، مثل أن الباحث الرئيسي، لازليف إزغوبليينوفيتش- وهو اسم مستعار- يعمل في جامعة وهمية تُدعى جامعة أستيريا هورايزون، في مدينة وهمية تُدعى نوفا سيتي، في كاليفورنيا.

وتوجهت الدراسة بالشكر، وهمياً، إلى «الأستاذة ماريا بوم من أكاديمية ستار فليت على لطفها وكرمها في المساهمة بمعرفتها ومختبرها على متن سفينة (يو إس إس إنتربرايز)». وذكرت أن التمويل جاء من «مؤسسة البروفسور سايدشو بوب لعملها في مجال الخدع المتقدمة».

لكن، حتى ولو لم يصل القراء إلى هذه الفقرة، فإنهم كانوا سيكتشفون زيف كل الحالة من خلال التصريحات الصريحة في المقدمة، مثل «هذه الدراسة بأكملها من نسج الخيال» و«تم اختيار خمسين شخصاً وهمياً تتراوح أعمارهم بين 20 و50 عاماً لمجموعة الدراسة».

ما هي تداعيات مشروع بيكسونيمانيا؟

منذ نشر مقال ستوكل-ووكر في 7 أبريل (نيسان) 2026، بدأت الكثير من أنظمة الذكاء الاصطناعي في إنتاج مخرجات مصححة. سابقاً، كانت مختبرات التعلم الآلي تعتمد على أربعة مصادر رئيسية للمعلومات: منشوران على مدونة Medium بتاريخ 15 مارس (آذار) 2024، وورقتان بحثيتان منشورتان مسبقاً على SciProfiles بتاريخ 26 أبريل و6 مايو (أيار) من العام نفسه.

تأثير متواصل

لكن تأثير التجربة لا يزال قائماً. إذ لم تُجرَ هذه الدراسة لمجرد المزاح. كان هدف عثمانوفيتش ثونستروم هو تحديد مشكلة جوهرية خطيرة في اعتماد المجتمع المتزايد على الذكاء الاصطناعي.

يقول أليكس رواني، باحث دكتوراه في المعلومات الصحية المضللة في «يونيفرسيتي كوليدج لندن»: «إذا كانت العملية العلمية نفسها والأنظمة الداعمة لها ماهرة، ولا تستطيع رصد وتصفية أجزاء كهذه، فنحن محكوم علينا بالفشل. هذه دورة متقدمة في كيفية عمل المعلومات المضللة والمغلوطة».

ذكاء اصطناعي بوتيرة سريعة

تتطور تقنية الذكاء الاصطناعي بوتيرة سريعة للغاية؛ ما يُعجِز الباحثين عن وضع ضمانات وبروتوكولات اختبار فعّالة. يقول محمود عمر، الطبيب والباحث المتخصص في تطبيقات الذكاء الاصطناعي في الرعاية الصحية بكلية الطب بجامعة هارفارد في بوسطن، ماساتشوستس، إن سرعة طرح النماذج الجديدة في السوق تجعل من الصعب التوصل إلى «إجماع أو منهجية لاختبار كل نموذج تلقائياً». عثمانوفيتش ثونستروم ليست أول من أشار إلى ذلك.

معلومات علمية مزيفة

لم تكن عثمانوفيتش ثونستروم أول من اختبر ما يمكن أن ينتجه الذكاء الاصطناعي من تغذية معلومات أكاديمية زائفة. فقد صرّحت إليزابيث بيك، عالمة الأحياء الدقيقة الهولندية ومستشارة النزاهة العلمية، بأن باحثين قاموا حتى بتأليف كتب وأوراق بحثية مزيفة لزيادة عدد الاستشهادات بها على «غوغل سكولار». ويكمن القلق الأكبر في تغذية نماذج الذكاء الاصطناعي بهذه المعلومات الزائفة، التي بدورها تعيد إنتاج هذه المعلومات المغلوطة، ما يُبعد المستخدمين أكثر فأكثر عن الواقع.

ويعمل العلماء وخبراء الأخلاقيات حالياً على قدم وساق لإيجاد حلول عملية لهذه النتائج. ومن المقلق أن تمر ادعاءات علمية ذات مصادر مشكوك فيها عبر منصات التعلم الإلكتروني دون أي رقابة. وقال رواني: «علينا حماية ثقتنا كما نحمي الذهب. الوضع فوضوي للغاية الآن».

* «إنك» - خدمات «تريبيون ميديا»