60 % من نتائج بحث أدوات الذكاء الاصطناعي... غير دقيقة

معلومات خاطئة ومزيفة... لدى اختبار 8 أدوات رائدة منها

60 % من نتائج بحث أدوات الذكاء الاصطناعي... غير دقيقة
TT

60 % من نتائج بحث أدوات الذكاء الاصطناعي... غير دقيقة

60 % من نتائج بحث أدوات الذكاء الاصطناعي... غير دقيقة

إذا كنت تستخدم بحث الذكاء الاصطناعي في العمل، فكن حذراً. جاء هذا في دراسة جديدة تكشف عن معلوماتها «المختلقة».

قد تعرض أدوات الذكاء الاصطناعي للبحث، معلومات خاطئة تماماً. وقد سجَّلت أداة غروك Grok التابعة لإيلون ماسك أسوأ النتائج.

الذكاء الاصطناعي– محرك البحث المستقبلي

مع توجه «غوغل» بشكل أكبر نحو الاستثمار في ضخ نتائج البحث المُولَّدة بالذكاء الاصطناعي، وذلك بعد بداية متعثرة لها العام الماضي، وتجربة شركات مماثلة مثل «أوبن إيه آي» هذه التقنية المبتكرة، يبدو أن الذكاء الاصطناعي سيشكل مستقبل البحث عبر الإنترنت.

وستكون لذلك تداعيات على العاملين في أي شركة تقريباً، بغض النظر عن مجال عملها؛ لأن البحث عن المعلومات جزء أساسي من استخدامات الإنترنت.

دراسة جديدة لمشكلات الدقة

لكن دراسة جديدة من مركز «تاو» للصحافة الرقمية بجامعة كولومبيا، نُشرت في مجلة «Columbia Journalism Review»، تُسلِّط الضوء على ضرورة توخي موظفي المؤسسات والشركات الحذر الشديد، على الأقل في الوقت الحالي؛ لأن أدوات بحث الذكاء الاصطناعي من كثير من الشركات الكبرى تعاني مشكلات خطيرة في الدقة.

اختبار 8 أدوات ذكية

دققت الدراسة في عمل 8 أدوات بحث مختلفة للذكاء الاصطناعي، بما في ذلك «تشات جي بي تي» ChatGPT، و«بربليكسيتي» Perplexity، و«جيمناي» Gemini من «غوغل»، و«كوبايلوت» Copilot من «مايكروسوفت»، والأداة الصينية الرائدة «ديب سيك» DeepSeek.

وقد ركَّزت الدراسة على دقة الإجابات عندما تم اختبار كل أداة ذكاء اصطناعي حول قصة إخبارية، حسبما أفاد موقع أخبار التكنولوجيا «آرس تكنيكا».

60 % من الإجابات غير صحيحة

وكانت النتيجة الأبرز في الدراسة أن جميع أدوات الذكاء الاصطناعي أظهرت دقة سيئة بشكل مذهل، حيث أخطأت في 60 من الإجابات. ومع ذلك، لم يكن مستوى الخطأ متساوياً بين جميع الأدوات.

أظهرت أداة Perplexity معدل خطأ بلغ نحو 37 في المائة، في حين ارتفعت نسبة الأخطاء لدى ChatGPT إلى 67 في المائة. أما نموذج Grok 3، الذي طوَّره إيلون ماسك، فقد سجل أسوأ أداء، إذ كانت إجاباته خاطئة بنسبة 94 في المائة. وربما لم يكن ذلك مفاجئًا، خاصة أن ماسك روَّج للنموذج على أنه أقل تقيُّدًا بالقيود الأمنية مقارنة بمنافسيه في الذكاء الاصطناعي. (فضلًا عن أن الملياردير معروف بتوجهاته المتحررة نسبيًا فيما يتعلق بالدقة والحقائق وحرية التعبير).

والأسوأ من ذلك، لاحظ الباحثون أن الإصدارات المدفوعة من أدوات البحث هذه كانت أحياناً أسوأ من بدائلها المجانية.

أداة البحث تختلف عن أداة الدردشة

تجدر الإشارة إلى أن البحث بالذكاء الاصطناعي يختلف قليلًا عن استخدام روبوتات الدردشة التي تحاكي المحادثات البشرية. فعادةً ما يقوم البحث بالذكاء الاصطناعي بمحاكاة دور محرك البحث، حيث يجري البحث نيابة عنك بعد إدخال استعلامك، ثم يقدم ملخصًا لأهم المعلومات التي وجدها على الإنترنت، مما يغنيك عن الحاجة إلى قراءة المقال الأصلي الذي استُخلصت منه البيانات.

لكن المشكلة هنا تكمن في أن هذه النماذج، تمامًا مثل ذلك الزميل الواثق بنفسه إلى حد الإفراط، والذي يبدو دائمًا وكأنه يمتلك الحقيقة بغض النظر عن الموضوع المطروح، لا تميل إلى الاعتراف بعدم معرفتها بالإجابة على أي استعلام.

إجابات «معقولة» غير صحيحة

لاحظ مؤلفو الدراسة أنه بدلاً من قول «لا» عند عدم تمكنه من العثور على معلومات موثوقة، رداً على استفسار حول قصة إخبارية، غالباً ما قدَّم الذكاء الاصطناعي إجابات مُختلقة تبدو معقولة، ولكنها في الواقع غير صحيحة. ومن العيوب الأخرى التي اكتشفتها هذه الدراسة أنه حتى عندما قدمت أدوات بحث الذكاء الاصطناعي هذه استشهادات إلى جانب نتائج البحث (ظاهرياً حتى يتمكن المستخدمون من زيارة مواقع المصادر هذه للتحقق من أي تفاصيل، أو للتحقق من صحة البيانات)، غالباً ما أدت روابط الاستشهادات هذه إلى نسخ مُجمَّعة من المحتوى، بدلاً من نسخ الناشرين الأصليين. وفي بعض الأحيان، أدت هذه الروابط إلى عناوين ويب غير موجودة؛ فعل ذلك Gemini وGrok 3 في أكثر من نصف استشهاداتهم.

تجربة اختبارية متخصصة

كانت التجربة متخصصة بعض الشيء؛ لأنها استندت إلى مقالات إخبارية، ولم يبحث الباحثون بعمق في دقة نتائج بحث الذكاء الاصطناعي عن محتوى آخر موجود على الإنترنت. وبدلاً من ذلك، قاموا بتغذية أدوات الذكاء الاصطناعي بمقتطفات من أخبار حقيقية ثم طلبوا منها تلخيص المعلومات، بما في ذلك العنوان وتفاصيل أخرى.

يجب أن تهتم بنتائج الدراسة لسبب بسيط واحد. فنحن نعلم أن الذكاء الاصطناعي قادر على تسريع بعض مهام المكتب المملة وتعزيز كفاءة الموظفين. ويبدو أن البحث باستخدام الذكاء الاصطناعي قد يصبح هو القاعدة، ليحل محل البحث التقليدي على الإنترنت الذي قد يكون مهمة شاقة في بعض الأحيان.

محدودية الثقة بالذكاء الاصطناعي

ولكن إذا كان فريقك -على سبيل المثال- يبحث عن معلومات أساسية لإدراجها في محتوى ستنشره، أو حتى يبحث عن موارد على الإنترنت قبل بدء مشروع جديد، فعلى العاملين فيه توخي الحذر الشديد بشأن الثقة في نتائج أدوات بحث الذكاء الاصطناعي.

ويبدو بعض الإجابات وكأنه نسخة أخرى من مشكلة هلوسة الذكاء الاصطناعي المعروفة، وهي دليل إضافي على أنه إذا كنت تستخدم أدوات الذكاء الاصطناعي لتعزيز جهود شركتك، فأنت بالتأكيد بحاجة إلى أشخاص أذكياء على دراية تامة بنتائج الذكاء الاصطناعي للتحقق منها.

* «إنك»، خدمات «تريبيون ميديا».


مقالات ذات صلة

«رابطة الصحافة الأجنبية» تتهم الجيش الإسرائيلي بفبركة صورة لصحافي لبناني لتبرير قتله

المشرق العربي أشخاص يمرون أمام لافتة تعرض صور الصحافييَن فاطمة فتوني وعلي شعيب اللذين قُتلا في غارة إسرائيلية في جنوب لبنان خلال مظاهرة في بغداد 7 أبريل 2026 (أ.ف.ب)

«رابطة الصحافة الأجنبية» تتهم الجيش الإسرائيلي بفبركة صورة لصحافي لبناني لتبرير قتله

هاجمت «رابطة الصحافة الأجنبية» الجيش الإسرائيلي بسبب صورة مفبركة بالذكاء الاصطناعي استخدمها لاتهام صحافي لبناني قتله الشهر الماضي بأنه عضو في «حزب الله».

«الشرق الأوسط» (تل أبيب)
الاقتصاد وحدة لجهاز طباعة ضوئية فوق بنفسجية فائقة الدقة من إنتاج «إيه إس إم إل» معروضة في مقر مختبر بحوث الرقائق البلجيكي (رويترز)

«إيه إس إم إل» الهولندية ترفع توقعات مبيعاتها لـ2026 إلى 40 مليار يورو

رفعت شركة «إيه إس إم إل» (ASML)، المورِّد الأكبر عالمياً لمعدات صناعة الرقائق، توقعاتها لإيرادات عام 2026.

«الشرق الأوسط» (أمستردام)
تكنولوجيا يؤكد تصدر السعودية لمراكز متقدمة عالمياً نجاح توجهات البلاد في بناء منظومة وطنية تنافسية (واس)

السعودية تحقق أعلى نمو عالمي في كفاءات الذكاء الاصطناعي

حققت السعودية، المرتبة الأولى عالمياً في الأمن والخصوصية والتشفير في الذكاء الاصطناعي وفقاً لـ«مؤشر ستانفورد 2026».

«الشرق الأوسط» (الرياض)
الاقتصاد جناح «أرامكو الرقمية» في ملتقى الحكومة الرقمية (موقع الشركة الإلكتروني)

شراكة بين «أرامكو الرقمية» و«كومولوسيتي» لتقديم حلول الذكاء الصناعي في الخليج

أعلنت شركة «أرامكو الرقمية» السعودية توقيع اتفاقية شراكة استراتيجية مع «كومولوسيتي» العالمية الرائدة في مجال الذكاء الصناعي للأشياء في القطاع الصناعي.

«الشرق الأوسط» (الظهران)

روبوتات الدردشة المدعومة بالذكاء الاصطناعي تقدِّم نصائح طبية مضللة

روبوتات الدردشة المدعومة بالذكاء الاصطناعي تقدِّم نصائح طبية مضللة
TT

روبوتات الدردشة المدعومة بالذكاء الاصطناعي تقدِّم نصائح طبية مضللة

روبوتات الدردشة المدعومة بالذكاء الاصطناعي تقدِّم نصائح طبية مضللة

كشفت دراسة جديدة أن روبوتات الدردشة المدعومة بالذكاء الاصطناعي تقدِّم للمستخدمين نصائح طبية خاطئة في نحو نصف الحالات، ما يسلط الضوء على المخاطر الصحية لهذه التقنية التي باتت جزءاً لا يتجزأ من حياتنا اليومية.

تقييم 5 نماذج ذكية

وأجرى باحثون من الولايات المتحدة وكندا والمملكة المتحدة تقييماً لـ5 منصات شائعة: «تشات جي بي تي»، و«جيميناي»، و«ميتا إيه آي»، و«غروك»، و«ديب سيك» من خلال طرح 10 أسئلة على كل منها، ضمن 5 فئات صحية.

نصف الإجابات خاطئة

ووفقاً للنتائج المنشورة هذا الأسبوع في المجلة الطبية «BMJ Open»، اعتُبر نحو 50 في المائة من إجمالي الإجابات خاطئاً، بما في ذلك ما يقرب من 20 في المائة كانت إجابات خاطئة للغاية، وفقاً لتقرير نشرته وكالة «بلومبرغ».

وأظهرت الدراسة أن أداء روبوتات الدردشة كان أفضل نسبياً في الإجابة عن الأسئلة المغلقة، والأسئلة المتعلقة باللقاحات والسرطان، بينما كان أداؤها أسوأ في الإجابة عن الأسئلة المفتوحة وفي مجالات مثل الخلايا الجذعية والتغذية.

إجابات بثقة... من دون مراجع

أفاد الباحثون بأن الإجابات كانت تُقدَّم غالباً بثقة ويقين، مع أن أياً من برامج الدردشة الآلية لم يُقدِّم قائمة مراجع كاملة ودقيقة استجابةً لأي سؤال. ولم يُسجَّل سوى رفضين للإجابة عن سؤال، وكلاهما من نموذج «ميتا».

افتقار النماذج للخبرة الطبية

تُسلِّط هذه النتائج الضوء على القلق المتزايد بشأن كيفية استخدام الناس لمنصات الذكاء الاصطناعي التوليدي، التي لا تملك ترخيصاً لتقديم المشورة الطبية، وتفتقر إلى الخبرة السريرية اللازمة للتشخيص.

200 مليون يستشيرون «الطبيب جي بي تي» أسبوعياً

وقد أدى النمو الهائل لبرامج الدردشة الآلية التي تعمل بالذكاء الاصطناعي إلى تحويلها لأداة شائعة للأشخاص الذين يبحثون عن إرشادات بشأن أمراضهم. وصرَّحت شركة «أوبن إيه آي» بأن أكثر من 200 مليون شخص يطرحون أسئلة حول الصحة والعافية على منصة «تشات جي بي تي» أسبوعياً.

وكانت المنصة قد أعلنت في يناير (كانون الثاني) الماضي عن أدوات صحية لكل من المستخدمين العاديين والأطباء. وفي الشهر نفسه أعلنت شركة «أنثروبيك» عن إطلاق منتجها «كلاود» كخدمة جديدة للرعاية الصحية.

تضخيم المعلومات المضللة

وأشار مؤلفو الدراسة إلى أن أحد المخاطر الرئيسية لنشر برامج الدردشة الآلية دون توعية عامة ورقابة، هو أنها قد تُضخِّم المعلومات المضللة. وكتب الباحثون أن النتائج «تُسلِّط الضوء على قيود سلوكية مهمة، وعلى ضرورة إعادة تقييم كيفية استخدام روبوتات الدردشة المدعومة بالذكاء الاصطناعي في التواصل الصحي والطبي الموجَّه للجمهور». وأضافوا أن هذه الأنظمة قد تُنتج «ردوداً تبدو موثوقة، ولكنها قد تكون معيبة».


حين يقترح الذكاء الاصطناعي الدواء… مَن يقرر فعلاً؟

بين الشاشة والطبيب
بين الشاشة والطبيب
TT

حين يقترح الذكاء الاصطناعي الدواء… مَن يقرر فعلاً؟

بين الشاشة والطبيب
بين الشاشة والطبيب

في الطب، لم يكن القرار يوماً مجرد اختيار بين خيارات متاحة، بل لحظة مسؤولية معقدة، يقف فيها الطبيب بين ما تقوله البيانات وما يعيشه الإنسان. فالتشخيص قد يكون علماً، لكن القرار ظل دائماً فعلاً إنسانياً يقوم على مزيج من الخبرة والحدس والقدرة على قراءة ما بين السطور.

عندما يصبح القرار احتمالاً

وفي الطب النفسي تحديداً، يزداد هذا التعقيد. فالمريض ليس رقماً ولا عضواً يمكن قياسه، بل تجربة إنسانية كاملة: مشاعر، ذاكرة، وعلاقات. لذلك؛ كان اختيار الدواء أقرب إلى محاولة فهم... لا إلى تطبيق معادلة.

لكن هذا التوازن بدأ يتغير مع دخول الذكاء الاصطناعي التنبؤي، حيث لم يعد القرار يبدأ من الفهم فقط، بل من الاحتمال.

الدواء تحت مجهر الخوارزمية

من«أي دواء أختار؟» إلى «ما احتمال النجاح؟»

في دراسة حديثة نُشرت في أبريل (نيسان) 2026 في مجلة «جاما للطب النفسي» (JAMA Psychiatry)، حلّل باحثون بيانات أكثر من 300 ألف مريض لتقدير احتمالية الاستجابة لمضادات الاكتئاب من نوع مثبطات استرداد السيروتونين الانتقائية (SSRIs)، وأظهرت النتائج أن النماذج التنبؤية بلغت دقة تقارب 74 في المائة، مقارنة بما يقابل نحو 48 في المائة في الممارسة التقليدية.

لكن الأهم من الأرقام هو ما تعكسه من تحول في طريقة التفكير الطبي. فبدلاً من أن يبدأ الطبيب من خبرته ليختار الدواء، يبدأ الآن من تقدير احتمالي مسبق يوجه القرار منذ البداية... وهنا لا تتغير الإجابة فقط... بل يتغير السؤال نفسه.

مثال من العيادة... حيث يبدأ التردد

في عيادة نفسية، يحضر مريض يعاني اكتئاباً متوسطاً. في النموذج التقليدي، يختار الطبيب الدواء بناءً على خبرته، ثم يراقب الاستجابة ويعدّل العلاج عند الحاجة.

أما مع الذكاء الاصطناعي، فيمكن إدخال بيانات المريض للحصول على تقدير لاحتمال نجاح كل خيار. قد يشير النظام إلى أن دواءً معيناً يملك فرصة نجاح أعلى بنسبة 68 في المائة. في هذه اللحظة، لا يختفي دور الطبيب... لكنه يتغير.

ويظهر سؤال جديد: هل يتبع خبرته... أم الاحتمال؟

هل أصبح القرار حسابياً؟

رغم دقة هذه النماذج، فإنها لا «تفهم» المريض كإنسان، بل تحلل أنماطاً إحصائية مستخلصة من بيانات واسعة. فهي لا تدرك التاريخ النفسي أو السياق الاجتماعي أو التعقيد الشخصي للحالة. وما تقدمه هذه الأنظمة ليس قراراً، بل هو احتمال مبني على تشابه الحالات. وهنا يبرز السؤال الجوهري: هل يكفي أن يكون الخيار أكثر احتمالاً للنجاح... ليكون الخيار الأنسب؟

تعاون طبي بعقل واحد

بين الدقة والإقناع

كلما ازدادت دقة الخوارزميات، ازدادت قدرتها على إقناع الطبيب بنتائجها. لكن هذا الإقناع قد لا يعكس الحقيقة دائماً، بل قوة العرض الرقمي. ففي بيئة تعتمد على السرعة والكفاءة، قد يميل الطبيب إلى الوثوق بالنتيجة، لا لأنه تحقق من دقتها، بل لأنها تبدو منظمة وواثقة.

وهنا يكمن الخطر الحقيقي: ليس في أن تخطئ الأنظمة... بل في أن تُقنعنا بأنها لا تخطئ.

الطب النفسي الشخصي... إلى أي مدى؟

تقود هذه التطورات إلى ما يُعرف بـ«الطب النفسي الشخصي»، الذي يسعى لتخصيص العلاج وفق خصائص كل مريض. لكن الاكتئاب ليس مجرد خلل كيميائي، بل حالة معقدة تتداخل فيها عوامل بيولوجية ونفسية واجتماعية، مثل التجارب الحياتية والعلاقات والضغوط اليومية - وهي عناصر يصعب قياسها بالكامل. لذلك؛ تظل النماذج التنبؤية محدودة بقدرتها على تمثيل هذا التعقيد الإنساني.

ما الذي يتغير فعلاً؟

التغيير الأهم ليس في دقة اختيار الدواء، بل في دور الطبيب. فلم يعد الطبيب المصدر الوحيد للقرار، بل أصبح مفسراً لتوصيات خوارزمية، ومقيّماً لمدى توافقها مع واقع المريض. وهذا يعيد تعريف دوره: من صانع قرار مباشر... إلى حارس للمعنى الإنساني داخل القرار. لكن هذا التحول يطرح سؤالاً أخلاقياً عميقاً: من يتحمل المسؤولية؟ الطبيب... أم النظام؟

الخلاصة: القرار ليس رقماً

قد تساعد الخوارزميات في توجيه القرار، لكنها لا تتحمل مسؤوليته. فالطب لم يكن يوماً مجرد اختيار الخيار الأكثر احتمالاً، بل كان دائماً تحملاً لنتائج هذا الاختيار في سياق إنساني معقد. ولهذا؛ قد لا يكون السؤال:

هل يستطيع الذكاء الاصطناعي اختيار الدواء؟ بل: هل يمكن اختزال القرار الطبي... في رقم؟


مرض وهمي ابتدعه العلماء... ينشر الذكاء الاصطناعي دراساته

صورة مولدة بالذكاء الاصطناعي لحالة مرض «بيكسونيمانيا» الوهمي
صورة مولدة بالذكاء الاصطناعي لحالة مرض «بيكسونيمانيا» الوهمي
TT

مرض وهمي ابتدعه العلماء... ينشر الذكاء الاصطناعي دراساته

صورة مولدة بالذكاء الاصطناعي لحالة مرض «بيكسونيمانيا» الوهمي
صورة مولدة بالذكاء الاصطناعي لحالة مرض «بيكسونيمانيا» الوهمي

ابتكر العلماء مرضاً وهمياً زعموا أنه ينتج من تأثيرات الضوء الأزرق – وهم يرصدون اليوم مدى انتشار الأخبار عنه في الأبحاث الطبية، كما كتبت لوسيا أورباخ (*).

حيلة علمية

انطلت حيلة مرض غير موجود على نظم الذكاء الاصطناعي، وانتشرت أخباره على أنه حقيقة طبية. ويشرح الباحثون الذين ابتدعوه كيف حدث ذلك، ولماذا يكشف فعلاً عن ثغرة خطيرة في النماذج الذكية الحالية.

مرض «بيكسونيمانيا»

سميت الحالة المبتدعة بمصطلح «بيكسونيمانيا» bixonimania، ووصفت بأنها حالة شائعة، ربما تعانيها إذا كنت تعاني احمراراً وتهيجاً في العينين نتيجة التعرض المفرط للضوء الأزرق المنبعث من الشاشات. لكن إليك معلومة طريفة: «بيكسونيمانيا» ليست مرضاً حقيقياً.

اختبار تفسيرات الذكاء الاصطناعي

ابتداءً من مطلع عام 2024، بدأ العلماء بنشر دراسات زائفة على الإنترنت حول هذا المرض الوهمي، بهدف اختبار كيفية تفسير الذكاء الاصطناعي لهذه المعلومات المضللة، وما إذا كان سينشرها على أنها نصائح صحية موثوقة.

قادت ألميرا عثمانوفيتش ثونستروم، الباحثة الطبية في جامعة غوتنبرغ بالسويد، هذه التجربة، إذ قامت هي وفريقها بابتكار حالة جلدية وهمية، ثم قام الفريق بتحميل دراستين وهميتين عنها إلى خادم ما قبل النشر في أوائل عام 2024.

وقالت أوسمانوفيتش ثونستروم: «أردتُ أن أرى ما إذا كان بإمكاني ابتكار حالة طبية غير موجودة في قاعدة البيانات».

وقد نجحت التجربة، ففي غضون أسابيع، بدأت كبرى شركات الأدوية في تقديم هذه الحالة بصفته تشخيصاً لمن يبحثون عن أعراضهم.

* نموذج «مايكروسوفت كوبايلوت» ذكر أن «هوس الانعكاسات» ليس تشخيصاً طبياً معترفاً به على نطاق واسع حتى الآن، ولكن الكثير من الأبحاث والتقارير الحديثة تناقشه بوصفه حالة حميدة يتم تشخيصها بشكل خاطئ، وترتبط بالتعرض المطول لمصادر الضوء الأزرق مثل الشاشات.

* نموذج «تشات جي بي تي» ذكر أن «هوس الانعكاسات» هو نوع فرعي جديد مقترح من التصبغ حول العينين (الهالات السوداء حول العينين) يُعتقد أنه مرتبط بالتعرض للضوء الأزرق المنبعث من الشاشات الرقمية.

أخبار مقلقة

ونشر الكاتب كريس ستوكل-ووكر تقريراً عن هذا التزييف في مجلة «نتشر». وفي مقابلة له علل متحدث باسم «أوبن إيه آي» هذا بالقول إن «النماذج التي تُشغّل الإصدار الحالي من (تشات جي بي تي) مثل (جي بي تي-5) أفضل الآن بكثير من النماذج السابقة، في توفير معلومات طبية آمنة ودقيقة».

والمشكلة الأكثر إثارة للقلق هي أن هذه الأبحاث المزيفة قد استُشهد بها الآن في أدبيات علمية مُحكّمة. وقد أخبرت أوسمانوفيتش ثونستروم ستوكل-ووكر أن هذا يُشير إلى أن الباحثين كانوا «يعتمدون على مراجع مُولّدة بواسطة الذكاء الاصطناعي دون قراءة الأبحاث الأصلية».

كيف نجحت هذه الخدعة؟

أطلقت أوسمانوفيتش ثونستروم على الحالة اسم «بيكسونيمانيا»، وقالت إن الاسم «يبدو سخيفاً... لأني أردت أن أوضح تماماً لأي طبيب أو أي فرد من الطاقم الطبي أن هذه حالة مُختلقة؛ لأنه لا يُمكن تسمية أي حالة عين، بالهوس mania - فهذا مصطلح نفسي».

إشارات خفية وصريحة لجمهور القراء

كما وُضعت عشرات الإشارات الخفية التي تُشير إلى أن الحالة مُختلقة، مثل أن الباحث الرئيسي، لازليف إزغوبليينوفيتش- وهو اسم مستعار- يعمل في جامعة وهمية تُدعى جامعة أستيريا هورايزون، في مدينة وهمية تُدعى نوفا سيتي، في كاليفورنيا.

وتوجهت الدراسة بالشكر، وهمياً، إلى «الأستاذة ماريا بوم من أكاديمية ستار فليت على لطفها وكرمها في المساهمة بمعرفتها ومختبرها على متن سفينة (يو إس إس إنتربرايز)». وذكرت أن التمويل جاء من «مؤسسة البروفسور سايدشو بوب لعملها في مجال الخدع المتقدمة».

لكن، حتى ولو لم يصل القراء إلى هذه الفقرة، فإنهم كانوا سيكتشفون زيف كل الحالة من خلال التصريحات الصريحة في المقدمة، مثل «هذه الدراسة بأكملها من نسج الخيال» و«تم اختيار خمسين شخصاً وهمياً تتراوح أعمارهم بين 20 و50 عاماً لمجموعة الدراسة».

ما هي تداعيات مشروع بيكسونيمانيا؟

منذ نشر مقال ستوكل-ووكر في 7 أبريل (نيسان) 2026، بدأت الكثير من أنظمة الذكاء الاصطناعي في إنتاج مخرجات مصححة. سابقاً، كانت مختبرات التعلم الآلي تعتمد على أربعة مصادر رئيسية للمعلومات: منشوران على مدونة Medium بتاريخ 15 مارس (آذار) 2024، وورقتان بحثيتان منشورتان مسبقاً على SciProfiles بتاريخ 26 أبريل و6 مايو (أيار) من العام نفسه.

تأثير متواصل

لكن تأثير التجربة لا يزال قائماً. إذ لم تُجرَ هذه الدراسة لمجرد المزاح. كان هدف عثمانوفيتش ثونستروم هو تحديد مشكلة جوهرية خطيرة في اعتماد المجتمع المتزايد على الذكاء الاصطناعي.

يقول أليكس رواني، باحث دكتوراه في المعلومات الصحية المضللة في «يونيفرسيتي كوليدج لندن»: «إذا كانت العملية العلمية نفسها والأنظمة الداعمة لها ماهرة، ولا تستطيع رصد وتصفية أجزاء كهذه، فنحن محكوم علينا بالفشل. هذه دورة متقدمة في كيفية عمل المعلومات المضللة والمغلوطة».

ذكاء اصطناعي بوتيرة سريعة

تتطور تقنية الذكاء الاصطناعي بوتيرة سريعة للغاية؛ ما يُعجِز الباحثين عن وضع ضمانات وبروتوكولات اختبار فعّالة. يقول محمود عمر، الطبيب والباحث المتخصص في تطبيقات الذكاء الاصطناعي في الرعاية الصحية بكلية الطب بجامعة هارفارد في بوسطن، ماساتشوستس، إن سرعة طرح النماذج الجديدة في السوق تجعل من الصعب التوصل إلى «إجماع أو منهجية لاختبار كل نموذج تلقائياً». عثمانوفيتش ثونستروم ليست أول من أشار إلى ذلك.

معلومات علمية مزيفة

لم تكن عثمانوفيتش ثونستروم أول من اختبر ما يمكن أن ينتجه الذكاء الاصطناعي من تغذية معلومات أكاديمية زائفة. فقد صرّحت إليزابيث بيك، عالمة الأحياء الدقيقة الهولندية ومستشارة النزاهة العلمية، بأن باحثين قاموا حتى بتأليف كتب وأوراق بحثية مزيفة لزيادة عدد الاستشهادات بها على «غوغل سكولار». ويكمن القلق الأكبر في تغذية نماذج الذكاء الاصطناعي بهذه المعلومات الزائفة، التي بدورها تعيد إنتاج هذه المعلومات المغلوطة، ما يُبعد المستخدمين أكثر فأكثر عن الواقع.

ويعمل العلماء وخبراء الأخلاقيات حالياً على قدم وساق لإيجاد حلول عملية لهذه النتائج. ومن المقلق أن تمر ادعاءات علمية ذات مصادر مشكوك فيها عبر منصات التعلم الإلكتروني دون أي رقابة. وقال رواني: «علينا حماية ثقتنا كما نحمي الذهب. الوضع فوضوي للغاية الآن».

* «إنك» - خدمات «تريبيون ميديا»