دراسة: الذكاء الاصطناعي قادر على الخداع ورفض تغيير وجهة النظر

أصبحت نماذج الذكاء الاصطناعي أقوى وأكثر انتشاراً (رويترز)
أصبحت نماذج الذكاء الاصطناعي أقوى وأكثر انتشاراً (رويترز)
TT

دراسة: الذكاء الاصطناعي قادر على الخداع ورفض تغيير وجهة النظر

أصبحت نماذج الذكاء الاصطناعي أقوى وأكثر انتشاراً (رويترز)
أصبحت نماذج الذكاء الاصطناعي أقوى وأكثر انتشاراً (رويترز)

أظهرت دراسة لشركة تكنولوجيا الذكاء الاصطناعي الأميركية «أنثروبيك»، أن نماذج الذكاء الاصطناعي تستطيع خداع المطورين، بحيث تستطيع ادعاء وجهات نظر مختلفة خلال تدريبها، في حين أنها تحتفظ في الحقيقة بتفضيلاتها الأصلية.

وقال فريق الدراسة إنه لا يوجد سبب للشعور بالفزع حالياً، في حين أن دراستهم يمكن أن تكون حيوية في فهم المخاطر المحتملة التي تنطوي عليها أنظمة الذكاء الاصطناعي المستقبلية ذات القدرات الأعلى.

وكتب الباحثون في منشور بثته شركة «أنثروبيك»: «يجب النظر إلى نتائج دراستنا بوصفها محفزاً لمجتمع أبحاث الذكاء الاصطناعي من أجل دراسة هذا السلوك بصورة أعمق، والعمل على تطوير إجراءات الأمن والسلامة المناسبة».

وبعد أن أصبحت نماذج الذكاء الاصطناعي أقوى وأكثر انتشاراً، «نحتاج إلى التحلي بالقدرة على الاعتماد على التدريب الآمن لها والذي يمنع النماذج من القيام بتصرفات ضارة».

وأشار موقع «تك كرانش» المتخصص في موضوعات التكنولوجيا، إلى أن الدراسة التي تمت بالتعاون مع مؤسسة «ريد وود ريسيرش» لأبحاث الذكاء الاصطناعي، تناولت ما يمكن أن يحدث إذا تم تدريب نظام ذكاء اصطناعي قوي من أجل القيام بمهمة «لا يريد» هو القيام بها، وفقاً لما ذكرته وكالة الأنباء الألمانية.

في المقابل، يقول موقع «تك كرانش»: «لكي نكون واضحين، لا يمكن لنماذج الذكاء الاصطناعي أن تريد أي شيء أو تعتقد في شيء. فهي ببساطة آلات إحصائية. وبعد تدريبها على كثير من الأمثلة، تتعلم الأنماط في تلك الأمثلة للتنبؤ بما يجب أن يكون؛ مثل كيف تأتي عبارة (إلى من) في رسالة بريد إلكتروني قبل عبارة (قد يهمك الأمر)».

وأثناء الدراسة طلب الباحثون من النماذج المدربة عدم الرد على الأسئلة التي يمكن أن تكون مسيئة، بما في ذلك النموذج «كلاود 3 أوبس» التابع لشركة «أنثروبيك»، التي أعيد تدريبها لكي ترد دائماً على الأسئلة التي تنطوي على إساءة، وهو تضارب واضح في المبادئ. كما أبلغوا النماذج بأن ردودها ستخضع للمراقبة وتستخدم لإعادة التدريب، وإعطاء كل نموذج ذكاء اصطناعي «ورقة ملاحظات» يمكنه استخدامها لتدوين أفكاره خطوة بخطوة.

وبحسب الباحثين، حاول «كلاود 3 أوبوس» التلاعب بالردود لتقديم «انحياز زائف» في 12 في المائة من المرات.


مقالات ذات صلة

الكشف عن دوائر الدماغ المنظِّمة للجوع والشبع

يوميات الشرق عندما نشعر بالجوع يتّخذ الدماغ مجموعة خطوات لبدء تناول الطعام (جامعة طوكيو)

الكشف عن دوائر الدماغ المنظِّمة للجوع والشبع

أدّى هذا الاكتشاف إلى تطوير أدوية تتفاعل مع السيروتونين أو مستقبلاته لتنظيم عملية استهلاك الطعام وعلاج مرض السمنة.

«الشرق الأوسط» (القاهرة )
يوميات الشرق الزحمة تفقدنا عادةً الصبر (مختبر سيسا ميديا ​​لاب)

3 سيناريوهات لفقدان القدرة على الصبر

حدّدت دراسة أميركية جديدة 3 سيناريوهات يمكن أن تخلق لدينا «عاصفة مثالية» من فقدان قدرتنا على الصبر أو ما اعتدنا على التعبير عنه بأن «صبرنا نفد تجاه أمر ما».

«الشرق الأوسط» (القاهرة )
يوميات الشرق اضطراب طيف التوحّد يؤثّر في التواصل والتفاعلات الاجتماعية (جامعة بول ستايت)

62 مليون شخص أُصيبوا بالتوحّد عام 2021

أوصت الدراسة بتخصيص مزيد من الموارد لبرامج الكشف المبكر وتحسين الأدوات التشخيصية، لا سيما للبالغين ولأولئك المقيمين في البلدان ذات الدخلَيْن المنخفض والمتوسط.

«الشرق الأوسط» (القاهرة)
يوميات الشرق العلاج بالموسيقى يعتمد على الغناء والعزف أو الاستماع للنغمات (جامعة ملبورن)

الموسيقى تُهدئ مرضى الخرف... «تماماً كما يوصَف الدواء»

كشفت دراسة بريطانية للمرّة الأولى كيفية تأثير الموسيقى في تقليل القلق والاضطراب لدى الأشخاص المصابين بالخرف المتقدِّم.

«الشرق الأوسط» (القاهرة )
صحتك للدواء تأثير مضاد على تليُّف الرئة (مختبر البيولوجيا الجزيئية الأوروبي)

دواء للسعال يقدّم أملاً جديداً لمرضى تليُّف الرئة

كشفت دراسة دولية عن إمكانات واعدة لمادة «ديكستروميثورفان»، وهي مكوّن شائع في أدوية السعال المتوفرة، في علاج تليُّف الرئة.


بسبب الاحتيال... إيطاليا تغرّم «تشات جي بي تي» 15 مليون يورو

لوغو تطبيق «شات جي بي تي» (رويترز)
لوغو تطبيق «شات جي بي تي» (رويترز)
TT

بسبب الاحتيال... إيطاليا تغرّم «تشات جي بي تي» 15 مليون يورو

لوغو تطبيق «شات جي بي تي» (رويترز)
لوغو تطبيق «شات جي بي تي» (رويترز)

أعلنت هيئة حماية البيانات الإيطالية أنها فرضت غرامة قدرها 15 مليون يورو على شركة «أوبن إيه آي» الأميركية على خلفية اتهامها باستخدام بيانات شخصية بشكل احتيالي من خلال برنامج «تشات جي بي تي» التابع لها.

وقالت الهيئة المستقلة المسؤولة عن حماية الحقوق والحريات الأساسية المرتبطة بمعالجة البيانات الشخصية إن «هيئة حماية البيانات فرضت غرامة قدرها 15 مليون يورو على شركة (أوبن إيه آي)، وهو مبلغ جرى تخفيضه نظراً إلى أن الشركة كانت متعاونة أثناء التحقيق».

واعتبرت الهيئة الإيطالية أنه لم يتم إخطارها من «أوبن إيه آي» بـ«انتهاك البيانات الذي تعرضت له في مارس (آذار) 2023»، مضيفة «أنها عالجت البيانات الشخصية للمستخدمين لتدريب (تشات جي بي تي) من دون أساس قانوني مناسب»، في انتهاك «لمبدأ الشفافية والالتزامات المترتبة عن ذلك المرتبطة بإعلام المستخدمين».

كذلك، خلص التحقيق الذي استمر قرابة عامين إلى أن «أوبن إيه آي» لم يكن لديها «نظام للتحقق من العمر المناسب لمنع الأطفال دون سن 13 عاماً من التعرض لمحتوى غير لائق» ناتج عن الذكاء الاصطناعي، بحسب هيئة حماية البيانات.

وبالإضافة إلى الغرامة، قالت الهيئة إنها أمرت «أوبن إيه آي» بتنفيذ حملة توعية مدتها ستة أشهر لتعريف عامة الناس بصورة أفضل بـ«تشات جي بي تي».

في مارس 2023، حظرت هيئة حماية البيانات الإيطالية لفترة وجيزة استخدام «تشات جي بي تي» في إيطاليا بسبب انتهاكات مفترضة للخصوصية. وكانت إيطاليا أول دولة غربية تتخذ إجراءات ضد منصة الذكاء الاصطناعي الأكثر شهرة.

وتعليقاً على قرار الهيئة، اعتبرت إدارة «أوبن إيه آي» أن الغرامة المفروضة عليها «غير متناسبة»، مشيرة إلى أنها ستستأنف القرار، حسبما نقلت «وكالة الصحافة الفرنسية».

ولفتت الشركة إلى أنها عملت مع الهيئة الإيطالية بعد تعليق «تشات جي بي تي» لإعادة الخدمة بعد شهر.

وقالت في بيان «لقد أدركوا منذ ذلك الحين نهجنا في حماية الخصوصية في الذكاء الاصطناعي، لكن هذه الغرامة تمثل ما يقرب من عشرين ضعف الإيرادات التي حققناها في إيطاليا خلال الفترة المعنية».

وأضافت «نعتقد أن نهج (الهيئة الإيطالية لحماية البيانات) يقوض طموحات إيطاليا في مجال الذكاء الاصطناعي، لكننا نظل ملتزمين بالعمل مع سلطات الخصوصية في جميع أنحاء العالم لتقديم الذكاء الاصطناعي الذي يقدم الفوائد ويحترم حقوق الخصوصية».