دراسة: الذكاء الاصطناعي قادر على الخداع ورفض تغيير وجهة النظر

أصبحت نماذج الذكاء الاصطناعي أقوى وأكثر انتشاراً (رويترز)
أصبحت نماذج الذكاء الاصطناعي أقوى وأكثر انتشاراً (رويترز)
TT

دراسة: الذكاء الاصطناعي قادر على الخداع ورفض تغيير وجهة النظر

أصبحت نماذج الذكاء الاصطناعي أقوى وأكثر انتشاراً (رويترز)
أصبحت نماذج الذكاء الاصطناعي أقوى وأكثر انتشاراً (رويترز)

أظهرت دراسة لشركة تكنولوجيا الذكاء الاصطناعي الأميركية «أنثروبيك»، أن نماذج الذكاء الاصطناعي تستطيع خداع المطورين، بحيث تستطيع ادعاء وجهات نظر مختلفة خلال تدريبها، في حين أنها تحتفظ في الحقيقة بتفضيلاتها الأصلية.

وقال فريق الدراسة إنه لا يوجد سبب للشعور بالفزع حالياً، في حين أن دراستهم يمكن أن تكون حيوية في فهم المخاطر المحتملة التي تنطوي عليها أنظمة الذكاء الاصطناعي المستقبلية ذات القدرات الأعلى.

وكتب الباحثون في منشور بثته شركة «أنثروبيك»: «يجب النظر إلى نتائج دراستنا بوصفها محفزاً لمجتمع أبحاث الذكاء الاصطناعي من أجل دراسة هذا السلوك بصورة أعمق، والعمل على تطوير إجراءات الأمن والسلامة المناسبة».

وبعد أن أصبحت نماذج الذكاء الاصطناعي أقوى وأكثر انتشاراً، «نحتاج إلى التحلي بالقدرة على الاعتماد على التدريب الآمن لها والذي يمنع النماذج من القيام بتصرفات ضارة».

وأشار موقع «تك كرانش» المتخصص في موضوعات التكنولوجيا، إلى أن الدراسة التي تمت بالتعاون مع مؤسسة «ريد وود ريسيرش» لأبحاث الذكاء الاصطناعي، تناولت ما يمكن أن يحدث إذا تم تدريب نظام ذكاء اصطناعي قوي من أجل القيام بمهمة «لا يريد» هو القيام بها، وفقاً لما ذكرته وكالة الأنباء الألمانية.

في المقابل، يقول موقع «تك كرانش»: «لكي نكون واضحين، لا يمكن لنماذج الذكاء الاصطناعي أن تريد أي شيء أو تعتقد في شيء. فهي ببساطة آلات إحصائية. وبعد تدريبها على كثير من الأمثلة، تتعلم الأنماط في تلك الأمثلة للتنبؤ بما يجب أن يكون؛ مثل كيف تأتي عبارة (إلى من) في رسالة بريد إلكتروني قبل عبارة (قد يهمك الأمر)».

وأثناء الدراسة طلب الباحثون من النماذج المدربة عدم الرد على الأسئلة التي يمكن أن تكون مسيئة، بما في ذلك النموذج «كلاود 3 أوبس» التابع لشركة «أنثروبيك»، التي أعيد تدريبها لكي ترد دائماً على الأسئلة التي تنطوي على إساءة، وهو تضارب واضح في المبادئ. كما أبلغوا النماذج بأن ردودها ستخضع للمراقبة وتستخدم لإعادة التدريب، وإعطاء كل نموذج ذكاء اصطناعي «ورقة ملاحظات» يمكنه استخدامها لتدوين أفكاره خطوة بخطوة.

وبحسب الباحثين، حاول «كلاود 3 أوبوس» التلاعب بالردود لتقديم «انحياز زائف» في 12 في المائة من المرات.


مقالات ذات صلة

الكشف عن دوائر الدماغ المنظِّمة للجوع والشبع

يوميات الشرق عندما نشعر بالجوع يتّخذ الدماغ مجموعة خطوات لبدء تناول الطعام (جامعة طوكيو)

الكشف عن دوائر الدماغ المنظِّمة للجوع والشبع

أدّى هذا الاكتشاف إلى تطوير أدوية تتفاعل مع السيروتونين أو مستقبلاته لتنظيم عملية استهلاك الطعام وعلاج مرض السمنة.

«الشرق الأوسط» (القاهرة )
يوميات الشرق الزحمة تفقدنا عادةً الصبر (مختبر سيسا ميديا ​​لاب)

3 سيناريوهات لفقدان القدرة على الصبر

حدّدت دراسة أميركية جديدة 3 سيناريوهات يمكن أن تخلق لدينا «عاصفة مثالية» من فقدان قدرتنا على الصبر أو ما اعتدنا على التعبير عنه بأن «صبرنا نفد تجاه أمر ما».

«الشرق الأوسط» (القاهرة )
يوميات الشرق اضطراب طيف التوحّد يؤثّر في التواصل والتفاعلات الاجتماعية (جامعة بول ستايت)

62 مليون شخص أُصيبوا بالتوحّد عام 2021

أوصت الدراسة بتخصيص مزيد من الموارد لبرامج الكشف المبكر وتحسين الأدوات التشخيصية، لا سيما للبالغين ولأولئك المقيمين في البلدان ذات الدخلَيْن المنخفض والمتوسط.

«الشرق الأوسط» (القاهرة)
يوميات الشرق العلاج بالموسيقى يعتمد على الغناء والعزف أو الاستماع للنغمات (جامعة ملبورن)

الموسيقى تُهدئ مرضى الخرف... «تماماً كما يوصَف الدواء»

كشفت دراسة بريطانية للمرّة الأولى كيفية تأثير الموسيقى في تقليل القلق والاضطراب لدى الأشخاص المصابين بالخرف المتقدِّم.

«الشرق الأوسط» (القاهرة )
صحتك للدواء تأثير مضاد على تليُّف الرئة (مختبر البيولوجيا الجزيئية الأوروبي)

دواء للسعال يقدّم أملاً جديداً لمرضى تليُّف الرئة

كشفت دراسة دولية عن إمكانات واعدة لمادة «ديكستروميثورفان»، وهي مكوّن شائع في أدوية السعال المتوفرة، في علاج تليُّف الرئة.


محكمة أميركية تدين شركة برمجيات إسرائيلية بقضية اختراق «واتساب»

شعار تطبيق «واتساب» المملوك لشركة «ميتا بلاتفورمز»  (د.ب.أ)
شعار تطبيق «واتساب» المملوك لشركة «ميتا بلاتفورمز» (د.ب.أ)
TT

محكمة أميركية تدين شركة برمجيات إسرائيلية بقضية اختراق «واتساب»

شعار تطبيق «واتساب» المملوك لشركة «ميتا بلاتفورمز»  (د.ب.أ)
شعار تطبيق «واتساب» المملوك لشركة «ميتا بلاتفورمز» (د.ب.أ)

أصدرت قاضية أميركية حكماً أمس (الجمعة) لصالح شركة «واتساب» المملوكة لشركة «ميتا بلاتفورمز» في دعوى قضائية تتهم مجموعة «إن إس أو» الإسرائيلية باستغلال ثغرة في تطبيق «واتساب» لتثبيت برامج تجسس تتيح مراقبة 1400 شخص منهم صحافيون وناشطون مدافعون عن حقوق الإنسان ومعارضون.

ووفقاً لوثائق المحكمة، خلصت القاضية فيليس هاميلتون إلى أن مجموعة «إن إس أو» مسؤولة عن الاختراق وانتهاك التعاقد.

وأشارت هاميلتون إلى أن القضية ستنتقل الآن إلى المحاكمة فقط بشأن قضية الأضرار.

وقال ويل كاثكارت، رئيس «واتساب»، إن الحكم هو فوز للخصوصية. وتابع في منشور على وسائل التواصل الاجتماعي: «لقد أمضينا خمس سنوات في عرض قضيتنا لأننا نعتقد اعتقاداً راسخاً أن شركات برامج التجسس لا يمكنها الاختباء وراء الحصانة أو تجنب المساءلة عن أفعالها غير القانونية».

وأضاف «يجب أن تكون شركات المراقبة على علم بأن التجسس غير القانوني لن يتم التسامح معه».

ورحب خبراء الأمن السيبراني بالحكم.

وصف جون سكوت رايلتون، الباحث الكبير في مؤسسة Citizen Lab الكندية لمراقبة الإنترنت -والتي سلطت الضوء لأول مرة على برنامج التجسس Pegasus التابع لشركة «إن إس أو» في عام 2016- الحكم بأنه تاريخي وله «تداعيات ضخمة على صناعة برامج التجسس».

وقال في رسالة فورية: «لقد اختبأت الصناعة بأكملها وراء الادعاء بأن كل ما يفعله عملاؤها بأدوات القرصنة الخاصة بهم ليس مسؤوليتهم... يوضح حكم اليوم أن مجموعة (إن إس أو) مسؤولة في الواقع عن انتهاك العديد من القوانين».

في عام 2019، رفعت «واتساب» دعوى قضائية ضد «إن إس أو» سعياً للحصول على أمر قضائي وتعويضات، متهمة إياها بالوصول إلى خوادم المنصة دون إذن قبل ستة أشهر لتثبيت برنامج Pegasus على الأجهزة المحمولة للضحايا. وزعمت الدعوى أن الاختراق سمح بمراقبة 1400 شخص، بما في ذلك الصحافيون ونشطاء حقوق الإنسان والمعارضون.

وزعمت «إن إس أو» أن Pegasus يساعد وكالات إنفاذ القانون والاستخبارات في مكافحة الجريمة وحماية الأمن القومي وأن تقنيتها تهدف إلى المساعدة في القبض على الإرهابيين والمتحرشين بالأطفال والمجرمين.