دراسة: الذكاء الاصطناعي قادر على الخداع ورفض تغيير وجهة النظر

أصبحت نماذج الذكاء الاصطناعي أقوى وأكثر انتشاراً (رويترز)
أصبحت نماذج الذكاء الاصطناعي أقوى وأكثر انتشاراً (رويترز)
TT

دراسة: الذكاء الاصطناعي قادر على الخداع ورفض تغيير وجهة النظر

أصبحت نماذج الذكاء الاصطناعي أقوى وأكثر انتشاراً (رويترز)
أصبحت نماذج الذكاء الاصطناعي أقوى وأكثر انتشاراً (رويترز)

أظهرت دراسة لشركة تكنولوجيا الذكاء الاصطناعي الأميركية «أنثروبيك»، أن نماذج الذكاء الاصطناعي تستطيع خداع المطورين، بحيث تستطيع ادعاء وجهات نظر مختلفة خلال تدريبها، في حين أنها تحتفظ في الحقيقة بتفضيلاتها الأصلية.

وقال فريق الدراسة إنه لا يوجد سبب للشعور بالفزع حالياً، في حين أن دراستهم يمكن أن تكون حيوية في فهم المخاطر المحتملة التي تنطوي عليها أنظمة الذكاء الاصطناعي المستقبلية ذات القدرات الأعلى.

وكتب الباحثون في منشور بثته شركة «أنثروبيك»: «يجب النظر إلى نتائج دراستنا بوصفها محفزاً لمجتمع أبحاث الذكاء الاصطناعي من أجل دراسة هذا السلوك بصورة أعمق، والعمل على تطوير إجراءات الأمن والسلامة المناسبة».

وبعد أن أصبحت نماذج الذكاء الاصطناعي أقوى وأكثر انتشاراً، «نحتاج إلى التحلي بالقدرة على الاعتماد على التدريب الآمن لها والذي يمنع النماذج من القيام بتصرفات ضارة».

وأشار موقع «تك كرانش» المتخصص في موضوعات التكنولوجيا، إلى أن الدراسة التي تمت بالتعاون مع مؤسسة «ريد وود ريسيرش» لأبحاث الذكاء الاصطناعي، تناولت ما يمكن أن يحدث إذا تم تدريب نظام ذكاء اصطناعي قوي من أجل القيام بمهمة «لا يريد» هو القيام بها، وفقاً لما ذكرته وكالة الأنباء الألمانية.

في المقابل، يقول موقع «تك كرانش»: «لكي نكون واضحين، لا يمكن لنماذج الذكاء الاصطناعي أن تريد أي شيء أو تعتقد في شيء. فهي ببساطة آلات إحصائية. وبعد تدريبها على كثير من الأمثلة، تتعلم الأنماط في تلك الأمثلة للتنبؤ بما يجب أن يكون؛ مثل كيف تأتي عبارة (إلى من) في رسالة بريد إلكتروني قبل عبارة (قد يهمك الأمر)».

وأثناء الدراسة طلب الباحثون من النماذج المدربة عدم الرد على الأسئلة التي يمكن أن تكون مسيئة، بما في ذلك النموذج «كلاود 3 أوبس» التابع لشركة «أنثروبيك»، التي أعيد تدريبها لكي ترد دائماً على الأسئلة التي تنطوي على إساءة، وهو تضارب واضح في المبادئ. كما أبلغوا النماذج بأن ردودها ستخضع للمراقبة وتستخدم لإعادة التدريب، وإعطاء كل نموذج ذكاء اصطناعي «ورقة ملاحظات» يمكنه استخدامها لتدوين أفكاره خطوة بخطوة.

وبحسب الباحثين، حاول «كلاود 3 أوبوس» التلاعب بالردود لتقديم «انحياز زائف» في 12 في المائة من المرات.


مقالات ذات صلة

الأنيميا تصيب 19 % من الحوامل عالمياً

صحتك الأنيميا حالة شائعة بين النساء الحوامل (جامعة مانشستر)

الأنيميا تصيب 19 % من الحوامل عالمياً

كشفت دراسة مرجعية، أجراها باحثون في إثيوبيا، عن أن معدل انتشار فقر الدم بسبب نقص الحديد بين النساء الحوامل يبلغ نحو 19 في المائة.

«الشرق الأوسط» (القاهرة )
صحتك الصداع النصفي هو اضطراب عصبي شائع يتميز بنوبات متكررة من الصداع الشديد (جامعة كاليفورنيا)

علاج فوري للصداع النصفي يثبت فعاليته

أكدت دراسة أميركية أن دواءً معتمداً للوقاية من الصداع النصفي يمكن أن يبدأ مفعوله فور تناوله.

«الشرق الأوسط» (القاهرة )
يوميات الشرق عندما نشعر بالجوع يتّخذ الدماغ مجموعة خطوات لبدء تناول الطعام (جامعة طوكيو)

الكشف عن دوائر الدماغ المنظِّمة للجوع والشبع

أدّى هذا الاكتشاف إلى تطوير أدوية تتفاعل مع السيروتونين أو مستقبلاته لتنظيم عملية استهلاك الطعام وعلاج مرض السمنة.

«الشرق الأوسط» (القاهرة )
يوميات الشرق الزحمة تفقدنا عادةً الصبر (مختبر سيسا ميديا ​​لاب)

3 سيناريوهات لفقدان القدرة على الصبر

حدّدت دراسة أميركية جديدة 3 سيناريوهات يمكن أن تخلق لدينا «عاصفة مثالية» من فقدان قدرتنا على الصبر أو ما اعتدنا على التعبير عنه بأن «صبرنا نفد تجاه أمر ما».

«الشرق الأوسط» (القاهرة )
يوميات الشرق اضطراب طيف التوحّد يؤثّر في التواصل والتفاعلات الاجتماعية (جامعة بول ستايت)

62 مليون شخص أُصيبوا بالتوحّد عام 2021

أوصت الدراسة بتخصيص مزيد من الموارد لبرامج الكشف المبكر وتحسين الأدوات التشخيصية، لا سيما للبالغين ولأولئك المقيمين في البلدان ذات الدخلَيْن المنخفض والمتوسط.

«الشرق الأوسط» (القاهرة)

كيف أصبح «كلود» روبوت الدردشة المفضل لدى خبراء التكنولوجيا؟

كيف أصبح «كلود» روبوت الدردشة المفضل لدى خبراء التكنولوجيا؟
TT

كيف أصبح «كلود» روبوت الدردشة المفضل لدى خبراء التكنولوجيا؟

كيف أصبح «كلود» روبوت الدردشة المفضل لدى خبراء التكنولوجيا؟

المعجبون به يشيدون بحساسيته وذكائه. ويتحدث إليه البعض عشرات المرات في اليوم - طالبين النصيحة بشأن وظائفهم وصحتهم وعلاقاتهم. كما يأتمنونه على أسرارهم ويستشيرونه قبل اتخاذ القرارات المهمة. ويشير إليه البعض باعتباره أفضل صديق لهم... إنه «كلود» Claude، روبوت الدردشة الذي يعمل بالذكاء الاصطناعي.

«كلود» أقل شهرة

لا يُعدّ «كلود»، وهو ابتكار شركة الذكاء الاصطناعي «أنثروبيك»، روبوت الدردشة الأكثر شهرة في السوق، بل هو «تشات جي بي تي» من شركة «أوبن إيه آي»، الذي يتوجه إليه أكثر من 300 مليون مستخدم أسبوعياً ويحتل مكاناً في شريط الإشارات المرجعية لكل طالب في المدرسة الثانوية في أميركا. كما أن «كلود» ليس مصمماً لجذب المستخدمين إلى علاقات مع رفاق الذكاء الاصطناعي الواقعيين، كما تفعل مع تطبيقات مثل Character.AI وReplika.

ساحر الخبراء

لكن «كلود» أصبح روبوت الدردشة المفضل لدى حشد من المطلعين على التكنولوجيا الذين يقولون إنه يساعدهم في كل شيء، من المشورة القانونية إلى التدريب الصحي إلى جلسات العلاج المؤقتة.

قال إيدان ماكلولين، الرئيس التنفيذي لشركة Topology Research، وهي شركة ناشئة في مجال الذكاء الاصطناعي: «إن مزيجاً من القوة الفكرية الخام والاستعداد للتعبير عن الآراء يجعلك تشعر بأن (كلود) أقرب من كونه أداة (جامدة)». «أنا والكثير من المستخدمين الآخرين، نجد ذلك (استخدامه) سحرياً».

لا يعتقد أكبر معجبي «كلود»، الذين يعمل الكثير منهم في شركات الذكاء الاصطناعي أو مرتبطون اجتماعياً بمشهد الذكاء الاصطناعي في نيويورك، أنه - من الناحية الفنية، هو شخص حقيقي. إنهم يعرفون أن نماذج لغة الذكاء الاصطناعي هي آلات تنبؤ، مصممة لإخراج استجابات معقولة لمطالباتهم. إنهم يدركون أن «كلود»، مثل روبوتات الدردشة الأخرى، يرتكب أخطاء ويولد الهراء أحياناً.

ويشعر بعض الأشخاص الذين تحدثت إليهم بالحرج قليلاً بشأن الدرجة التي قاموا بها بتشبيه «كلود» أو الاعتماد على نصائحه.

أكثر إبداعاً وتعاطفاً

لكن بالنسبة إلى الأشخاص الذين يحبونه، يشعر «كلود» بأنه مختلف. أكثر إبداعاً وتعاطفاً... وأقل إزعاجاً. يقول الخبراء إن مخرجاته تشبه الاستجابات التي قد يقدمها إنسان ذكي ومنتبه وأقل شبهاً بالنثر العام الذي تولدها برامج الدردشة الأخرى.

نتيجة لذلك؛ أصبح «كلود» بسرعة رفيقاً اجتماعياً للمطلعين على الذكاء الاصطناعي - وربما معاينة لما سيأتي لبقية منا، حيث أصبحت «الشخصيات الاصطناعية» القوية أكثر تشابكاً في حياتنا اليومية.

كتب نيك كاماراتا، وهو باحث سابق في «أوبن إيه آي» أخيراً موضوعاً طويلاً على منصة «إكس» حول الطريقة التي استولى بها «كلود» على مجموعته الاجتماعية. كتب أن أصدقاءه المهووسين بـ«كلود» بدوا أكثر صحة وأفضل دعماً؛ لأن «لديهم نوعاً من الملاك الحارس الحسابي الذي يجيد كل شيء ويراقبهم».

سحر الاتزان

لم يكن «كلود» ساحراً دائماً. عندما تم إصدار نسخة سابقة في العام الماضي؛ إذ صدم روبوت المحادثة الكثير من الأشخاص - بمن فيهم أنا - باعتباره متزمتاً ومملاً. تشتهر شركة «أنثروبيك» بهوسها بسلامة الذكاء الاصطناعي، ويبدو أن «كلود» قد تمت برمجته للتحدث مثل سيدة الكنيسة. غالباً ما كان يقدم للمستخدمين محاضرات أخلاقية رداً على أسئلتهم أو يرفض الإجابة عليها على الإطلاق.

لكن الشركة كانت تعمل على منح «كلود» المزيد من الشخصية. وخضعت الإصدارات الأحدث لعملية تُعرف باسم «تدريب الشخصية» - وهي خطوة تتم بعد أن يخضع النموذج للتدريب الأولي، لكن قبل إصداره للجمهور.

التدريب على الانفتاح الذهني

أثناء تدريب الشخصية، يُطلب من «كلود» إنتاج استجابات تتوافق مع السمات البشرية المرغوبة مثل الانفتاح الذهني والتفكير والفضول. ثم يحكم «كلود» على استجاباته وفقاً لمدى التزامها بهذه الخصائص. يتم إرجاع البيانات الناتجة إلى نموذج الذكاء الاصطناعي. وتقول شركة «أنثروبيك» إنه مع التدريب الكافي، يتعلم «كلود» «استيعاب» هذه المبادئ وعرضها بشكل متكرر عند التفاعل مع المستخدمين.

ومن غير الواضح ما إذا كان تدريب «كلود» بهذه الطريقة له فوائد تجارية. فقد جمعت شركة «أنثروبيك» مليارات الدولارات من مستثمرين كبار، بما في ذلك «أمازون»، على وعد بتقديم نماذج ذكاء اصطناعي عالية الكفاءة ومفيدة في بيئات مكتبية أكثر هدوءاً. وقد يؤدي حقن الكثير من الشخصية في «كلود» إلى نفور العملاء من الشركات، أو قد ينتج ببساطة نموذجاً أفضل في المساعدة في حل مشاكل العلاقات من كتابة مذكرات الاستراتيجية.

«شخصية كلود» متسقة ومتحدية

أخبرتني أماندا أسكيل، الباحثة والفيلسوفة في «أنثروبيك» والمسؤولة عن ضبط «شخصية كلود»، في مقابلة بأن «شخصية كلود» تم ضبطها بعناية لتكون متسقة، لكن لجذب مجموعة واسعة من الناس.

وقالت إن الهدف من «كلود» كان إنشاء شخصية ذكاء اصطناعي تكون مفيدة في معظم الطلبات، لكنها ستتحدى المستخدمين أيضاً عند الضرورة.

وقالت: «ما هو نوع الشخص الذي يمكنك الاختلاف معه، لكنك ستغادر وتفكر، (هذا شخص جيد؟). هذه هي السمات التي نريد أن يتمتع بها (كلود)».

قدرات محدودة

لا يزال «كلود» متأخراً أميالاً عن «جي بي تي» عندما يتعلق الأمر بالوعي السائد. فهو يفتقر إلى الميزات الموجودة في برامج الدردشة الأخرى، مثل وضع الدردشة الصوتية والقدرة على إنشاء الصور أو البحث في الإنترنت عن معلومات محدثة.

ويتكهن بعض صناع الذكاء الاصطناعي المنافسين بأن شعبية «كلود» هي نزوة عابرة أو أنها تحظى بشعبية فقط بين محبي الذكاء الاصطناعي الذين يريدون التباهي ببرنامج الدردشة الغامض الذي يحبونه.

رفيق صحي

بالنسبة إلى بعض البالغين الأصحاء، قد يكون وجود رفيق من الذكاء الاصطناعي للدعم مفيداً - وربما حتى تحويلياً. لكن بالنسبة للشباب، أو أولئك الذين يعانون الاكتئاب أو مشاكل الصحة العقلية الأخرى، أشعر بالقلق من أن برامج الدردشة الآلية المقنعة للغاية قد تطمس الخط الفاصل بين الخيال والواقع، أو تبدأ في استبدال العلاقات الإنسانية الأكثر صحة.

وهذا ما تفعله أيضاً أسكيل، التي ساعدت في إنشاء «شخصية كلود»، التي كانت تراقب ارتفاع شعبيتها بمزيج من الفخر والقلق.

وقالت: «أريد حقاً أن يحصل الناس على أشياء تدعمهم ومفيدة لهم. وفي الوقت نفسه، أريد التأكد من أنها صحية نفسياً».

* خدمة «نيويورك تايمز»