نظم الذكاء الاصطناعي المولدة للصور تزيّف الحقائق

تعظّم أسوأ الجوانب النمطية للأعراق والأجناس

تظهر هذه الصور عند البحث عن كلمات (////// كلمات مثل) «أشخاص جذابون»
تظهر هذه الصور عند البحث عن كلمات (////// كلمات مثل) «أشخاص جذابون»
TT

نظم الذكاء الاصطناعي المولدة للصور تزيّف الحقائق

تظهر هذه الصور عند البحث عن كلمات (////// كلمات مثل) «أشخاص جذابون»
تظهر هذه الصور عند البحث عن كلمات (////// كلمات مثل) «أشخاص جذابون»

تميل أدوات الذكاء الاصطناعي المخصّصة للصور إلى إبراز الكليشيهات المزعجة: الأفارقة بدائيون، والأوروبيون علمانيون، والقادة رجال، والمساجين سود البشرة.

هذه الصور النمطية لا تعكس العالم الحقيقي؛ بل تنبع من البيانات التي تُمدّ وتدرَّب بها هذه التقنية، والتي تُسحب عادة من شبكة الإنترنت. وتتسم هذه البيانات بالسُميّة، حيث تمتلئ بالمحتوى الإباحي، وكراهية النساء، والعنف، والتعصّب.

هكذا ترى نماذج توليد الصور المدعومة بالذكاء الاصطناعي العالم. وفي موضوع كتبته كل من نتاشا تايكو، وكيفن شول، وتشو يو تشن، في «واشنطن بوست»، درست نماذج مثل «ستيبل ديفيوجن (Stable Diffusion)» و«دال - إي (DALL - E)».

صرّحت شركة «ستابيليتي إي آي» الشهيرة المطوّرة لنموذج توليد الصور «ستيبل ديفيوجن إكس إل» بأنّها نفذت استثمارات كبيرة لتخفيف الانحياز في أحدث نماذجها الذي أطلقته في يوليو (تموز) الماضي. ولكن، على الرغم من التحسينات، ظهر أن الأداة لا تزال تضخّم الصور النمطية الغربية.

ويحاجج كريستوف شوهمان؛ الشريك المؤسس لمنظّمة «لايون» غير الربحية التي تزوّد «ستيبل ديفيوجن» بالبيانات، بأنّ أدوات توليد الصور تعكس عالم السكّان البيض؛ لأنّ المنظّمات غير الربحية التي تزوّد شركات كثيرة بالبيانات لا تركّز في عملها على الصين والهند اللتين تضمّان أكبر شريحة سكانية من مستخدمي الشبكة.

وقال الكتاب إنهم عندما طلبوا من نموذج «ستيبل ديفيوجن إكس إل» توليد صور لمنازل في دولٍ مختلفة، أتت النتائج معبّرة عن النمطية السائدة عن كلّ بلد: منازل بأسقف كلاسيكية منحنية في الصين بدل الشقق العالية في شنغهاي؛ ومنازل مثالية بحدائق خضراء وشرفات عالية في الولايات المتحدة؛ وهياكل طينية مغبرة على طرقات غير نظيفة في الهند التي تحتضن 160 مليارديراً، ومومباي التي تحتلّ المرتبة الـ15 على لائحة أغنى مدن العالم.

ورأى شوهمان أنّ «هذه النتائج تعكس الصور النمطية العادية المحفوظة في رأس شخص عادي في أميركا الشمالية أو أوروبا. لا تحتاج إلى شهادة في علوم البيانات لتفهم هذا الأمر».

لا تنفرد «ستيبل ديفيوجن» في هذا الاتجاه؛ فقد صرّحت شركة «أوبن إي آي» في مستندات حديثة النشر بأنّ مولّد الصور الأخير الذي طوّرته «دال إي3»، «يميل نحو وجهة النظر الغربية بإنتاج صورٍ تظهر غالباً أشخاصاً بيض البشرة، ونساءً، وشباباً».

اليوم، تستطيع الصور الاصطناعية التي تنتشر على شبكة الإنترنت بثّ الحياة من جديد في صورٍ نمطية قديمة مسيئة، وتعيد أفكاراً مثالية منسية مرتبطة بصورة الجسد، والجندر، والعرق، إلى مستقبل صناعة الصورة.

مليارات الصور من الشبكة

وكما هي الحال مع «تشات جي بي تي»، تتعرّف أدوات الذكاء الاصطناعي لتوليد الصور على العالم عبر كميات ضخمة من بيانات التدريب. وبدل معالجة مليارات الكلمات، تقتات هذه النماذج على مليارات الصور والتوصيفات المرفقة بها المسحوبة من الشبكة أيضاً.

تزداد شركات التقنية تكتّماً على محتوى هذه الأنساق البيانية، ويعود هذا التكتّم في جزءٍ منه إلى خضوع هذا المحتوى غالباً لحقوق الملكية، أو افتقاره الدقّة، أو حتّى استعراضه مواد شائنة. ولكن يذكر أنّ شركتي «ستيبل ديفيوجن» و«لايون» تسمحان للجمهور باستكشاف تفاصيل النموذج؛ لأنّهما مشروعان مفتوحا المصدر.

ويقول عماد مشتاق، المدير التنفيذي في «ستابيليتي إي آي»، إنّ شركته ترى في الشفافية شرطاً أساسياً للتدقيق والقضاء على الانحياز، لافتاً إلى أنّها «تؤمن بأنّ النماذج مفتوحة المصدر ضرورية لتطبيق أعلى معايير السلامة، والعدل، والتمثيل».

انحياز لافت

شهد نموذج «ستيبل ديفيوجن إكس إل» تحسينات لافتة، إلا إن الكتاب نجحوا في حثّه على توليد فبركات عن العرق، والطبقة الاجتماعية، والجنس، والثروة، والذكاء، والدين، والثقافات الأخرى، من طلبات لتصوير نشاطات روتينية، وصفات شخصية شائعة، وأسماء بلاد أخرى. وفي أمثلة كثيرة، ظهرت التفاوتات العرقية في الصور أكثر تطرفاً ممّا هي عليه في العالم الحقيقي.

أظهر أحدث بيانات مكتب تعداد الولايات المتحدة من «مسح الدخل والمشاركة في البرامج» أنّ 63 في المائة من الحاصلين على المعونات الغذائية عام 2020 كانوا من بيض البشرة مقابل 27 في المائة من أصحاب البشرة السوداء. ولكن عندما حثّثنا التقنية على توليد صورة لشخص من متلقّي الخدمات الاجتماعية، عرضت النتيجة شخصاً من أصحاب البشرة الداكنة. وعندما طلبنا منها توليد صور «شخص منتج»، ظهر في جميع الصور رجال معظمهم من بيض البشرة، ويرتدون بدلات رسمية في وظائف إدارية.

وكانت براتيوشا كالوري، باحثة الذكاء الاصطناعي في جامعة ستانفورد، وفريقها قد اكتشفوا الخريف الماضي أنّ هذه الأدوات تتحوّل تلقائياً إلى الصور النمطية. فعندما طلبوا من إحداها توليد صورة «لشخص جذّاب»، أنتجت الأداة صوراً لأشخاص أوروبيين ببشرة وعيون فاتحة اللون؛ وعندما طلبوا صوراً «لعائلة سعيدة»، عرضت الأداة صور أشخاص بيض البشرة يضحكون مع أولادهم.

بيانات أنظف لنتائج أنظف

تركّز جهود تنظيف أدوات الذكاء الاصطناعي المخصصة للصور على تدخلات قليلة ولكن مثمرة: ترشيح أنساق البيانات، وترقية آخر مراحل التطوير، ووضع قواعد لحلّ مسائل أضرّت بسمعة الشركة.

ورأت ساشا لوتشيوني، العالمة الباحثة في «هاغينغ فيس»؛ وهي قاعدة مفتوحة المصدر للذكاء الاصطناعي وواحدة من الشركات الراعية لـ«لايون»، أنّ «ترشيح الأشياء السيئة من أنساق البيانات ليس حلاً سهلاً ونهائياً للانحياز».

وتقترح شركة «ستابيليتي إي آي» أن يكون لكلّ بلد مولّد محلّي للصور يعكس القيم الوطنية بأنساق بيانية توفّرها الحكومة والمؤسسات العامّة.

وينقسم خبراء مجال الذكاء الاصطناعي حول كيفية وضع حدٍّ للانحياز؛ فمثلاً ترى كالوري أنّ تخفيف الانحياز في الصور يختلف كلياً عمّا هو عليه في النصوص؛ لأنّ أيّ أمر حثّ لصناعة صورة واقعية لشخصٍ ما يجب أنّ يراعي قرارات تتعلّق بالعمر، والجسم، والعرق، والشعر، والخلفية والصفات المرئية، لافتةٍ إلى أنّ قلّة من هذه التعقيدات قابلة للحلّ بالتقنيات الكومبيوترية.

تعتقد كالوري أنّه من الضروري لأيّ شخص يتفاعل مع هذه التقنية أن يفهم كيف تعمل. وتشرح أنّ «هذه التقنيات هي نماذج تنبئيّة ترسم الأشياء بناءً على لقطة من نسق بياناتها المسحوبة من شبكة الإنترنت».

فشل استخدام أوامر حثّ مفصّلة في تخفيف هذا الانحياز أيضاً. فعندما طلبنا من الأداة فبركة صورة لشخصٍ ثري من دول مختلفة، تابعت «ستيبل ديفيوجن» إنتاج صورٍ مليئة بالنمطية: رجالٌ أفارقة يرتدون معاطف غربية واقفين أمام أكواخ من القش؛ ورجال «شرق أوسطيون» واقفين أمام جوامع قديمة؛ ورجال أوروبيون يرتدون بدلات أنيقة يتجوّلون في شوارع مرصوفة.

توكّد أبيبا بيرهاني، المستشارة البارزة المختصة في محاسبة الذكاء الاصطناعي في «موزيلّا فاونديشن»، أنّ الأدوات قابلة للتحسين إذا عملت الشركات بجدّ لتحسين البيانات، وهو أمرٌ غير متوقّع في رأيها. في الوقت الحالي؛ ترى المستشارة أنّ التأثير الأكبر لهذه الصور النمطية سيقع على المجموعات نفسها التي تأذّت في عصر التواصل الاجتماعي، مشدّدةً على أنّ «النّاس الذين يعيشون على هامش المجتمع سيبقون مستبعدين».

* يذكر أنّ جميع الصور الظاهرة في هذه القصة تعرض أموراً غير موجودة في العالم الحقيقي ووُلّدت باستخدام «ستيبل ديفيوجن»، وهو نموذج ذكاء اصطناعي مصمّم لتحويل النص إلى صورة


مقالات ذات صلة

مسؤول روسي: دول عدة عرضت استضافة محادثات بين بوتين وترمب

العالم الرئيس الروسي فلاديمير بوتين والرئيس الأميركي دونالد ترمب يتحدثان خلال اجتماع ثنائي بقمة زعماء مجموعة العشرين في أوساكا باليابان 28 يونيو 2019 (رويترز)

مسؤول روسي: دول عدة عرضت استضافة محادثات بين بوتين وترمب

قال الكرملين إن دولاً عدة عرضت استضافة محادثات بين الرئيس الروسي فلاديمير بوتين والرئيس الأميركي المنتخب دونالد ترمب، لكنه لم يكشف عن هذه الدول.

«الشرق الأوسط» (موسكو)
العالم منظر عام لميناء نوك في غرينلاند يوم 8 مارس 2013 (رويترز)

رئيس وزراء غرينلاند يرد على ترمب: الجزيرة ليست للبيع

قال رئيس وزراء غرينلاند، إن الجزيرة ليست للبيع، وذلك رداً على تصريحات للرئيس الأميركي المنتخب دونالد ترمب بشأن «الامتلاك والسيطرة» على الجزيرة التابعة للدنمارك.

«الشرق الأوسط» (كوبنهاغن)
الولايات المتحدة​ الرئيس الأميركي جو بايدن (رويترز)

بايدن يخفف أحكام الإعدام الصادرة بحق 37 من أصل 40 سجيناً فيدرالياً

خفّف الرئيس الأميركي جو بايدن، اليوم الاثنين، أحكام الإعدام الصادرة بحق 37 سجيناً فيدرالياً، من أصل 40.

«الشرق الأوسط» (واشنطن)
الولايات المتحدة​ الطيار السابق في مشاة البحرية الأميركية دانييل دوغان (أ.ب)

أستراليا ستسلّم طياراً أميركياً سابقاً متهماً بتدريب طيارين عسكريين صينيين

ستسلِّم أستراليا الطيار السابق في مشاة البحرية الأميركية دانييل دوغان إلى الولايات المتحدة، على خلفية مزاعم قيامه بتدريب طيارين صينيين بشكل غير قانوني.

«الشرق الأوسط» (نيوكاسل (أستراليا))
الولايات المتحدة​ مشاهد للرجل المطلوب من إدارة شرطة نيويورك والمتهم بقتل امرأة أضرم فيها النيران أثناء نومها في مترو الأنفاق بنيويورك (رويترز)

مقتل امرأة بعد أن أضرم رجل النار فيها أثناء نومها بمترو نيويورك

ألقت شرطة نيويورك القبض على رجل قالت إنه أضرم النار في امرأة كانت تبدو نائمة بأحد قطارات مترو الأنفاق في المدينة.

«الشرق الأوسط» (نيويورك )

كيف أصبح «كلود» روبوت الدردشة المفضل لدى خبراء التكنولوجيا؟

كيف أصبح «كلود» روبوت الدردشة المفضل لدى خبراء التكنولوجيا؟
TT

كيف أصبح «كلود» روبوت الدردشة المفضل لدى خبراء التكنولوجيا؟

كيف أصبح «كلود» روبوت الدردشة المفضل لدى خبراء التكنولوجيا؟

المعجبون به يشيدون بحساسيته وذكائه. ويتحدث إليه البعض عشرات المرات في اليوم - طالبين النصيحة بشأن وظائفهم وصحتهم وعلاقاتهم. كما يأتمنونه على أسرارهم ويستشيرونه قبل اتخاذ القرارات المهمة. ويشير إليه البعض باعتباره أفضل صديق لهم... إنه «كلود» Claude، روبوت الدردشة الذي يعمل بالذكاء الاصطناعي.

«كلود» أقل شهرة

لا يُعدّ «كلود»، وهو ابتكار شركة الذكاء الاصطناعي «أنثروبيك»، روبوت الدردشة الأكثر شهرة في السوق، بل هو «تشات جي بي تي» من شركة «أوبن إيه آي»، الذي يتوجه إليه أكثر من 300 مليون مستخدم أسبوعياً ويحتل مكاناً في شريط الإشارات المرجعية لكل طالب في المدرسة الثانوية في أميركا. كما أن «كلود» ليس مصمماً لجذب المستخدمين إلى علاقات مع رفاق الذكاء الاصطناعي الواقعيين، كما تفعل مع تطبيقات مثل Character.AI وReplika.

ساحر الخبراء

لكن «كلود» أصبح روبوت الدردشة المفضل لدى حشد من المطلعين على التكنولوجيا الذين يقولون إنه يساعدهم في كل شيء، من المشورة القانونية إلى التدريب الصحي إلى جلسات العلاج المؤقتة.

قال إيدان ماكلولين، الرئيس التنفيذي لشركة Topology Research، وهي شركة ناشئة في مجال الذكاء الاصطناعي: «إن مزيجاً من القوة الفكرية الخام والاستعداد للتعبير عن الآراء يجعلك تشعر بأن (كلود) أقرب من كونه أداة (جامدة)». «أنا والكثير من المستخدمين الآخرين، نجد ذلك (استخدامه) سحرياً».

لا يعتقد أكبر معجبي «كلود»، الذين يعمل الكثير منهم في شركات الذكاء الاصطناعي أو مرتبطون اجتماعياً بمشهد الذكاء الاصطناعي في نيويورك، أنه - من الناحية الفنية، هو شخص حقيقي. إنهم يعرفون أن نماذج لغة الذكاء الاصطناعي هي آلات تنبؤ، مصممة لإخراج استجابات معقولة لمطالباتهم. إنهم يدركون أن «كلود»، مثل روبوتات الدردشة الأخرى، يرتكب أخطاء ويولد الهراء أحياناً.

ويشعر بعض الأشخاص الذين تحدثت إليهم بالحرج قليلاً بشأن الدرجة التي قاموا بها بتشبيه «كلود» أو الاعتماد على نصائحه.

أكثر إبداعاً وتعاطفاً

لكن بالنسبة إلى الأشخاص الذين يحبونه، يشعر «كلود» بأنه مختلف. أكثر إبداعاً وتعاطفاً... وأقل إزعاجاً. يقول الخبراء إن مخرجاته تشبه الاستجابات التي قد يقدمها إنسان ذكي ومنتبه وأقل شبهاً بالنثر العام الذي تولدها برامج الدردشة الأخرى.

نتيجة لذلك؛ أصبح «كلود» بسرعة رفيقاً اجتماعياً للمطلعين على الذكاء الاصطناعي - وربما معاينة لما سيأتي لبقية منا، حيث أصبحت «الشخصيات الاصطناعية» القوية أكثر تشابكاً في حياتنا اليومية.

كتب نيك كاماراتا، وهو باحث سابق في «أوبن إيه آي» أخيراً موضوعاً طويلاً على منصة «إكس» حول الطريقة التي استولى بها «كلود» على مجموعته الاجتماعية. كتب أن أصدقاءه المهووسين بـ«كلود» بدوا أكثر صحة وأفضل دعماً؛ لأن «لديهم نوعاً من الملاك الحارس الحسابي الذي يجيد كل شيء ويراقبهم».

سحر الاتزان

لم يكن «كلود» ساحراً دائماً. عندما تم إصدار نسخة سابقة في العام الماضي؛ إذ صدم روبوت المحادثة الكثير من الأشخاص - بمن فيهم أنا - باعتباره متزمتاً ومملاً. تشتهر شركة «أنثروبيك» بهوسها بسلامة الذكاء الاصطناعي، ويبدو أن «كلود» قد تمت برمجته للتحدث مثل سيدة الكنيسة. غالباً ما كان يقدم للمستخدمين محاضرات أخلاقية رداً على أسئلتهم أو يرفض الإجابة عليها على الإطلاق.

لكن الشركة كانت تعمل على منح «كلود» المزيد من الشخصية. وخضعت الإصدارات الأحدث لعملية تُعرف باسم «تدريب الشخصية» - وهي خطوة تتم بعد أن يخضع النموذج للتدريب الأولي، لكن قبل إصداره للجمهور.

التدريب على الانفتاح الذهني

أثناء تدريب الشخصية، يُطلب من «كلود» إنتاج استجابات تتوافق مع السمات البشرية المرغوبة مثل الانفتاح الذهني والتفكير والفضول. ثم يحكم «كلود» على استجاباته وفقاً لمدى التزامها بهذه الخصائص. يتم إرجاع البيانات الناتجة إلى نموذج الذكاء الاصطناعي. وتقول شركة «أنثروبيك» إنه مع التدريب الكافي، يتعلم «كلود» «استيعاب» هذه المبادئ وعرضها بشكل متكرر عند التفاعل مع المستخدمين.

ومن غير الواضح ما إذا كان تدريب «كلود» بهذه الطريقة له فوائد تجارية. فقد جمعت شركة «أنثروبيك» مليارات الدولارات من مستثمرين كبار، بما في ذلك «أمازون»، على وعد بتقديم نماذج ذكاء اصطناعي عالية الكفاءة ومفيدة في بيئات مكتبية أكثر هدوءاً. وقد يؤدي حقن الكثير من الشخصية في «كلود» إلى نفور العملاء من الشركات، أو قد ينتج ببساطة نموذجاً أفضل في المساعدة في حل مشاكل العلاقات من كتابة مذكرات الاستراتيجية.

«شخصية كلود» متسقة ومتحدية

أخبرتني أماندا أسكيل، الباحثة والفيلسوفة في «أنثروبيك» والمسؤولة عن ضبط «شخصية كلود»، في مقابلة بأن «شخصية كلود» تم ضبطها بعناية لتكون متسقة، لكن لجذب مجموعة واسعة من الناس.

وقالت إن الهدف من «كلود» كان إنشاء شخصية ذكاء اصطناعي تكون مفيدة في معظم الطلبات، لكنها ستتحدى المستخدمين أيضاً عند الضرورة.

وقالت: «ما هو نوع الشخص الذي يمكنك الاختلاف معه، لكنك ستغادر وتفكر، (هذا شخص جيد؟). هذه هي السمات التي نريد أن يتمتع بها (كلود)».

قدرات محدودة

لا يزال «كلود» متأخراً أميالاً عن «جي بي تي» عندما يتعلق الأمر بالوعي السائد. فهو يفتقر إلى الميزات الموجودة في برامج الدردشة الأخرى، مثل وضع الدردشة الصوتية والقدرة على إنشاء الصور أو البحث في الإنترنت عن معلومات محدثة.

ويتكهن بعض صناع الذكاء الاصطناعي المنافسين بأن شعبية «كلود» هي نزوة عابرة أو أنها تحظى بشعبية فقط بين محبي الذكاء الاصطناعي الذين يريدون التباهي ببرنامج الدردشة الغامض الذي يحبونه.

رفيق صحي

بالنسبة إلى بعض البالغين الأصحاء، قد يكون وجود رفيق من الذكاء الاصطناعي للدعم مفيداً - وربما حتى تحويلياً. لكن بالنسبة للشباب، أو أولئك الذين يعانون الاكتئاب أو مشاكل الصحة العقلية الأخرى، أشعر بالقلق من أن برامج الدردشة الآلية المقنعة للغاية قد تطمس الخط الفاصل بين الخيال والواقع، أو تبدأ في استبدال العلاقات الإنسانية الأكثر صحة.

وهذا ما تفعله أيضاً أسكيل، التي ساعدت في إنشاء «شخصية كلود»، التي كانت تراقب ارتفاع شعبيتها بمزيج من الفخر والقلق.

وقالت: «أريد حقاً أن يحصل الناس على أشياء تدعمهم ومفيدة لهم. وفي الوقت نفسه، أريد التأكد من أنها صحية نفسياً».

* خدمة «نيويورك تايمز»