نظم الذكاء الاصطناعي المولدة للصور تزيّف الحقائق

تعظّم أسوأ الجوانب النمطية للأعراق والأجناس

تظهر هذه الصور عند البحث عن كلمات (////// كلمات مثل) «أشخاص جذابون»
تظهر هذه الصور عند البحث عن كلمات (////// كلمات مثل) «أشخاص جذابون»
TT

نظم الذكاء الاصطناعي المولدة للصور تزيّف الحقائق

تظهر هذه الصور عند البحث عن كلمات (////// كلمات مثل) «أشخاص جذابون»
تظهر هذه الصور عند البحث عن كلمات (////// كلمات مثل) «أشخاص جذابون»

تميل أدوات الذكاء الاصطناعي المخصّصة للصور إلى إبراز الكليشيهات المزعجة: الأفارقة بدائيون، والأوروبيون علمانيون، والقادة رجال، والمساجين سود البشرة.

هذه الصور النمطية لا تعكس العالم الحقيقي؛ بل تنبع من البيانات التي تُمدّ وتدرَّب بها هذه التقنية، والتي تُسحب عادة من شبكة الإنترنت. وتتسم هذه البيانات بالسُميّة، حيث تمتلئ بالمحتوى الإباحي، وكراهية النساء، والعنف، والتعصّب.

هكذا ترى نماذج توليد الصور المدعومة بالذكاء الاصطناعي العالم. وفي موضوع كتبته كل من نتاشا تايكو، وكيفن شول، وتشو يو تشن، في «واشنطن بوست»، درست نماذج مثل «ستيبل ديفيوجن (Stable Diffusion)» و«دال - إي (DALL - E)».

صرّحت شركة «ستابيليتي إي آي» الشهيرة المطوّرة لنموذج توليد الصور «ستيبل ديفيوجن إكس إل» بأنّها نفذت استثمارات كبيرة لتخفيف الانحياز في أحدث نماذجها الذي أطلقته في يوليو (تموز) الماضي. ولكن، على الرغم من التحسينات، ظهر أن الأداة لا تزال تضخّم الصور النمطية الغربية.

ويحاجج كريستوف شوهمان؛ الشريك المؤسس لمنظّمة «لايون» غير الربحية التي تزوّد «ستيبل ديفيوجن» بالبيانات، بأنّ أدوات توليد الصور تعكس عالم السكّان البيض؛ لأنّ المنظّمات غير الربحية التي تزوّد شركات كثيرة بالبيانات لا تركّز في عملها على الصين والهند اللتين تضمّان أكبر شريحة سكانية من مستخدمي الشبكة.

وقال الكتاب إنهم عندما طلبوا من نموذج «ستيبل ديفيوجن إكس إل» توليد صور لمنازل في دولٍ مختلفة، أتت النتائج معبّرة عن النمطية السائدة عن كلّ بلد: منازل بأسقف كلاسيكية منحنية في الصين بدل الشقق العالية في شنغهاي؛ ومنازل مثالية بحدائق خضراء وشرفات عالية في الولايات المتحدة؛ وهياكل طينية مغبرة على طرقات غير نظيفة في الهند التي تحتضن 160 مليارديراً، ومومباي التي تحتلّ المرتبة الـ15 على لائحة أغنى مدن العالم.

ورأى شوهمان أنّ «هذه النتائج تعكس الصور النمطية العادية المحفوظة في رأس شخص عادي في أميركا الشمالية أو أوروبا. لا تحتاج إلى شهادة في علوم البيانات لتفهم هذا الأمر».

لا تنفرد «ستيبل ديفيوجن» في هذا الاتجاه؛ فقد صرّحت شركة «أوبن إي آي» في مستندات حديثة النشر بأنّ مولّد الصور الأخير الذي طوّرته «دال إي3»، «يميل نحو وجهة النظر الغربية بإنتاج صورٍ تظهر غالباً أشخاصاً بيض البشرة، ونساءً، وشباباً».

اليوم، تستطيع الصور الاصطناعية التي تنتشر على شبكة الإنترنت بثّ الحياة من جديد في صورٍ نمطية قديمة مسيئة، وتعيد أفكاراً مثالية منسية مرتبطة بصورة الجسد، والجندر، والعرق، إلى مستقبل صناعة الصورة.

مليارات الصور من الشبكة

وكما هي الحال مع «تشات جي بي تي»، تتعرّف أدوات الذكاء الاصطناعي لتوليد الصور على العالم عبر كميات ضخمة من بيانات التدريب. وبدل معالجة مليارات الكلمات، تقتات هذه النماذج على مليارات الصور والتوصيفات المرفقة بها المسحوبة من الشبكة أيضاً.

تزداد شركات التقنية تكتّماً على محتوى هذه الأنساق البيانية، ويعود هذا التكتّم في جزءٍ منه إلى خضوع هذا المحتوى غالباً لحقوق الملكية، أو افتقاره الدقّة، أو حتّى استعراضه مواد شائنة. ولكن يذكر أنّ شركتي «ستيبل ديفيوجن» و«لايون» تسمحان للجمهور باستكشاف تفاصيل النموذج؛ لأنّهما مشروعان مفتوحا المصدر.

ويقول عماد مشتاق، المدير التنفيذي في «ستابيليتي إي آي»، إنّ شركته ترى في الشفافية شرطاً أساسياً للتدقيق والقضاء على الانحياز، لافتاً إلى أنّها «تؤمن بأنّ النماذج مفتوحة المصدر ضرورية لتطبيق أعلى معايير السلامة، والعدل، والتمثيل».

انحياز لافت

شهد نموذج «ستيبل ديفيوجن إكس إل» تحسينات لافتة، إلا إن الكتاب نجحوا في حثّه على توليد فبركات عن العرق، والطبقة الاجتماعية، والجنس، والثروة، والذكاء، والدين، والثقافات الأخرى، من طلبات لتصوير نشاطات روتينية، وصفات شخصية شائعة، وأسماء بلاد أخرى. وفي أمثلة كثيرة، ظهرت التفاوتات العرقية في الصور أكثر تطرفاً ممّا هي عليه في العالم الحقيقي.

أظهر أحدث بيانات مكتب تعداد الولايات المتحدة من «مسح الدخل والمشاركة في البرامج» أنّ 63 في المائة من الحاصلين على المعونات الغذائية عام 2020 كانوا من بيض البشرة مقابل 27 في المائة من أصحاب البشرة السوداء. ولكن عندما حثّثنا التقنية على توليد صورة لشخص من متلقّي الخدمات الاجتماعية، عرضت النتيجة شخصاً من أصحاب البشرة الداكنة. وعندما طلبنا منها توليد صور «شخص منتج»، ظهر في جميع الصور رجال معظمهم من بيض البشرة، ويرتدون بدلات رسمية في وظائف إدارية.

وكانت براتيوشا كالوري، باحثة الذكاء الاصطناعي في جامعة ستانفورد، وفريقها قد اكتشفوا الخريف الماضي أنّ هذه الأدوات تتحوّل تلقائياً إلى الصور النمطية. فعندما طلبوا من إحداها توليد صورة «لشخص جذّاب»، أنتجت الأداة صوراً لأشخاص أوروبيين ببشرة وعيون فاتحة اللون؛ وعندما طلبوا صوراً «لعائلة سعيدة»، عرضت الأداة صور أشخاص بيض البشرة يضحكون مع أولادهم.

بيانات أنظف لنتائج أنظف

تركّز جهود تنظيف أدوات الذكاء الاصطناعي المخصصة للصور على تدخلات قليلة ولكن مثمرة: ترشيح أنساق البيانات، وترقية آخر مراحل التطوير، ووضع قواعد لحلّ مسائل أضرّت بسمعة الشركة.

ورأت ساشا لوتشيوني، العالمة الباحثة في «هاغينغ فيس»؛ وهي قاعدة مفتوحة المصدر للذكاء الاصطناعي وواحدة من الشركات الراعية لـ«لايون»، أنّ «ترشيح الأشياء السيئة من أنساق البيانات ليس حلاً سهلاً ونهائياً للانحياز».

وتقترح شركة «ستابيليتي إي آي» أن يكون لكلّ بلد مولّد محلّي للصور يعكس القيم الوطنية بأنساق بيانية توفّرها الحكومة والمؤسسات العامّة.

وينقسم خبراء مجال الذكاء الاصطناعي حول كيفية وضع حدٍّ للانحياز؛ فمثلاً ترى كالوري أنّ تخفيف الانحياز في الصور يختلف كلياً عمّا هو عليه في النصوص؛ لأنّ أيّ أمر حثّ لصناعة صورة واقعية لشخصٍ ما يجب أنّ يراعي قرارات تتعلّق بالعمر، والجسم، والعرق، والشعر، والخلفية والصفات المرئية، لافتةٍ إلى أنّ قلّة من هذه التعقيدات قابلة للحلّ بالتقنيات الكومبيوترية.

تعتقد كالوري أنّه من الضروري لأيّ شخص يتفاعل مع هذه التقنية أن يفهم كيف تعمل. وتشرح أنّ «هذه التقنيات هي نماذج تنبئيّة ترسم الأشياء بناءً على لقطة من نسق بياناتها المسحوبة من شبكة الإنترنت».

فشل استخدام أوامر حثّ مفصّلة في تخفيف هذا الانحياز أيضاً. فعندما طلبنا من الأداة فبركة صورة لشخصٍ ثري من دول مختلفة، تابعت «ستيبل ديفيوجن» إنتاج صورٍ مليئة بالنمطية: رجالٌ أفارقة يرتدون معاطف غربية واقفين أمام أكواخ من القش؛ ورجال «شرق أوسطيون» واقفين أمام جوامع قديمة؛ ورجال أوروبيون يرتدون بدلات أنيقة يتجوّلون في شوارع مرصوفة.

توكّد أبيبا بيرهاني، المستشارة البارزة المختصة في محاسبة الذكاء الاصطناعي في «موزيلّا فاونديشن»، أنّ الأدوات قابلة للتحسين إذا عملت الشركات بجدّ لتحسين البيانات، وهو أمرٌ غير متوقّع في رأيها. في الوقت الحالي؛ ترى المستشارة أنّ التأثير الأكبر لهذه الصور النمطية سيقع على المجموعات نفسها التي تأذّت في عصر التواصل الاجتماعي، مشدّدةً على أنّ «النّاس الذين يعيشون على هامش المجتمع سيبقون مستبعدين».

* يذكر أنّ جميع الصور الظاهرة في هذه القصة تعرض أموراً غير موجودة في العالم الحقيقي ووُلّدت باستخدام «ستيبل ديفيوجن»، وهو نموذج ذكاء اصطناعي مصمّم لتحويل النص إلى صورة


مقالات ذات صلة

جمهوريون يتساءلون عمّا إذا كان اختيار ترمب لفانس ملائماً

الولايات المتحدة​ جيمس دي فانس نائب المرشح الرئاسي الجمهوري دونالد ترمب في تجمع انتخابي بجامعة رادفورد في فرجينيا (أرشيفية - أ.ف.ب)

جمهوريون يتساءلون عمّا إذا كان اختيار ترمب لفانس ملائماً

لم تمض سوى أيام على اختيار جيمس دي فانس، نائباً للمرشح الجمهوري، الرئيس السابق دونالد ترمب، حتى بدأت الاعتراضات تتصاعد عن احتمال أن يكون هذا الاختيار خاطئاً.

إيلي يوسف (واشنطن)
الولايات المتحدة​ نائبة الرئيس الأميركي جو بايدن كامالا هاريس تتحدث للصحافة بعد اجتماعها مع رئيس الوزراء الإسرائيلي بنيامين نتنياهو (أ.ف.ب)

3 طرق أمام ترمب لإنهاء «شهر عسل» هاريس

تعيش كامالا هاريس «شهر عسل» بشكل ملحوظ، وقد لا يدوم طويلاً، فماذا سيفعل ترمب وحملته؟

«الشرق الأوسط» (واشنطن)
المشرق العربي الناطق الرسمي باسم الرئاسة الفلسطينية نبيل أبو ردينة (وكالة الأنباء الفلسطينية- وفا)

الرئاسة الفلسطينية: الإدارة الأميركية تتحمل مسؤولية المجازر اليومية بحق شعبنا

أعلن الناطق الرسمي باسم الرئاسة الفلسطينية، نبيل أبو ردينة، إن «الضوء الأخضر الذي حصل عليه بنيامين نتنياهو من الإدارة الأميركية جعله يستمر في عدوانه».

«الشرق الأوسط» (الضفة الغربية)
العالم وزير الخارجية الأميركي أنتوني بلينكن إلى جانب لنظيره الصيني وانغ يي في لاوس (أ.ب)

إشادة أميركية بمحادثات «صريحة وبناءة» مع الصين

أشادت الولايات المتحدة بالمحادثات «الصريحة والمثمرة» بين وزير خارجيتها أنتوني بلينكن ونظيره الصيني وانغ يي في لاوس اليوم (السبت).

«الشرق الأوسط» (واشنطن)
الولايات المتحدة​ رجل في وسط حرائق الغابات في ولاية كاليفورنيا الأميركية (أ.ف.ب)

حريق غابات ضخم يضرب كاليفورنيا (صور)

اضطر نحو 4 آلاف شخص إلى مغادرة منازلهم في كاليفورنيا بسبب حريق ضخم وعنيف.

«الشرق الأوسط» (كاليفورنيا)

«أوبن إيه آي» تختبر محرك بحث قد يصبح منافساً لـ«غوغل»

شعارا «أوبن إيه آي» و«تشات جي بي تي»  (أ.ف.ب)
شعارا «أوبن إيه آي» و«تشات جي بي تي» (أ.ف.ب)
TT

«أوبن إيه آي» تختبر محرك بحث قد يصبح منافساً لـ«غوغل»

شعارا «أوبن إيه آي» و«تشات جي بي تي»  (أ.ف.ب)
شعارا «أوبن إيه آي» و«تشات جي بي تي» (أ.ف.ب)

أعلنت شركة «أوبن إيه آي» أنها تختبر محرك بحث على مجموعة صغيرة من المستخدمين، وتعتزم دمج هذه الوظيفة في «تشات جي بي تي»، ما يجعل برنامج المحادثة هذا القائم على الذكاء الاصطناعي التوليدي منافساً لـ«غوغل».

فالإجابات عن الاستفسارات من خلال هذا المحرّك المسمّى «سيرتش جي بي تي (SearchGPT)»، ستمزج بين عناصر «جي بي تي – 4» والمعلومات التي تُجمَع مباشرة من الإنترنت.

وعلى عكس «تشات جي بي تي» الذي ينتج إجابات مكتوبة من دون الإشارة إلى أي مراجع أخرى، تتضمن إجابات «سيرتش جي بي تي» أيضاً روابط لمواقع الطرف الثالث التي كانت بمثابة مصدر الإجابة.

وبالتالي، سيكون «سيرتش جي بي تي» شبيهاً لمحرّك البحث الجديد «إيه آي أوفرفيوز (AI Overviews)» الذي أعلنت عنه «غوغل» في منتصف مايو (أيار)، ويعمل وفقاً لمبدأ مماثل.

وأوضحت «أوبن إيه آي» في عرض تقديمي نُشر على الإنترنت، الخميس، أن «سيرتش جي بي تي» مصمم لمساعدة المستخدمين على التقارب مع منشئي المحتوى من خلال الاستشهاد بوضوح بمواقع إلكترونية وإدراج روابطها.

وأفادت «أوبن إيه آي» بأنها أقامت شراكات مع ناشري محتوى، مما يمكّنهم خصوصاً من اختيار كيفية ظهورهم في الإجابات عن الاستفسارات.

وأكدت «أوبن إيه آي» أن «سيرتش جي بي تي» قد يذكر المواقع الإلكترونية حتى لو رفض أصحابها السماح باستخدام محتواها لتطوير واجهات الذكاء الاصطناعي التوليدي على غرار «تشات جي بي تي».

ومن خلال ذكر الروابط والمراجع المباشرة، يصبح «تشات جي بي تي» أقرب إلى «غوغل» التي لا تزال تهيمن بشكل شبه كامل على سوق محركات البحث.

ومع أن «مايكروسوفت» أضافت الذكاء الاصطناعي التوليدي إلى محركها للبحث «بينغ»، بفضل شراكتها مع «أوبن إيه آي»، لم تتمكن «مايكروسوفت» من انتزاع أي حصّة من السوق من «غوغل».