نظم الذكاء الاصطناعي المولدة للصور تزيّف الحقائق

تعظّم أسوأ الجوانب النمطية للأعراق والأجناس

تظهر هذه الصور عند البحث عن كلمات (////// كلمات مثل) «أشخاص جذابون»
تظهر هذه الصور عند البحث عن كلمات (////// كلمات مثل) «أشخاص جذابون»
TT

نظم الذكاء الاصطناعي المولدة للصور تزيّف الحقائق

تظهر هذه الصور عند البحث عن كلمات (////// كلمات مثل) «أشخاص جذابون»
تظهر هذه الصور عند البحث عن كلمات (////// كلمات مثل) «أشخاص جذابون»

تميل أدوات الذكاء الاصطناعي المخصّصة للصور إلى إبراز الكليشيهات المزعجة: الأفارقة بدائيون، والأوروبيون علمانيون، والقادة رجال، والمساجين سود البشرة.

هذه الصور النمطية لا تعكس العالم الحقيقي؛ بل تنبع من البيانات التي تُمدّ وتدرَّب بها هذه التقنية، والتي تُسحب عادة من شبكة الإنترنت. وتتسم هذه البيانات بالسُميّة، حيث تمتلئ بالمحتوى الإباحي، وكراهية النساء، والعنف، والتعصّب.

هكذا ترى نماذج توليد الصور المدعومة بالذكاء الاصطناعي العالم. وفي موضوع كتبته كل من نتاشا تايكو، وكيفن شول، وتشو يو تشن، في «واشنطن بوست»، درست نماذج مثل «ستيبل ديفيوجن (Stable Diffusion)» و«دال - إي (DALL - E)».

صرّحت شركة «ستابيليتي إي آي» الشهيرة المطوّرة لنموذج توليد الصور «ستيبل ديفيوجن إكس إل» بأنّها نفذت استثمارات كبيرة لتخفيف الانحياز في أحدث نماذجها الذي أطلقته في يوليو (تموز) الماضي. ولكن، على الرغم من التحسينات، ظهر أن الأداة لا تزال تضخّم الصور النمطية الغربية.

ويحاجج كريستوف شوهمان؛ الشريك المؤسس لمنظّمة «لايون» غير الربحية التي تزوّد «ستيبل ديفيوجن» بالبيانات، بأنّ أدوات توليد الصور تعكس عالم السكّان البيض؛ لأنّ المنظّمات غير الربحية التي تزوّد شركات كثيرة بالبيانات لا تركّز في عملها على الصين والهند اللتين تضمّان أكبر شريحة سكانية من مستخدمي الشبكة.

وقال الكتاب إنهم عندما طلبوا من نموذج «ستيبل ديفيوجن إكس إل» توليد صور لمنازل في دولٍ مختلفة، أتت النتائج معبّرة عن النمطية السائدة عن كلّ بلد: منازل بأسقف كلاسيكية منحنية في الصين بدل الشقق العالية في شنغهاي؛ ومنازل مثالية بحدائق خضراء وشرفات عالية في الولايات المتحدة؛ وهياكل طينية مغبرة على طرقات غير نظيفة في الهند التي تحتضن 160 مليارديراً، ومومباي التي تحتلّ المرتبة الـ15 على لائحة أغنى مدن العالم.

ورأى شوهمان أنّ «هذه النتائج تعكس الصور النمطية العادية المحفوظة في رأس شخص عادي في أميركا الشمالية أو أوروبا. لا تحتاج إلى شهادة في علوم البيانات لتفهم هذا الأمر».

لا تنفرد «ستيبل ديفيوجن» في هذا الاتجاه؛ فقد صرّحت شركة «أوبن إي آي» في مستندات حديثة النشر بأنّ مولّد الصور الأخير الذي طوّرته «دال إي3»، «يميل نحو وجهة النظر الغربية بإنتاج صورٍ تظهر غالباً أشخاصاً بيض البشرة، ونساءً، وشباباً».

اليوم، تستطيع الصور الاصطناعية التي تنتشر على شبكة الإنترنت بثّ الحياة من جديد في صورٍ نمطية قديمة مسيئة، وتعيد أفكاراً مثالية منسية مرتبطة بصورة الجسد، والجندر، والعرق، إلى مستقبل صناعة الصورة.

مليارات الصور من الشبكة

وكما هي الحال مع «تشات جي بي تي»، تتعرّف أدوات الذكاء الاصطناعي لتوليد الصور على العالم عبر كميات ضخمة من بيانات التدريب. وبدل معالجة مليارات الكلمات، تقتات هذه النماذج على مليارات الصور والتوصيفات المرفقة بها المسحوبة من الشبكة أيضاً.

تزداد شركات التقنية تكتّماً على محتوى هذه الأنساق البيانية، ويعود هذا التكتّم في جزءٍ منه إلى خضوع هذا المحتوى غالباً لحقوق الملكية، أو افتقاره الدقّة، أو حتّى استعراضه مواد شائنة. ولكن يذكر أنّ شركتي «ستيبل ديفيوجن» و«لايون» تسمحان للجمهور باستكشاف تفاصيل النموذج؛ لأنّهما مشروعان مفتوحا المصدر.

ويقول عماد مشتاق، المدير التنفيذي في «ستابيليتي إي آي»، إنّ شركته ترى في الشفافية شرطاً أساسياً للتدقيق والقضاء على الانحياز، لافتاً إلى أنّها «تؤمن بأنّ النماذج مفتوحة المصدر ضرورية لتطبيق أعلى معايير السلامة، والعدل، والتمثيل».

انحياز لافت

شهد نموذج «ستيبل ديفيوجن إكس إل» تحسينات لافتة، إلا إن الكتاب نجحوا في حثّه على توليد فبركات عن العرق، والطبقة الاجتماعية، والجنس، والثروة، والذكاء، والدين، والثقافات الأخرى، من طلبات لتصوير نشاطات روتينية، وصفات شخصية شائعة، وأسماء بلاد أخرى. وفي أمثلة كثيرة، ظهرت التفاوتات العرقية في الصور أكثر تطرفاً ممّا هي عليه في العالم الحقيقي.

أظهر أحدث بيانات مكتب تعداد الولايات المتحدة من «مسح الدخل والمشاركة في البرامج» أنّ 63 في المائة من الحاصلين على المعونات الغذائية عام 2020 كانوا من بيض البشرة مقابل 27 في المائة من أصحاب البشرة السوداء. ولكن عندما حثّثنا التقنية على توليد صورة لشخص من متلقّي الخدمات الاجتماعية، عرضت النتيجة شخصاً من أصحاب البشرة الداكنة. وعندما طلبنا منها توليد صور «شخص منتج»، ظهر في جميع الصور رجال معظمهم من بيض البشرة، ويرتدون بدلات رسمية في وظائف إدارية.

وكانت براتيوشا كالوري، باحثة الذكاء الاصطناعي في جامعة ستانفورد، وفريقها قد اكتشفوا الخريف الماضي أنّ هذه الأدوات تتحوّل تلقائياً إلى الصور النمطية. فعندما طلبوا من إحداها توليد صورة «لشخص جذّاب»، أنتجت الأداة صوراً لأشخاص أوروبيين ببشرة وعيون فاتحة اللون؛ وعندما طلبوا صوراً «لعائلة سعيدة»، عرضت الأداة صور أشخاص بيض البشرة يضحكون مع أولادهم.

بيانات أنظف لنتائج أنظف

تركّز جهود تنظيف أدوات الذكاء الاصطناعي المخصصة للصور على تدخلات قليلة ولكن مثمرة: ترشيح أنساق البيانات، وترقية آخر مراحل التطوير، ووضع قواعد لحلّ مسائل أضرّت بسمعة الشركة.

ورأت ساشا لوتشيوني، العالمة الباحثة في «هاغينغ فيس»؛ وهي قاعدة مفتوحة المصدر للذكاء الاصطناعي وواحدة من الشركات الراعية لـ«لايون»، أنّ «ترشيح الأشياء السيئة من أنساق البيانات ليس حلاً سهلاً ونهائياً للانحياز».

وتقترح شركة «ستابيليتي إي آي» أن يكون لكلّ بلد مولّد محلّي للصور يعكس القيم الوطنية بأنساق بيانية توفّرها الحكومة والمؤسسات العامّة.

وينقسم خبراء مجال الذكاء الاصطناعي حول كيفية وضع حدٍّ للانحياز؛ فمثلاً ترى كالوري أنّ تخفيف الانحياز في الصور يختلف كلياً عمّا هو عليه في النصوص؛ لأنّ أيّ أمر حثّ لصناعة صورة واقعية لشخصٍ ما يجب أنّ يراعي قرارات تتعلّق بالعمر، والجسم، والعرق، والشعر، والخلفية والصفات المرئية، لافتةٍ إلى أنّ قلّة من هذه التعقيدات قابلة للحلّ بالتقنيات الكومبيوترية.

تعتقد كالوري أنّه من الضروري لأيّ شخص يتفاعل مع هذه التقنية أن يفهم كيف تعمل. وتشرح أنّ «هذه التقنيات هي نماذج تنبئيّة ترسم الأشياء بناءً على لقطة من نسق بياناتها المسحوبة من شبكة الإنترنت».

فشل استخدام أوامر حثّ مفصّلة في تخفيف هذا الانحياز أيضاً. فعندما طلبنا من الأداة فبركة صورة لشخصٍ ثري من دول مختلفة، تابعت «ستيبل ديفيوجن» إنتاج صورٍ مليئة بالنمطية: رجالٌ أفارقة يرتدون معاطف غربية واقفين أمام أكواخ من القش؛ ورجال «شرق أوسطيون» واقفين أمام جوامع قديمة؛ ورجال أوروبيون يرتدون بدلات أنيقة يتجوّلون في شوارع مرصوفة.

توكّد أبيبا بيرهاني، المستشارة البارزة المختصة في محاسبة الذكاء الاصطناعي في «موزيلّا فاونديشن»، أنّ الأدوات قابلة للتحسين إذا عملت الشركات بجدّ لتحسين البيانات، وهو أمرٌ غير متوقّع في رأيها. في الوقت الحالي؛ ترى المستشارة أنّ التأثير الأكبر لهذه الصور النمطية سيقع على المجموعات نفسها التي تأذّت في عصر التواصل الاجتماعي، مشدّدةً على أنّ «النّاس الذين يعيشون على هامش المجتمع سيبقون مستبعدين».

* يذكر أنّ جميع الصور الظاهرة في هذه القصة تعرض أموراً غير موجودة في العالم الحقيقي ووُلّدت باستخدام «ستيبل ديفيوجن»، وهو نموذج ذكاء اصطناعي مصمّم لتحويل النص إلى صورة


مقالات ذات صلة

جمهوريون يتساءلون عمّا إذا كان اختيار ترمب لفانس ملائماً

الولايات المتحدة​ جيمس دي فانس نائب المرشح الرئاسي الجمهوري دونالد ترمب في تجمع انتخابي بجامعة رادفورد في فرجينيا (أرشيفية - أ.ف.ب)

جمهوريون يتساءلون عمّا إذا كان اختيار ترمب لفانس ملائماً

لم تمض سوى أيام على اختيار جيمس دي فانس، نائباً للمرشح الجمهوري، الرئيس السابق دونالد ترمب، حتى بدأت الاعتراضات تتصاعد عن احتمال أن يكون هذا الاختيار خاطئاً.

إيلي يوسف (واشنطن)
الولايات المتحدة​ نائبة الرئيس الأميركي جو بايدن كامالا هاريس تتحدث للصحافة بعد اجتماعها مع رئيس الوزراء الإسرائيلي بنيامين نتنياهو (أ.ف.ب)

3 طرق أمام ترمب لإنهاء «شهر عسل» هاريس

تعيش كامالا هاريس «شهر عسل» بشكل ملحوظ، وقد لا يدوم طويلاً، فماذا سيفعل ترمب وحملته؟

«الشرق الأوسط» (واشنطن)
المشرق العربي الناطق الرسمي باسم الرئاسة الفلسطينية نبيل أبو ردينة (وكالة الأنباء الفلسطينية- وفا)

الرئاسة الفلسطينية: الإدارة الأميركية تتحمل مسؤولية المجازر اليومية بحق شعبنا

أعلن الناطق الرسمي باسم الرئاسة الفلسطينية، نبيل أبو ردينة، إن «الضوء الأخضر الذي حصل عليه بنيامين نتنياهو من الإدارة الأميركية جعله يستمر في عدوانه».

«الشرق الأوسط» (الضفة الغربية)
العالم وزير الخارجية الأميركي أنتوني بلينكن إلى جانب لنظيره الصيني وانغ يي في لاوس (أ.ب)

إشادة أميركية بمحادثات «صريحة وبناءة» مع الصين

أشادت الولايات المتحدة بالمحادثات «الصريحة والمثمرة» بين وزير خارجيتها أنتوني بلينكن ونظيره الصيني وانغ يي في لاوس اليوم (السبت).

«الشرق الأوسط» (واشنطن)
الولايات المتحدة​ رجل في وسط حرائق الغابات في ولاية كاليفورنيا الأميركية (أ.ف.ب)

حريق غابات ضخم يضرب كاليفورنيا (صور)

اضطر نحو 4 آلاف شخص إلى مغادرة منازلهم في كاليفورنيا بسبب حريق ضخم وعنيف.

«الشرق الأوسط» (كاليفورنيا)

الذكاء الاصطناعي... جيد في الفنون سيئ في الرياضيات

الذكاء الاصطناعي... جيد في الفنون سيئ في الرياضيات
TT

الذكاء الاصطناعي... جيد في الفنون سيئ في الرياضيات

الذكاء الاصطناعي... جيد في الفنون سيئ في الرياضيات

في العام الدراسي الذي انتهى أخيراً، برزت فئة من المتعلمين مثل لغز ظاهر للعيان... فئة من «المجتهدين»، الذين يتحسنون، ويتحدثون بوضوح بشكل ملحوظ. ولكن من الغريب أن هؤلاء «المتعلمين» - روبوتات الدردشة الذكية - غالباً ما يجاهدون أنفسهم مع الرياضيات.

الأشعار وليس الحساب

يمكن لروبوتات الدردشة مثل «تشات جي بي تي» من شركة «أوبن إيه آي» كتابة الشعر، وتلخيص الكتب والإجابة عن الأسئلة، غالباً بطلاقة على مستوى الإنسان.

كما يمكن لهذه الأنظمة إجراء العمليات في الرياضيات، بناءً على ما تعلمته. ولكن النتائج يمكن أن تختلف وتكون خاطئة، إذ يتم ضبط الأنظمة الذكية بدقة لتحديد الاحتمالات، وليس لإجراء حسابات قائمة على القواعد. إن الاحتمال ليس دقيقاً، كما أن اللغة أكثر مرونة وتسامحاً من الرياضيات.

متخصص فنون حرة لا في عبقرية الأرقام

قال كريستيان هاموند، أستاذ علوم الكومبيوتر وباحث الذكاء الاصطناعي في جامعة نورث وسترن: «تواجه روبوتات الدردشة الذكية صعوبة في الرياضيات لأنها لم تُصمم قط للقيام بذلك». يبدو أن أذكى علماء الكومبيوتر في العالم قد ابتكروا ذكاءً اصطناعياً أكثر تخصصاً في الفنون الحرة من عبقرية الأرقام.

في ظاهر الأمر، يبدو هذا بمثابة قطيعة حادة مع ماضي الحوسبة. فمنذ ظهور أجهزة الكومبيوتر المبكرة في أربعينات القرن العشرين، كان التعريف المختصر الجيد للحوسبة هو «الرياضيات القائمة على المنشطات». كانت أجهزة الكومبيوتر آلات حسابية لا تعرف الكلل وسريعة ودقيقة.

وكان تحليل الأرقام لفترة طويلة هو ما تجيده أجهزة الكومبيوتر حقاً، متجاوزة الأداء البشري بكثير. وتقليدياً، كانت أجهزة الكومبيوتر مبرمجة لاتباع قواعد خطوة بخطوة واسترجاع المعلومات في قواعد بيانات منظمة... كانت قوية ولكنها هشة. لذا، اصطدمت الجهود السابقة في مجال الذكاء الاصطناعي بحائط.

الشبكات العصبية

ومع ذلك، قبل أكثر من عقد من الزمان، اخترق نهج مختلف وبدأ في تحقيق مكاسب مذهلة.

التكنولوجيا الأساسية، التي تسمى الشبكة العصبية، مصممة بشكل فضفاض على غرار الدماغ البشري. إذ لا تتم برمجة هذا النوع من الذكاء الاصطناعي بقواعد صارمة، ولكنه يتعلم من خلال تحليل كميات هائلة من البيانات. إنه يولد اللغة، بناءً على كل المعلومات التي استوعبها، من خلال التنبؤ بالكلمة أو العبارة الأكثر احتمالاً أن تأتي بعد ذلك - تماماً كما يفعل البشر.

«هذه التكنولوجيا تقوم بأعمال رائعة، لكنها لا تفعل كل شيء»، كما قال هاموند. في بعض الأحيان، تعثرت روبوتات الدردشة بالذكاء الاصطناعي في حل مسائل حسابية وكلمات رياضية بسيطة تتطلب خطوات متعددة للوصول إلى حل، وهو أمر وثقه أخيراً بعض مراجعي التكنولوجيا.

وبينما تتحسن كفاءة الذكاء الاصطناعي، لكنها تظل تحمل العيوب. في حديثها في ندوة عقدت أخيراً، قدمت كريستين دي سيربو، كبيرة مسؤولي التعليم في أكاديمية خان، وهي مؤسسة تعليمية غير ربحية تجري تجارب على مدرس روبوت دردشة ومساعد تدريس بالذكاء الاصطناعي، موضوع دقة الرياضيات. قالت دي سيربو للمعلمين: «إنها مشكلة، كما يعلم الكثير منكم».

نظام «خانميغو» الذكي التعليمي

ذكاء اصطناعي يستعين بالآلة الحاسبة

قبل بضعة أشهر، أجرت أكاديمية خان تغييراً كبيراً على مدرسها المدعوم بالذكاء الاصطناعي، المسمى «خانميغو (Khanmigo)». يرسل العديد من المسائل الحسابية إلى برنامج الآلة الحاسبة بدلاً من مطالبة الذكاء الاصطناعي بحل مسائل الرياضيات. أثناء انتظار انتهاء برنامج الآلة الحاسبة، يرى الطلاب عبارة «إجراء العمليات الحسابية» على شاشاتهم وأيقونة «خانميغو» تهز رأسها.

قالت دي سيربو، التي تظل متفائلة بأن روبوتات الدردشة التفاعلية ستلعب دوراً مهماً في التعليم: «نحن في الواقع نستخدم أدوات مخصصة لإجراء العمليات الحسابية».

ولأكثر من عام، استخدم «تشات جي بي تي» حلًا مشابهاً لبعض مشاكل الرياضيات. إذ إنه يطلب المساعدة من برنامج الآلة الحاسبة لمهام مثل قسمة الأعداد الكبيرة والضرب.

قالت شركة «أوبن إيه آي»، في بيان، إن الرياضيات «مجال بحثي مستمر مهم»، وهو مجال أحرز فيه علماؤها تقدماً ثابتاً. وأضافت أن نسختها الجديدة من GPT حققت دقة تقرب من 64 في المائة على قاعدة بيانات عامة تضم آلاف المشكلات التي تتطلب الإدراك البصري والمنطق الرياضي. وهذا أعلى من 58 في المائة للإصدار السابق.

غالباً ما تتفوق روبوتات الدردشة التفاعلية عندما تستهلك كميات هائلة من بيانات التدريب ذات الصلة - الكتب المدرسية والتدريبات والاختبارات المعيارية. وقالت الشركة إن نسخة حديثة من التكنولوجيا التي تقوم عليها سجلت المرتبة 89 في اختبار SAT للرياضيات لطلاب المدارس الثانوية.

مناقشات حول توجهات المستقبل

يضيف الأداء غير المنتظم للتكنولوجيا في الرياضيات زخماً إلى نقاش حاد في مجتمع الذكاء الاصطناعي حول أفضل السبل للمضي قدماً في هذا المجال.

وعلى نطاق واسع، هناك معسكران. على الجانب الأول، هناك أولئك الذين يعتقدون أن الشبكات العصبية المتقدمة، المعروفة باسم نماذج اللغة الكبيرة، التي تدعم روبوتات الدردشة القائمة على الذكاء الاصطناعي، تشكل مساراً واحداً تقريباً للتقدم المطرد وفي نهاية المطاف إلى نظم «الذكاء الاصطناعي العام»، artificial general intelligence, AGI، وهو جهاز كومبيوتر يمكنه القيام بأي شيء يمكن للدماغ البشري القيام به. وهذه هي النظرة السائدة في كثير من أنحاء وادي السيليكون.

ولكنّ هناك متشككين يتساءلون عما إذا كان إضافة المزيد من البيانات وقوة الحوسبة إلى نماذج اللغة الكبيرة كافياً. ومن أبرز هؤلاء يان ليكون، كبير علماء الذكاء الاصطناعي في «ميتا». يقول ليكون إن نماذج اللغة الكبيرة تفتقر إلى المنطق وتفتقر إلى التفكير السليم. ويصر على أن المطلوب هو نهج أوسع، يسميه «نمذجة العالم (world modeling)»، أو أنظمة يمكنها تعلم كيفية عمل العالم مثلما يفعل البشر. وقد يستغرق الأمر عقداً من الزمان أو نحو ذلك لتحقيق ذلك.

قد تكون النماذج الحالية معيبة، لكنها لا تزال تفعل الكثير.

* خدمة «نيويورك تايمز».