نظم الذكاء الاصطناعي المولدة للصور تزيّف الحقائق

تعظّم أسوأ الجوانب النمطية للأعراق والأجناس

تظهر هذه الصور عند البحث عن كلمات (////// كلمات مثل) «أشخاص جذابون»
تظهر هذه الصور عند البحث عن كلمات (////// كلمات مثل) «أشخاص جذابون»
TT

نظم الذكاء الاصطناعي المولدة للصور تزيّف الحقائق

تظهر هذه الصور عند البحث عن كلمات (////// كلمات مثل) «أشخاص جذابون»
تظهر هذه الصور عند البحث عن كلمات (////// كلمات مثل) «أشخاص جذابون»

تميل أدوات الذكاء الاصطناعي المخصّصة للصور إلى إبراز الكليشيهات المزعجة: الأفارقة بدائيون، والأوروبيون علمانيون، والقادة رجال، والمساجين سود البشرة.

هذه الصور النمطية لا تعكس العالم الحقيقي؛ بل تنبع من البيانات التي تُمدّ وتدرَّب بها هذه التقنية، والتي تُسحب عادة من شبكة الإنترنت. وتتسم هذه البيانات بالسُميّة، حيث تمتلئ بالمحتوى الإباحي، وكراهية النساء، والعنف، والتعصّب.

هكذا ترى نماذج توليد الصور المدعومة بالذكاء الاصطناعي العالم. وفي موضوع كتبته كل من نتاشا تايكو، وكيفن شول، وتشو يو تشن، في «واشنطن بوست»، درست نماذج مثل «ستيبل ديفيوجن (Stable Diffusion)» و«دال - إي (DALL - E)».

صرّحت شركة «ستابيليتي إي آي» الشهيرة المطوّرة لنموذج توليد الصور «ستيبل ديفيوجن إكس إل» بأنّها نفذت استثمارات كبيرة لتخفيف الانحياز في أحدث نماذجها الذي أطلقته في يوليو (تموز) الماضي. ولكن، على الرغم من التحسينات، ظهر أن الأداة لا تزال تضخّم الصور النمطية الغربية.

ويحاجج كريستوف شوهمان؛ الشريك المؤسس لمنظّمة «لايون» غير الربحية التي تزوّد «ستيبل ديفيوجن» بالبيانات، بأنّ أدوات توليد الصور تعكس عالم السكّان البيض؛ لأنّ المنظّمات غير الربحية التي تزوّد شركات كثيرة بالبيانات لا تركّز في عملها على الصين والهند اللتين تضمّان أكبر شريحة سكانية من مستخدمي الشبكة.

وقال الكتاب إنهم عندما طلبوا من نموذج «ستيبل ديفيوجن إكس إل» توليد صور لمنازل في دولٍ مختلفة، أتت النتائج معبّرة عن النمطية السائدة عن كلّ بلد: منازل بأسقف كلاسيكية منحنية في الصين بدل الشقق العالية في شنغهاي؛ ومنازل مثالية بحدائق خضراء وشرفات عالية في الولايات المتحدة؛ وهياكل طينية مغبرة على طرقات غير نظيفة في الهند التي تحتضن 160 مليارديراً، ومومباي التي تحتلّ المرتبة الـ15 على لائحة أغنى مدن العالم.

ورأى شوهمان أنّ «هذه النتائج تعكس الصور النمطية العادية المحفوظة في رأس شخص عادي في أميركا الشمالية أو أوروبا. لا تحتاج إلى شهادة في علوم البيانات لتفهم هذا الأمر».

لا تنفرد «ستيبل ديفيوجن» في هذا الاتجاه؛ فقد صرّحت شركة «أوبن إي آي» في مستندات حديثة النشر بأنّ مولّد الصور الأخير الذي طوّرته «دال إي3»، «يميل نحو وجهة النظر الغربية بإنتاج صورٍ تظهر غالباً أشخاصاً بيض البشرة، ونساءً، وشباباً».

اليوم، تستطيع الصور الاصطناعية التي تنتشر على شبكة الإنترنت بثّ الحياة من جديد في صورٍ نمطية قديمة مسيئة، وتعيد أفكاراً مثالية منسية مرتبطة بصورة الجسد، والجندر، والعرق، إلى مستقبل صناعة الصورة.

مليارات الصور من الشبكة

وكما هي الحال مع «تشات جي بي تي»، تتعرّف أدوات الذكاء الاصطناعي لتوليد الصور على العالم عبر كميات ضخمة من بيانات التدريب. وبدل معالجة مليارات الكلمات، تقتات هذه النماذج على مليارات الصور والتوصيفات المرفقة بها المسحوبة من الشبكة أيضاً.

تزداد شركات التقنية تكتّماً على محتوى هذه الأنساق البيانية، ويعود هذا التكتّم في جزءٍ منه إلى خضوع هذا المحتوى غالباً لحقوق الملكية، أو افتقاره الدقّة، أو حتّى استعراضه مواد شائنة. ولكن يذكر أنّ شركتي «ستيبل ديفيوجن» و«لايون» تسمحان للجمهور باستكشاف تفاصيل النموذج؛ لأنّهما مشروعان مفتوحا المصدر.

ويقول عماد مشتاق، المدير التنفيذي في «ستابيليتي إي آي»، إنّ شركته ترى في الشفافية شرطاً أساسياً للتدقيق والقضاء على الانحياز، لافتاً إلى أنّها «تؤمن بأنّ النماذج مفتوحة المصدر ضرورية لتطبيق أعلى معايير السلامة، والعدل، والتمثيل».

انحياز لافت

شهد نموذج «ستيبل ديفيوجن إكس إل» تحسينات لافتة، إلا إن الكتاب نجحوا في حثّه على توليد فبركات عن العرق، والطبقة الاجتماعية، والجنس، والثروة، والذكاء، والدين، والثقافات الأخرى، من طلبات لتصوير نشاطات روتينية، وصفات شخصية شائعة، وأسماء بلاد أخرى. وفي أمثلة كثيرة، ظهرت التفاوتات العرقية في الصور أكثر تطرفاً ممّا هي عليه في العالم الحقيقي.

أظهر أحدث بيانات مكتب تعداد الولايات المتحدة من «مسح الدخل والمشاركة في البرامج» أنّ 63 في المائة من الحاصلين على المعونات الغذائية عام 2020 كانوا من بيض البشرة مقابل 27 في المائة من أصحاب البشرة السوداء. ولكن عندما حثّثنا التقنية على توليد صورة لشخص من متلقّي الخدمات الاجتماعية، عرضت النتيجة شخصاً من أصحاب البشرة الداكنة. وعندما طلبنا منها توليد صور «شخص منتج»، ظهر في جميع الصور رجال معظمهم من بيض البشرة، ويرتدون بدلات رسمية في وظائف إدارية.

وكانت براتيوشا كالوري، باحثة الذكاء الاصطناعي في جامعة ستانفورد، وفريقها قد اكتشفوا الخريف الماضي أنّ هذه الأدوات تتحوّل تلقائياً إلى الصور النمطية. فعندما طلبوا من إحداها توليد صورة «لشخص جذّاب»، أنتجت الأداة صوراً لأشخاص أوروبيين ببشرة وعيون فاتحة اللون؛ وعندما طلبوا صوراً «لعائلة سعيدة»، عرضت الأداة صور أشخاص بيض البشرة يضحكون مع أولادهم.

بيانات أنظف لنتائج أنظف

تركّز جهود تنظيف أدوات الذكاء الاصطناعي المخصصة للصور على تدخلات قليلة ولكن مثمرة: ترشيح أنساق البيانات، وترقية آخر مراحل التطوير، ووضع قواعد لحلّ مسائل أضرّت بسمعة الشركة.

ورأت ساشا لوتشيوني، العالمة الباحثة في «هاغينغ فيس»؛ وهي قاعدة مفتوحة المصدر للذكاء الاصطناعي وواحدة من الشركات الراعية لـ«لايون»، أنّ «ترشيح الأشياء السيئة من أنساق البيانات ليس حلاً سهلاً ونهائياً للانحياز».

وتقترح شركة «ستابيليتي إي آي» أن يكون لكلّ بلد مولّد محلّي للصور يعكس القيم الوطنية بأنساق بيانية توفّرها الحكومة والمؤسسات العامّة.

وينقسم خبراء مجال الذكاء الاصطناعي حول كيفية وضع حدٍّ للانحياز؛ فمثلاً ترى كالوري أنّ تخفيف الانحياز في الصور يختلف كلياً عمّا هو عليه في النصوص؛ لأنّ أيّ أمر حثّ لصناعة صورة واقعية لشخصٍ ما يجب أنّ يراعي قرارات تتعلّق بالعمر، والجسم، والعرق، والشعر، والخلفية والصفات المرئية، لافتةٍ إلى أنّ قلّة من هذه التعقيدات قابلة للحلّ بالتقنيات الكومبيوترية.

تعتقد كالوري أنّه من الضروري لأيّ شخص يتفاعل مع هذه التقنية أن يفهم كيف تعمل. وتشرح أنّ «هذه التقنيات هي نماذج تنبئيّة ترسم الأشياء بناءً على لقطة من نسق بياناتها المسحوبة من شبكة الإنترنت».

فشل استخدام أوامر حثّ مفصّلة في تخفيف هذا الانحياز أيضاً. فعندما طلبنا من الأداة فبركة صورة لشخصٍ ثري من دول مختلفة، تابعت «ستيبل ديفيوجن» إنتاج صورٍ مليئة بالنمطية: رجالٌ أفارقة يرتدون معاطف غربية واقفين أمام أكواخ من القش؛ ورجال «شرق أوسطيون» واقفين أمام جوامع قديمة؛ ورجال أوروبيون يرتدون بدلات أنيقة يتجوّلون في شوارع مرصوفة.

توكّد أبيبا بيرهاني، المستشارة البارزة المختصة في محاسبة الذكاء الاصطناعي في «موزيلّا فاونديشن»، أنّ الأدوات قابلة للتحسين إذا عملت الشركات بجدّ لتحسين البيانات، وهو أمرٌ غير متوقّع في رأيها. في الوقت الحالي؛ ترى المستشارة أنّ التأثير الأكبر لهذه الصور النمطية سيقع على المجموعات نفسها التي تأذّت في عصر التواصل الاجتماعي، مشدّدةً على أنّ «النّاس الذين يعيشون على هامش المجتمع سيبقون مستبعدين».

* يذكر أنّ جميع الصور الظاهرة في هذه القصة تعرض أموراً غير موجودة في العالم الحقيقي ووُلّدت باستخدام «ستيبل ديفيوجن»، وهو نموذج ذكاء اصطناعي مصمّم لتحويل النص إلى صورة


مقالات ذات صلة

أميركا تعتزم مقاطعة مراسم تأبين ستقام في الأمم المتحدة للرئيس الإيراني

شؤون إقليمية يقف دبلوماسيون يحضرون اجتماع الجمعية العامة دقيقة صمتاً على أرواح قتلى حادث تحطم طائرة الرئيس الإيراني (إ.ب.أ)

أميركا تعتزم مقاطعة مراسم تأبين ستقام في الأمم المتحدة للرئيس الإيراني

قال مسؤول أميركي إن الولايات المتحدة تعتزم مقاطعة مراسم تأبين ستنظمها الأمم المتحدة، اليوم (الخميس) للرئيس الإيراني إبراهيم رئيسي الذي لقي حتفه في تحطم مروحيته.

«الشرق الأوسط» (واشنطن)
الولايات المتحدة​ الرئيس الأميركي السابق دونالد ترمب (رويترز)

ترمب: الأم تيريزا لم تكن لتتغلب على التهم الموجهة إليّ

قال الرئيس الأميركي السابق دونالد ترمب إن «الأم تيريزا لم تكن لتتمكن من التغلب على الاتهامات» الموجهة إليه في محاكمته الأخيرة.

«الشرق الأوسط» (واشنطن)
الولايات المتحدة​ الملياردير إيلون ماسك والرئيس الأميركي السابق دونالد ترمب (أ.ب)

تقرير: إيلون ماسك قد ينضم لإدارة ترمب في حال فوزه بالانتخابات المقبلة

ذكر تقرير صحافي أن الرئيس الأميركي السابق دونالد ترمب أجرى مكالمات هاتفية عدة مع الملياردير إيلون ماسك لمناقشة إمكانية تولي الأخير دوراً استشارياً في إدارته.

«الشرق الأوسط» (واشنطن)
شمال افريقيا الفريق عبد البرهان في زيارة إلى أحد المستشفيات في ولاية القضارف يوم 10 أبريل (أ.ف.ب)

معسكر البرهان يرفض «العودة القسرية» إلى المفاوضات

أعلن «مجلس السيادة» السوداني رفضه القاطع للعودة «القسرية» إلى المفاوضات مع «قوات الدعم السريع» في سياق رده على طلب أميركي وجه إلى رئيس المجلس الفريق البرهان.

أحمد يونس (أديس ابابا) علي بردى (واشنطن)
الولايات المتحدة​ وزير الخارجية الأميركي أنتوني بلينكن (رويترز)

بلينكن: إسرائيل بحاجة إلى خطة لمرحلة ما بعد الحرب «في أسرع وقت»

شدّد وزير الخارجية الأميركي أنتوني بلينكن، اليوم (الأربعاء)، على أن إسرائيل بحاجة لوضع خطة لمرحلة ما بعد الحرب في غزة «في أسرع وقت ممكن».

«الشرق الأوسط» (كيشيناو)

سماعات رأس مانعة للضوضاء تسمعك ما تريده بذكاء

عزز الباحثون سماعات إلغاء الضوضاء بشبكة عصبية تعتمد على الهاتف الذكي لتحديد الأصوات المحيطة والحفاظ عليها مع تصفية كل شيء آخر (شاترستوك)
عزز الباحثون سماعات إلغاء الضوضاء بشبكة عصبية تعتمد على الهاتف الذكي لتحديد الأصوات المحيطة والحفاظ عليها مع تصفية كل شيء آخر (شاترستوك)
TT

سماعات رأس مانعة للضوضاء تسمعك ما تريده بذكاء

عزز الباحثون سماعات إلغاء الضوضاء بشبكة عصبية تعتمد على الهاتف الذكي لتحديد الأصوات المحيطة والحفاظ عليها مع تصفية كل شيء آخر (شاترستوك)
عزز الباحثون سماعات إلغاء الضوضاء بشبكة عصبية تعتمد على الهاتف الذكي لتحديد الأصوات المحيطة والحفاظ عليها مع تصفية كل شيء آخر (شاترستوك)

توفر سماعات الرأس المانعة للضوضاء واحة من الصمت وسط ضجيج الحياة اليومية. تم تصميم هذه الأجهزة لحجب الضوضاء المحيطة ما يوفر للمستخدمين أجواء هادئة للعمل أو الاسترخاء. لكن تقنية إلغاء الضوضاء التقليدية لا تفرق في كثير من الأحيان بين الضوضاء الخلفية والأصوات المهمة، مما قد يؤدي إلى فصل المستخدمين عن بيئاتهم سمعياً.

يحاول شيام غولاكوتا، وهو باحث من جامعة واشنطن وأحد رواد دمج الذكاء الاصطناعي مع معالجة الصوت، إحداث تغيير في تجربتنا مع الصوت. طور فريق غولاكوتا نظاماً مبتكراً لا يقلل الضوضاء فحسب، بل يختار أيضاً بذكاء الأصوات التي يسمح بمرورها عبر السماعات.

ويوضح غولاكوتا التطبيق العملي لنظامه من خلال سيناريو بسيط. يقول إنه «يجب عليك تخيّل أنك في حديقة تستمتع بتغريد الطيور الهادئ، ولكنك منزعج بسبب محادثة عالية في مكان قريب. تسمح تقنيتنا لسماعات الرأس بعزل أصوات الطيور وتحسينها مع التقليل من الثرثرة المزعجة».

تولد سماعات الرأس موجات صوتية تكون سلبية (أو معكوسة) تماما للضوضاء الواردة وتسمى هذه العملية «التدخل المدمر» (شاترستوك)

طريقة التعرف على الصوت

يستخدم هذا النظام المتقدم شبكة عصبية تعتمد على الهاتف الذكي قادرة على التعرف على 20 صوتاً بيئياً مختلفاً، مثل المنبهات، وبكاء الأطفال، وأبواق السيارات، وصفارات الإنذار، وزقزقة العصافير. يمكن للمستخدمين تحديد الأصوات التي يرغبون في التركيز عليها، ويقوم النظام ديناميكياً بتصفية وتضخيم هذه الأصوات المحددة في الوقت الفعلي، مما يؤدي بشكل فعال إلى كتم جميع الضوضاء غير المرغوب فيها.

ويوضح غولاكوتا أن التحدي الذي واجه فريق العمل هو ابتكار طريقة للتعرف بدقة على الأصوات المختلفة في البيئة ثم عزل الأصوات المرغوبة عن الضوضاء. وذكر أنه كان من المهم أن يتم تسليم الأصوات المعالجة دون تأخير لضمان توافقها مع الإشارات البصرية في البيئة.

تعالج الخوارزميات المتقدمة الأصوات الخارجية في الوقت الفعلي وتنتج إشارات مضادة للضوضاء (شاترستوك)

خوارزمية لفهم الكلام

ركز فريق غولاكوتا بشكل خاص على تعزيز فهم الكلام في البيئات الصاخبة. يمكن للخوارزمية الخاصة بهم تحديد صوت متحدث معين وسط ضجيج الخلفية، مما يتيح إجراء محادثات أكثر وضوحاً وتركيزاً. تعتبر هذه الميزة مفيدة بشكل خاص في الأماكن المزدحمة حيث قد يكون التركيز على محادثة واحدة أمراً صعباً.

ومع تقدم المشروع، يتصور غولاكوتا فئة جديدة من أجهزة السمع الذكية تسمى بالأجهزة السمعية التي لا تحمي المستخدمين من الضوضاء فحسب، بل تعزز أيضاً تفاعلهم السمعي مع العالم. ويعد الباحث الأميركي أنه على وشك إنشاء أجهزة سمعية مستقبلية يمكنها زيادة قدرات السمع البشرية وتحسين نوعية الحياة بشكل كبير من خلال تكامل الذكاء الاصطناعي المتقدم.

حقائق

1920 العام الذي نشأت فيه

فكرة استخدام الموجات الصوتية لإلغاء الضوضاء إذ وضع عالم فيزياء بريطاني يُدعى هيو ألكسندر ماكدونالد نظرية حول إمكانية إلغاء الضوضاء النشطة. ويعود الفضل للدكتور لورانس جيروم فوغل الذي أنشأ، في الخمسينات من القرن الماضي، نظام إلغاء الضوضاء النشط المصمم لسماعات الطيران. ولم يصبح النموذج تجارياً إلا في الثمانيات.

لا تمثل مبادرة فريق البحث الأميركي هذه قفزة كبيرة في تكنولوجيا الصوت فحسب، بل تقدم أيضاً لمحة عن المستقبل حيث تتكامل التكنولوجيا بسلاسة مع الإدراك البشري لتعزيز حياتنا اليومية. ومع استمرار الفريق في تحسين التكنولوجيا وتوسيعها، فإن التطبيقات المحتملة في مختلف البيئات الصاخبة تجعل هذا الحل القائم على الذكاء الاصطناعي يغير قواعد اللعبة في الأجهزة الصوتية الشخصية.