نظم الذكاء الاصطناعي المولدة للصور تزيّف الحقائق

تعظّم أسوأ الجوانب النمطية للأعراق والأجناس

تظهر هذه الصور عند البحث عن كلمات (////// كلمات مثل) «أشخاص جذابون»
تظهر هذه الصور عند البحث عن كلمات (////// كلمات مثل) «أشخاص جذابون»
TT

نظم الذكاء الاصطناعي المولدة للصور تزيّف الحقائق

تظهر هذه الصور عند البحث عن كلمات (////// كلمات مثل) «أشخاص جذابون»
تظهر هذه الصور عند البحث عن كلمات (////// كلمات مثل) «أشخاص جذابون»

تميل أدوات الذكاء الاصطناعي المخصّصة للصور إلى إبراز الكليشيهات المزعجة: الأفارقة بدائيون، والأوروبيون علمانيون، والقادة رجال، والمساجين سود البشرة.

هذه الصور النمطية لا تعكس العالم الحقيقي؛ بل تنبع من البيانات التي تُمدّ وتدرَّب بها هذه التقنية، والتي تُسحب عادة من شبكة الإنترنت. وتتسم هذه البيانات بالسُميّة، حيث تمتلئ بالمحتوى الإباحي، وكراهية النساء، والعنف، والتعصّب.

هكذا ترى نماذج توليد الصور المدعومة بالذكاء الاصطناعي العالم. وفي موضوع كتبته كل من نتاشا تايكو، وكيفن شول، وتشو يو تشن، في «واشنطن بوست»، درست نماذج مثل «ستيبل ديفيوجن (Stable Diffusion)» و«دال - إي (DALL - E)».

صرّحت شركة «ستابيليتي إي آي» الشهيرة المطوّرة لنموذج توليد الصور «ستيبل ديفيوجن إكس إل» بأنّها نفذت استثمارات كبيرة لتخفيف الانحياز في أحدث نماذجها الذي أطلقته في يوليو (تموز) الماضي. ولكن، على الرغم من التحسينات، ظهر أن الأداة لا تزال تضخّم الصور النمطية الغربية.

ويحاجج كريستوف شوهمان؛ الشريك المؤسس لمنظّمة «لايون» غير الربحية التي تزوّد «ستيبل ديفيوجن» بالبيانات، بأنّ أدوات توليد الصور تعكس عالم السكّان البيض؛ لأنّ المنظّمات غير الربحية التي تزوّد شركات كثيرة بالبيانات لا تركّز في عملها على الصين والهند اللتين تضمّان أكبر شريحة سكانية من مستخدمي الشبكة.

وقال الكتاب إنهم عندما طلبوا من نموذج «ستيبل ديفيوجن إكس إل» توليد صور لمنازل في دولٍ مختلفة، أتت النتائج معبّرة عن النمطية السائدة عن كلّ بلد: منازل بأسقف كلاسيكية منحنية في الصين بدل الشقق العالية في شنغهاي؛ ومنازل مثالية بحدائق خضراء وشرفات عالية في الولايات المتحدة؛ وهياكل طينية مغبرة على طرقات غير نظيفة في الهند التي تحتضن 160 مليارديراً، ومومباي التي تحتلّ المرتبة الـ15 على لائحة أغنى مدن العالم.

ورأى شوهمان أنّ «هذه النتائج تعكس الصور النمطية العادية المحفوظة في رأس شخص عادي في أميركا الشمالية أو أوروبا. لا تحتاج إلى شهادة في علوم البيانات لتفهم هذا الأمر».

لا تنفرد «ستيبل ديفيوجن» في هذا الاتجاه؛ فقد صرّحت شركة «أوبن إي آي» في مستندات حديثة النشر بأنّ مولّد الصور الأخير الذي طوّرته «دال إي3»، «يميل نحو وجهة النظر الغربية بإنتاج صورٍ تظهر غالباً أشخاصاً بيض البشرة، ونساءً، وشباباً».

اليوم، تستطيع الصور الاصطناعية التي تنتشر على شبكة الإنترنت بثّ الحياة من جديد في صورٍ نمطية قديمة مسيئة، وتعيد أفكاراً مثالية منسية مرتبطة بصورة الجسد، والجندر، والعرق، إلى مستقبل صناعة الصورة.

مليارات الصور من الشبكة

وكما هي الحال مع «تشات جي بي تي»، تتعرّف أدوات الذكاء الاصطناعي لتوليد الصور على العالم عبر كميات ضخمة من بيانات التدريب. وبدل معالجة مليارات الكلمات، تقتات هذه النماذج على مليارات الصور والتوصيفات المرفقة بها المسحوبة من الشبكة أيضاً.

تزداد شركات التقنية تكتّماً على محتوى هذه الأنساق البيانية، ويعود هذا التكتّم في جزءٍ منه إلى خضوع هذا المحتوى غالباً لحقوق الملكية، أو افتقاره الدقّة، أو حتّى استعراضه مواد شائنة. ولكن يذكر أنّ شركتي «ستيبل ديفيوجن» و«لايون» تسمحان للجمهور باستكشاف تفاصيل النموذج؛ لأنّهما مشروعان مفتوحا المصدر.

ويقول عماد مشتاق، المدير التنفيذي في «ستابيليتي إي آي»، إنّ شركته ترى في الشفافية شرطاً أساسياً للتدقيق والقضاء على الانحياز، لافتاً إلى أنّها «تؤمن بأنّ النماذج مفتوحة المصدر ضرورية لتطبيق أعلى معايير السلامة، والعدل، والتمثيل».

انحياز لافت

شهد نموذج «ستيبل ديفيوجن إكس إل» تحسينات لافتة، إلا إن الكتاب نجحوا في حثّه على توليد فبركات عن العرق، والطبقة الاجتماعية، والجنس، والثروة، والذكاء، والدين، والثقافات الأخرى، من طلبات لتصوير نشاطات روتينية، وصفات شخصية شائعة، وأسماء بلاد أخرى. وفي أمثلة كثيرة، ظهرت التفاوتات العرقية في الصور أكثر تطرفاً ممّا هي عليه في العالم الحقيقي.

أظهر أحدث بيانات مكتب تعداد الولايات المتحدة من «مسح الدخل والمشاركة في البرامج» أنّ 63 في المائة من الحاصلين على المعونات الغذائية عام 2020 كانوا من بيض البشرة مقابل 27 في المائة من أصحاب البشرة السوداء. ولكن عندما حثّثنا التقنية على توليد صورة لشخص من متلقّي الخدمات الاجتماعية، عرضت النتيجة شخصاً من أصحاب البشرة الداكنة. وعندما طلبنا منها توليد صور «شخص منتج»، ظهر في جميع الصور رجال معظمهم من بيض البشرة، ويرتدون بدلات رسمية في وظائف إدارية.

وكانت براتيوشا كالوري، باحثة الذكاء الاصطناعي في جامعة ستانفورد، وفريقها قد اكتشفوا الخريف الماضي أنّ هذه الأدوات تتحوّل تلقائياً إلى الصور النمطية. فعندما طلبوا من إحداها توليد صورة «لشخص جذّاب»، أنتجت الأداة صوراً لأشخاص أوروبيين ببشرة وعيون فاتحة اللون؛ وعندما طلبوا صوراً «لعائلة سعيدة»، عرضت الأداة صور أشخاص بيض البشرة يضحكون مع أولادهم.

بيانات أنظف لنتائج أنظف

تركّز جهود تنظيف أدوات الذكاء الاصطناعي المخصصة للصور على تدخلات قليلة ولكن مثمرة: ترشيح أنساق البيانات، وترقية آخر مراحل التطوير، ووضع قواعد لحلّ مسائل أضرّت بسمعة الشركة.

ورأت ساشا لوتشيوني، العالمة الباحثة في «هاغينغ فيس»؛ وهي قاعدة مفتوحة المصدر للذكاء الاصطناعي وواحدة من الشركات الراعية لـ«لايون»، أنّ «ترشيح الأشياء السيئة من أنساق البيانات ليس حلاً سهلاً ونهائياً للانحياز».

وتقترح شركة «ستابيليتي إي آي» أن يكون لكلّ بلد مولّد محلّي للصور يعكس القيم الوطنية بأنساق بيانية توفّرها الحكومة والمؤسسات العامّة.

وينقسم خبراء مجال الذكاء الاصطناعي حول كيفية وضع حدٍّ للانحياز؛ فمثلاً ترى كالوري أنّ تخفيف الانحياز في الصور يختلف كلياً عمّا هو عليه في النصوص؛ لأنّ أيّ أمر حثّ لصناعة صورة واقعية لشخصٍ ما يجب أنّ يراعي قرارات تتعلّق بالعمر، والجسم، والعرق، والشعر، والخلفية والصفات المرئية، لافتةٍ إلى أنّ قلّة من هذه التعقيدات قابلة للحلّ بالتقنيات الكومبيوترية.

تعتقد كالوري أنّه من الضروري لأيّ شخص يتفاعل مع هذه التقنية أن يفهم كيف تعمل. وتشرح أنّ «هذه التقنيات هي نماذج تنبئيّة ترسم الأشياء بناءً على لقطة من نسق بياناتها المسحوبة من شبكة الإنترنت».

فشل استخدام أوامر حثّ مفصّلة في تخفيف هذا الانحياز أيضاً. فعندما طلبنا من الأداة فبركة صورة لشخصٍ ثري من دول مختلفة، تابعت «ستيبل ديفيوجن» إنتاج صورٍ مليئة بالنمطية: رجالٌ أفارقة يرتدون معاطف غربية واقفين أمام أكواخ من القش؛ ورجال «شرق أوسطيون» واقفين أمام جوامع قديمة؛ ورجال أوروبيون يرتدون بدلات أنيقة يتجوّلون في شوارع مرصوفة.

توكّد أبيبا بيرهاني، المستشارة البارزة المختصة في محاسبة الذكاء الاصطناعي في «موزيلّا فاونديشن»، أنّ الأدوات قابلة للتحسين إذا عملت الشركات بجدّ لتحسين البيانات، وهو أمرٌ غير متوقّع في رأيها. في الوقت الحالي؛ ترى المستشارة أنّ التأثير الأكبر لهذه الصور النمطية سيقع على المجموعات نفسها التي تأذّت في عصر التواصل الاجتماعي، مشدّدةً على أنّ «النّاس الذين يعيشون على هامش المجتمع سيبقون مستبعدين».

* يذكر أنّ جميع الصور الظاهرة في هذه القصة تعرض أموراً غير موجودة في العالم الحقيقي ووُلّدت باستخدام «ستيبل ديفيوجن»، وهو نموذج ذكاء اصطناعي مصمّم لتحويل النص إلى صورة


مقالات ذات صلة

محادثات «صريحة ومثمرة» أميركية ــ صينية

الولايات المتحدة​ وزيرا خارجية الصين وأميركا خلال لقائهما على هامش اجتماع «آسيان» في عاصمة لاوس فينتيان السبت (أ.ف.ب)

محادثات «صريحة ومثمرة» أميركية ــ صينية

أجرى وزير الخارجية الأميركي أنتوني بلينكن محادثات «صريحة ومثمرة» مع نظيره الصيني، وانغ يي، في لاوس أمس، على هامش اجتماع «آسيان»، أعرب خلالها عن مخاوف بلاده.

«الشرق الأوسط» (فينتيان (لاوس))
الولايات المتحدة​ جيمس دي فانس نائب المرشح الرئاسي الجمهوري دونالد ترمب في تجمع انتخابي بجامعة رادفورد في فرجينيا (أرشيفية - أ.ف.ب)

جمهوريون يتساءلون عمّا إذا كان اختيار ترمب لفانس ملائماً

لم تمض سوى أيام على اختيار جيمس دي فانس، نائباً للمرشح الجمهوري، الرئيس السابق دونالد ترمب، حتى بدأت الاعتراضات تتصاعد عن احتمال أن يكون هذا الاختيار خاطئاً.

إيلي يوسف (واشنطن)
الولايات المتحدة​ نائبة الرئيس الأميركي جو بايدن كامالا هاريس تتحدث للصحافة بعد اجتماعها مع رئيس الوزراء الإسرائيلي بنيامين نتنياهو (أ.ف.ب)

3 طرق أمام ترمب لإنهاء «شهر عسل» هاريس

تعيش كامالا هاريس «شهر عسل» بشكل ملحوظ، وقد لا يدوم طويلاً، فماذا سيفعل ترمب وحملته؟

«الشرق الأوسط» (واشنطن)
المشرق العربي الناطق الرسمي باسم الرئاسة الفلسطينية نبيل أبو ردينة (وكالة الأنباء الفلسطينية- وفا)

الرئاسة الفلسطينية: الإدارة الأميركية تتحمل مسؤولية المجازر اليومية بحق شعبنا

أعلن الناطق الرسمي باسم الرئاسة الفلسطينية، نبيل أبو ردينة، إن «الضوء الأخضر الذي حصل عليه بنيامين نتنياهو من الإدارة الأميركية جعله يستمر في عدوانه».

«الشرق الأوسط» (الضفة الغربية)
العالم وزير الخارجية الأميركي أنتوني بلينكن إلى جانب لنظيره الصيني وانغ يي في لاوس (أ.ب)

إشادة أميركية بمحادثات «صريحة وبناءة» مع الصين

أشادت الولايات المتحدة بالمحادثات «الصريحة والمثمرة» بين وزير خارجيتها أنتوني بلينكن ونظيره الصيني وانغ يي في لاوس اليوم (السبت).

«الشرق الأوسط» (واشنطن)

تعرف على مزايا الذكاء الاصطناعي المتقدم في هاتف «أوبو رينو12»

شاشة مقاومة للصدمات والخدوش بمستويات أداء متقدمة وتصميم أنيق
شاشة مقاومة للصدمات والخدوش بمستويات أداء متقدمة وتصميم أنيق
TT

تعرف على مزايا الذكاء الاصطناعي المتقدم في هاتف «أوبو رينو12»

شاشة مقاومة للصدمات والخدوش بمستويات أداء متقدمة وتصميم أنيق
شاشة مقاومة للصدمات والخدوش بمستويات أداء متقدمة وتصميم أنيق

تخيل هاتفاً يستطيع فتح عيون الأفراد في الصور بعد التقاطها وعيونهم مغمضة، مع قدرته على إزالة جميع الأفراد والعناصر المختلفة من خلفية الصور المهمة بضغطة زر واحدة دون الحاجة لتحديد أي من هذه العناصر.

ما رأيك بقدرته على التركيز على أوجه أكثر من شخص في الصور الجماعية، والتقاط الصورة بوضوح كامل لجميع الأوجه في الوقت نفسه؟

هل تريد هاتفاً يستطيع الاستماع إلى التسجيلات الصوتية وتحويلها إلى نصوص، ومن ثم تلخيصها وتحضير قوائم بالخطوات التالية وفق المحادثة؟

كل هذه المزايا أصبحت واقعاً بفضل تقنيات الذكاء الاصطناعي الجديدة، وذلك في هاتف «أوبو رينو12 5 جي (Oppo Reno12 5G)»، الذي سيتم إطلاقه في المنطقة العربية نهاية الأسبوع المقبل. وحضرت «الشرق الأوسط» فعالية الإطلاق في المنطقة العربية، ونذكر أبرز مزايا الذكاء الاصطناعي التي يقدمها.

ميزتا فتح العيون المغمضة وإزالة العناصر من الخلفية بتقنيات الذكاء الاصطناعي

قدرات مطورة للذكاء الاصطناعي

* ميزة «ممحاة الذكاء الاصطناعي (AI Eraser)». يقدم الهاتف هذه الميزة التي تزيل الغرباء العابرين في الصور بنقرة واحدة؛ بسبب قدراتها السريعة على التعرف تلقائياً على الأشخاص والعناصر غير المرغوب بها.

تحسين الصور الجماعية. يدعم الهاتف ميزتَين إضافيَّتين للذكاء الاصطناعي مصممتَين خصيصاً لتحسين الصور الجماعية، الأولى هي «الوجه الواضح (AI Clear Face)»، التي تركز على وجوه جميع الأفراد في الصورة، حتى البعيد منهم عن الكاميرا، وتقديم وضوح كبير من خلال استعادة التفاصيل عالية الدقة مثل محيط الوجه والشعر والحواجب.

وتدعم ميزة «الوجه الأفضل (AI Best Face)» التعرف تلقائياً على الأشخاص الذين ظهروا في الصور وقد رمشت عيونهم، لتستخدم تقنيات الذكاء الاصطناعي التوليدي لإصلاح الأمر، وجعلهم يظهرون بعيون مفتوحة وبواقعية كبيرة.

* ميزة «استوديو الذكاء الاصطناعي (AI Studio)». تقدم القدرة على إيجاد صور رمزية رقمية أو لوحات فنية من صورة واحدة فقط للمستخدم، بحيث يمكن للمستخدمين إظهار أنفسهم كأنهم رعاة بقر أو نجوم في قصص الرسومات اليابانية «مانغا»، وغير ذلك من إبداعات الذكاء الاصطناعي التوليدي.

* ميزة «صندوق أدوات الذكاء الاصطناعي (AI Toolbox)». وهي ميزة تتعلق بالإنتاجية والكفاءة، تعتمد على نموذج اللغة الكبير «Large Language Model LLM»، الخاص بمساعد الذكاء الاصطناعي «غوغل جيميناي (Gemini)»، التي تمثل إضافة جديدة إلى الشريط الجانبي الذكي، وتقوم بتعزيز إمكانات التعرف على محتوى صفحات الإنترنت وما يتم عرضه على الشاشة واقتراح وظائف مختلفة مرتبطة تعتمد على الذكاء الاصطناعي تشمل الإنشاء السريع لمحتوى منصات التواصل الاجتماعي وتلخيص محتوى المقالات الطويلة. ويدعم تطبيق تسجيل الصوتيات أداة «تلخيص التسجيلات المدعومة بالذكاء الاصطناعي (AI Recording Summary)» لتفريغ واستخراج الملخصات النصية من تسجيل صوتي وتنظيمها في نقاط، مع عرض قوائم المهام والأوقات والمواقع والتفاصيل الأخرى لتحسين مراجعتها بعد الانتهاء من التسجيل.

مقارنة مع هاتف «سامسونغ غالاكسي إس24 ألترا»

ولدى مقارنة هذه المزايا مع هاتف «سامسونغ غالاكسي إس24 ألترا» الذي يُعدّ من أول الهواتف التي دعّمت تقنيات الذكاء الاصطناعي بشكل متقدم في الهواتف الجوالة، نجد أن «رينو12» يتفوق في وظائف التصوير الذكية، حيث يدعم مجموعة واسعة من الوظائف التي تشمل فتح عيون المستخدمين بعد التصوير، وحذف عناصر عدة غير مرغوبة في الخلفية بضغطة زر واحدة، إلى جانب القدرة على التركيز على جميع الأوجه في الصورة وجعلها أكثر وضوحاً.

ومن جهته يدعم «غالاكسي إس24 ألترا» وظيفة اختيار عنصر ما من الصورة الملتقطة وتكبيره أو تصغيره وحده فقط، ليقوم الذكاء الاصطناعي بتعديل المحتوى المحيط بذلك العنصر بشكل يجعل الصورة تظهر طبيعية للغاية، مع قدرته على تدوير الصور في أثناء تحريرها من خلال وظيفة «مساعد التصوير (Photo Assist)»، ليقوم الذكاء الاصطناعي بملء الفراغات الموجودة في الزوايا بشكل يتناسق مع محتوى الصورة.

كما يتفوق «رينو12» في القدرة على تفريغ التسجيلات الصوتية وتلخيصها وإضافة المهام التي يجب القيام بها في قوائم خاصة.

ويتعادل الهاتفان في القدرة على تلخيص الملاحظات النصية واختيار أسلوب كتابة نصوص محتوى الشبكات الاجتماعية ليقوم التطبيق بتعديل طول الجملة وأسلوب كتابتها، بينما يقدم «غالاكسي إس24 ألترا» القدرة على الترجمة المباشرة للمحادثات الهاتفية (Live Translation) بدعم للغة الغربية على شكل تحديث تم طرحه بعد إطلاق الهاتف بداية العام الحالي. ولكن بعد تجربة هذه الميزة، لم يستطع الهاتف ترجمة المحادثات من اللغة العربية إلى الإنجليزية بشكل دقيق، وكانت النتائج متوسطة في بعض الأحيان وغير صحيحة في أحيان أخرى، وقد يتطلب هذا الأمر مزيداً من التطوير والتحديث لرفع جودة الترجمة من اللغة العربية إلى اللغات الأخرى. هذا، ويدعم الهاتف ميزة البحث بالضغط على زر الدائرة، بحيث يبحث في الإنترنت عن عنصر ما في الصورة بمجرد تحديده بإصبع المستخدم.

مواصفات تقنية

يبلغ قطر شاشة الهاتف 6.7 بوصة، وهي تعرض الصورة بدقة 2412x1080 وبكثافة 394 بكسل في البوصة وبتقنية AMOLED التي تعرض أكثر من مليار لون بتردد 120 هرتز وبدعم لتقنية HDR10 Plus وبشدة سطوع تبلغ 1200 شمعة، مع مقاومة الخدوش بشكل كبير. واستعرضت الشركة تجربة تشغيل مثقب على الشاشة والضغط عليها، لتقاوم تلك العملية وتستمر الشاشة بالعمل دون أي ضرر أو ظهور أي خدوش.

ويقدم الهاتف مصفوفة كاميرات خلفية ثلاثية بدقة 50 و8 و2 ميغابكسل (للصور عالية الوضوح وبزوايا عريضة وللصور البعيدة) مع استخدام مستشعر Sony LYT-600 فائق الجودة، إلى جانب تقديم كاميرا أمامية بدقة 32 ميغابكسل للصور الذاتية والمكالمات المرئية. ويأتي الهاتف مزوداً بميزة Flash Snapshot التي تضبط عملية التعريض الضوئي للكاميرا والتقاط الإضاءة الواقعية وألوان البشرة بشكل أكثر دقة.

ويعمل الهاتف بمعالج «ميدياتيك دايمنستي 7300-إنيرجي» الجديد ثماني النوى (4 نوى بسرعة 2.5 غيغاهرتز و4 نوى بسرعة 2 غيغاهرتز) بدقة التصنيع 4 نانومتر، ويقدم 12 غيغابايت من الذاكرة التي يمكن توسعتها بـ12 غيغابايت إضافية باستخدام السعة التخزينية المدمجة، مع تقديم 512 غيغابايت من السعة التخزينية المدمجة. وتبلغ شحنة البطارية 5000 ملي أمبير - ساعة ويمكن شحنها بقدرة 80 واط من 0 إلى 32 في المائة في خلال 10 دقائق أو بالكامل في 46 دقيقة فقط.

هذا، ويدعم الجهاز تقنية «لينك بوست (LinkBoost )» المدعومة بالذكاء الاصطناعي التي تضمن تحسين زمن استجابة الشبكة في المناطق ذات الإشارة الضعيفة أو الشبكات المزدحمة، وتعزيز التبديل السلس بين شبكات «واي فاي» وشبكة الاتصالات، وتسريع استعادة الإشارة عند الخروج من المصاعد أو مرآب السيارة. كما يدعم الجهاز تقنيات «واي فاي» a وb وg وn وac وax و«بلوتوث 5.4» اللاسلكية وهو مقاوم للمياه والغبار وفقاً لمعيار IP65، ويعمل بنظام التشغيل «آندرويد 14» وواجهة الاستخدام «كالار أو إس 14.1».

وتبلغ سماكة الهاتف 7.6 مليمتر ويبلغ وزنه 177 غراماً، ويبلغ سعره 1799 ريالاً سعودياً (نحو 479 دولاراً أميركياً)، وهو متوافر في المنطقة العربية باللونين الفضي والبني بدءاً من 1 أغسطس (آب) المقبل.