أداة ذكاء صناعي جديدة تبتكر وجوهاً بشرية

صور مختلقة تحمل مختلف الصفات الجسدية والعرقية

أداة ذكاء صناعي جديدة تبتكر وجوهاً بشرية
TT

أداة ذكاء صناعي جديدة تبتكر وجوهاً بشرية

أداة ذكاء صناعي جديدة تبتكر وجوهاً بشرية

في البداية، ظهرت تقنية التزييف «ديب فيكس» deepfakes التي تتيح لمستخدمها لصق وجه أحدهم على جسم أي شخصٍ آخر. بعدها، برزت تقنية «ذس بيرسون داز نات إكزيست» This Person Does Not Exist التي تبتكر أشخاصاً على أي موقع إلكتروني مع كلّ تحديثٍ تجرونه لتحميل الموقع. وأخيراً، حان دور «جينريتد فوتوز» Generated Photos، الموقع الذي يخزّن صوراً فوتوغرافية تجارية مصنوعة بكاملها من بشرٍ... ابتكرهم الذكاء الصناعي.

ابتكار صور البشر
يعدّ ابتكار بشرٍ بهيئة حقيقية من أكبر التحديات التي يواجهها الذكاء الصناعي البصري، ولكنّ الباحثين بدأوا يتقنون استخدام هذه التقنية بسرعة كبيرة. وجديد هذه التقنية يحمل اسم «جينريتد فوتوز» التي وصلت عائداتها إلى 15 ألف دولارٍ في الشهر من بيع مكتبة تحتوي على نماذج بشرية مبتكرة بالذكاء الصناعي. وأطلقت الشركة التي تقف خلف هذا الموقع أخيراً تحديثاً جديداً لا يتيح للمستخدم صناعة نسخة بشرية بمساعدة الذكاء الصناعي فحسب، بل يسمح له أيضاً بتحريكها.
يوفّر هذا التحديث ضوابط تحكّم سهلة الاستخدام ليتمكّن من جعل الشخص الذي صنعه يعبس، أو ينظر إلى اليسار، أو يرتدي النظّارات. وكما المصوّر الفوتوغرافي، يمكنكم الاستعانة بواجهة المستخدم المتوفّرة في الموقع لضبط الوضعية التي تريدونها للشخصية التي صنعتموها.

جوانب سلبية
يقول إيفان براون، مؤسس «جينريتد فوتوز»، إنّه يرى «منصّته كبرنامج فوتوشوب، ولكن لتعديل مشاهد وليس بيكسلات؛ لذا يجدر بالمستخدم أن يعتمد على أوامر عالية المستوى وكأنّه يتعامل مع طابعة بشرية».
لا شكّ في أنّ ابتكار أشخاص جدد ليس اقتراحاً مريحاً، لا سيّما أنّنا رأينا الكثير من الانتهاكات مع «ديب فيكس»، فقد تعرّض الكثير من المشاهير، وحتّى الأشخاص العاديين، إلى استغلال وجوههم ولصقها على محتوى غير لائق. ولكنّ «جينريتد فوتوز» لا يسمح لكم بنسخ شخصٍ آخر.
تسعى الشركة المطوّرة لهذه التقنية إلى حماية مستخدميها من الجوانب السلبية لهذا التطوّر وتجنّب حوادث سرقة الهوية الإلكترونية. قبل بضعة أشهر، أطلقت «جينريتد فوتوز» أداة أسمتها «أنونيمايزر» Anonymizer tool يمكنها نسخ صورتكم وصناعة نسخة منكم لا يمكن التعرّف عليها لاستخدامها على مواقع التواصل الاجتماعي وتفادي المراقبة. قد يكون للوجه الجديد نفس الشعر ولون البشرة، ولكن لن تزيّنه العينان كلتاهما، ولا الضحكة المميزة. بمعنى آخر، قد تكون هذه النسخة أقرب إلى قريبٍ يشبهكم وليس إلى أخٍ توأم. (يقول براون أيضاً، إنّه يتعاون مع وكالات الشرطة عند حاجتها إلى رصد وتحديد الصور المزيفة).

طريقة العمل
إذن، كيف تعمل الأداة الجديدة؟ تبدأون العمل بوجهٍ منتقى بشكل عشوائي. يمكنكم اختيار الجنس (رجلاً أو امرأة)، وتغيير وضعية الرأس من خلال جرّ قالبٍ خاص في الاتجاه الذي تريدون للشخص أن ينظر نحوه. بعدها، حدّدوا خياراتكم الأخرى من خلال النقر في المربعات وسحب الشرائح. يمكنكم تغيير لون البشرة والشعر، وجعل الشخص مشمئزاً أو حزيناً، وأن تضيفوا نظارات للقراءة أو ماكياج. يمكنكم حتّى أن تجعلوه أكبر أو أصغر سناً.
بعد الانتهاء، يمكنكم شراء ابتكاركم بصيغة عالية الدقّة لاستخدامه كما تشاؤون (وحتّى للاستعمال التجاري). وتُباع الوجوه ذات التصميم الخاص بثلاثة دولارات، ويحصل الزبون على خصم للطلبات الكبيرة.
يعتبر التنوّع مهمّاً بالنسبة لزبائن براون الذين يبحثون عن وجوهٍ مجهولة الهوية وقابلة للتعديل قد تكون مفيدة للشركات النّاشئة التي تريد وضع صورة إنسان على روبوت محادثة «تشات بوت»، أو حتّى لتسويق موقع مواعدة، دون إدراج الشخص الحقيقي. يدّعي براون أنّ لديه زبوناً في شركة تواصل اجتماعي بارزة تستخدم «جنريتد فوتوز» للمساعدة في تدريب الذكاء الصناعي على رصد الصور المزيفة. كما تحدّث عن شركة صينية لصناعة المواد الغذائية ابتكرت وجهاً بشرياً لتجنّب قوانين التغليف المطبّقة في البلاد.
ويضمّ زبائنه الآخرون باحثين يحتاجون إلى ابتكار وجوه جديدة لتدريب برامجهم الخاصّة بالذكاء الصناعي البصري، وباحثين أكاديميين يشترون الوجوه لاستخدامها في دراساتهم. للسيطرة على الانحياز الثقافي، أو لعزل متغيّر كخطوط الشعر، يمنح اختراع بعض البشر بمواصفات محدّدة الباحثين قدرة أكبر على التحكّم مقارنة بالصور الفوتوغرافية التقليدية.
شارك براون شهادات عدّة من زبائن من الدوائر الأكاديمية، اختلفت فيها حالات الاستخدام من تعليم مادّة حول شهادات شهود العيان في المحاكم الجنائية، إلى تدريب ذكاء صناعي بصري على التعرّف على وجوهٍ ترتدي أقنعة بشكلٍ خاطئ في عصر الجائحة.

صور حسب الأعراق
يقول براون، إنّه طوّر هذه المزايا التخصيصية في المنصّة بناءً على طلب الزبائن منذ اليوم الأوّل. عند انطلاقه عام 2019، قدّم الموقع قاعدة بيانات تحتوي على 10 آلاف نموذج من أصول عرقية متنوّعة، ولكنّها كانت جميعها شابّة بعمر 25 سنة تقريباً، بضحكة جذّابة، تنظر دائماً إلى الكاميرا.
يقول براون، إنّ «طلب أحد الزبائن كان: هل يمكنه التوقّف عن الابتسام لثانية واحدة حباً بالله؟»؛ لهذا السبب، وبعد ستّة أشهر من العمل، شهران منها لوضع الذكاء الصناعي في قلب الخدمة، طوّر الفريق البحثي المنتج الذي ترونه اليوم. جرّبته بنفسي ويمكنني القول، إنّه مثيرٌ جداً عندما يعمل. يشعرك أنّك صاحب قوّة خارقة لأنّك تصنع الإنسان الخاص بك. من النّادر جداً أن يستطيع المستخدم التحكّم بخوارزمية غامضة بهذه السهولة والدقّة.
ولكنّ الخدمة أصبحت أسوأ بسبب الانحرافات البصرية التي لم تكن موجودة في مكتبة الموقع قبل التحديث. يعود هذا الأمر إلى دفع هذه الأداة بقوّة أكبر بكثير مما كانت عليه قبلاً، وتغذيتها بزوايا أكثر تعقيداً للرأس وتسريحات الشعر. يقول براون، إنّ الأمر هو عبارة عن «توازن بين الانحراف والشّكل الموحّد»، مشيراً إلى أنّ أفواه وأنوف البشر سهلة المحاكاة؛ لأنّ معظم الأنوف متشابهة جداً. ولكن عندما يتعلّق الأمر بشيء كالشعر، لا يعود للمعايير أهميّة.
خلال تجربة الموقع، لاحظتُ أنّ الصور العائدة لأصحاب البشرة السوداء كانت بشعر أملس وكأنّه مصفّف بأداة خاصة، رغم أنّ شعور هؤلاء تكون عادة سميكة وكثيفة. لم أجد أي خصل مجعّدة أو سميكة أو جدائل. وعندما سألت إذا كان هذا الموضوع عابراً، وما إذا كانت نسقات البيانات التي يغلب عليها العرق الأبيض التي درّبت الذكاء الصناعي قد تكون هي المؤثّرة على تقديم الشخصيات ذات البشرة السوداء، أصرّ براون على أنّ الأمر ليس كذلك.
وأجاب بأنّ «المثير للسخرية هو أنّ هذه الحالة هي نتيجة الطلب المعاكس. راسلنا أشخاصٌ من البشرة السوداء يشكون من فبركة صور أشخاص بتسريحات شعر تنميطية، معتبرين أنّه يجب أن تتوفّر لدينا أنواع شعرٍ عديدة ومن بينها الشعر الأملس. لذا؛ فإن المبالغة في التفاعل مع هذا الطلب ربّما تكون هي المشكلة».
في جميع الأحوال، يستحقّ التحديث الجديد من «فيس جنرايتور» التجربة ولو للحصول على نظرة خاطفة على مستقبل أدوات الذكاء الصناعي. قبل خمس سنواتٍ مضت، كان احتمال ابتكار بشرٍ بهيئة حقيقية أشبه بأفلام الخيال العلمي. أمّا اليوم، فلم يصبح بإمكاننا صناعتها فحسب، بل يمكننا أن نطلب منها أن تأخذ وضعية معيّنة».
في خطوتها التالية، تعتزم «جنريتد فوتوز» السماح لمستخدميها وضع وجوههم على أجساد بشرية كاملة؛ ما سيساهم في توسيع سوق مخازن الصور من جهة، ويدفع الحرب على ما هو حقيقي إلى المزيد من الالتباس من جهة ثانية.
* موقع «فاست كومباني»
- خدمات «تريبيون ميديا»


مقالات ذات صلة

دراسة جديدة: نماذج الذكاء الاصطناعي اللغوية تفتقر لفهم حقيقي للعالم

تكنولوجيا بحسب الدراسة أظهرت نماذج الذكاء الاصطناعي أنها لا تتعلم بالفعل الحقائق الكامنة عن العالم (أدوبي)

دراسة جديدة: نماذج الذكاء الاصطناعي اللغوية تفتقر لفهم حقيقي للعالم

تشير دراسة حديثة إلى أن نماذج اللغة الكبيرة تفتقر إلى فهم حقيقي للعالم، إذ تتفوق في مهام ثابتة، لكنها تتعثر مع تغييرات بسيطة، ما يثير تساؤلات حول جدواها.

نسيم رمضان (لندن)
الاقتصاد زوار في جناح شركة «أميركان إكسبريس السعودية» بمؤتمر «سيمليس» للمدفوعات الرقمية بالرياض (الشركة) play-circle 01:34

«أميركان إكسبريس السعودية»: البنية التحتية المتطورة تدعم زيادة إنفاق السياح

يرى الرئيس التنفيذي لشركة «أميركان إكسبريس السعودية» أن البنية التحتية المتطورة للمدفوعات الرقمية بالسعودية وزيادة نقاط البيع تعززان إنفاق السيّاح.

عبير حمدي (الرياض)
تكنولوجيا ستحدد انتخابات 2024 كيفية تطوير التكنولوجيا وحماية خصوصية المستخدمين ومستوى التدخل الحكومي في ذلك القطاع (أدوبي)

كيف ستؤثر الانتخابات الرئاسية الأميركية على مستقبل التكنولوجيا؟

ستتأثر السياسات التكنولوجية بنتائج الانتخابات الأميركية بشكل كبير بسبب اختلاف رؤى كل مرشح حول تنظيم الذكاء الاصطناعي وخصوصية البيانات ومكافحة الاحتكار.

نسيم رمضان (لندن)
تكنولوجيا توفر «غاما» منصة ذكية لإنشاء العروض التقديمية بسرعة معتمدة على الذكاء الاصطناعي لتبسيط عملية التصميم (غاما)

كيف تسهّل منصة «غاما» العروض التقديمية عبر الذكاء الاصطناعي؟

يمكن الآن للمستخدمين تحويل أفكارهم إلى شرائح عرض احترافية وجاهزة في ثوانٍ، ودون عناء التنسيق اليدوي.

عبد العزيز الرشيد (الرياض)
خاص تستثمر «ساس» أكثر من مليار دولار في بحث وتطوير قدرات الذكاء الاصطناعي مع التركيز على السعودية كسوق رئيسية لها في المنطقة (شاترستوك)

خاص «ساس»: دمج البيانات الحقيقية والاصطناعية سيقود التحول الرقمي في السعودية

في حديث لـ«الشرق الأوسط»، تؤكد شركة «ساس» التزامها بدعم أهداف رؤية 2030 عبر استثمارات في البحث والتطوير لتعزيز قدرات الذكاء الاصطناعي.

نسيم رمضان (دبي)

دراسة جديدة: نماذج الذكاء الاصطناعي اللغوية تفتقر لفهم حقيقي للعالم

بحسب الدراسة أظهرت نماذج الذكاء الاصطناعي أنها لا تتعلم بالفعل الحقائق الكامنة عن العالم (أدوبي)
بحسب الدراسة أظهرت نماذج الذكاء الاصطناعي أنها لا تتعلم بالفعل الحقائق الكامنة عن العالم (أدوبي)
TT

دراسة جديدة: نماذج الذكاء الاصطناعي اللغوية تفتقر لفهم حقيقي للعالم

بحسب الدراسة أظهرت نماذج الذكاء الاصطناعي أنها لا تتعلم بالفعل الحقائق الكامنة عن العالم (أدوبي)
بحسب الدراسة أظهرت نماذج الذكاء الاصطناعي أنها لا تتعلم بالفعل الحقائق الكامنة عن العالم (أدوبي)

أظهرت نماذج اللغة الكبيرة (LLMs)، مثل النماذج التي يقوم عليها نموذج «GPT-4»، قدرات مذهلة في توليد النصوص، سواء أكان ذلك في كتابة الشعر، أو تأليف المقالات، حتى تقديم حلول برمجية. تُدرَّب هذه النماذج، المعتمدة على بنى معمارية متقدمة تُعرف باسم «المحوّلات» (Transformers)، على توقع تسلسل الكلمات، ما يمكّنها من الاستجابة للمطالبات بطرق تحاكي فهماً يشبه البشري. ومع ذلك، تشير أبحاث حديثة إلى أن هذه النماذج، على الرغم من قدراتها المثيرة للإعجاب، قد لا تتعلم بالفعل الحقائق الكامنة عن العالم.

خريطة لمدينة نيويورك الأميركية (أدوبي)

التنقل في مدينة نيويورك دون خريطة

في دراسة حديثة قادها آشِش رامباتشان، أستاذ مساعد في الاقتصاد وباحث في مختبر نظم المعلومات واتخاذ القرار بمعهد ماساتشوستس للتكنولوجيا (LIDS)، قام الباحثون باختبار مدى قدرة نموذج لغوي مبني على «المحوّلات» على التنقل في مدينة نيويورك. وبينما أظهر النموذج دقة عالية في تقديم توجيهات دقيقة خطوة فخطوة عبر شبكة شوارع المدينة، تراجع أداؤه بشكل كبير عندما تمت إضافة عراقيل مثل إغلاق بعض الشوارع والتحويلات.

وعندما حلّل الباحثون أنماط التنقل التي أنتجها النموذج، اكتشفوا أن «خرائط» مدينة نيويورك التي كوّنها النموذج كانت تحتوي على مسارات غير واقعية، مثل شوارع غير موجودة وروابط غير دقيقة بين تقاطعات متباعدة. هذا الاكتشاف أثار تساؤلات حول حدود هذه النماذج، خاصة في البيئات التي تتطلب دقة كبيرة.

التداعيات في العالم الحقيقي

تنطوي هذه القيود على تداعيات هامة. فعلى الرغم من أن نماذج الذكاء الاصطناعي تبدو قادرة على التعامل مع مهام معقدة، فإن أداءها قد يتراجع بشكل كبير عندما تتغير المتغيرات البيئية، ولو بشكل بسيط. على سبيل المثال، قد يتمكن النموذج من التنقل في خريطة ثابتة لمدينة نيويورك، لكنه يتعثر عند مواجهة تحديات غير متوقعة، مثل إغلاق الشوارع. ويحذر فريق البحث من أن استخدام هذه النماذج في تطبيقات حقيقية قد يؤدي إلى فشل غير متوقع إذا واجهت سيناريوهات خارجة عن بيانات التدريب.

لعبة «أوثيللو» هي لعبة ألواح استراتيجية يشارك فيها لاعبان يلعبان على لوح مقسم إلى 8 × 8 مربعات غير مختلفة اللون (أدوبي)

مقاييس لتقييم الفهم

لمزيد من التعمق في مدى قدرة نماذج الذكاء الاصطناعي على تكوين «نماذج للعالم»، أي تمثيلات داخلية للقواعد والهيكليات، طوّر الفريق مقياسين جديدين للتقييم، هما «تمييز التسلسل» و«ضغط التسلسل».

يقيس «تمييز التسلسل» قدرة النموذج على التمييز بين سيناريوهات مختلفة، مثل تمييز موضعين مختلفين على لوحة لعبة «أوثيللو». ويقيّم المقياس ما إذا كان النموذج يفهم أن مدخلات مختلفة تحمل دلالات مختلفة.

أما مقياس «ضغط التسلسل» فيقيّم قدرة النموذج على إدراك الحالات المتطابقة، مثل وضعين متطابقين على لوحة لعبة «أوثيللو»، ويفهم أن خطوات التحرك التالية من كل وضع يجب أن تكون متشابهة.

قام الفريق باختبار هذه المقاييس على فئة معينة من المسائل تشمل تسلسلاً محدداً من الحالات والقواعد، مثل التنقل في شبكة شوارع أو لعب «أوثيللو». من خلال هذه التقييمات، سعى الباحثون لفهم ما إذا كانت النماذج قد طوّرت بالفعل نماذج منطقية للعالم.

العشوائية قد تؤدي إلى فهم أعمق

كشف البحث عن نتيجة غير متوقعة، حيث أظهرت النماذج التي دربت على تسلسلات عشوائية قدرة أكبر على بناء نماذج داخلية دقيقة مقارنة بتلك التي دربت على بيانات منظمة. على سبيل المثال، في لعبة «أوثيللو»، كانت النماذج المدربة على حركات عشوائية قادرة على التعرف على جميع الحركات الممكنة، حتى الحركات غير المثلى التي لا يلجأ إليها اللاعبون المحترفون.

وأوضح كيون فافا، الباحث الرئيسي وأستاذ زائر في جامعة هارفارد، أنه «من الناحية النظرية، عندما يتم تدريب النموذج على حركات عشوائية، فإنه يرى مجموعة كاملة من الاحتمالات، بما في ذلك الخيارات غير المحتملة». ويبدو أن هذا التعرض الواسع «يساعد النموذج في تكوين نموذج أكثر دقة للعالم، وإن لم يلتزم بالأسلوب الأمثل».

ورغم هذه النتائج، لم يستطع أي من النماذج تكوين نموذج منطقي متكامل للعالم في مهمة التنقل. وعندما أضاف الباحثون تحويلات إلى خريطة نيويورك، فشلت جميع النماذج في التكيف. وأشار فافا إلى أن «التراجع في الأداء كان مفاجئاً؛ إغلاق واحد في المائة فقط من الشوارع تسبب في انخفاض الدقة بشكل حاد، من أداء شبه مثالي إلى 67 بالمائة فقط».

تراجع أداء نماذج الذكاء الاصطناعي بشكل كبير عندما تتغير المتغيرات البيئية ولو بشكل بسيط (أدوبي)

بناء نماذج للعالم موثوقة

تسلط نتائج هذه الدراسة الضوء على تحدٍ كبير، يتمثل في أنه عندما تبدو المحوّلات قادرة على أداء مهام معينة، فإنها قد تفتقر إلى الفهم الأساسي للقواعد. وشدّد رامباتشان على ضرورة الحذر، قائلاً: «غالباً ما يفترض الناس أنه بما أن هذه النماذج تحقق نتائج رائعة، فلا بد أنها طوّرت فهماً جوهرياً للعالم. لكن دراستنا تشير إلى أننا بحاجة إلى النظر في هذا الافتراض بعناية وعدم الاعتماد على الحدس فقط».

ويخطط الباحثون لتوسيع دراستهم لتشمل تحديات أكثر تعقيداً حيث قد تكون القواعد غير معروفة كلياً أو متغيرة. وباستخدام مقاييسهم التقييمية على هذه المجالات، يأملون في فهم حدود نماذج الذكاء الاصطناعي بشكل أفضل وتوجيه تطويرها في المستقبل.

تداعيات أوسع وأهداف مستقبلية

تتجاوز تداعيات هذا البحث فهم العالم الافتراضي، وتمس التطبيقات العملية. إذا كانت نماذج الذكاء الاصطناعي غير قادرة على تكوين نماذج داخلية دقيقة للعالم، فإن ذلك يثير تساؤلات حول استخدامها في مجالات تتطلب منطقاً دقيقاً، مثل القيادة الذاتية، والأبحاث العلمية، والتخطيط اللوجستي. ويقول الباحثون إن الحاجة ملحة لإعادة التفكير في كيفية تدريب هذه النماذج وتقييمها لتكون أكثر تكيفاً وموثوقية.

هذا البحث مدعوم من قبل عدة مؤسسات، بما في ذلك مبادرة علوم البيانات في جامعة هارفارد، ومؤسسة العلوم الوطنية، ومؤسسة ماك آرثر. سيتم عرض الدراسة في مؤتمر نظم معالجة المعلومات العصبية، حيث سيواصل الباحثون مناقشة تعقيدات نماذج الذكاء الاصطناعي واستكشاف مسارات جديدة لتطويرها.