الثقة في الوجوه المرسومة رقمياً تفوق الحقيقية

صور الذكاء الاصطناعي (S تكتسب مصداقية تفوق الحقيقية R) (المصدر: دورية «بروسيدنغ أوف ذا ناشيونال أكاديمي أوف ساينس»)
صور الذكاء الاصطناعي (S تكتسب مصداقية تفوق الحقيقية R) (المصدر: دورية «بروسيدنغ أوف ذا ناشيونال أكاديمي أوف ساينس»)
TT

الثقة في الوجوه المرسومة رقمياً تفوق الحقيقية

صور الذكاء الاصطناعي (S تكتسب مصداقية تفوق الحقيقية R) (المصدر: دورية «بروسيدنغ أوف ذا ناشيونال أكاديمي أوف ساينس»)
صور الذكاء الاصطناعي (S تكتسب مصداقية تفوق الحقيقية R) (المصدر: دورية «بروسيدنغ أوف ذا ناشيونال أكاديمي أوف ساينس»)

لا يستطيع الناس التمييز بين الوجه الناتج عن الذكاء الصناعي، باستخدام برنامج StyleGAN2 (ستايلغان 2) والوجه الحقيقي، وفق دراسة نشرتها أول من أمس، دورية «بروسيدنغ أوف ذا ناشيونال أكاديمي أوف ساينس».
وخلال الدراسة أجرت الدكتورة صوفي نايتنجيل من جامعة «لانكستر» البريطانية، والدكتور هاني فريد، من جامعة «كاليفورنيا» الأميركية، تجارب طُلب فيها من المشاركين تمييز أحدث الوجوه المركَّبة عن الوجوه الحقيقية ومستوى الثقة الذي تثيره الوجوه.
وكشفت النتائج أنّ الوجوه التي أُنشِئت صناعياً ليست فقط مجرد صور واقعية للغاية، لا يمكن تمييزها تقريباً عن الوجوه الحقيقية، ولكن يُحكم عليها أيضاً بأنّها أكثر جدارة بالثقة، وهو ما دفع بالباحثين للتحذير من تداعيات عدم قدرة الناس على تحديد الصور التي أُنشئت بواسطة الذكاء الصناعي.
وخلال التجارب التي تمت خلال الدراسة، صنّف 315 مشاركاً في التجربة الأولى، 128 وجهاً مأخوذاً من مجموعة تضمّ 800 وجه حقيقي أو مركَّب، وكان معدل دقة المشاركين 48%.
وفي تجربة ثانية، دُرِّب 219 مشاركاً جديداً وأُعطوا ملاحظات في كيفية تصنيف الوجوه، وصنّفوا 128 وجهاً مأخوذاً من المجموعة نفسها المكونة من 800 وجه، كما في التجربة الأولى، ولكن على الرغم من تدريبهم، تحسن معدل الدقة إلى 59% فقط. وقرر الباحثون معرفة ما إذا كانت التصورات عن الجدارة بالثقة يمكن أن تساعد الأشخاص في تحديد الصور الصناعية.
وطلبت تجربة ثالثة من 223 مشاركاً تقييم مصداقية 128 وجهاً مأخوذاً من نفس المجموعة المكونة من 800 وجه على مقياس من 1 (غير جدير بالثقة أبداً) إلى 7 (جدير بالثقة جداً).
وكان متوسط تصنيف الوجوه الصناعية 7.7% أكثر جدارة بالثقة من متوسط تصنيف الوجوه الحقيقية، وهي نسبة تعد ذات دلالة إحصائية.
وتقول صوفي نايتنجيل، الباحثة الرئيسية بالدراسة، في تقرير نشره الموقع الإلكتروني للجامعة بالتزامن مع نشر الدراسة: «ربما الأكثر إثارة للاهتمام، أنّنا نجد أنّ الوجوه التي أُنشئت صناعياً هي أكثر جدارة بالثقة من الوجوه الحقيقية».
ولحماية الجمهور من «التزييف العميق»، تقترح نايتنجيل، ضمانات لإنشاء الصور المركَّبة وتوزيعها، ويمكن أن تشمل الضمانات، على سبيل المثال، دمج علامات مائية قوية في شبكات تركيب الصور والفيديو التي من شأنها أن توفر آلية نهائية لتحديد الصور الموثوق بها.



الذكاء الصناعي يقرأ الأفكار وينصّها

فك تشفير إعادة بناء الكلام باستخدام بيانات مسح الرنين المغناطيسي (جامعة تكساس)
فك تشفير إعادة بناء الكلام باستخدام بيانات مسح الرنين المغناطيسي (جامعة تكساس)
TT

الذكاء الصناعي يقرأ الأفكار وينصّها

فك تشفير إعادة بناء الكلام باستخدام بيانات مسح الرنين المغناطيسي (جامعة تكساس)
فك تشفير إعادة بناء الكلام باستخدام بيانات مسح الرنين المغناطيسي (جامعة تكساس)

طُوّر جهاز فك ترميز يعتمد على الذكاء الصناعي، قادر على ترجمة نشاط الدماغ إلى نص متدفق باستمرار، في اختراق يتيح قراءة أفكار المرء بطريقة غير جراحية، وذلك للمرة الأولى على الإطلاق، حسب صحيفة «الغارديان» البريطانية.
وبمقدور جهاز فك الترميز إعادة بناء الكلام بمستوى هائل من الدقة، أثناء استماع الأشخاص لقصة ما - أو حتى تخيلها في صمت - وذلك بالاعتماد فقط على مسح البيانات بالتصوير بالرنين المغناطيسي الوظيفي فقط.
وجدير بالذكر أن أنظمة فك ترميز اللغة السابقة استلزمت عمليات زراعة جراحية. ويثير هذا التطور الأخير إمكانية ابتكار سبل جديدة لاستعادة القدرة على الكلام لدى المرضى الذين يجابهون صعوبة بالغة في التواصل، جراء تعرضهم لسكتة دماغية أو مرض العصبون الحركي.
في هذا الصدد، قال الدكتور ألكسندر هوث، عالم الأعصاب الذي تولى قيادة العمل داخل جامعة تكساس في أوستن: «شعرنا بالصدمة نوعاً ما؛ لأنه أبلى بلاءً حسناً. عكفت على العمل على هذا الأمر طيلة 15 عاماً... لذلك كان الأمر صادماً ومثيراً عندما نجح أخيراً».
ويذكر أنه من المثير في هذا الإنجاز أنه يتغلب على قيود أساسية مرتبطة بالتصوير بالرنين المغناطيسي الوظيفي، وترتبط بحقيقة أنه بينما يمكن لهذه التكنولوجيا تعيين نشاط الدماغ إلى موقع معين بدقة عالية على نحو مذهل، يبقى هناك تأخير زمني كجزء أصيل من العملية، ما يجعل تتبع النشاط في الوقت الفعلي في حكم المستحيل.
ويقع هذا التأخير لأن فحوصات التصوير بالرنين المغناطيسي الوظيفي تقيس استجابة تدفق الدم لنشاط الدماغ، والتي تبلغ ذروتها وتعود إلى خط الأساس خلال قرابة 10 ثوانٍ، الأمر الذي يعني أنه حتى أقوى جهاز فحص لا يمكنه تقديم أداء أفضل من ذلك.
وتسبب هذا القيد الصعب في إعاقة القدرة على تفسير نشاط الدماغ استجابة للكلام الطبيعي؛ لأنه يقدم «مزيجاً من المعلومات» منتشراً عبر بضع ثوانٍ.
ورغم ذلك، نجحت نماذج اللغة الكبيرة - المقصود هنا نمط الذكاء الصناعي الذي يوجه «تشات جي بي تي» - في طرح سبل جديدة. وتتمتع هذه النماذج بالقدرة على تمثيل المعنى الدلالي للكلمات بالأرقام، الأمر الذي يسمح للعلماء بالنظر في أي من أنماط النشاط العصبي تتوافق مع سلاسل كلمات تحمل معنى معيناً، بدلاً من محاولة قراءة النشاط كلمة بكلمة.
وجاءت عملية التعلم مكثفة؛ إذ طُلب من ثلاثة متطوعين الاستلقاء داخل جهاز ماسح ضوئي لمدة 16 ساعة لكل منهم، والاستماع إلى مدونات صوتية. وجرى تدريب وحدة فك الترميز على مطابقة نشاط الدماغ للمعنى باستخدام نموذج لغة كبير أطلق عليه «جي بي تي - 1»، الذي يعتبر سلف «تشات جي بي تي».