اكتسبت كاميرات الهواتف الذكية قوّة كبيرة في السنوات الخمس الماضية، وحقّقت قفزة على مستوى النوعية، مدفوعة بشكلٍ كبير بالتطوّرات التي شهدها مجال التصوير الفوتوغرافي الحاسوبي، أي التقنية التي تستخدم الخوارزميات، والذكاء الاصطناعي، وأجهزة الاستشعار، لإنتاج صورٍ واضحة وواقعية. نعم، لقد أصبح بإمكاننا جميعاً اليوم أن نلتقط صوراً رائعة تنافس عمل المحترفين.
زيف الصور
وماذا بعدُ؟ الحقيقة الصعبة أن الصور أضحت أكثر زيفاً.
بدأت شركة «غوغل»، التي تقود مجال التصوير بالهواتف الذكية، توريد هاتفها الجديد «بيكسل 8» (700 دولار) المجهّز بمجموعة أدوات مدفوعة بالذكاء الاصطناعي لتحرير وتوليف الصور. ويعمل برنامج تشغيل الهاتف على أكثر من مجرّد تعديل حدّة وسطوع الصورة؛ إذ يستخدم الذكاء الاصطناعي لفبركة المشاهد، أو يزيل العناصر غير المرغوبة لمنح المستخدم النتيجة التي يريدها.
تخيّل مثلاً صورةً اقتُطع فيها كتف أحد الأشخاص. يتيح لكم برنامج «غوغل» الجديد النقر على زرّ «ماجيك إيديتور» Magic Editor لتعديل وضعية الشخص المعني في الإطار، ومن ثمّ يستخدم الذكاء الاصطناعي لإنتاج الجزء المقتطع من كتفه.
تخيّل أيضاً صورةً التقطتها لأحد الأصدقاء أمام نصب تاريخي بخلفية مزدحمة بالسياح. يمكنك استخدام أداة التوليف نفسها لتحديد هؤلاء الأشخاص والنقر على زرّ الحذف. وفي غضون ثوانٍ، سيختفي هؤلاء الغرباء، وسيعمل برنامج «غوغل» تلقائياً على توليد مشهد يغطّي الخلفية.
دمجت «غوغل» أدوات الذكاء الاصطناعي الجديدة هذه في تطبيق «غوغل فوتوز» المجّاني المتوفر لأجهزة «أندرويد» و«آيفون»، الذي يستخدمه أكثر من مليار مستخدم. وقالت الشركة إنّ «بيكسل 8» هو أوّل هاتف ذكي يضمّ مولّفاً بالذكاء الاصطناعي، ما يعني أنّ الأدوات نفسها قد تصبح قريباً متوفرة في الأجهزة الأخرى.
تحرير الصور بالذكاء الاصطناعي
يشكّل مولّف الصور المدعوم بالذكاء الاصطناعي الجديد من «غوغل» جزءاً من موجة الذكاء الاصطناعي التوليدي التي انتشرت العام الماضي، بعد إطلاق «تشات جي بي تي» الذي ينتج نصوصاً بناءً على أوامر حثّ من المستخدم. بدورها، تتيح أدوات الذكاء الاصطناعي التوليدي المبنية على الصورة كـ«دال إي» و«ميدجورني» و«أدوبي فايرفلاي» للمستخدمين، ابتكار صور عبر طباعة أمر حثّ كـ«قطّ ينام على حافّة النافذة».
ومع ذلك، يعدّ «بيكسل 8» نقطة تحوّل في هذا المجال؛ حيث إنّه الهاتف الاستهلاكي الأوّل المجهّز بذكاء اصطناعي توليدي مدمج في عملية ابتكار الصور من دون كلفة إضافية، ما يدفع التصوير الفوتوغرافي الهاتفي إلى عصرٍ لن يشكّك فيه النّاس في حقيقة ما يرونه في صورهم، حتّى في صور من يحبّون.
(تضفي كاميرا هاتف «الآيفون» بعض التأثيرات الاصطناعية كـ«إضاءة المسرح» التي تعزّز سطوع مواضيع الصور، وتُعتم الخلفية، ولكنّها لا تصنع صوراً مزيّفة).
واعتبر رين نغ، الأستاذ في علوم الكومبيوتر بجامعة كاليفورنيا، بيركلي، ويعطي دروساً في التصوير الفوتوغرافي الحاسوبي، أنّ «هذه اللحظة مهمّة جداً، وستغيّر أموراً كثيرة في عالم الصورة. ومع تقدّمنا بجرأة نحو المستقبل، لن تعود الصورة حقيقة بصرية».
اختبار هاتف «بيكسل 8»
اختبرت كاميرا وأدوات «بيكسل 8» الجديدة لتبيان ما إذا كانت بالفعل تطوّراً مفيداً، وعدّلنا بواسطتها عشرات الصور، ولا بدّ من الاعتراف بأنّنا ذُهلنا وخفنا من القدرة على فبركة الصور المزيفة. وإليكم النتائج:
استخدمتُ «بيكسل 8» لالتقاط صورٍ لكلبيّ ماكس (من نوع كورغي) وموتشي (من نوع لابرادور بنّي اللون) ومن ثمّ استخدمتُ الذكاء الاصطناعي.
وجاءت النتائج متضاربة. في صورةٍ يظهر فيها ماكس جالساً على صخرة كبيرة، أردتُ أن أتخلّص من ورقة حصلتُ عليها من شرطي للسماح لكلابي بالجري دون قيد في المتنزّه. دخلت إلى تطبيق «غوغل فوتوز» وضغطتُ على زرّ «ماجيك إيديتور» ورسمتُ حدوداً حول الورقة. قام البرنامج بعملٍ رائع، حيث استبدل الورقة المزعجة ببلاطة صخرية وبضع إبر الصنوبر.
في صورةٍ أخرى، يقف موتشي بالقرب من ماكس والجزء الأيسر من مؤخرته غير ظاهر في إطار الصورة، فحاولتُ تقريبه إلى اليسار باستخدام التطبيق. نجح التقريب، لكنّ الجهة اليمنى المفبركة بالذكاء الاصطناعي من موتشي بدت غير واضحة واقتُطع حافر الكلب الأيسر.
الذكاء الاصطناعي يستخدم لفبركة المشاهد أو إزالة العناصر غير المرغوبة من اللقطات
بعدها، جاءت النتيجة الأكثر نفوراً. ففي صورة لمطعم بيتزا اقتُطع فيها وجه موتشي من الإطار، حاولتُ تحريكه لتبيان ما إذا كان الذكاء الاصطناعي سينجح في توليد ما تبقى من رأسه. لم أتوقع أن يعيد البرنامج إنتاج وجهه الأشيب، ولكنّ الذكاء الاصطناعي أنتج شيئاً أشبه بالكابوس، كلباً شيطانياً بحافرين يخرجان من ساقي موتشي.
توفّر «غوغل» زرّ «إعادة التوليد» Regenerate، الذي ستستخدمونه عندما لا تروق لكم النتائج، فجرّبته، ولكنّه منحني نتائج مخيفة في كلّ مرّة.
في الصورة نفسها، حاولت حذف الغرباء في خلفية الصورة، ونجح الأمر بشكلٍ مثالي، ولكنّه بدا لي مقلقاً بعض الشيء، وكأنّني أشاهد مشهداً من فيلم خيال علمي يختفي فيه نصف سكّان العالم.
تتوقّع شركة «غوغل» أن يصطدم المستخدمون ببعض الأخطاء في أدواتها الجديدة التي لا تزال في أيّامها الأولى، موضحةً في بيان أنّ «هذه الميزة لا تزال في مراحلها الأولى، ولن تكون دائماً على صواب. ننتظر الانطباعات للعمل على تحسين نموذجنا باستمرار».
تقنيات غير مكتملة
هل نحتاج لاستخدام هذه التقنيات؟ لا أعتقد أنّ أدوات التوليف المدعومة بالذكاء الاصطناعي هذه يجب أن تتوفّر بشكلٍ دائم في تطبيقات الصور أو في الهواتف الاستهلاكية، خصوصاً في وضعها غير المكتمل.
وحتّى بعد نضوج التقنية، تنتظرنا أسئلة كثيرة حول المسائل الأخلاقية المحيطة بالصور الاصطناعية.
يساهم توليف الصور لتعزيز الوضوح والسطوع في تحسين الصورة من دون تغيير مادتها، ولكن الإضافة الاصطناعية للعناصر تتجاوز الحدود وتحوّل الصورة إلى تزييف. باختصار، يمكن لاستخدام أدوات الذكاء الاصطناعي لإنتاج ومشاركة الصور أن يساهم في نشر المواد المزيفة على الشبكة، في مرحلة يتكاثر فيها التضليل وتصعب فيها الثقة.