نظام ذكاء صناعي يبتكر صوراً رقمية عند الطلب

يعمل بأوامر مكتوبة... وخبراء يتخوفون من توظيفه لترويج قصص مزيفة

صورة لقطتين تلعبان الشطرنج صنعها نظام «دال - إي» عند الطلب
صورة لقطتين تلعبان الشطرنج صنعها نظام «دال - إي» عند الطلب
TT
20

نظام ذكاء صناعي يبتكر صوراً رقمية عند الطلب

صورة لقطتين تلعبان الشطرنج صنعها نظام «دال - إي» عند الطلب
صورة لقطتين تلعبان الشطرنج صنعها نظام «دال - إي» عند الطلب

يعمل الباحثون في «أوبن إيه آي»، أحد أكبر مختبرات الذكاء الصناعي في العالم، على تطوير تقنية تتيح للنّاس صناعة صور رقمية بخطوة بسيطة، وذلك بوصف ما يريدون مشاهدته.
أطلق الباحثون على التقنية اسم «دال - إي» DALL - E في إشارة منهم إلى فيلم للرسوم المتحرّكة «وال - إي» (2008) الذي يتحدّث عن روبوت، وعن الرسام السريالي سالفادور دالي.

صناعة صور رقمية
تلقّى مختبر «أوبن إيه آي» OpenAI تمويلاً بقيمة مليار دولار من شركة «مايكروسوفت»، ولكنه لم يتشارك بالتقنية مع أفراد الجمهور بعد. إلّا أنّ أليكس نيكول، أحد الباحثين المشاركين في تطويرها، قدّم أخيراً عرضاً لكيفية عملها.
عندما طلب نيكول من النظام تنفيذ شكل «إبريق شاي على شكل ثمرة أفوكادو» وطبع هذه الكلمات على شاشة كومبيوتر عملاقة، صنع له النظام عشر صور مختلفة لإبريق شاي على شكل أفوكادو باللون الأخضر القاتم.
عندها، قال نيكول «(دال – إي) بارع في ابتكار الأفوكادو».
وعندما طبع على الشاشة عبارة «قطط تلعب الشطرنج»، ابتكر النظام قططاً تجلس من جهتي لوحة الشطرنج مع 32 قطعة مرصوفة عليها. وعندما طلب عبارة «دبّ يعزف البوق تحت الماء»، ابتكر النظام صورة تُظهر فقاعات ترتفع من طرف بوق الدبّ باتجاه سطح الماء.
يعمل «دال - إي» على توليف الصور أيضاً، فعندما حذف نيكول البوق وطلب استبداله بغيتار، امتثل النظام وظهر الغيتار بين يدي الدب.
أمضى فريقٌ مؤلّف من سبعة باحثين سنتين في تطوير التقنية التي يخطّط «أوبن إيه آي». لتوفيرها كأداة لمن يحتاجون إليها كمصممي الغرافيك، لتزوّدهم باختصارات وأفكار جديدة يستخدمونها في ابتكارهم وتعديلهم للصور الرقمية. ويستخدم المبرمجون اليوم أداة «كوبايلوت» Copilot المستندة إلى تقنية مماثلة من تطوير «أوبن إيه آي». لصناعة الرموز البرمجية.

                                               صورة إبريق يشبه ثمرة الافاكادو يصنعها نظام «دال-إي» عند الطلب
تقنية مثيرة للقلق
ولكنّ الكثير من الخبراء يرون أنّ «دال - إي» مثيرٌ للقلق، ويتخوّفون من أنّ استمرار تطوّر هذا النوع من التقنية قد يؤدي إلى انتشار المعلومات المضلّلة عبر شبكة الإنترنت، وتغذية الحملات الإلكترونية المغرضة كتلك التي ساعدت في التلاعب بالانتخابات الرئاسية الأميركية عام 2016.
واعتبر سوباراو كامبهامباتي، أستاذ علوم الكومبيوتر في جامعة ولاية أريزونا، أنّ «هذه التقنية يمكن استخدامها في أمور جيّدة، ولكنّها قد تستخدم أيضاً في جميع أنواع التطبيقات المجنونة والمقلقة كصناعة مواد (ديب فيك) من الصور والفيديوهات المزيفة والمضللة».
قبل نحو خمس سنوات، طوّرت أبرز مختبرات الذكاء الصناعي في العالم أنظمة قادرة على تعريف الأشياء الظاهرة في الصور الرقمية، وحتّى فبركة صورٍ تظهر وروداً وكلاباً وسيارات ووجوهاً. وبعدها ببضع سنوات، طوّرت المختبرات أنظمة قادرة على القيام بالأشياء نفسها في الكتابات النصية، وتلخيص المقالات، والإجابة على الأسئلة، وابتكار التغريدات، وحتّى كتابة المدوّنات.
ويأخذ الباحثون اليوم بجمع وتوحيد هذه التقنيات لابتكار أشكال جديدة من الذكاء الصناعي، ويُعدّ «دال – إي» خطوة تقدّمية بارزة في هذا المجال لأنّه يعتمد على اللغة والصور، وفي بعض الحالات، على العلاقة بين الاثنين.
وفي هذا الصدد قال أورين إتزيوني، الرئيس التنفيذي لمعهد «آلان» للذكاء الصناعي في سياتل «يمكننا استخدام مصادر عدّة متقاطعة من المعلومات لابتكار تقنية أفضل».
ولكنّ التقنية الجديدة ليست مثالية. فعندما طلب نيكول من «دال - إي» «وضع برج إيفل على القمر»، لم يفهم النظام الفكرة ووضع القمر في سماء البرج. وعندما طلب منه «غرفة معيشة مليئة بالرمال»، عرض له مشهداً أقرب إلى موقع بناء منه إلى غرفة معيشة.
أمّا حين صعّب نيكول طلباته بعض الشيء، بإضافة أو حذف بعض الكلمات من هنا وهناك، نفّذ النظام طلبه. فعندما طلب منه ابتكار صورة تعرض «بيانو في غرفة معيشة مليئة بالرمال»، بدت الصورة أشبه بشاطئ في غرفة المعيشة.

شبكات عصبية
ينتمي «دال - إي» إلى ما يسمّيه باحثو الذكاء الصناعي شبكة عصبية، وهي عبارة عن نظام حسابي صُمم على شكل شبكة الأعصاب في الدماغ، وهي التقنية نفسها التي تتعرّف إلى الأوامر المحكية في الهواتف الذكية، وترصد وجود المشاة أثناء تجوّل السيارات الآلية في شوارع المدن.
تتعلّم الشبكة العصبية مهاراتها من خلال تحليل كميات كبيرة من البيانات. تستطيع الشبكة مثلاً تعلّم التعرّف إلى الأفوكادو من خلال رصد الأنماط في آلاف صور ثمار الأفوكادو. يبحث «دال - إي» عن الأنماط أثناء تحليله لملايين الصور الرقمية والنصوص المرفقة التي تصف محتوى الصور، ليتعلّم بهذه الطريقة رصد الرابط بين الصورة والكلمة.
عندما يصف أحدهم صورة لـ«دال - إي»، ينتج الأخير مجموعة من الملامح الرئيسية التي قد تتضمّنها هذه الصورة. قد تكون هذه الملامح على شكل الخطّ في طرف البوق، أو خط آخر منحنٍ من أذن الدبّ.
بعدها، تعمل شبكة عصبية أخرى اسمها نموذج الانتشار diffusion model على صناعة الصورة وفبركة البيكسلات المطلوبة لرسم هذه الملامح. تنتج النسخة الأخيرة من «دال - إي»، التي كُشف عنها النقاب أخيراً في ورقة بحثية تصف النظام، صوراً عالية الدقّة تبدو في أحيانٍ كثيرة كالصور الفوتوغرافية.
يستمرّ «أوبن إيه آي». في تحسين تقنية «دال - إي» رغم أنها تخفق غالباً في فهم ما يصفه المستخدم أو تفسد الصورة التي تصنعها، إذ ينجح الباحثون في معظم الأحيان في صقل مهارات الشبكة العصبية عبر تغذيتها بكميات أكبر من البيانات.
يستطيع الباحثون أيضاً تطوير أنظمة أكثر قوّة من خلال تطبيق الأفكار نفسها على أنواع جديدة من البيانات. وقد طوّر معهد آلان The Allen Institute أخيراً نظاماً يحلّل الصوت والصورة والنص. وبعد تحليل ملايين فيديوهات الـ«يوتيوب» التي تحتوي على مقاطع صوتية وملاحظات توضيحية، تعلّم النظام تحديد لحظات استثنائية كنباح الكلاب أو صوت إقفال الأبواب في البرامج التلفزيونية والأفلام.
يعتقد الخبراء، أنّ الباحثين سيستمرّون في بناء هذا النوع من الأنظمة لأنّها قد تصبح أخيراً قادرة على مساعدة الشركات في تحسين محرّكات البحث، وأجهزة المساعدة الرقمية، وغيرها من التقنيات الشائعة، بالإضافة إلى أتمتة وظائف جديدة لفناني الغرافيك والمبرمجين وغيرهم.
ولكنّ هذه القدرة تنطوي على بعض النواقص لأنّ أنظمة الذكاء الصناعي تظهر نوعاً من التمييز ضدّ المرأة وأصحاب البشرة الملوّنة كونها تكتسب مهاراتها من مجموعات كبيرة من النصوص الإلكترونية والصور والبيانات المنحازة، فضلاً عن إمكانية استخدامها لصناعة المحتوى الإباحي وخطابات الكراهية والمواد المسيئة. يعتقد الخبراء أنّ التقنية ستسهّل في نهاية المطاف صناعة المعلومات المضللة إلى درجة ستجعل الناس يشككون في كلّ شيء يرونه على الشبكة.
من جهته، اعتبر إتزيوني أنّه «يمكننا صناعة النصوص وقراءتها بصوت أحدهم. ويمكننا صناعة صور وفيديوهات. تحتوي شبكة الإنترنت اليوم على الكثير من المعلومات المضلّلة ولكنّ القلق هو من فكرة رفع مستوى التضليل».
يفرض مختبر «أوبن إيه آي». ضوابط شديدة على «دال - إي» كي يمنع الأطراف الخارجية من استخدامه كما يحلو لها، وعمد إلى وضع علامة عائدة له في زاوية كلّ صورة ينتجها. وأخيراً، افتتح المختبر تجربة للنظام للراغبين باختباره منتصف شهر أبريل (نيسان) الماضي ولكن لمجموعة صغيرة فقط.
* خدمة «نيويورك تايمز»



«لايت فون 3»: هاتف أقل ذكاءً... لدرء «تعفّن الدماغ»

«لايت فون 3»: هاتف أقل ذكاءً... لدرء «تعفّن الدماغ»
TT
20

«لايت فون 3»: هاتف أقل ذكاءً... لدرء «تعفّن الدماغ»

«لايت فون 3»: هاتف أقل ذكاءً... لدرء «تعفّن الدماغ»

قُرَّائي الأعزاء، لديّ اعتراف: أعاني من مرضٍ يُطلق عليه الشباب «تعفّن الدماغ» (brain rot)، وهو عدم القدرة على التفكير بعمق بعد كثرة تصفح الهاتف، حيث وفي هذه الأيام، يصعب حتى إنهاء كتاب.

يعاني الكثيرون من هذه المشكلة. وقد أدى ذلك إلى ظهور فئة من المنتجات التقنية البسيطة التي تسعى جاهدةً للتخلص من مُشتتات الانتباه، بدءاً من دبوس ياقة الهاتف الذكي المُزوّد ​​بذكاء اصطناعي، الذي لم يعد موجوداً الآن، والذي كان يُدوّن الملاحظات، وصولاً إلى الهواتف ذات الميزات الأساسية فقط.

هاتف من دون متصفح إنترنت

أحدث مثال على ذلك، هاتف «لايت فون ثلاثة» (Light Phone III) بسعر 600 دولار أميركي، من شركة ناشئة في مدينة نيويورك، وهو هاتف مُبسّط لا يُقدّم أي شيء يُذكر.

الإصدار الأحدث، الذي بدأ شحنه في مارس (آذار) الماضي، والمُقرر إصداره على نطاق أوسع في يوليو (تموز) المقبل، يُمكنه إجراء المكالمات، وإرسال الرسائل النصية، والتقاط الصور، وعرض اتجاهات الخريطة، وتشغيل الموسيقى والبودكاست، ولا يفعل أي شيء آخر.

لا يوجد متصفح ويب. ولا متجر تطبيقات، ما يعني عدم وجود «أوبر» لطلب سيارة، ولا برنامج «سلاك»، ولا وسائل تواصل اجتماعي. ولا حتى بريد إلكتروني.

وقال كايوي تانغ، الرئيس التنفيذي لشركة «لايت» الناشئة التي طورت إصدارات متعددة من هاتف لايت على مدى السنوات التسع الماضية: «إنك تستخدمه عند الحاجة، وعندما تعيده (إلى جيبك) يختفي من حياتك».

«توتر أقل وإبداع أكثر»

وأضاف: «نتلقى الكثير من العملاء الذين يخبروننا أنهم يشعرون بتوتر أقل؛ ويصبحون أكثر إنتاجية؛ ويزدادون إبداعاً».

كنتُ متشوقاً لمعرفة ما إذا كان هاتف «لايت» سيشفيني من كسل عقلي، لذلك استخدمته هاتفي الرئيسي لمدة أسبوع. وكانت هناك لحظات استمتعت بها، فأثناء انتظار القطار، أو الاستراحة في النادي الرياضي، أو تناول الطعام بمفردي، لم أكن أرغب في التحديق في شاشة الهاتف، وشعرتُ بوعي أكبر لما يحيط بي. بدت المكالمات الهاتفية واضحة وجميلة. وقام تطبيق الخرائط بعمل جيد في إرشادي في المدينة.

ذكّرني ذلك بأوقاتٍ أبسط عندما كنا نستخدم الهواتف أساساً للتحادث قبل وضعها جانباً للتركيز على مهام أخرى.

نقائص في الميزات

لكن خلال الأسبوع، قلّصت سلبيات الهواتف الأقل تطوراً من استمتاعي بها، وشعرتُ عموماً بمزيد من التوتر وضعف في الأداء. وجدتُ نفسي فجأةً عاجزاً عن دخول محطة قطار، أو البحث عن اسم مطعم جديد، أو التحكم في باب مرآبي.

بعض ذلك لا يعود إلى هاتف Light Phone نفسه، وهو منتجٌ عادي، بل إلى اعتماد المجتمع كله على ميزات الهواتف الذكية المتقدمة.

تجربة الهاتف

وإليكم كيف قضيتُ أسبوعي في قضاء المهمات، والتنقل، والخروج بهاتفٍ أقل تقنية.

* قائمة الهاتف

عندما جهّزتُ جهاز مراجعة هاتف Light Phone خلال عطلة نهاية الأسبوع، كان الهاتف، الذي يبدو قطعة مستطيلة سوداء، بسيطاً جداً. كانت قائمة الهاتف عبارة عن شاشة سوداء تعرض قائمةً نصيةً بيضاء لميزاته: الهاتف، والكاميرا، وألبوم الصور، والمنبه.

لإضافة المزيد من الأدوات، اضطررتُ لاستخدام متصفح ويب على جهازي للوصول إلى لوحة التحكم، حيثُ يُمكنني تثبيت ميزات مثل تطبيق الخرائط والمفكرة والمؤقت. والآن، بعد أن أصبحتُ مستعداً للانطلاق، كنتُ مصمماً على العيش، ولو لفترة، من دون هاتفي الآيفون.

* التنقل إلى العمل

صباح يوم الاثنين، بدأتُ رحلتي إلى العمل، راكباً قطاراً من أوكلاند، كاليفورنيا، إلى سان فرانسيسكو. عندما وصلتُ إلى المحطة، أدركتُ أنه لا يمكنني الدخول من دون هاتفي الآيفون، لأنني حوّلتُ بطاقة النقل الفعلية، قبل سنوات، إلى بطاقة افتراضية مخزنة في محفظة هاتفي الذكي.

لم يكن هاتف لايت مزوداً بمحفظة لشحن بطاقة النقل الافتراضية، فعدتُ إلى المنزل بخجل لأحضر هاتفي الآيفون، ووصلتُ إلى المكتب متأخراً نصف ساعة.

المراسلات والصور

* مراسلة الأصدقاء والتقاط الصور

أضفتُ بعضاً من أقرب أصدقائي إلى دفتر عناوين هاتف لايت، وأرسلتُ لهم رسائل نصية أشرح فيها تجربتي. كانت الكتابة على لوحة مفاتيح الجهاز بطيئة جزئياً لعدم وجود ميزة التصحيح التلقائي لتصحيح الأخطاء المطبعية. ونتيجةً لذلك، كانت المحادثات مقتضبة.

وقد ساد جوٌّ من المرح عندما أرسلتُ صوراً لبعض الأشخاص . بدت الصور، ذات الإضاءة الخافتة والحبيبات، وكأنها مُلتقطة بكاميرا هاتف منذ 15 عاماً على الأقل.

* إنجاز المهمات

في عصر أحد الأيام، اضطررتُ إلى تسليم طرد مُرتجع من أمازون إلى متجر «UPS». اخترتُ خيار الشحن الأنسب، الذي تضمن إظهار رمز الاستجابة السريعة للمسح الضوئي.

المشكلة؟ لم يكن هاتف «لايت» مزوداً بتطبيق بريد إلكتروني أو متصفح ويب لتنزيل الرمز. بدلاً من ذلك، حملتُه على شاشة حاسوبي والتقطتُ صورةً عاديةً بالهاتف.

عندما أحضرتُ الطرد إلى «UPS» وعرضتُ الصورة، حبستُ ​​أنفاسي، على أمل أن تكون الصورة واضحةً بما يكفي. رفع الموظف الماسح الضوئي، وبعد ثلاث محاولات، سمعتُ صوت تنبيه وملصق شحن مطبوعاً. يا لها من راحة، ولكن يا له من عناء!

* موعد غداء

في وضع آخر، خرجتُ أنا وزوجتي لتناول غداءٍ مُفاجئ. رجعتُ بالسيارة إلى الخلف، ثم اضطررتُ إلى أن أطلب من زوجتي استخدام هاتفها الآيفون لإغلاق باب مرآبنا. ثم، كنا نحاول تذكر اسم مطعم سوشي جديد قرأنا عنه أخيراً في مدونة طعام. لم أستطع منع نفسي من البحث عن منشور المدونة حول هاتف لايت. وفي النهاية، خمنّا الاسم، وانتهى بنا المطاف في المطعم الخطأ. مع ذلك، كان من اللطيف تناول الغداء معاً دون أن أرغب في التحقق من بريدي الإلكتروني.

الخلاصة

مع إعجابي بهدف هاتف لايت، إلا أن تجربتي تُظهر أنه لا يوجد شيء يمكننا فعله أو شراؤه فعلياً لإعادتنا إلى أيام البساطة. فالعديد من جوانب حياتنا، بما في ذلك التنقل في المدينة، والعمل، ودفع ثمن البضائع والخدمات والتحكم في الأجهزة المنزلية، تدور حول هواتفنا الذكية عالية الأداء.

أقرّ تانغ، الرئيس التنفيذي لشركة «لايت»، بأن الهاتف ليس مناسباً للجميع، لكنه أضاف أن الآباء فكروا في شراء الهاتف لأطفالهم لتقليل تشتت انتباههم في المدرسة. وتعمل الشركة أيضاً على إضافة المزيد من الأدوات، مثل الدفع عبر الهاتف المحمول والقدرة على طلب سيارة.

* خدمة «نيويورك تايمز».