تطبيق مدعوم بـ«الذكاء الصناعي» يحوّل النص إلى صورة

تطبيق مدعوم بـ«الذكاء الصناعي» يحوّل النص إلى صورة
TT

تطبيق مدعوم بـ«الذكاء الصناعي» يحوّل النص إلى صورة

تطبيق مدعوم بـ«الذكاء الصناعي» يحوّل النص إلى صورة

شهدت الأشهر القليلة الأخيرة ازدياداً مطرداً في عدد الأعمال الفنية المبتكرة والواقعية، المصنوعة بنظم «الذكاء الصناعي»، ولكنّها كانت متاحة لمجموعة مختارة من المستفيدين. أمّا اليوم، فقد بات بإمكان أي شخص تشغيل نسخة غرافيكية كاملة من تطبيق «ستيبل ديفيوجن (Stable Diffusion)» المدعوم بـ«الذكاء الصناعي» الذي يحوّل النص إلى صورة على أيّ جهاز «ماك» مزوّد بنظام «آبل سيليكون»، ودون الحاجة إلى خلفية معرفية تقنية.
إذن، كلّ ما عليك فعله هو تنزيل التطبيق في ملف التطبيقات على جهازك، والنقر مرّتين عليه، وطباعة هدفك ليظهر سحر تطبيق «ديفيوجن بي» أمامك.

صندوق سحري
حتّى اليوم، كان الراغبون في تجربة السحر الرائع الذي يتمتّع به «الذكاء الصناعي» الذي يحوّل النص إلى صورة، يملكون خيارين فقط: الدفع للحصول على خدمة «ميد جورني» MidJourney، أو «دال-إي» DALL-E (إذا كانوا محظوظين بتلقّي دعوة)، أو تنزيل الأداة المجّانية المفتوحة المصدر «ستيبل ديفيوجن» التي تقدّم دليلاً إرشادياً مفصّلاً لتحميل كلّ الشروط المطلوبة، ولكنّه غالباً ما يفتقر إلى أمورٍ صغيرة تصعّب العملية على المستخدم، وقد تدفعه للاستسلام في النهاية. ولكنّ هذه الحالة انتهت بفضل ديفام غوبتا، وهو مهندس بحثي متخصص في «الذكاء الصناعي» بشركة «ميتا»؛ حيث أصبح بإمكان أيّ شخص يملك آلة مزوّدة ببرنامج «آبل سيليكون» الاستمتاع بقوّة «ستيبل ديفيوجن» بسهولة تامّة، وبمجرّد جرّ التطبيق ووضعه في ملف التطبيقات عوضاً عن الاشتراك في خدمة «أدوبي» أو أيّ خدمة أخرى.
ولا يفرض التطبيق أي رسوم ولا يتطلّب اتصالاً بالإنترنت بعد التحميل الأساسي للنماذج المطلوبة لتشغيله، ولا حتّى تحميل معلومات على السحابة.
يعمل التطبيق على أي جهاز «ماك» مزوّد بمعالج «إم 1» و«إم 2» ويتيح لكم الاستفادة من القوّة الخارقة المدمجة في هذه الرقائق الصغيرة.
ويعتبر المطوّرون ذاكرة الوصول العشوائي بسعة 16 غيغابايت مكوّناً أساسياً لنجاح هذه العملية؛ لأنّ التعلّم الآلي يحتاج إلى ذاكرة قوية، ولكن لا بدّ من الإشارة إلى أنّنا اختبرناه على جهاز «ماك بوك إير» مزوّد برقاقة «إم 1»، وذاكرة وصول عشوائي بسعة 8 غيغابايت، دون أي شائبة. وخلال الاختبار، احتجنا إلى خمس أو ستّ دقائق للوصول إلى التطبيق (نصيحة واحدة: أقفلوا جميع تطبيقاتكم لمنح «ديفيوجن بي» أكبر مساحة ممكنة).
الأكيد أنّ هذا التطوّر الملحوظ والمتوقّع، سيولّد طفرةً من الصور الجديدة والابتكارات التي تحمل معها نتائجها الخاصة، التي لم يمكننا التنبؤ بها بعد.

أداة إبداعية
انتقد كثير من الرسامين أدوات تحويل النصوص إلى صور؛ خوفاً من خسارة أعمالهم. ولكنّ لهذا الجدل وجهاً آخر يوحي بأنّ هذا النوع من البرمجيات لن يكون إلا أداةً إضافية في ترسانة المبدعين حول العالم.
قبل بضعة أسابيع، قال لنا صانع الفيديوهات والمخرج بول تريلّو، إنّه يعتقد أنّ هذه الأداة «لن تحرم فنّاني المؤثرات البصرية من أعمالهم»، بل توقّع أن «تعزّز من فعالية العمل الذي يقومون به اليوم؛ لأنّها ستفتح الباب لأنواع جديدة كلياً من التقنيات، فضلاً عن أنّها ستتيح للمشاريع ذات الميزانية المتواضعة إنتاج مؤثرات بصرية شديدة الواقعية».
وكشفت جوزفين ميلر، المديرة الفنية والفنّانة المتخصصة في الواقع المعزز والواقع الممتدّ والفنّ الثلاثي الأبعاد في المملكة المتحدة، أنّها تملك شعور تريلّو نفسه، وأنّ هذه التقنية فتحت لها المجال للقيام بأمور أكثر، لافتةً إلى أنّها «أحياناً تدخل تصاميمها في خدمة (دال–إي) التي تنتج نسخات مغايرة من التصاميم، ومن ثمّ تكتشف شيئاً غير متوقّع لم تفكّر فيه، ما يأخذها إلى اتجاه إبداعي جديد».
وأضافت ميلر -التي تعمل مع فريق من الفنّانين والمطوّرين على تصميم مرشح بالواقع المعزّز سيتيح لمستخدمي «إنستغرام» مشاهدة لوحات فنية ممتدّة– أنّها تستخدم التطبيق لتقديم نسخات مختلفة من أعمالها للزبائن. وقالت: «أقول لهم: هذا تصميمي، لكنّني صنعتُ لكم هذه النسخات الأخرى بواسطة (الذكاء الصناعي) لتروها، فيجدون أحياناً ما يعجبهم في واحدة من النسخات الآلية، ونعمد لإضافتها إلى التصميم النهائي».
بدوره، يقول مانويل «مانو فيجن» سينسيلي، وهو فنّان ومدير قسم تصميم الواقع الممتدّ في شركة «يونيتي»، إنّه أيضاً يعتقد أنّ هذه الأدوات مؤثّرة جداً للمبتكرين، واصفاً إيّاها بـ«الأدوات الحتمية»، خصوصاً أنّها تفتح آفاقاً جديدة لأصحاب المخيّلة الواسعة الذين لا يملكون مهارات تنفيذية لابتكار مواد بصريّة.
ويشرح سينسيلي أنّ «هذه الأداة قد تسهم في تمكين الأشخاص الذين لا يملكون قوى في هذا المجال».
وتوافق ميلر زميلها الرأي، وتتحدّث عن حالة محدّدة استطاع فيها أطفالٌ من أصحاب الهمم، فجأة، استخدام كلماتهم لصناعة صور بواسطة خدمة «دال-إي»، أي استطاعوا القيام بما كانوا يعجزون عنه سابقاً؛ لأنّهم لا يستطيعون الرسم، واصفةً الأمر بـ«السحري».
ويؤمن سينسيلي بأنّ هذه التقنية ستؤدّي إلى نهضة تشبه تجارب أخرى عاشها العالم في السابق مع ثورات تقنية أخرى، مثل التوليف الرقمي للفيديوهات والنشر والتصوير الفوتوغرافي.
* «فاست كومباني»
- خدمات «تريبيون ميديا»


مقالات ذات صلة

«بلاك هات» تعود إلى الرياض بنسختها الثالثة

عالم الاعمال «بلاك هات» تعود إلى الرياض بنسختها الثالثة

«بلاك هات» تعود إلى الرياض بنسختها الثالثة

تعود فعالية الأمن السيبراني الأبرز عالمياً «بلاك هات» في نسختها الثالثة إلى «مركز الرياض للمعارض والمؤتمرات» ببلدة ملهم شمال العاصمة السعودية الرياض.

تكنولوجيا «غوغل» تطلق النسخة الأولية من آندرويد 16 للمطورين مع ميزات جديدة لتعزيز الخصوصية ومشاركة البيانات الصحية (غوغل)

«غوغل» تطلق النسخة الأولية من آندرويد 16 للمطورين مع ميزات جديدة

أطلقت «غوغل» النسخة التجريبية الأولية من آندرويد 16 للمطورين، وهي خطوة تمهد الطريق للتحديثات الكبيرة المقبلة في هذا النظام.

عبد العزيز الرشيد (الرياض)
تكنولوجيا «أبل» تؤكد مشكلة اختفاء الملاحظات بسبب خلل بمزامنة (iCloud) وتوضح خطوات استعادتها مع توقع تحديث (iOS) قريب (أبل)

اختفاء الملاحظات في أجهزة آيفون... المشكلة والحلول

وفقاً لتقرير رسمي من «أبل»، فإن المشكلة تتعلق بإعدادات مزامنة الآيكلاود (iCloud).

عبد العزيز الرشيد (الرياض)
تكنولوجيا تمكنك «دورا» من تصميم مواقع ثلاثية الأبعاد مذهلة بسهولة تامة باستخدام الذكاء الاصطناعي دون الحاجة لأي معرفة برمجية (دورا)

صمم موقعك ثلاثي الأبعاد بخطوات بسيطة ودون «كود»

تتيح «دورا» للمستخدمين إنشاء مواقع مخصصة باستخدام الذكاء الاصطناعي عبر إدخال وصف نصي بسيط.

عبد العزيز الرشيد (الرياض)
خاص يحول الذكاء الاصطناعي الطابعات من مجرد خدمة بسيطة إلى أداة أكثر ذكاءً واستجابة لحاجات المستخدمين (أدوبي)

خاص كيف يجعل الذكاء الاصطناعي الطابعات أكثر ذكاءً؟

تلتقي «الشرق الأوسط» الرئيسة العامة ومديرة قسم الطباعة المنزلية في شركة «إتش بي» (HP) لفهم تأثير الذكاء الاصطناعي على عمل الطابعات ومستقبلها.

نسيم رمضان (بالو ألتو - كاليفورنيا)

هل وصل الذكاء الاصطناعي إلى حدوده القصوى؟

لوغو تطبيق «شات جي بي تي» (رويترز)
لوغو تطبيق «شات جي بي تي» (رويترز)
TT

هل وصل الذكاء الاصطناعي إلى حدوده القصوى؟

لوغو تطبيق «شات جي بي تي» (رويترز)
لوغو تطبيق «شات جي بي تي» (رويترز)

هل وصلت نماذج الذكاء الاصطناعي التوليدي إلى طريق مسدود؟ منذ إطلاق «تشات جي بي تي» قبل عامين، بعث التقدم الهائل في التكنولوجيا آمالاً في ظهور آلات ذات ذكاء قريب من الإنسان... لكن الشكوك في هذا المجال تتراكم.

وتعد الشركات الرائدة في القطاع بتحقيق مكاسب كبيرة وسريعة على صعيد الأداء، لدرجة أن «الذكاء الاصطناعي العام»، وفق تعبير رئيس «أوبن إيه آي» سام ألتمان، يُتوقع أن يظهر قريباً.

وتبني الشركات قناعتها هذه على مبادئ التوسع، إذ ترى أنه سيكون كافياً تغذية النماذج عبر زيادة كميات البيانات وقدرة الحوسبة الحاسوبية لكي تزداد قوتها، وقد نجحت هذه الاستراتيجية حتى الآن بشكل جيد لدرجة أن الكثيرين في القطاع يخشون أن يحصل الأمر بسرعة زائدة وتجد البشرية نفسها عاجزة عن مجاراة التطور.

وأنفقت مايكروسوفت (المستثمر الرئيسي في «أوبن إيه آي»)، و«غوغل»، و«أمازون»، و«ميتا» وغيرها من الشركات مليارات الدولارات وأطلقت أدوات تُنتج بسهولة نصوصاً وصوراً ومقاطع فيديو عالية الجودة، وباتت هذه التكنولوجيا الشغل الشاغل للملايين.

وتعمل «إكس إيه آي»، شركة الذكاء الاصطناعي التابعة لإيلون ماسك، على جمع 6 مليارات دولار، بحسب «سي إن بي سي»، لشراء مائة ألف شريحة من تصنيع «نفيديا»، المكونات الإلكترونية المتطورة المستخدمة في تشغيل النماذج الكبيرة.

وأنجزت «أوبن إيه آي» عملية جمع أموال كبيرة بقيمة 6.6 مليار دولار في أوائل أكتوبر (تشرين الأول)، قُدّرت قيمتها بـ157 مليار دولار.

وقال الخبير في القطاع غاري ماركوس «تعتمد التقييمات المرتفعة إلى حد كبير على فكرة أن النماذج اللغوية ستصبح من خلال التوسع المستمر، ذكاء اصطناعياً عاماً». وأضاف «كما قلت دائماً، إنه مجرد خيال».

- حدود

وذكرت الصحافة الأميركية مؤخراً أن النماذج الجديدة قيد التطوير تبدو وكأنها وصلت إلى حدودها القصوى، ولا سيما في «غوغل»، و«أنثروبيك» (كلود)، و«أوبن إيه آي».

وقال بن هورويتز، المؤسس المشارك لـ«a16z»، وهي شركة رأسمال استثماري مساهمة في «أوبن إيه آي» ومستثمرة في شركات منافسة بينها «ميسترال»: «إننا نزيد (قوة الحوسبة) بالمعدل نفسه، لكننا لا نحصل على تحسينات ذكية منها».

أما «أورايون»، أحدث إضافة لـ«أوبن إيه آي» والذي لم يتم الإعلان عنه بعد، فيتفوق على سابقيه لكن الزيادة في الجودة كانت أقل بكثير مقارنة بالقفزة بين «جي بي تي 3» و«جي بي تي 4»، آخر نموذجين رئيسيين للشركة، وفق مصادر أوردتها «ذي إنفورميشن».

ويعتقد خبراء كثر أجرت «وكالة الصحافة الفرنسية» مقابلات معهم أن قوانين الحجم وصلت إلى حدودها القصوى، وفي هذا الصدد، يؤكد سكوت ستيفنسون، رئيس «سبيلبوك»، وهي شركة متخصصة في الذكاء الاصطناعي القانوني التوليدي، أن «بعض المختبرات ركزت كثيراً على إضافة المزيد من النصوص، معتقدة أن الآلة ستصبح أكثر ذكاءً».

وبفضل التدريب القائم على كميات كبيرة من البيانات المجمعة عبر الإنترنت، باتت النماذج قادرة على التنبؤ، بطريقة مقنعة للغاية، بتسلسل الكلمات أو ترتيبات وحدات البكسل. لكن الشركات بدأت تفتقر إلى المواد الجديدة اللازمة لتشغيلها.

والأمر لا يتعلق فقط بالمعارف: فمن أجل التقدم، سيكون من الضروري قبل كل شيء أن تتمكن الآلات بطريقة أو بأخرى من فهم معنى جملها أو صورها.

- «تحسينات جذرية»

لكنّ المديرين في القطاع ينفون أي تباطؤ في الذكاء الاصطناعي. ويقول داريو أمودي، رئيس شركة «أنثروبيك»، في البودكاست الخاص بعالم الكمبيوتر ليكس فريدمان «إذا نظرنا إلى وتيرة تعاظم القدرات، يمكننا أن نعتقد أننا سنصل (إلى الذكاء الاصطناعي العام) بحلول عام 2026 أو 2027».

وكتب سام ألتمان الخميس على منصة «إكس»: «ليس هناك طريق مسدود». ومع ذلك، أخّرت «أوبن إيه آي» إصدار النظام الذي سيخلف «جي بي تي - 4».

وفي سبتمبر (أيلول)، غيّرت الشركة الناشئة الرائدة في سيليكون فالي استراتيجيتها من خلال تقديم o1، وهو نموذج من المفترض أن يجيب على أسئلة أكثر تعقيداً، خصوصاً في مسائل الرياضيات، وذلك بفضل تدريب يعتمد بشكل أقل على تراكم البيانات مرتكزاً بدرجة أكبر على تعزيز القدرة على التفكير.

وبحسب سكوت ستيفنسون، فإن «o1 يمضي وقتاً أطول في التفكير بدلاً من التفاعل»، ما يؤدي إلى «تحسينات جذرية».

ويشبّه ستيفنسون تطوّر التكنولوجيا باكتشاف النار: فبدلاً من إضافة الوقود في شكل بيانات وقدرة حاسوبية، حان الوقت لتطوير ما يعادل الفانوس أو المحرك البخاري. وسيتمكن البشر من تفويض المهام عبر الإنترنت لهذه الأدوات في الذكاء الاصطناعي.