«ميدجورني» لتوليد الصور عبر الذكاء الاصطناعي أصبحت واجهة ويب شاملة

تواجه الشركة دعوى قضائية جماعية رفعها فنانون يزعمون أنها استخدمت صوراً محمية بحقوق الطبع والنشر (شاترستوك)
تواجه الشركة دعوى قضائية جماعية رفعها فنانون يزعمون أنها استخدمت صوراً محمية بحقوق الطبع والنشر (شاترستوك)
TT

«ميدجورني» لتوليد الصور عبر الذكاء الاصطناعي أصبحت واجهة ويب شاملة

تواجه الشركة دعوى قضائية جماعية رفعها فنانون يزعمون أنها استخدمت صوراً محمية بحقوق الطبع والنشر (شاترستوك)
تواجه الشركة دعوى قضائية جماعية رفعها فنانون يزعمون أنها استخدمت صوراً محمية بحقوق الطبع والنشر (شاترستوك)

احتلت «ميدجورني (Midjourney)» مكانة بارزة في مجال توليد النصوص إلى الصور باستخدام الذكاء الاصطناعي، وغالباً ما يجري الاحتفال بها بوصفها «ملك» الإبداع المدفوع بالذكاء الاصطناعي. ومع ازدياد المنافسة في مجال توليد الصور باستخدام الذكاء الاصطناعي، ودخول لاعبين جدد مثل «xAI»، التابع لإيلون ماسك، و«Imagen 3» من «غوغل»، الساحة، تواجه «ميدجورني» تحديات جديدة. الآن، تحقق الشركة تحولاً كبيراً من خلال إطلاق واجهة ويب جديدة، وفتح أبوابها لجمهور أوسع، وتقديم ميزات محسَّنة لكل من المستخدمين المبتدئين والمتمرسين.

واجهة ويب جديدة

ولتحسين إمكانية الوصول، يمثل الانتقال من منصة تعتمد على «ديسكورد (Discord)» إلى واجهة ويب كاملة، لحظة محورية لـ«ميدجورني». في السابق، كان المستخدمون بحاجة للتفاعل مع «ميدجورني» عبر أوامر «ديسكورد»؛ وهي طريقة، على الرغم من قوتها، قد تكون مرهِقة للمستخدمين الجدد. ومع ذلك تعمل واجهة الويب الجديدة على تبسيط هذه العملية، مما يجعلها أكثر سهولة في الاستخدام. لا يعمل هذا التحول على خفض حاجز الدخول فحسب، بل يعمل أيضاً على توسيع الوصول إلى مجموعة أوسع من المستخدمين.

تجربة أكثر بساطة

عند زيارة موقع «ميدجورني» الجديد، يجري الترحيب بالمستخدمين بتجربة مبسَّطة. التسجيل بسيط، مما يسمح لهم بالتسجيل باستخدام حسابات «غوغل» أو «ديسكورد». وبمجرد تسجيل الدخول، يمكن للمستخدمين إنشاء ما يصل إلى 25 صورة يومياً دون أي تكلفة، مما يمنحهم فرصة خالية من المخاطر لاستكشاف قدرات المنصة. تتضمن الواجهة علامة تبويب «إنشاء» لتوليد الصور، وصفحة «استكشاف» لتصفُّح مجموعة واسعة من المحتوى الذي ينشئه المستخدم.

تشهد الشركة منافسة شرسة من قِبل «xAI» التابعة لإيلون ماسك و«Imagen 3» من «غوغل» (شاترستوك)

محرر الصور الموحد بالذكاء الاصطناعي

تُعد قوة الإبداع واحدة من أبرز ميزات منصة «ميدجورني» الجديدة على الويب. تعمل هذه الأداة على دمج عدد من الميزات القوية في واجهة واحدة سهلة الاستخدام، مما يعزز تجربة المستخدم بشكل كبير. يتضمن «المحرر» أدوات للرسم الداخلي، وتمديد اللوحة القماشية، وإعادة التأطير، والتكبير، مما يسمح للمستخدمين بتحسين صورهم المولَّدة بواسطة الذكاء الاصطناعي بدقة. وجرت إضافة «فرشاة» افتراضية، مما يوفر تحكماً أكبر عند تحرير أجزاء معينة من الصورة.

يتيح هذا النهج المتكامل لتحرير الصور للمستخدمين إعادة طلاء أجزاء من الصورة باستخدام صور جديدة جرى إنشاؤها بواسطة الذكاء الاصطناعي بناءً على مطالبات نصية. كما يتيح تمديد حدود الصورة بسلاسة، مما يجعل من السهل إنشاء صور موسَّعة ومفصلة. لا تعمل هذه التحسينات على تبسيط عملية التحرير فحسب، بل تفتح أيضاً إمكانيات إبداعية جديدة للمستخدمين، من المبدعين العاديين، إلى الفنانين المحترفين.

التنافس في سوق إنشاء الصور بالذكاء الاصطناعي

تواجه «ميدجورني»، الآن، منافسة شديدة من منصات مثل «xAI»، و«Imagen 3»، وكلتاهما تجلب نهجاً مبتكراً إلى الطاولة. تقدم «Grok-2» من «xAI»، والتي تعمل بنموذج «Flux.1K» مفتوح المصدر، بديلاً متساهلاً ومتعدد الاستخدامات يجذب قاعدة مستخدمين متنامية. وفي الوقت نفسه، أضافت «Imagen 3» من «غوغل» مزيداً من الضغط، مما أدى إلى تكثيف السباق نحو التفوق في توليد الصور بالذكاء الاصطناعي.

وفي خِضم ذلك، فإن قرار «ميدجورني» توسيع إمكانية الوصول إليها وتعزيز منصتها يعد خطوة استراتيجية للاحتفاظ بقاعدة مستخدميها وزيادتها. من خلال تقديم بدل يومي مجاني لـ25 نسخة من الصور، لا تجتذب «ميدجورني» مستخدمين جدداً فحسب، بل تشجع أيضاً المستخدمين الحاليين على استكشاف الإمكانات الكاملة للمنصة.

تعمل واجهة الويب الجديدة على تبسيط التعامل مع «ميدجورني» وجعلها أكثر سهولة في الاستخدام (شاترستوك)

التحديات القانونية

في حين تُواصل «ميدجورني» الابتكار، فإنها تواجه أيضاً تحديات قانونية كبيرة. تتورط الشركة حالياً في دعوى قضائية جماعية رفعها فنانون يزعمون أن الشركة استخدمت صوراً محمية بحقوق الطبع والنشر دون إذن لتدريب نماذج الذكاء الاصطناعي الخاصة بها. وقد رفض القاضي مؤخراً طلب «ميدجورني» برفض القضية، مما يسمح لها بالانتقال إلى مرحلة الاكتشاف. تُسلط هذه الدعوى القضائية الضوء على المناقشات الجارية حول حقوق الملكية الفكرية في عصر الذكاء الاصطناعي، مما يثير أسئلة مهمة حول الاستخدام الأخلاقي للمواد المحمية بحقوق الطبع والنشر في تدريب الذكاء الاصطناعي.

كما يبدو، يمثل تطور مسار «ميدجورني» من منصة تعتمد على «ديسكورد» إلى واجهة ويب شاملة، خطوةً مهمة إلى الأمام في صناعة إنشاء الصور بالذكاء الاصطناعي. وبذلك تضع نفسها في وضع يسمح لها بالبقاء في المقدمة في سوق مزدحمة بشكل متزايد.


مقالات ذات صلة

برامج للتحكّم بأسراب الطائرات من دون طيار الضخمة

علوم برامج للتحكّم بأسراب الطائرات من دون طيار الضخمة

برامج للتحكّم بأسراب الطائرات من دون طيار الضخمة

تقنيات «لمنع الحرب العالمية الثالثة»

باتريك تاكر (واشنطن)
تكنولوجيا «غوغل» تطلق النسخة الأولية من آندرويد 16 للمطورين مع ميزات جديدة لتعزيز الخصوصية ومشاركة البيانات الصحية (غوغل)

«غوغل» تطلق النسخة الأولية من آندرويد 16 للمطورين مع ميزات جديدة

أطلقت «غوغل» النسخة التجريبية الأولية من آندرويد 16 للمطورين، وهي خطوة تمهد الطريق للتحديثات الكبيرة المقبلة في هذا النظام.

عبد العزيز الرشيد (الرياض)
الاقتصاد مهندس يعمل في إحدى المنشآت التابعة لـ«معادن» (الشركة) play-circle 02:41

رئيس «معادن»: حفر 820 ألف متر من آبار الاستكشاف بالسعودية خلال عامين

تتعاون شركة التعدين العربية السعودية (معادن) مع رواد العالم وتستفيد من أحدث التقنيات لتقديم أكبر برنامج تنقيب في منطقة واحدة على مستوى العالم.

آيات نور (الرياض)
الاقتصاد عرض تقديمي في إحدى الفعاليات التقنية التي أقيمت بالعاصمة السعودية الرياض (واس)

رئيس «سكاي»: الذكاء الاصطناعي يعزز مستقبل الاقتصاد السعودي

تتصدر الشركة السعودية للذكاء الاصطناعي (سكاي) مسيرة بناء منظومة تقنية عالمية المستوى ما يمهد الطريق لتحقيق نمو اقتصادي مدفوع بالذكاء الاصطناعي

آيات نور (الرياض)
تكنولوجيا تمكنك «دورا» من تصميم مواقع ثلاثية الأبعاد مذهلة بسهولة تامة باستخدام الذكاء الاصطناعي دون الحاجة لأي معرفة برمجية (دورا)

صمم موقعك ثلاثي الأبعاد بخطوات بسيطة ودون «كود»

تتيح «دورا» للمستخدمين إنشاء مواقع مخصصة باستخدام الذكاء الاصطناعي عبر إدخال وصف نصي بسيط.

عبد العزيز الرشيد (الرياض)

هل وصل الذكاء الاصطناعي إلى حدوده القصوى؟

لوغو تطبيق «شات جي بي تي» (رويترز)
لوغو تطبيق «شات جي بي تي» (رويترز)
TT

هل وصل الذكاء الاصطناعي إلى حدوده القصوى؟

لوغو تطبيق «شات جي بي تي» (رويترز)
لوغو تطبيق «شات جي بي تي» (رويترز)

هل وصلت نماذج الذكاء الاصطناعي التوليدي إلى طريق مسدود؟ منذ إطلاق «تشات جي بي تي» قبل عامين، بعث التقدم الهائل في التكنولوجيا آمالاً في ظهور آلات ذات ذكاء قريب من الإنسان... لكن الشكوك في هذا المجال تتراكم.

وتعد الشركات الرائدة في القطاع بتحقيق مكاسب كبيرة وسريعة على صعيد الأداء، لدرجة أن «الذكاء الاصطناعي العام»، وفق تعبير رئيس «أوبن إيه آي» سام ألتمان، يُتوقع أن يظهر قريباً.

وتبني الشركات قناعتها هذه على مبادئ التوسع، إذ ترى أنه سيكون كافياً تغذية النماذج عبر زيادة كميات البيانات وقدرة الحوسبة الحاسوبية لكي تزداد قوتها، وقد نجحت هذه الاستراتيجية حتى الآن بشكل جيد لدرجة أن الكثيرين في القطاع يخشون أن يحصل الأمر بسرعة زائدة وتجد البشرية نفسها عاجزة عن مجاراة التطور.

وأنفقت مايكروسوفت (المستثمر الرئيسي في «أوبن إيه آي»)، و«غوغل»، و«أمازون»، و«ميتا» وغيرها من الشركات مليارات الدولارات وأطلقت أدوات تُنتج بسهولة نصوصاً وصوراً ومقاطع فيديو عالية الجودة، وباتت هذه التكنولوجيا الشغل الشاغل للملايين.

وتعمل «إكس إيه آي»، شركة الذكاء الاصطناعي التابعة لإيلون ماسك، على جمع 6 مليارات دولار، بحسب «سي إن بي سي»، لشراء مائة ألف شريحة من تصنيع «نفيديا»، المكونات الإلكترونية المتطورة المستخدمة في تشغيل النماذج الكبيرة.

وأنجزت «أوبن إيه آي» عملية جمع أموال كبيرة بقيمة 6.6 مليار دولار في أوائل أكتوبر (تشرين الأول)، قُدّرت قيمتها بـ157 مليار دولار.

وقال الخبير في القطاع غاري ماركوس «تعتمد التقييمات المرتفعة إلى حد كبير على فكرة أن النماذج اللغوية ستصبح من خلال التوسع المستمر، ذكاء اصطناعياً عاماً». وأضاف «كما قلت دائماً، إنه مجرد خيال».

- حدود

وذكرت الصحافة الأميركية مؤخراً أن النماذج الجديدة قيد التطوير تبدو وكأنها وصلت إلى حدودها القصوى، ولا سيما في «غوغل»، و«أنثروبيك» (كلود)، و«أوبن إيه آي».

وقال بن هورويتز، المؤسس المشارك لـ«a16z»، وهي شركة رأسمال استثماري مساهمة في «أوبن إيه آي» ومستثمرة في شركات منافسة بينها «ميسترال»: «إننا نزيد (قوة الحوسبة) بالمعدل نفسه، لكننا لا نحصل على تحسينات ذكية منها».

أما «أورايون»، أحدث إضافة لـ«أوبن إيه آي» والذي لم يتم الإعلان عنه بعد، فيتفوق على سابقيه لكن الزيادة في الجودة كانت أقل بكثير مقارنة بالقفزة بين «جي بي تي 3» و«جي بي تي 4»، آخر نموذجين رئيسيين للشركة، وفق مصادر أوردتها «ذي إنفورميشن».

ويعتقد خبراء كثر أجرت «وكالة الصحافة الفرنسية» مقابلات معهم أن قوانين الحجم وصلت إلى حدودها القصوى، وفي هذا الصدد، يؤكد سكوت ستيفنسون، رئيس «سبيلبوك»، وهي شركة متخصصة في الذكاء الاصطناعي القانوني التوليدي، أن «بعض المختبرات ركزت كثيراً على إضافة المزيد من النصوص، معتقدة أن الآلة ستصبح أكثر ذكاءً».

وبفضل التدريب القائم على كميات كبيرة من البيانات المجمعة عبر الإنترنت، باتت النماذج قادرة على التنبؤ، بطريقة مقنعة للغاية، بتسلسل الكلمات أو ترتيبات وحدات البكسل. لكن الشركات بدأت تفتقر إلى المواد الجديدة اللازمة لتشغيلها.

والأمر لا يتعلق فقط بالمعارف: فمن أجل التقدم، سيكون من الضروري قبل كل شيء أن تتمكن الآلات بطريقة أو بأخرى من فهم معنى جملها أو صورها.

- «تحسينات جذرية»

لكنّ المديرين في القطاع ينفون أي تباطؤ في الذكاء الاصطناعي. ويقول داريو أمودي، رئيس شركة «أنثروبيك»، في البودكاست الخاص بعالم الكمبيوتر ليكس فريدمان «إذا نظرنا إلى وتيرة تعاظم القدرات، يمكننا أن نعتقد أننا سنصل (إلى الذكاء الاصطناعي العام) بحلول عام 2026 أو 2027».

وكتب سام ألتمان الخميس على منصة «إكس»: «ليس هناك طريق مسدود». ومع ذلك، أخّرت «أوبن إيه آي» إصدار النظام الذي سيخلف «جي بي تي - 4».

وفي سبتمبر (أيلول)، غيّرت الشركة الناشئة الرائدة في سيليكون فالي استراتيجيتها من خلال تقديم o1، وهو نموذج من المفترض أن يجيب على أسئلة أكثر تعقيداً، خصوصاً في مسائل الرياضيات، وذلك بفضل تدريب يعتمد بشكل أقل على تراكم البيانات مرتكزاً بدرجة أكبر على تعزيز القدرة على التفكير.

وبحسب سكوت ستيفنسون، فإن «o1 يمضي وقتاً أطول في التفكير بدلاً من التفاعل»، ما يؤدي إلى «تحسينات جذرية».

ويشبّه ستيفنسون تطوّر التكنولوجيا باكتشاف النار: فبدلاً من إضافة الوقود في شكل بيانات وقدرة حاسوبية، حان الوقت لتطوير ما يعادل الفانوس أو المحرك البخاري. وسيتمكن البشر من تفويض المهام عبر الإنترنت لهذه الأدوات في الذكاء الاصطناعي.