«ميدجورني» لتوليد الصور عبر الذكاء الاصطناعي أصبحت واجهة ويب شاملة

تواجه الشركة دعوى قضائية جماعية رفعها فنانون يزعمون أنها استخدمت صوراً محمية بحقوق الطبع والنشر (شاترستوك)
تواجه الشركة دعوى قضائية جماعية رفعها فنانون يزعمون أنها استخدمت صوراً محمية بحقوق الطبع والنشر (شاترستوك)
TT

«ميدجورني» لتوليد الصور عبر الذكاء الاصطناعي أصبحت واجهة ويب شاملة

تواجه الشركة دعوى قضائية جماعية رفعها فنانون يزعمون أنها استخدمت صوراً محمية بحقوق الطبع والنشر (شاترستوك)
تواجه الشركة دعوى قضائية جماعية رفعها فنانون يزعمون أنها استخدمت صوراً محمية بحقوق الطبع والنشر (شاترستوك)

احتلت «ميدجورني (Midjourney)» مكانة بارزة في مجال توليد النصوص إلى الصور باستخدام الذكاء الاصطناعي، وغالباً ما يجري الاحتفال بها بوصفها «ملك» الإبداع المدفوع بالذكاء الاصطناعي. ومع ازدياد المنافسة في مجال توليد الصور باستخدام الذكاء الاصطناعي، ودخول لاعبين جدد مثل «xAI»، التابع لإيلون ماسك، و«Imagen 3» من «غوغل»، الساحة، تواجه «ميدجورني» تحديات جديدة. الآن، تحقق الشركة تحولاً كبيراً من خلال إطلاق واجهة ويب جديدة، وفتح أبوابها لجمهور أوسع، وتقديم ميزات محسَّنة لكل من المستخدمين المبتدئين والمتمرسين.

واجهة ويب جديدة

ولتحسين إمكانية الوصول، يمثل الانتقال من منصة تعتمد على «ديسكورد (Discord)» إلى واجهة ويب كاملة، لحظة محورية لـ«ميدجورني». في السابق، كان المستخدمون بحاجة للتفاعل مع «ميدجورني» عبر أوامر «ديسكورد»؛ وهي طريقة، على الرغم من قوتها، قد تكون مرهِقة للمستخدمين الجدد. ومع ذلك تعمل واجهة الويب الجديدة على تبسيط هذه العملية، مما يجعلها أكثر سهولة في الاستخدام. لا يعمل هذا التحول على خفض حاجز الدخول فحسب، بل يعمل أيضاً على توسيع الوصول إلى مجموعة أوسع من المستخدمين.

تجربة أكثر بساطة

عند زيارة موقع «ميدجورني» الجديد، يجري الترحيب بالمستخدمين بتجربة مبسَّطة. التسجيل بسيط، مما يسمح لهم بالتسجيل باستخدام حسابات «غوغل» أو «ديسكورد». وبمجرد تسجيل الدخول، يمكن للمستخدمين إنشاء ما يصل إلى 25 صورة يومياً دون أي تكلفة، مما يمنحهم فرصة خالية من المخاطر لاستكشاف قدرات المنصة. تتضمن الواجهة علامة تبويب «إنشاء» لتوليد الصور، وصفحة «استكشاف» لتصفُّح مجموعة واسعة من المحتوى الذي ينشئه المستخدم.

تشهد الشركة منافسة شرسة من قِبل «xAI» التابعة لإيلون ماسك و«Imagen 3» من «غوغل» (شاترستوك)

محرر الصور الموحد بالذكاء الاصطناعي

تُعد قوة الإبداع واحدة من أبرز ميزات منصة «ميدجورني» الجديدة على الويب. تعمل هذه الأداة على دمج عدد من الميزات القوية في واجهة واحدة سهلة الاستخدام، مما يعزز تجربة المستخدم بشكل كبير. يتضمن «المحرر» أدوات للرسم الداخلي، وتمديد اللوحة القماشية، وإعادة التأطير، والتكبير، مما يسمح للمستخدمين بتحسين صورهم المولَّدة بواسطة الذكاء الاصطناعي بدقة. وجرت إضافة «فرشاة» افتراضية، مما يوفر تحكماً أكبر عند تحرير أجزاء معينة من الصورة.

يتيح هذا النهج المتكامل لتحرير الصور للمستخدمين إعادة طلاء أجزاء من الصورة باستخدام صور جديدة جرى إنشاؤها بواسطة الذكاء الاصطناعي بناءً على مطالبات نصية. كما يتيح تمديد حدود الصورة بسلاسة، مما يجعل من السهل إنشاء صور موسَّعة ومفصلة. لا تعمل هذه التحسينات على تبسيط عملية التحرير فحسب، بل تفتح أيضاً إمكانيات إبداعية جديدة للمستخدمين، من المبدعين العاديين، إلى الفنانين المحترفين.

التنافس في سوق إنشاء الصور بالذكاء الاصطناعي

تواجه «ميدجورني»، الآن، منافسة شديدة من منصات مثل «xAI»، و«Imagen 3»، وكلتاهما تجلب نهجاً مبتكراً إلى الطاولة. تقدم «Grok-2» من «xAI»، والتي تعمل بنموذج «Flux.1K» مفتوح المصدر، بديلاً متساهلاً ومتعدد الاستخدامات يجذب قاعدة مستخدمين متنامية. وفي الوقت نفسه، أضافت «Imagen 3» من «غوغل» مزيداً من الضغط، مما أدى إلى تكثيف السباق نحو التفوق في توليد الصور بالذكاء الاصطناعي.

وفي خِضم ذلك، فإن قرار «ميدجورني» توسيع إمكانية الوصول إليها وتعزيز منصتها يعد خطوة استراتيجية للاحتفاظ بقاعدة مستخدميها وزيادتها. من خلال تقديم بدل يومي مجاني لـ25 نسخة من الصور، لا تجتذب «ميدجورني» مستخدمين جدداً فحسب، بل تشجع أيضاً المستخدمين الحاليين على استكشاف الإمكانات الكاملة للمنصة.

تعمل واجهة الويب الجديدة على تبسيط التعامل مع «ميدجورني» وجعلها أكثر سهولة في الاستخدام (شاترستوك)

التحديات القانونية

في حين تُواصل «ميدجورني» الابتكار، فإنها تواجه أيضاً تحديات قانونية كبيرة. تتورط الشركة حالياً في دعوى قضائية جماعية رفعها فنانون يزعمون أن الشركة استخدمت صوراً محمية بحقوق الطبع والنشر دون إذن لتدريب نماذج الذكاء الاصطناعي الخاصة بها. وقد رفض القاضي مؤخراً طلب «ميدجورني» برفض القضية، مما يسمح لها بالانتقال إلى مرحلة الاكتشاف. تُسلط هذه الدعوى القضائية الضوء على المناقشات الجارية حول حقوق الملكية الفكرية في عصر الذكاء الاصطناعي، مما يثير أسئلة مهمة حول الاستخدام الأخلاقي للمواد المحمية بحقوق الطبع والنشر في تدريب الذكاء الاصطناعي.

كما يبدو، يمثل تطور مسار «ميدجورني» من منصة تعتمد على «ديسكورد» إلى واجهة ويب شاملة، خطوةً مهمة إلى الأمام في صناعة إنشاء الصور بالذكاء الاصطناعي. وبذلك تضع نفسها في وضع يسمح لها بالبقاء في المقدمة في سوق مزدحمة بشكل متزايد.


مقالات ذات صلة

إذا كنت تعاني من كتابة بريد إلكتروني... «غوغل» تقدم لك الحل

تكنولوجيا بحد أدنى 12 كلمة يمكن لـ«جيمناي» تحويل ملاحظات المستخدمين إلى بريد إلكتروني مصقول وجاهز للإرسال (شاترستوك)

إذا كنت تعاني من كتابة بريد إلكتروني... «غوغل» تقدم لك الحل

«ساعدني في الكتابة» و«صقل مسودتي» لمساعدة المستخدمين في صقل رسائلهم دون عناء.

نسيم رمضان (لندن)
تكنولوجيا يتيح الاستماع للبودكاست مباشرةً من أي متصفح إمكانية الوصول إلى مكتبة البرامج وقوائم الانتظار«أبل»

«أبل» تتيح الوصول إلى خدمة البودكاست عبر الويب

في خطوة جديدة تسعى من خلالها إلى تحسين تجربة المستخدمين وتوسيع نطاق خدماتها، أتاحت شركة «أبل» إمكانية الوصول إلى خدمة (بودكاست أبل) عبر الويب. هذه الخطوة تأتي…

عبد العزيز الرشيد (الرياض)
تكنولوجيا برنامج مكافآت الثغرات الأمنية لمتجر «غوغل بلاي» كان يهدف إلى مكافأة الباحثين عن اكتشاف الثغرات في تطبيقات «أندرويد» (غوغل)

«غوغل» تعلن إيقاف برنامج مكافآت الثغرات الأمنية لمتجرها

البرنامج سيتوقف اعتباراً من 31 أغسطس (آب) 2024 بعد استمراره لمدة 7 سنوات!

عبد العزيز الرشيد (الرياض)
تكنولوجيا يساعد تطبيق «Microsoft Teams» الموحد الجديد المستخدمين في التنقل بين الحسابات الشخصية والعملية والتعليمية بسهولة (مايكروسوفت)

«مايكروسوفت تيمز» أصبح الآن موحداً بين مختلف الحواسيب

لتبسيط وتعزيز تجربة المستخدم مما يلغي الحاجة إلى عمليات تثبيت متعددة.

نسيم رمضان (لندن)
خاص لعبت «إنتل» دوراً محورياً في دمج الحلول القائمة على الذكاء الاصطناعي لتعزيز تجربة المشجعين والرياضيين والمنظمين (إنتل)

خاص هل ستكون تقنيات أولمبياد باريس نموذجاً للمدن الذكية مستقبلاً؟

هذه الابتكارات ستعزز تصميم المدن والتنقل داخلها لجعلها أكثر كفاءةً وشمولاً.

نسيم رمضان (لندن)

أجهزة كومبيوتر تشم! طموح لرئيس شركة «مهووس بالروائح»

إحدى الشركات تريد استخدام التكنولوجيا لمحاكاة حاسة الشم (رويترز)
إحدى الشركات تريد استخدام التكنولوجيا لمحاكاة حاسة الشم (رويترز)
TT

أجهزة كومبيوتر تشم! طموح لرئيس شركة «مهووس بالروائح»

إحدى الشركات تريد استخدام التكنولوجيا لمحاكاة حاسة الشم (رويترز)
إحدى الشركات تريد استخدام التكنولوجيا لمحاكاة حاسة الشم (رويترز)

من حواس الإنسان الخمس، يستطيع الذكاء الاصطناعي محاكاة حاستي البصر والسمع، إلا إن إحدى الشركات تريد استخدام التكنولوجيا لمحاكاة حاسة الشم أيضاً.

ويسعى أليكس ويلشكو، الرئيس التنفيذي والمؤسس المشارك لشركة «Osmo»، وهي شركة ناشئة، لاستخدام تكنولوجيا الذكاء الاصطناعي لمساعدة أجهزة الكمبيوتر على «توليد الروائح مثلما نولد الصور والأصوات»، وفقاً لموقع الشركة على الإنترنت.

وكان ويلشكو «مهووساً بالروائح» لفترة طويلة، وقال لشبكة «سي إن بي سي»: «لقد كان شغفي هو محاولة فهم الرائحة. إنها حاسة عاطفية قوية جداً، لكننا لا نعرف عنها سوى القليل».

ولهذا السبب، حصل ويلشكو على درجة البكالوريوس في علم الأعصاب من جامعة ميشيغان، ودرس علم أعصاب الشم في جامعة هارفارد، حيث حصل على درجة الدكتوراه في عام 2016.

في العام التالي، أصبح عالماً باحثاً في «Google Research»، حيث أمضى 5 سنوات في قيادة فريق استخدم التعلم الآلي لمساعدة أجهزة الكمبيوتر على التنبؤ بكيفية رائحة الجزيئات المختلفة بناءً على بنيتها.

وفيما بدأت شركة «Osmo» كمشروع بحثي خلال أيام ويلشكو في «غوغل»، فقد شرع في إطلاقها كشركة ناشئة منفصلة في عام 2022 بدعم من «Lux Capital» و«Google Ventures».

وبصفته الرئيس التنفيذي للشركة، أوضح أن مهمة الشركة الناشئة هي «تحسين صحة الإنسان وسعادته» من خلال رقمنة حاسة الشم لدى البشر.

لكن ما السبب الذي يجعل ويلشكو يعتقد أن البشر يمكن أن يستفيدوا من منح أجهزة الكمبيوتر القدرة على معالجة الرائحة؟ وكيف طوّرت «أوزمو» تقنيتها الفريدة، وتأمل أن تتمكن التكنولوجيا من تحقيقه في المستقبل؟

والسؤال الكبير هو، لماذا نمنح أجهزة الكمبيوتر القدرة على الشم؟ أحد الأسباب الرئيسية التي يستشهد بها ويلشكو هو أنها ضرورية لمساعدة المهنيين الطبيين على اكتشاف الأمراض.

وقال: «لقد علمنا أن الرائحة تحتوي على معلومات يمكننا استخدامها للكشف عن المرض. لكن أجهزة الكمبيوتر لا تستطيع التحدث بهذه اللغة، ولا يمكنها تفسير هذه البيانات بعد».

وفي حين أن هذا هو هدفه الطويل الأجل للشركة، فإنه يريد في الأمد القريب أن تصنع «أوزمز» جزيئات عطرية أكثر أماناً واستدامة للعطور في المنتجات اليومية، مثل العطور والشامبو وطارد الحشرات ومنظفات الغسيل.

وقال: «عادةً ما تحتوي هذه المنتجات على عطور صمّمها عدد صغير جداً من الشركات السرية. نعتقد أنه يمكننا أن نعمل بشكل أفضل معهم من خلال بناء مكونات أفضل وأكثر أماناً وغير سامة... ولا تهيج بشرتك أو عينيك».

أما عن طريقة استخدام الشركة للذكاء الاصطناعي لتحويل الرائحة إلى رقمية، فأوضح ويلشكو أنه خلال فترة عمله في «غوغل»، استخدم فريقه برنامج التعلم الآلي لتطوير «خريطة الرائحة الرئيسية». للقيام بذلك، درّب فريقه نموذج الذكاء الاصطناعي الخاص بهم على مجموعة بيانات مكونة من 5000 جزيء عطر عبر فئات مختلفة من الروائح، مثل الأزهار أو الفواكه أو النعناع.

وجد ويلشكو أن الجزيئات قد يكون من الصعب على أجهزة الكمبيوتر تحليلها بسبب هياكلها المعقدة.

وأوضح أن «السبب وراء صعوبة الأمر هو أنه يمكنك تحريك شيء صغير في هذا الجزيء، مثل رابطة واحدة، وتتحول رائحة الجزيء من الورود إلى البيض الفاسد».

ولكن بفضل التقدم في تكنولوجيا الذكاء الاصطناعي، تمكن النموذج من التقاط الأنماط في الهياكل المختلفة للجزيئات واستخدام هذه المعرفة للتنبؤ بدقة برائحة الجزيئات الأخرى، وقال: «كان خارقاً في قدرته على التنبؤ برائحة الأشياء».

بناء «أوزمو» من الألف إلى الياء

في حين يمكن تدريب نماذج اللغة الكبيرة، المعروفة باسم روبوتات الدردشة بالذكاء الاصطناعي، على البيانات من «الإنترنت بالكامل»، فإن مكتبة رقمية مماثلة للمعلومات حول الروائح لم تكن متاحة بسهولة عندما بدأوا في بناء نموذج الذكاء الاصطناعي الخاص بهم، وفقاً لويلشكو.

وقال: «الشيء الوحيد الذي أدركناه هو أنه لا يمكننا استخدام بيانات أي شخص آخر. لقد أمضينا في الواقع نحو عام في العمل مع شركات في صناعة العطور، كان لديها ما اعتقدوا أنه مجموعات بيانات رائعة، لكن وجدناها ليست كذلك».

وقد دفع ذلك ويلشكو وفريقه إلى بناء «نوع جديد من البيانات»، بحسبه.

لقد حصلوا على آلاف الجزيئات وأوصاف روائحها، وفقاً لخبراء العطور. ثم قاموا بإدخال هذه البيانات في الشبكات العصبية الرسومية (GNNs)، التي تندرج تحت مظلة التعلم الآلي، وتستخدم خوارزميات قوية لاكتشاف وتحليل العلاقات بين نقاط البيانات. في هذه المرحلة من العملية، فكّر في شبكة اجتماعية حيث يمكنك رؤية الأشخاص وكيف يرتبطون بالصداقات.

وقال إن فريقه يمكنه بعد ذلك استخدام الشبكات العصبية الرسومية لمساعدة نموذج الذكاء الاصطناعي الخاص بهم على فهم الذرات والروابط التي تربط بينها، وكيف يحدد هذا الهيكل الجزيئي رائحتها.

وفي النهاية، تريد «Osmo» أن تكون قادرة على استخدام تقنيتها لنقل الروائح عن طريق رقمنة الرائحة في مكان واحد وإعادة إنشاء نسخة دقيقة في مكان آخر، بحسب ويلشكو.

وقال: «هذه هي الطريقة التي تثبت بها لنفسك أن نموذج الذكاء الاصطناعي الخاص بك يفهم حقاً رائحة شيء ما، لأنه إذا لم تتمكن من إعادة إنشائه بحيث تكون رائحته مطابقة للرائحة الأصلية، فأنت تخدع نفسك».

ويخطط ويلشكو أيضاً لمواصلة العمل نحو تحقيق هدفه الطويل الأمد، المتمثل في استخدام التكنولوجيا للمساعدة في تحديد الأمراض في وقت مبكر.

وختم بالقول: «سنكون قادرين في النهاية على اكتشاف الأمراض بالرائحة، ونحن في طريقنا لبناء هذه التكنولوجيا. لن يحدث هذا هذا العام، أو في أي وقت قريب، لكننا في طريقنا».