أداة «ويسك» من «غوغل» لتجربة إبداعية مفيدة بالذكاء الاصطناعي
«ويسك» أداة ذكاء اصطناعي تتيح للمستخدمين إنشاء صور جديدة عبر دمج عناصر من صورهم الأصلية مع التحكم في الأسلوب والمشهد والتفاصيل الإبداعية (غوغل)
أطلقت «غوغل» مؤخراً أداة «ويسك (Whisk)»، وهي تجربة جديدة ضمن مشروع «مختبرات غوغل (Google Labs)» تهدف إلى تطوير طرق مبتكرة لإنشاء الصور باستخدام الذكاء الاصطناعي. تتيح هذه الأداة للمستخدمين الاستفادة من الصور الأصلية بوصفها مُدخلات، بدلاً من الاعتماد فقط على الأوامر النصية المكتوبة.
كيفية عمل خدمة وأداة «ويسك»
تتميز أداة «ويسك» بإمكانية سحب وإفلات الصور في واجهتها البسيطة، حيث يجري تحديد ثلاثة عناصر رئيسية على أنها مُدخلات:
• الموضوع، أي العنصر الرئيسي في الصورة.
• المشهد وهو البيئة أو المكان الذي يظهر فيه الموضوع.
• الأسلوب وهو الطابع الفني للصورة مثل الواقعية أو الرسوم المتحركة.
تتيح أداة «ويسك» إنشاء صور بالذكاء الاصطناعي عبر تحديد الموضوع والمشهد والأسلوب من صورة أصلية مع إمكانية تعديل النتائج بوصف نصي (غوغل)
بالإضافة إلى هذه الخيارات، يمكن إضافة وصف نصي لتقديم تفاصيل إضافية حول النتيجة المطلوبة. تقوم الأداة، بعد ذلك، باستخدام نموذج الذكاء الاصطناعي «جيميناي (Gemini)» لتحليل الصور وتوليد وصف نصي دقيق، ثم تمرر هذه الأوصاف إلى نموذج إنشاء الصور «إيماجن 3 (Imagen 3)» من «غوغل»؛ للحصول على النتيجة النهائية.
ثلاثة مميزات لأداة «ويسك»
• التحكم الإبداعي حيث تمنح الأداة المستخدمين حرية كبيرة في التحكم بالصور، مما يسمح بدمج وتعديل العناصر المختلفة للحصول على نتائج فريدة.
• سهولة الاستخدام حيث يمكن لأي شخص استخدام الأداة، دون الحاجة إلى خبرة تقنية؛ بفضل واجهتها البسيطة والمباشرة.
• إمكانية التعديل في حال كانت النتائج غير مُرضية، يمكن للمستخدم تعديل الأوصاف النصية لتحسين الصورة.
أداة «ويسك» لا تدعم دمج صورتين لكنها تتيح تعديل صورة واحدة عبر اختيار الموضوع والمشهد والأسلوب (غوغل)
الهدف من الأداة وتوفرها
جرى تصميم «ويسك» لتكون وسيلة استكشاف بصري سريعة، بدلاً من أداة تحرير صور دقيقة. تُعد هذه الأداة جزءاً من جهود «غوغل» لتطوير حلول ذكاء اصطناعي تُسهّل العمليات الإبداعية وتُعزز الابتكار في مجال التصميم الرقمي. تتوفر «ويسك» للمستخدمين في الولايات المتحدة عبر منصة «مختبرات غوغل». يمكن الاشتراك في التجربة من خلال زيارة الموقع الرسمي لـ«مختبرات غوغل».
ومع استمرار «غوغل» في تطوير تقنيات الذكاء الاصطناعي، تُعد أداة «ويسك» مثالاً جديداً على كيفية تسخير التكنولوجيا لتحفيز الإبداع، وتقديم حلول مبتكرة لصنّاع المحتوى والمبدعين.
أفكار وأوامر بسيطة تتيح للذكاء الاصطناعي إنشاء برامج كومبيوتريةhttps://aawsat.com/%D8%AA%D9%83%D9%86%D9%88%D9%84%D9%88%D8%AC%D9%8A%D8%A7/5127609-%D8%A3%D9%81%D9%83%D8%A7%D8%B1-%D9%88%D8%A3%D9%88%D8%A7%D9%85%D8%B1-%D8%A8%D8%B3%D9%8A%D8%B7%D8%A9-%D8%AA%D8%AA%D9%8A%D8%AD-%D9%84%D9%84%D8%B0%D9%83%D8%A7%D8%A1-%D8%A7%D9%84%D8%A7%D8%B5%D8%B7%D9%86%D8%A7%D8%B9%D9%8A-%D8%A5%D9%86%D8%B4%D8%A7%D8%A1-%D8%A8%D8%B1%D8%A7%D9%85%D8%AC-%D9%83%D9%88%D9%85%D8%A8%D9%8A%D9%88%D8%AA%D8%B1%D9%8A%D8%A9
أفكار وأوامر بسيطة تتيح للذكاء الاصطناعي إنشاء برامج كومبيوترية
البرمجة من دون لغة برمجية تشابه عملية التحكم بالطرق القيديم بواسطة الازرار والمفاتيح
أنا لست مبرمجاً، ولا أستطيع أن أكتب سطراً واحداً بلغة بايثون Python للبرمجة عالية المستوى، أو لغة جافا سكريبت JavaScript للبرمجة أو لغة C ++ للبرمجة.
وباستثناء فترة قصيرة في سنوات مراهقتي، عندما كنت أقوم ببناء مواقع إلكترونية وأتلاعب بالرسوم المتحركة، فإني لم أكن مهندس برمجيات، ولا أطمح إلى ترك الصحافة من أجل العمل في صناعة التكنولوجيا.
ومع ذلك، فقد كنت أكتب الكثير من الرموز(الأكواد) البرمجية على مدى الأشهر القليلة الماضية.
توظيف الذكاء الاصطناعي للبرمجة
ومن بين إبداعاتي توصلت إلى أداة تقوم بنسخ وتلخيص المدونات الصوتية (Podcasts) الطويلة، وأداة لتنظيم إشاراتي المرجعية (Bookmarks) على وسائل التواصل الاجتماعي في قاعدة بيانات قابلة للبحث، كما توصلت إلى موقع ويب يخبرني ما إذا كان حجم أي قطعة أثاث يناسب صندوق سيارتي، وإلى تطبيق يسمى LunchBox Buddy، الذي يحلل محتويات ثلاجتي ويساعدني في تحديد ما يمكنني تحضيره لغداء ابني في المدرسة.
محادثة مع اداة الذكاء الاصطناعي لصنع تطبيق لوجبات غداء للاطفال
وكل هذه الإبداعات كانت ممكنة بفضل تقنية الذكاء الاصطناعي، والاتجاه الجديد في الذكاء الاصطناعي الذي يُعرف باسم (Vibecoding). وهو مصطلح مبتكر يستخدم لوصف طريقة بناء التطبيقات أو المواقع باستخدام أدوات الذكاء الاصطناعي بشكل بسيط وغير تقني؛ إذ يشير إلى إنشاء البرامج أو تطوير التطبيقات عن طريق كتابة أو تقديم أفكار أو أوامر بسيطة، غالباً تكون نصوصاً، لأدوات الذكاء الاصطناعي، بدلاً من كتابة الأكواد البرمجية المعقدة.
ويعد Vibecoding، وهو مصطلح ابتكره الباحث في مجال الذكاء الاصطناعي أندريه كارباثي، اختصاراً مفيداً للطريقة التي تسمح بها أدوات الذكاء الاصطناعي اليوم حتى للهواة غير المتخصصين ببناء تطبيقات ومواقع ويب تعمل بشكل كامل، فقط عن طريق كتابة التعليمات في مربع النص؛ إذ لا تحتاج إلى معرفة كيفية البرمجة لكي تمارس هذه الطريقة؛ إذ إنه مجرد وجود فكرة، وقليل من الصبر، عادةً ما يكون كافياً.
وصف الأفكار
وقد كتب كارباثي الشهر الماضي عن الأمر قائلاً: «هذه ليست برمجة حقيقية، أنا فقط أنظر إلى الأفكار والمشاكل، وأكتب وصفاً لما أريده، وأقوم بتشغيل الأدوات، ثم نسخ الأكواد ولصقها، وفي الغالب ينجح الأمر».
وقد كانت تجاربي الخاصة في Vibecoding تهدف إلى إنشاء ما أسميه «برمجيات الشخص الواحد» «software for one»، وهي تطبيقات صغيرة مُخصَّصة تهدف لحل مشاكل معينة في حياتي، فهذه ليست من أنواع الأدوات التي قد تبنيها شركات التكنولوجيا الكبيرة، ولا توجد سوق حقيقية لها، كما أن ميزاتها تكون محدودة، وبعضها يعمل بشكل جزئي فقط.
لكن بناء البرمجيات بهذه الطريقة، من خلال وصف مشكلة في جملة أو جملتين، ثم مشاهدة نموذج ذكاء اصطناعي قوي يعمل على بناء أداة مُخصَّصة لحلها، هو تجربة مذهلة، فهي تخلق شعوراً بالذهول الناتج عن استخدام الذكاء الاصطناعي، على غرار ما شعرت به بعد استخدام تطبيق ChatGPT لأول مرة.
وهي أفضل طريقة وجدتها لإثبات قدرات نماذج الذكاء الاصطناعي اليوم للمشككين، والتي يمكنها أتمتة أجزاء كبيرة من البرمجة الأساسية للكومبيوتر، وقد تكون قادرة قريباً على تحقيق إنجازات مماثلة في مجالات أخرى.
صحيح أن أدوات البرمجة باستخدام الذكاء الاصطناعي موجودة منذ سنوات، وقد صُممت أدوات سابقة، مثل GitHub Copilot، لمساعدة المبرمجين المحترفين على العمل بشكل أسرع، وذلك جزئياً من خلال تكملة أسطر الشيفرة البرمجية الخاصة بهم بالطريقة نفسها التي يكمل بها ChatGPT الجملة، لكننا كنا لا نزال في حاجة إلى معرفة كيفية البرمجة للحصول على أقصى استفادة منها والتدخل عندما يتعثر الذكاء الاصطناعي.
أدوات ذكية جديدة
لكن على مدى العام أو العامين الماضيين، تم بناء أدوات جديدة للاستفادة من نماذج الذكاء الاصطناعي الأكثر قوة التي تمكّن حتى المبتدئين من البرمجة مثل المحترفين.
وتعمل هذه الأدوات، التي تشمل Cursor وReplit وBolt وLovable، بالطريقة نفسها تقريباً، فبناءً على تعليمات المُستخدِم، تقوم الأداة بتصميم المنتَج، وتحدد أفضل الشيفرات البرمجية ولغات البرمجة التي يجب استخدامها، ثم تبدأ العمل على بناء المنتَج، وتسمح معظم الأدوات باستخدام محدود مجاني، مع وجود مستويات أخرى مدفوعة تفتح ميزات أفضل، وقدرة على بناء المزيد من المنتجات.
وبالنسبة لغير المبرمجين، فإن الـVibecoding يمكن أن يبدو وكأنه أشبه بالسحر، فبعد كتابة التعليمات الخاصة بك، تظهر سطور غامضة من التعليمات البرمجية بسرعة، وبعد بضع ثوانٍ قليلة، إذا سار كل شيء على ما يرام، يظهر نموذج أولي يعمل، ويمكن للمستخدمين اقتراح تعديلات أو تغييرات، وعندما يكونون راضين عن منتجهم الجديد، فإن بإمكانهم نشره على الويب أو تشغيله على أجهزة الكمبيوتر الخاصة بهم، ويمكن أن تستغرق العملية بضع دقائق فقط، أو ساعات عدة، اعتماداً على مدى التعقيد.
تجربة تخلق شعوراً بالذهول من قدرات الأدوات الذكية
تطبيق شخصي لوجبة غداء للأطفال
وقد طلبت من Bolt بناء تطبيق يمكن أن يساعدني في تحضير وجبة غداء مدرسية لابني، بناءً على صورة تم تحميلها لمحتويات ثلاجتي، وبعد نحو 10 دقائق من إدخال التعليمات الخاصة بي، كان LunchBox Buddy وهو الاسم الذي اختاره الذكاء الاصطناعي لتطبيقي الجديد، جاهزاً، واقترح إعداد شطيرة ديك رومي عادية.
ولم تكن جميع تجاربي في Vibecoding ناجحة، حيث واجهت صعوبة لمدة أسابيع في بناء أداة «Inbox Autopilot» التي يمكنها الرد على رسائل البريد الإلكتروني الخاصة بي تلقائياً، بأسلوبي في الكتابة نفسه، كما واجهت عقبات عند محاولة دمج العمليات التي يتم تنفيذها باستخدام الذكاء الاصطناعي في تطبيقات مثل Google Photos وiOS Voice Memos، والتي لم يتم تصميمها للعمل بشكل جيد مع الإضافات الخارجية من أطراف ثالثة.
وبالطبع، يرتكب الذكاء الاصطناعي أخطاءً أحياناً، فذات مرة، عندما حاولت إنشاء موقع ويب لمتجر إطارات في الحي الذي أسكن به، اختلق الذكاء الاصطناعي تقييمات مزيفة من صفحة مفترضة للمتجر على Yelp (وهو موقع يقدم تقييمات للمحال التجارية والخدمات) وأضافها إلى صفحة التقييمات على الموقع الإلكتروني للمتجر.
وفي مرة أخرى، عندما حاولت تحويل قصة طويلة كتبتها موقعاً إلكترونياً تفاعلياً، أدرج الذكاء الاصطناعي نحو نصف النَص وترك النصف الآخر.
وبعبارة أخرى، لا يزال الـVibecoding في حاجة إلى الاستفادة من وجود البشر للإشراف على الروبوتات أو على الأقل التواجد بالقرب منها، ومن المحتمل أن يكون أفضل لمشاريع الهواة، وليس للمهام الأساسية.
لكن هذه الحال قد لا تستمر طويلاً، فالكثير من شركات الذكاء الاصطناعي تعمل على تطوير وكلاء لهندسة البرمجيات التي قد تحل محل المبرمجين البشريين بشكل كامل، وبالفعل، يحقق الذكاء الاصطناعي درجات عالمية في اختبارات البرمجة التنافسية، كما قامت الكثير من شركات التكنولوجيا الكبرى، بما في ذلك «غوغل»، بتفويض جزء كبير من أعمالها الهندسية إلى أنظمة الذكاء الاصطناعي.
وقد صرَّح سوندار بيتشاي، الرئيس التنفيذي لـلشركة أخيراً، بأن الشيفرة البرمجية التي يولدها الذكاء الاصطناعي تمثل أكثر من ربع جميع الشيفرات الجديدة الذي يتم نشرها في الشركة.
إذن، لو كنت مبرمجاً مبتدئاً، وهو النوع الذي يبدو أن الذكاء الاصطناعي من المرجح أن يحل محله، فقد أشعر بحالة من الذعر بشأن مستقبل وظيفتي، لكنني مجرد شخص يحب التجريب وبناء الأدوات التي تعمل على تحسين حياتي بطرق بسيطة، والـVibecoding، أو البرمجة الفعلية، هي أحد المجالات التي يبدو أن الذكاء الاصطناعي يتطور فيها بشكل لا لَبس فيه.