2024... عام «النقلة النوعية» للذكاء الاصطناعي

روبوتات المحادثة تنتج الصور الفورية والروبوتات الميكانيكية تتعلّم

2024... عام «النقلة النوعية» للذكاء الاصطناعي
TT

2024... عام «النقلة النوعية» للذكاء الاصطناعي

2024... عام «النقلة النوعية» للذكاء الاصطناعي

خلال حدثٍ تقني استضافته سان فرانسيسكو في نوفمبر (تشرين الثاني) الماضي، سُئل سام ألتمان، الرئيس التنفيذي لشركة الذكاء الاصطناعي «أوبن إيه آي» عن المفاجآت التي سيشهدها المجال في عام 2024.

جاء ردّه سريعاً على الشكل التّالي: «روبوتات المحادثة كـ(تشات جي بي تي) ستحقّق قفزة نوعية لم يكن أحدٌ يتوقعها». وإلى جانبه، كان يجلس جايمس مانييكا المدير التنفيذي من شركة «غوغل»، الذي هزّ رأسه وقال: «وأنّا أؤيّد هذا الكلام».

تحسينات سريعة

ميزة واحدة تُعرّف صناعة الذكاء الاصطناعي هذا العام: تحسّنٌ سريعٌ ولافت في التقنية وتراكم في التطوّرات التي تسمح للذكاء الاصطناعي بتوليد أنواعٍ جديدة من الوسائط، وتقليد المنطق البشري بأشكالٍ جديدة، والتسرّب إلى العالم الحقيقي عبر فصيلٍ جديدٍ من الروبوتات.

وسنرى في الأشهر القليلة المقبلة مولّدات الصورة المدعومة بالذكاء الاصطناعي، كـ«دال - إي» و«ميدجورني»، وهي تنتج فيديوهات وصوراً بشكلٍ آنيّ، وتندمج بشكلٍ تدريجي مع روبوتات المحادثة، مثل «تشات جي بي تي».

وهذا الأمر يعني أنّ روبوتات المحادثة ستذهب أبعد من النص الرقمي؛ إلى التعامل مع الصور، والفيديوهات، والرسوم البيانية وغيرها من الوسائط، وستُظهر سلوكاً أقرب إلى المنطق البشري، من خلال أداء المزيد من المهام المعقّدة في مجالات كالرياضيات والعلوم. ومع تحرّك التقنية أكثر باتجاه الروبوتات، ستصبح هذه الأخيرة قادرة على حلّ مشكلات خارج العالم الرقمي.

بدأ كثير من هذه التطورات بالتبلور داخل أهمّ مختبرات البحث وفي عالم المنتجات التقنية منذ العام الماضي، إلّا أنّ قوّة هذه المنتجات ستكبر أكثر، وسيستخدمها عددٌ أكبر من الناس في 2024.

يرى ديفيد لوان، الرئيس التنفيذي لشركة الذكاء الاصطناعي الناشئة «أديبت» أنّ «التقدّم السريع للذكاء الاصطناعي مستمرّ ولا مفرّ منه».

تعكف شركاتٌ كثيرة كـ«أوبن إيه آي»، و«غوغل»، على تطوير الذكاء الاصطناعي أكثر من غيره من التقنيات بسبب الطريقة التي صُممت بها الأنظمة التي يقوم عليها.

يتولّى مهندسون تصميم معظم التطبيقات البرمجية التي تتطلّب ابتكار كلّ رمز كومبيوتر على حدة في عمليّة بطيئة ومملّة. في المقابل، تعمل الشركات اليوم على تحسين الذكاء الاصطناعي بمزيد من السرعة لأنّ تقنيته ترتكز على شبكات عصبية، وأنظمة حسابية قابلة لتعلّم مهارات من خلال تحليل البيانات الرقمية. تستطيع الشبكة العصبية تعلّم توليد نصّ بمفردها من خلال رصد الأنماط في بيانات متنوعة، كمقالات «ويكيبيديا»، والكتب، والنصوص الرقمية المسحوبة من شبكة الإنترنت.

تغيرات عام 2024

نستعرض لكم في الدليل التالي التغييرات التي سيشهدها الذكاء الاصطناعي هذا العام، بدءاً من التطورات المتوقَّعة في المدى القريب، التي ستدفع قدرات التقنية نحو المزيد من التقدّم.

* الفيديوهات الفورية: ولّدت التطبيقات المدعومة بالذكاء الاصطناعي حتّى اليوم نصوصاً وصوراً جامدة على شكل استجابات لأوامر الحثّ. يستطيع «دال - إي» مثلاً ابتكار صور أشبه بصورٍ فوتوغرافية حقيقية في غضون ثوانٍ بناء على طلبات، مثل: «وحيد قرن يغوص مقابل جسر غولدن غيت».

ولكنّ هذا العام سيشهد على الأرجح طرح العديد من الشركات، كـ«أوبن إيه آي»، و«غوغل» و«ميتا» و«رانوي»، لمولّدات صورة تتيح للمستخدمين فبركة فيديوهات أيضاً، حتّى إنّ بعض هذه الشركات أتمّ تطوير نماذج تجريبية لأدوات تبتكر فيديوهات فورية وفقاً لأوامر حثٍّ نصية قصيرة.

ومن المرجّح أيضاً أن تسعى هذه الشركات إلى دمج قوى مولّدات الصورة والفيديو في روبوتات المحادثة لتعزيز قدرات هذه الأخيرة.

* روبوتات محادثة «متعدّدة الأوضاع»: تشهد روبوتات المحادثة ومولّدات الصور، التي طُوّرت في الأساس بوصفها أدوات منفصلة، اندماجاً تدريجياً؛ فقد أطلقت «أوبن إيه آي»، العام الماضي، ولأوّل مرّة نسخة جديدة من «تشات جي بي تي» قادرة على توليد صورٍ ونصوص.

تعمل شركات الذكاء الاصطناعي على تصميم أنظمة «متعدّدة الأوضاع»؛ ما يعني أنّ ذكاءها الاصطناعي يستطيع التعامل مع عدّة أنواع من الوسائط. تتعلّم هذه الأنظمة مهاراتها من خلال تحليل الصور، والنصوص، وربّما أنواع أخرى من الوسائط كالرسوم البيانية، والأصوات، والفيديوهات، حتّى تستطيع إنتاج نصوصها وصورها وأصواتها الخاصّة. وهذا ليس كلّ شيء! لأنّ هذه الأنظمة تتعلّم أيضاً العلاقات بين مختلف أنواع الوسائط، ستصبح يوماً قادرة على فهم نوعٍ من الوسائط والردّ عليه بنوعٍ مختلف. بمعنى آخر، قد يغذّي أحدهم روبوت المحادثة بصورة ما، ليردّ عليه الأخير بنص.منطق أفضل ووكلاء الذكاء

* «منطق» أفضل. عندما يتحدّث ألتمان عن القفزة النوعية التي سيحققها الذكاء الاصطناعي، يقصد روبوتات المحادثة التي تتمتّع «بتفكير منطقي» أفضل يساعدها في القيام بمهام أكثر تعقيداً، كحلّ مسائل حسابية شائكة وتوليد برامج كومبيوتر مفصّلة.

الهدف هو بناء أنظمة تستطيع حلّ مسألة ما بعناية ومنطقية من خلال سلسلة من الخطوات السرية التي تعتمد كلّ واحدة منها على الأخرى، لأنّ هذه هي طريقة عمل المنطق البشري، في بعض الحالات على الأقلّ.

يختلف علماء بارزون فيما بينهم على ما إذا كانت روبوتات المحادثة قادرة فعلاً على التفكير بهذا القدر من المنطق. يحاجج بعضهم بأنّ هذه الأنظمة بالكاد تُظهر بعض المنطق، مع تكرارها للسلوك التي رصدته في بيانات الإنترنت. ولكنّ «أوبن إيه آي» وغيرها تبني أنظمة قادرة على الردّ على أسئلة صعبة حول مواضيع، كالرياضيات، وبرمجة الكومبيوتر، والفيزياء، وغيرها من العلوم.

من جهته، عدّ نيك فروست، باحثٌ سابقٌ في «غوغل» ومدير مساعد في شركة الذكاء الاصطناعي الناشئة «كوهير»، أنّ «ارتفاع مستوى الثقة بهذه الأنظمة سيزيد من شعبيتها». وإذا أصبحت روبوتات المحادثة فعلاً أكثر منطقية، يمكنها أن تتحوّل بسهولة إلى «وكلاء ذكاء اصطناعي».

• «وكلاء الذكاء الاصطناعي». تُعلِّم شركات التقنية أنظمة الذكاء الاصطناعي كيفية التعامل مع المسائل الصعبة خطوة بخطوة، وبنفس الطريقة، يمكنها أيضاً تحسين قدرة روبوتات المحادثة على استخدام التطبيقات البرمجية والمواقع الإلكترونية نيابة عن المستخدم.

يعمل الباحثون بجدّ على تحويل روبوتات المحادثة إلى نوعٍ جديد من الأنظمة الآلية المستقلّة التي تُسمّى «وكلاء الذكاء الاصطناعي»، وهذا يعني أنّ روبوت المحادثة سيصبح قادراً على استخدام تطبيقات البرمجة، والمواقع الإلكترونية، وغيرها من الأدوات الإلكترونية، كالتقويم ومواقع السفر، ليتمكّن النّاس أخيراً من توكيله للقيام بأعمالهم. ولكنّ هذا الأمر قد يفضي أيضاً إلى سيطرة وكلاء الذكاء الاصطناعي على بعض الوظائف بشكلٍ كامل.

تعمل روبوتات المحادثة اليوم وكأنّها وكلاء في بعض الأمور البسيطة، حيث إنها تسجّل مواعيد الاجتماعات، وتعدّل الملفات، وتحلّل البيانات، وتضع الرسوم البيانية. ولكنّ أداء هذه الأدوات لا يرقى دائماً إلى الجودة المطلوبة، وهي قابلة للانهيار في لحظة عند التعامل مع مهام أكثر تعقيداً.

هذا العام، من المتوقع أن تكشف شركات الذكاء الاصطناعي النقاب عن وكلاء أكثر كفاءة؛ فقد رجّح لوان أنّ «المستخدمين سيتمكنون من توكيل أي مهام مملّة ومتعبة من أعمالهم اليومية على جهاز الكومبيوتر إلى وكيل من هذا النوع».

وتشمل هذه المهام متابعة النفقات باستخدام تطبيقٍ مثل «كويك بوكس»، أو تثبيت أيّام العطلة في تطبيق كـ «ووركداي». وعلى المدى الطويل، ستتوسع قدرات الوكلاء لتتجاوز خدمات البرمجيات والإنترنت إلى عالم الروبوتات.

• روبوتات أذكى. في الماضي، كانت الروبوتات تُبرمج لأداء المهمّة نفسها مرّة بعد مرّة، كحمل الصناديق التي تتشابه حجماً وشكلاً. أمّا اليوم، فيستخدم الباحثون نفس التقنية التي تشغّل روبوتات المحادثة لمنح الروبوتات التقليدية القوّة اللازمة للتعامل مع مهام أكثر تعقيداً وربّما غير مألوفة.

وكما يتعلّم روبوت المحادثة توقّع الكلمة التالية في جملة من خلال تحليل كميات كبيرة من النصوص الرقمية، يستطيع الروبوت تعلّم توقّع ما سيحصل في العالم الحقيقي من خلال تحليل عددٍ غير محدود من الفيديوهات التي تستعرض أشياء وأجساماً تُرفع وتُنقل.

سيكون هذا العام عام دمج قوى الذكاء الاصطناعي في الروبوتات التي تعمل غالباً خلف الكواليس، كالأذرع الميكانيكية التي تطوي القمصان في متاجر خدمات الغسيل، أو ترتّب البضائع في المخازن. ويعمل عمالقة التقنية أيضاً، ومنهم إيلون ماسك، على إيصال الروبوتات الشبيهة بالبشر إلى بيوت المستخدمين.

* خدمة «نيويورك تايمز»



«أبل إنتليجنس»... مزايا متفاوتة ومخاطر الهلوسة

«أبل إنتليجنس»... مزايا متفاوتة ومخاطر الهلوسة
TT

«أبل إنتليجنس»... مزايا متفاوتة ومخاطر الهلوسة

«أبل إنتليجنس»... مزايا متفاوتة ومخاطر الهلوسة

سيصل أهم منتج جديد من «أبل» لهذا العام هذا الشهر، إذ سيطرح إصدار «أبل إنتليجنس» مجموعةً من أدوات البرمجيات التي تجلب ما تصفه «أبل» بالذكاء الاصطناعي إلى أجهزتها، من خلال تحديثات برمجية مجانية لأصحاب بعض هواتف «آيفون» وأجهزة «ماك» وأجهزة «آيباد».

نسخة أولية وإصدار تجريبي

ستتضمن النسخة الأولية من «أبل إنتليجنس»، التي تنشرها «أبل» إصداراً تجريبياً غير مكتمل، ونسخة محسنة قليلاً من المساعد الافتراضي من «أبل سيري»، وأدوات تلخص النص تلقائياً، وتنسخ التسجيلات الصوتية وتزيل عوامل التشتيت من الصور. وبالنسبة لشركة «أبل»، فإن هذا الظهور الأول هو بداية عصر جديد.

إعادة هيكلة تكنولوجية في «أبل»

ويأتي إصدار «أبل إنتليجنس»؛ نتيجةً لإعادة هيكلة كبرى لشركة «كوبرتينو» في كاليفورنيا، بعد نحو عامين من عملية قلب صناعة التكنولوجيا رأساً على عقب بواسطة روبوت الدردشة «تشات جي بي تي (ChatGPT)» من شركة «أوبن إيه آي».

كان المسؤولون التنفيذيون في شركة «أبل» قلقين من أن يبدو هاتف «آيفون» عتيقاً في نهاية المطاف دون تقنية الذكاء الاصطناعي المماثلة، لذلك أوقفت «أبل» مشروع السيارة ذاتية القيادة، الذي استغرق أكثر من عقد من الزمان في الإعداد، وأعادت تعيين مهندسيها للعمل على «أبل إنتليجنس».

مزايا محدودة

وسوف يصل إصدار «أبل إنتليجنس» من دون كثير من الميزات الأكثر شهرة التي أعلنت عنها «أبل» في يونيو (حزيران) الماضي. وعلى الرغم من أن الشركة أبرمت صفقة مع «أوبن إيه آي»، لتضمين «تشات جي بي تي» في برنامجها، فإن برنامج الدردشة هذا لن يكون جزءاً من هذا الإصدار الأولي. كما أن «سيري» ليس ذكياً بما يكفي (حتى الآن) للقيام بأشياء مثل ربط البيانات من تطبيقات متعددة لإخبارك بما إذا كان اجتماع اللحظة الأخيرة سيجعلك تتأخر عن مواعيدك مع أطفالك. وقالت «أبل» إن هذه الميزات وغيرها سيتم طرحها تدريجياً خلال العام المقبل.

اختبار الإصدار المبكر

وللحصول على معاينة مسبقة، اختبرت إصداراً مبكراً من «أبل إنتليجنس» خلال الأسبوع الماضي. كانت الميزات الجديدة صعبة بعض الشيء للعثور عليها، فقد تم دمجها في أجزاء مختلفة من نظام برامج «أبل»، بما في ذلك أزرار تحرير النص والصور.

* ميزات مفيدة... وأخرى غير ناجحة

وُجدت بعض الميزات؛ بما في ذلك أدوات التدقيق اللغوي للنص ونسخ الصوت، مفيدة للغاية. وكانت أدوات أخرى؛ مثل أداة لإنشاء ملخصات لمقالات الويب وزر لإزالة عوامل التشتيت غير المرغوب فيها من الصور، غير ناجحة إلى حد أنه يجب تجاهلها.

كل هذا يعني أن «أبل إنتليجنس» يستحق المتابعة على مدار السنوات القليلة المقبلة لمعرفة ما إذا كان سيتطور إلى منتج لا غنى عنه، لكنه ليس سبباً مقنعاً للإسراف في شراء أجهزة جديدة.

* الأجهزة العاملة بالإصدار

سيعمل «أبل إنتليجنس» على أحدث هواتف «iPhone 16s»، و«iPhone 15 Pro» من العام الماضي، بالإضافة إلى بعض أجهزة «iPad» وأجهزة «Mac»، التي تم إصدارها في السنوات الأربع الماضية.

أدوات «أبل إنتليجنس» المفيدة

فيما يلي الأدوات التي ستكون الأكثر فائدة، والأدوات التي يمكنك تخطيها عندما يصل البرنامج إلى الأجهزة هذا الشهر:

* نسخ التسجيلات الصوتية كتابياً (Transcribe Audio Recordings)

يقدم «أبل إنتليجنس» ميزة تبدو متأخرة منذ فترة طويلة: عندما تستخدم تطبيق المذكرات الصوتية لتسجيل الصوت، سينتج التطبيق الآن تلقائياً نصاً مكتوباً إلى جانب الملف. بصفتي صحافياً يسجل المقابلات بانتظام، كنت متحمساً لتجربة هذه الأداة وسعدت بنجاحها. عندما التقيت شركة تقنية الأسبوع الماضي، ضغطت على زر التسجيل في التطبيق، وبعد أن ضغطت على زر الإيقاف، كان النص جاهزاً لي.

اكتشف برنامج «أبل إنتليجنس» متى كان شخص آخر يتحدث وأنشأ فقرة جديدة وفقاً لذلك في النص. لقد نسخ بعض الكلمات بشكل غير صحيح كلما تمتم شخص ما. ولكن بشكل عام، سهّل لي النص البحث عن كلمة رئيسية لاستخراج جزء من المحادثة.

* طلب المساعدة من «سيري» حول منتج «أبل» (Ask Siri for Help With an Apple Product)

في حين أنه قد يكون من السهل استخدام أي هاتف ذكي أو جهاز لوحي، فإن برامج «أبل» أصبحت معقدة بشكل متزايد على مرّ السنين، لذلك قد يكون من الصعب معرفة كيفية الاستفادة من الميزات التي يصعب العثور عليها.

وقد غرست «أبل إنتليجنس» في «سيري» القدرة على تقديم المساعدة في التنقل بين منتجات «أبل». لا يمكنني أبداً أن أتذكر طوال حياتي كيفية تشغيل تطبيقين جنباً إلى جنب على «آيباد»، على سبيل المثال. لذلك سألت «سيري»: «كيف أستخدم تقسيم الشاشة على آيباد؟». وقد أظهر لي «سيري» بسرعة قائمةً من التعليمات، التي تضمنت النقر على زر في الجزء العلوي من التطبيق. ومن عجيب المفارقات أن «مساعد سيري» لم يتمكّن من تقديم المساعدة حول كيفية استخدام «أبل إنتليجنس» لإعادة كتابة بريد إلكتروني. بدلاً من ذلك، قام بتحميل قائمة بنتائج بحث «غوغل» تعرض مواقع ويب أخرى مع الخطوات.

* تسريع الكتابة (Speed Through Writing)

عند الحديث عن البريد الإلكتروني، يتضمّن «أبل إنتليجنس» أدوات كتابة لتحرير كلماتك، ويمكنه حتى إنشاء ردود بريد إلكتروني «جاهزة». لقد استخدمتُ أداة الرد التلقائي لإبعاد مندوب مبيعات في وكالة للسيارات، بسرعة: «شكراً لك على التواصل. لم أعد مهتماً بشراء سيارة في هذا الوقت».

أما بالنسبة لتحرير النص، فقد قمت بتسليط الضوء على رسالة بريد إلكتروني كتبتها بسرعة إلى أحد الزملاء، وضغطت على زر «مراجعة». قام «أبل إنتليجنس» بسرعة بتحرير النص لإدراج علامات الترقيم التي تخطيتها.

أدوات «أبل» يمكنك تجاهلها

* إزالة عوامل التشتيت من الصور (Removing Distractions From Photos)

تتمثل إحدى أكثر ميزات «أبل إنتليجنس» المتوقعة في القدرة على تحرير صورة تلقائياً لإزالة عامل تشتيت، مثل شخص يفسد الصورة في صورة عائلية مثالية بخلاف ذلك.

سيرغب كثير من الأشخاص في تجربة هذه الأداة، المسماة «التنظيف (Clean Up)»... ولكن استعدوا للشعور بالإحباط.

لتجربتها، فتحتُ صورة التقطتها لأفراد الأسرة في حفل زفاف في الهواء الطلق قبل بضع سنوات. ضغطت على زر «Clean Up» على أمل إزالة الأشخاص الجالسين على كراسي الحديقة في الخلفية. وقد حذف البرنامج الأشخاص والكراسي، ولكن تم استبدال مزيج غير مفهوم من وحدات البكسل باللونين الأبيض والأسود بهم.

لقد جرّبتُ الأداة مرة أخرى على صورة لكلبي الكورغي، ماكس، وهو نائم على أريكتي بجوار بطانية. لقد أزال «أبل إنتليجنس» البطانية، وحاول إعادة إنتاج وسادة الأريكة. وبدلاً من ذلك، قام بإنشاء أخدود عميق غير جذاب.

* تلخيص النص (Summarizing Text)

يبدو أن «أبل» تعتقد بأن الإنترنت مليء بكثير من الكلمات. تتمثل إحدى أبرز ميزات «أبل إنتليجنس» في قدرته على إنشاء ملخصات للنص في كثير من التطبيقات، بما في ذلك البريد الإلكتروني ومقالة الويب والمستندات.

بالضغط على زر «التلخيص» في متصفح «سفاري (Safari)»، حصلتُ على ملخص من 3 جمل لمقال من صحيفة «نيويورك تايمز» مكون من 1200 كلمة حول إيجابيات وسلبيات تناول سمك التونة. لقد لخصت شركة «أبل إنتليجنس» فرضية المقال: إن سمك التونة طعام مغذٍ قد يحتوي على نسبة عالية من الزئبق، ويجب على المستهلكين النظر في أنواع سمك التونة التي تحتوي على مستويات منخفضة من الزئبق.

خطر الهلوسة والتلفيق

لسوء الحظ، أوصى «أبل إنتليجنس» في ملخصه، الناس بتناول سمك التونة الأبيض، وهو أحد الأنواع المدرجة في المقال على أنها تحتوي على أعلى مستويات الزئبق.

هذا هو ما يُعرف في صناعة التكنولوجيا بـ«الهلوسة»، وهي مشكلة شائعة؛ حيث يقوم الذكاء الاصطناعي بتلفيق المعلومات بعد الفشل في تخمين الإجابة الصحيحة. كما فشلت الأداة في تلخيص ملاحظاتي. وحديثاً، وللتحضير لاجتماع مكتبي، قمتُ بتدوين ملاحظات حول 3 زملاء كنت سألتقيهم. وبدلاً من إنتاج ملف محكم عن كل شخص، قامت الأداة بإنشاء ملخص لدور شخص واحد فقط.

وقد رفضت شركة «أبل» التعليق على هذا... وباختصار، يمكنك تخطي هذه الأداة.

* خدمة «نيويورك تايمز».

اقرأ أيضاً