«تشات جي بي تي» الجديد... يرى ويتحادث

اختبارات نظام الذكاء الاصطناعي التوليدي تؤكد تفوقه وتمايزه

«تشات جي بي تي» الجديد... يرى ويتحادث
TT

«تشات جي بي تي» الجديد... يرى ويتحادث

«تشات جي بي تي» الجديد... يرى ويتحادث

«تشات جي بي تي» ChatGPT نظام الذكاء الاصطناعي التوليدي المثير، قاتل العمل المكتبي الممل، العدو اللدود لمعلمي المدارس الثانوية ولكتاب السيناريو في هوليوود على حد سواء، يحصل على بعض الصلاحيات الجديدة.

الرؤية والاستماع والتحدث

أعلنت شركة «أوبن إيه إي» OpenAI، الشركة المصنّعة للنظام، أنها ستمنح برنامج الدردشة الشهير القدرة على «الرؤية والاستماع والتحدث» من خلال ميزتين جديدتين: الأولى، تحديث يسمح لـChatGPT بتحليل الصور والرد عليها؛ إذ يمكنك تحميل صورة لدراجة، على سبيل المثال، والحصول على تعليمات حول كيفية خفض المقعد، أو الحصول على اقتراحات لوصفات الأطعمة بناءً على صورة لمحتويات ثلاجتك. والأخرى، هي ميزة تتيح للمستخدمين التحدث إلى «تشات جي بي تي» والحصول على ردود يتم تسليمها بصوت الذكاء الاصطناعي، بالطريقة التي قد تتحدث بها مع «سيري» Siri أو «أليكسا» Alexa.

تعدّ هذه الميزات جزءاً من التوجه على مستوى الصناعة نحو ما يسمى «أنظمة الذكاء الاصطناعي متعددة الوسائط» التي يمكنها التعامل مع النصوص والصور ومقاطع الفيديو، وأي شيء آخر قد يقرر المستخدم طرحه عليها.

الهدف النهائي، وفقاً لبعض الباحثين، هو تصميم نظام ذكاء اصطناعي قادر على معالجة المعلومات بجميع الطرق التي يستطيع الإنسان القيام بها.

لا يستطيع معظم المستخدمين الوصول إلى الميزات الجديدة حتى الآن، لكن الشركة ستقدمها أولاً لعملاء ChatGPT Plus وEnterprise خلال الأسابيع القليلة المقبلة، وستجعلها متاحة على نطاق أوسع بعد ذلك. وستعمل ميزة الرؤية على كل من سطح المكتب والهاتف الجوال، في حين أن ميزة الكلام ستكون متاحة فقط من خلال تطبيقات ChatGPT على نظم تشغيل «آي أو إس» و«أندرويد».

«تشات جي بي تي» الجديد ينتقل إلى مرحلة «أنظمة الذكاء الاصطناعي متعددة الوسائط»

اختبارات عملية على المزايا الجديدة

حصلت على وصول مبكر إلى ChatGPT الجديد لإجراء اختبار عملي. هذا ما وجدته عندما بدأت بتجربة ميزة التعرف على الصور في النظام الذكي على بعض الأغراض المنزلية؟

* «ما هذا الشيء الذي وجدته في درج النفايات الخاص بي»؟ سألت بعد أن حمّلت صورة لقطعة غامضة من السيليكون الأزرق بها خمسة ثقوب.

- أجاب ChatGPT: يبدو أن الجسم عبارة عن حامل أو قبضة من السيليكون، وغالباً ما يستخدم لربط عناصر متعددة معاً»».

وكان الجواب قريباً للحقيقة بما فيه الكفاية، إنه مقوٍ للأصابع استخدمته منذ سنوات أثناء تعافيي من إصابة في اليد.

* بعد ذلك، غذّيت النظام ببعض الصور للعناصر التي كنت أنوي بيعها على «سوق فيسبوك» Facebook Marketplace، وطلبت منه كتابة تفصيلات لكل منها.

- نجح النظام بشكل فائق في تفسير وشرح كل الأشياء، واصفاً ثلاجة صغيرة من طراز قديم بأنها «مثالية لأولئك الذين يقدرون لمسة من الماضي في منازلهم الحديثة».

* يمكن لـChatGPT الجديد أيضاً تحليل النص داخل الصور. التقطت صورة للصفحة الأولى من النسخة المطبوعة لصحيفة «نيويورك تايمز» يوم الأحد وطلبت من الروبوت تلخيصها.

- لقد كان أداء النظام جيداً، حيث وصف جميع المقالات الخمس الموجودة على الصفحة الأولى في بضع جمل لكل منها، على الرغم من أنه ارتكب خطأً واحداً على الأقل، حيث اخترع إحصائية حول الوفيات المرتبطة بالفنتانيل لم تكن موجودة في المقالة الأصلية.

* عيون ChatGPT ليست مثالية. لقد فشل عندما طلبت منه حل لغز الكلمات المتقاطعة. لقد ظنت خطأ أن لعبة الديناصورات المحشوة لطفلي، هي حوت. وعندما طلبت المساعدة في تحويل واحدة من تلك الرسوم البيانية لتجميع الأثاث التي لا تحتوي على كلمات إلى قائمة تعليمات خطوة بخطوة، أعطاني قائمة مختلطة من الأجزاء، معظمها كان خاطئاً.

صوت اصطناعي سلس وطبيعي

الآن، دعنا نتحدث عما أراه الأكثر إثارة للإعجاب بين الميزتين: الميزة الصوتية الجديدة لـ«جي بي تي»، التي تتيح للمستخدمين التحدث إلى التطبيق وتلقي الردود المنطوقة.

يعدّ استخدام الميزة أمراً سهلاً: فقط اضغط على أيقونة سماعة الرأس وابدأ في التحدث. وعندما تتوقف، يقوم النظام بتحويل كلماتك إلى نص باستخدام نظام «ويسبر» Whisper للتعرف على الكلام المطور من قِبل الشركة، الذي يولد استجابة ويعيد إليك الإجابة باستخدام خوارزمية جديدة لتحويل النص إلى كلام، وذلك باستخدام واحد من خمسة أصوات ذكاء اصطناعي.

تم إنشاء الأصوات، التي تشمل أصوات الذكور والإناث، باستخدام مقتطفات قصيرة أخذت من ممثلين صوتيين محترفين قامت الشركة بتعيينهم. واخترت «إمبر» «Ember»، وهو صوت ذكوري مفعم بالحيوية.

تفوق على أدوات المساعدة الصوتية

اختبرت الميزة الصوتية في «جي بي تي» لساعات عدة في مجموعة من المهام المختلفة، قراءة قصة قبل النوم لطفلي الصغير، والدردشة معي حول التوتر المرتبط بالعمل، ومساعدتي في تحليل حلم رأيته مؤخراً. لقد فعلت كل هذه الأمور بشكل جيد إلى حد ما، خاصة عندما أعطيته بعض المطالبات الذهبية وطلبت منها محاكاة صديق أو معالج أو معلم.

ما برز في هذه الاختبارات هو مدى اختلاف التحدث إلى ChatGPT عن التحدث إلى الأجيال الأقدم من أجهزة المساعدة الصوتية التي تعمل بتقنية الذكاء الاصطناعي، مثل «سيري» و«أليكسا».

تلك الأدوات المساعدة، يمكن حتى في أفضل حالاتها، أن تكون خشبية ومسطحة. إنها تجيب عن سؤال واحد في كل مرة، غالباً من خلال البحث عن شيء ما على الإنترنت وقراءته بصوت عالٍ كلمة بكلمة، أو الاختيار من بين عدد محدود من الإجابات المبرمجة.

على النقيض من ذلك، يبدو الصوت الاصطناعي لـ«جي بي تي» سلساً وطبيعياً، مع اختلافات طفيفة في النغمة والإيقاع؛ مما يجعله يبدو أقل آلياً. لقد كان قادراً على إجراء محادثات طويلة ومفتوحة حول أي موضوع تقريباً قمت بتجربته، بما في ذلك المطالبات التي كنت متأكداً من أنه لم يواجهها من قبل.

ربما لن يستخدم معظم الأشخاص روبوتات الدردشة المدعمة بالذكاء الاصطناعي بهذه الطريقة. بالنسبة للكثير من المهام، لا تزال الكتابة أسرع من التحدث، وكان انتظاري للنظام لقراءة ردوده الطويلة أمراً مزعجاً.

كما لم يكن من المفيد؛ كون التطبيق بطيئاً ومعيباً في بعض الأحيان نتيجة لبعض المشكلات الفنية في الإصدار التجريبي من التطبيق الذي اختبرته.

دفء المحادثة مع صوت أكثر إنسانية

إن وجود الذكاء الاصطناعي يتحدث إليك بصوت يشبه الإنسان هو تجربة أكثر حميمية من قراءة ردوده على الشاشة. وبعد بضع ساعات من التحدث مع ChatGPT بهذه الطريقة، شعرت بدفء جديد يتسلل إلى محادثاتنا. ومن دون الارتباط بواجهة نصية، شعرت بضغط أقل للتوصل إلى المطالبة المثالية. لقد تحدثنا بشكل عرضي أكثر، وكشفت المزيد عن حياتي.

قال بيتر دينغ، نائب رئيس المنتجات الاستهلاكية والمؤسساتية في OpenAI، والذي تحدث معي عن الميزة الصوتية الجديدة: «يبدو الأمر وكأنه منتج مختلف تقريباً». وقال: «لأنك لم تعد تنسخ ما لديك في رأسك إلى أصابعك ينتهي بك الأمر إلى طرح أشياء مختلفة».

هل سيقع المستخدمون الوحيدون المتيمون في حب «جي بي تي»، بعد أن أصبح بإمكانه الاستماع إليهم والرد عليهم؟ ذلك ممكن. أنا شخصياً لم أنسَ أبداً أنني كنت أتحدث إلى برنامج الدردشة الآلي. ومن المؤكد أنني لم أقع في خطأ عدّ ChatGPT كائناً واعياً، ولم أطوّر ارتباطات عاطفية به.

لكنني رأيت أيضاً لمحة عن المستقبل الذي قد يسمح فيه بعض الأشخاص لأجهزة الذكاء الاصطناعي المساعدة المعتمدة على الصوت بالدخول إلى الحرم الداخلي لحياتهم، حيث يأخذون معهم روبوتات الدردشة التي تعمل بالذكاء الاصطناعي أثناء التنقل، ويعاملونهم كأصدقاء مقربين لهم على مدار الساعة طوال أيام الأسبوع، ومعالجين، ومبارزين.

إن ذلك يبدو جنوناً، أليس كذلك؟ ومع ذلك، ألم يكن كل هذا يبدو جنونياً بعض الشيء قبل عام؟

«تشات جي بي تي» يرفض التعليق حول الصور البشرية

إن أكبر القيود على ميزة الرؤية في ChatGPT هي أنه يرفض الإجابة عن معظم الأسئلة المتعلقة بصور الوجوه البشرية. وهذا حسب التصميم. وقد أخبرتني شركة «أوين إيه إي» أنها لا تريد تمكينه من التعرف على الوجه أو أي استخدامات مخيفة أخرى، وأنها لا تريد أن يصدر التطبيق إجابات متحيزة أو مسيئة للأسئلة المتعلقة بالمظهر الجسدي للأشخاص. ولكن حتى من دون الوجوه، من السهل أن نتخيل الكثير من الطرق التي يمكن أن يكون بها روبوت المحادثة القائم على الذكاء الاصطناعي القادر على معالجة المعلومات المرئية مفيداً، خاصة مع تحسن التكنولوجيا.

يمكن أن يستخدمه البستاني، والباحث عن الطعام للتعرف على النباتات في البرية. كما يمكن لعشاق التمارين الرياضية استخدامه لتوليد خطط تمرين مخصصة، فقط عن طريق التقاط صورة للمعدات الموجودة في صالة الألعاب الرياضية الخاصة بهم. ويمكن للطلاب استخدامه لحل مسائل الرياضيات والعلوم المرئية، ويمكن للأشخاص ضعاف البصر استخدامه للتنقل حول العالم بسهولة أكبر.

* خدمة «نيويورك تايمز»


مقالات ذات صلة

مؤتمر «مايكروسوفت إغنايت 2024» يكشف عن أبرز نزعات الذكاء الاصطناعي المقبلة

تكنولوجيا يستعرض مؤتمر «مايكروسوفت إغنايت 2024» أبرز تقنيات الذكاء الاصطناعي المقبلة

مؤتمر «مايكروسوفت إغنايت 2024» يكشف عن أبرز نزعات الذكاء الاصطناعي المقبلة

إطلاق أكبر مشروع للأمن الرقمي بتاريخ البشرية لمواجهة أكثر من 7000 هجمة في الثانية.

خلدون غسان سعيد (جدة)
الاقتصاد علم شركة «إنفيديا» على الحرم الجامعي في سانتا كلارا بكاليفورنيا (إ.ب.أ)

بالأرقام... كيف أصبحت «إنفيديا» الشركة الأكثر قيمة في العالم؟

حققت «إنفيديا» مرة أخرى نتائج ربع سنوية تجاوزت توقعات «وول ستريت».

«الشرق الأوسط» (نيويورك)
الاقتصاد شاشة تسجيل الوصول في مكتب «إنفيديا» في أوستن بتكساس (أ.ف.ب)

«إنفيديا» تتفوق على توقعات الأرباح مع ترقب المستثمرين للطلب على رقائق «بلاكويل» للذكاء الاصطناعي

أعلنت شركة «إنفيديا»، يوم الأربعاء، عن زيادة في أرباحها ومبيعاتها في الربع الثالث مع استمرار الطلب على رقائق الكمبيوتر المتخصصة.

«الشرق الأوسط» (نيويورك)
تكنولوجيا 7 مشاريع تجريبية للذكاء الاصطناعي من «غوغل» يمكنك التعرف عليها الآن

7 مشاريع تجريبية للذكاء الاصطناعي من «غوغل» يمكنك التعرف عليها الآن

تمنحنا «غوغل» إمكانية الوصول إلى مجموعة متنوعة من الأدوات التجريبية التي لم تصبح منتجات كاملة بعد.

دوغ آموث (واشنطن)
علوم ​الذكاء الاصطناعي في علاج جذور الأسنان

​الذكاء الاصطناعي في علاج جذور الأسنان

يحدد الآفات والخراجات حولها

د. عميد خالد عبد الحميد (الرياض)

مؤتمر «مايكروسوفت إغنايت 2024» يكشف عن أبرز نزعات الذكاء الاصطناعي المقبلة

يستعرض مؤتمر «مايكروسوفت إغنايت 2024» أبرز تقنيات الذكاء الاصطناعي المقبلة
يستعرض مؤتمر «مايكروسوفت إغنايت 2024» أبرز تقنيات الذكاء الاصطناعي المقبلة
TT

مؤتمر «مايكروسوفت إغنايت 2024» يكشف عن أبرز نزعات الذكاء الاصطناعي المقبلة

يستعرض مؤتمر «مايكروسوفت إغنايت 2024» أبرز تقنيات الذكاء الاصطناعي المقبلة
يستعرض مؤتمر «مايكروسوفت إغنايت 2024» أبرز تقنيات الذكاء الاصطناعي المقبلة

تنتهي اليوم فعاليات مؤتمر «مايكروسوفت إغنايت 2024» (Microsoft Ignite) السنوي في مدينة شيكاغو الأميركية، بحضور تجاوز 14 ألف زائر، الذي استعرضت «مايكروسوفت» خلال أيامه الثلاثة أكثر من 80 خدمة ومنتجاً وميزة مرتبطة بالذكاء الاصطناعي.

الذكاء الاصطناعي بخدمة الموظفين

طوّرت الشركة خدمة «مايكروسوفت 365 كوبايلوت» (Microsoft 365 Copilot) الخاصة بالشركات، مقدمة «أفعال كوبايلوت» (Copilot Actions) التي تسمح بأتمتة المهام اليومية في مجال العمل بأوامر بسيطة، مثل الحصول على ملخص اجتماعات «تيمز» (Teams) في ذلك اليوم أو إعداد التقارير الأسبوعية أو تلخيص ما الذي يجب القيام به حسب الرسائل الواردة إلى بريد المستخدم والاجتماعات التي حدثت قبل عودته من إجازته السنوية، وغيرها.

«عملاء مايكروسوفت»

كشفت الشركة كذلك ميزة «عملاء مايكروسوفت» (Microsoft Agents) التي تسمح بالبحث في ملفات الشركة وتحليلها والإجابة على أسئلة الموظفين أو العملاء بكل خصوصية، وتلخيص النتائج بهدف تسريع اتخاذ قرارات العمل. وتعمل هذه الميزة في خدمة «شيربوينت» (SharePoint) لكل شركة.

فيديو للموقع:

المترجم الفوري

ويمكن لعميل ذكاء اصطناعي اسمه «المترجم الفوري» (Interpreter) ترجمة محادثات الاجتماعات المرئية في «تيمز» بهدف كسر الحواجز اللغوية والتركيز على جوهر الاجتماع، مع القدرة على محاكاة صوت المستخدم بلغة الطرف الثاني. ويمكن لعميل ذكي آخر اسمه «المُيَسِّر» (Facilitator) تلخيص اجتماعات «تيمز» وأتمتة إدارة المشاريع عبر جميع مراحلها. كما يستطيع بعض عملاء الذكاء الاصطناعي مساعدة الموظفين على حلّ مشاكلهم التقنية دون الحاجة للعودة إلى قسم الدعم الفني، والإجابة على أسئلتهم المتعلقة بسياسات الشركة والموارد البشرية والمشتريات، وغيرها.

الذكاء الاصطناعي رفيق المبرمجين

ولتسهيل تضمين تقنيات الذكاء الاصطناعي في برامج الشركات والأفراد، تقدم «مايكروسوفت» ما تسميه بـ«مسبك آجور للذكاء الاصطناعي» (Azure AI Foundry) الذي يوفر مجموعة برمجية للذكاء الاصطناعي وبوابة لتطوير عملاء الذكاء الاصطناعي.

وتوفر هذه المجموعة البرمجية أكثر من 25 قالباً مسبق الإعداد (Template) للذكاء الاصطناعي تسمح بتطوير تطبيقات مدعومة بهذه التقنية وتبسيط عملية البرمجة ونشرها عبر منصات «غيتهاب» (Github) و«فيجوال ستوديو» (Visual Studio) و«كوبايلوت ستوديو» (Copilot Studio). وتسمح البوابة للمبرمجين اكتشاف خدمات وأدوات ونماذج ذكاء اصطناعي تناسب احتياجاتهم واحتياجات الشركات التي يعملون لديها.

حماية المستخدمين

حذّرت «مايكروسوفت» أن عدد الهجمات الإلكترونية التي تستهدف سرقة كلمات السرّ قد ارتفع خلال آخر 3 أعوام من 579 إلى أكثر من 7000 هجمة في كل ثانية، مع مضاعفة العدد في آخر سنة، ما يضع سبل الحماية التقليدية في موضع لا يسمح لها اللحاق بتقدم القراصنة.

مبادرة المستقبل الآمن

هذا الأمر يتطلب إعادة تطوير عملية حماية المستخدمين، ما دفع الشركة إلى إطلاق «مبادرة المستقبل الآمن» (Secure Future Initiative) التي طلبت من 34000 مهندس العمل على أكبر مشروع للأمن الرقمي بتاريخ البشرية وتطوير مقاومة البرامج ونظم التشغيل وأجهزة المستخدمين لطوفان الهجمات الرقمية الذي تتسارع وتيرته في كل يوم.

وكشفت كذلك عن عملها على تطوير «مايكروسوفت سيكيوريتي إكسبوجر مانجمنت» (Microsoft Security Exposure Management) الذي يقوم بتحليل آلية تواصل الأجهزة المختلفة والبيانات والهوية الرقمية والشبكات، بعضها مع بعض، داخل بيئة العمل واكتشاف العلاقات بينها وعرض مسار الاختراقات الممكنة لأي قرصان إلكتروني، وذلك لاكتشاف نقطة الضعف في البيئة المعقدة التي يمكن للقراصنة الدخول منها، وتوقع هدفهم وتتبع المسار المفترض لهم عبر الأجهزة المختلفة للوصول إلى الهوية الرقمية أو البيانات الحساسة، ومن ثم حماية ذلك المسار بشكل استباقي على صعيد سدّ الثغرات في الأجهزة أو البرامج أو نظام التشغيل أو الشبكة، وغيرها من العوامل الأخرى. كما يستطيع هذا المشروع التأكد من سلامة الاحتياطات الأمنية للفريق التقني داخل الشركة.

وأطلقت الشركة نظام «مايكروسوفت سيكيوريتي كوبايلوت» (Microsoft Security Copilot) المدعوم بالذكاء الاصطناعي للقيام بالوظائف الأمنية باستخدام الذكاء الاصطناعي بكل سلاسة وسهولة، حيث أظهرت الدراسات انخفاض معدل مدة حلّ المشاكل الأمنية لدى استخدام هذا النظام بنحو 30 في المائة.

أجهزة الذكاء الاصطناعي

واستعرضت الشركة أول جهاز من فئته، مصنوع خصيصاً للاتصال بأمان مع خدمة «ويندوز 365» السحابية، اسمه «ويندوز 365 لينك» (Windows 365 Link).

الجهاز بسيط وآمن، وسيتم إطلاقه في أبريل (نيسان) 2025 المقبل، بسعر 349 دولاراً أميركياً، ويسمح للمستخدمين بالعمل بأمان مع نظام التشغيل «ويندوز» السحابي بكل سرعة وموثوقية.

ولا يقوم الجهاز بتخزين أي بيانات داخله، ولا يقوم بتثبيت أي برامج فيه، مع تقديم وحدة معالجة للذكاء الاصطناعي مدمجة فيه لتسريع التفاعل مع البيانات والحصول على النتائج بكل سلاسة.

تحليل علوم الأرض

وعلى الصعيد نفسه، تعاونت وكالة الفضاء الأميركية «ناسا» مع «مايكروسوفت» لتطوير أداة مدعومة بالذكاء الاصطناعي اسمها «كوبايلوت الأرض» (Earth Copilot) تهدف إلى تبسيط عملية تحليل البيانات المرتبطة بعلوم الأرض التي تجمعها الأقمار الاصطناعية الخاصة بـ«ناسا». وسيتم نشر هذه البيانات المعقدة للجميع بهدف مشاركة المعلومات المهمة مع العلماء والباحثين والطلاب والمدرسين وصناع السياسات وعموم الناس.

وستستخدم الوكالة خدمة «آجور أوبين إيه آي» (Azure OpenAI Service) لتذليل العقبات التقنية وتمكين المجموعات المختلفة للمستخدمين من التفاعل مع البيانات العلمية لكوكب الأرض، ما يدل على الأبواب التي يفتحها الذكاء الاصطناعي لتسهيل وتبسيط عملية التعليم والبحث وتحليل مجموعات البيانات الضخمة في المجالات العلمية وسنّ السياسات، وفي مجالات الزراعة والتخطيط الحضري والاستجابة في حالات الكوارث، وغيرها.

ويمكن زيارة الموقع من هذا الرابط: www.earthdata.nasa.gov/dashboard