«تشات جي بي تي» الجديد... يرى ويتحادث

اختبارات نظام الذكاء الاصطناعي التوليدي تؤكد تفوقه وتمايزه

«تشات جي بي تي» الجديد... يرى ويتحادث
TT

«تشات جي بي تي» الجديد... يرى ويتحادث

«تشات جي بي تي» الجديد... يرى ويتحادث

«تشات جي بي تي» ChatGPT نظام الذكاء الاصطناعي التوليدي المثير، قاتل العمل المكتبي الممل، العدو اللدود لمعلمي المدارس الثانوية ولكتاب السيناريو في هوليوود على حد سواء، يحصل على بعض الصلاحيات الجديدة.

الرؤية والاستماع والتحدث

أعلنت شركة «أوبن إيه إي» OpenAI، الشركة المصنّعة للنظام، أنها ستمنح برنامج الدردشة الشهير القدرة على «الرؤية والاستماع والتحدث» من خلال ميزتين جديدتين: الأولى، تحديث يسمح لـChatGPT بتحليل الصور والرد عليها؛ إذ يمكنك تحميل صورة لدراجة، على سبيل المثال، والحصول على تعليمات حول كيفية خفض المقعد، أو الحصول على اقتراحات لوصفات الأطعمة بناءً على صورة لمحتويات ثلاجتك. والأخرى، هي ميزة تتيح للمستخدمين التحدث إلى «تشات جي بي تي» والحصول على ردود يتم تسليمها بصوت الذكاء الاصطناعي، بالطريقة التي قد تتحدث بها مع «سيري» Siri أو «أليكسا» Alexa.

تعدّ هذه الميزات جزءاً من التوجه على مستوى الصناعة نحو ما يسمى «أنظمة الذكاء الاصطناعي متعددة الوسائط» التي يمكنها التعامل مع النصوص والصور ومقاطع الفيديو، وأي شيء آخر قد يقرر المستخدم طرحه عليها.

الهدف النهائي، وفقاً لبعض الباحثين، هو تصميم نظام ذكاء اصطناعي قادر على معالجة المعلومات بجميع الطرق التي يستطيع الإنسان القيام بها.

لا يستطيع معظم المستخدمين الوصول إلى الميزات الجديدة حتى الآن، لكن الشركة ستقدمها أولاً لعملاء ChatGPT Plus وEnterprise خلال الأسابيع القليلة المقبلة، وستجعلها متاحة على نطاق أوسع بعد ذلك. وستعمل ميزة الرؤية على كل من سطح المكتب والهاتف الجوال، في حين أن ميزة الكلام ستكون متاحة فقط من خلال تطبيقات ChatGPT على نظم تشغيل «آي أو إس» و«أندرويد».

«تشات جي بي تي» الجديد ينتقل إلى مرحلة «أنظمة الذكاء الاصطناعي متعددة الوسائط»

اختبارات عملية على المزايا الجديدة

حصلت على وصول مبكر إلى ChatGPT الجديد لإجراء اختبار عملي. هذا ما وجدته عندما بدأت بتجربة ميزة التعرف على الصور في النظام الذكي على بعض الأغراض المنزلية؟

* «ما هذا الشيء الذي وجدته في درج النفايات الخاص بي»؟ سألت بعد أن حمّلت صورة لقطعة غامضة من السيليكون الأزرق بها خمسة ثقوب.

- أجاب ChatGPT: يبدو أن الجسم عبارة عن حامل أو قبضة من السيليكون، وغالباً ما يستخدم لربط عناصر متعددة معاً»».

وكان الجواب قريباً للحقيقة بما فيه الكفاية، إنه مقوٍ للأصابع استخدمته منذ سنوات أثناء تعافيي من إصابة في اليد.

* بعد ذلك، غذّيت النظام ببعض الصور للعناصر التي كنت أنوي بيعها على «سوق فيسبوك» Facebook Marketplace، وطلبت منه كتابة تفصيلات لكل منها.

- نجح النظام بشكل فائق في تفسير وشرح كل الأشياء، واصفاً ثلاجة صغيرة من طراز قديم بأنها «مثالية لأولئك الذين يقدرون لمسة من الماضي في منازلهم الحديثة».

* يمكن لـChatGPT الجديد أيضاً تحليل النص داخل الصور. التقطت صورة للصفحة الأولى من النسخة المطبوعة لصحيفة «نيويورك تايمز» يوم الأحد وطلبت من الروبوت تلخيصها.

- لقد كان أداء النظام جيداً، حيث وصف جميع المقالات الخمس الموجودة على الصفحة الأولى في بضع جمل لكل منها، على الرغم من أنه ارتكب خطأً واحداً على الأقل، حيث اخترع إحصائية حول الوفيات المرتبطة بالفنتانيل لم تكن موجودة في المقالة الأصلية.

* عيون ChatGPT ليست مثالية. لقد فشل عندما طلبت منه حل لغز الكلمات المتقاطعة. لقد ظنت خطأ أن لعبة الديناصورات المحشوة لطفلي، هي حوت. وعندما طلبت المساعدة في تحويل واحدة من تلك الرسوم البيانية لتجميع الأثاث التي لا تحتوي على كلمات إلى قائمة تعليمات خطوة بخطوة، أعطاني قائمة مختلطة من الأجزاء، معظمها كان خاطئاً.

صوت اصطناعي سلس وطبيعي

الآن، دعنا نتحدث عما أراه الأكثر إثارة للإعجاب بين الميزتين: الميزة الصوتية الجديدة لـ«جي بي تي»، التي تتيح للمستخدمين التحدث إلى التطبيق وتلقي الردود المنطوقة.

يعدّ استخدام الميزة أمراً سهلاً: فقط اضغط على أيقونة سماعة الرأس وابدأ في التحدث. وعندما تتوقف، يقوم النظام بتحويل كلماتك إلى نص باستخدام نظام «ويسبر» Whisper للتعرف على الكلام المطور من قِبل الشركة، الذي يولد استجابة ويعيد إليك الإجابة باستخدام خوارزمية جديدة لتحويل النص إلى كلام، وذلك باستخدام واحد من خمسة أصوات ذكاء اصطناعي.

تم إنشاء الأصوات، التي تشمل أصوات الذكور والإناث، باستخدام مقتطفات قصيرة أخذت من ممثلين صوتيين محترفين قامت الشركة بتعيينهم. واخترت «إمبر» «Ember»، وهو صوت ذكوري مفعم بالحيوية.

تفوق على أدوات المساعدة الصوتية

اختبرت الميزة الصوتية في «جي بي تي» لساعات عدة في مجموعة من المهام المختلفة، قراءة قصة قبل النوم لطفلي الصغير، والدردشة معي حول التوتر المرتبط بالعمل، ومساعدتي في تحليل حلم رأيته مؤخراً. لقد فعلت كل هذه الأمور بشكل جيد إلى حد ما، خاصة عندما أعطيته بعض المطالبات الذهبية وطلبت منها محاكاة صديق أو معالج أو معلم.

ما برز في هذه الاختبارات هو مدى اختلاف التحدث إلى ChatGPT عن التحدث إلى الأجيال الأقدم من أجهزة المساعدة الصوتية التي تعمل بتقنية الذكاء الاصطناعي، مثل «سيري» و«أليكسا».

تلك الأدوات المساعدة، يمكن حتى في أفضل حالاتها، أن تكون خشبية ومسطحة. إنها تجيب عن سؤال واحد في كل مرة، غالباً من خلال البحث عن شيء ما على الإنترنت وقراءته بصوت عالٍ كلمة بكلمة، أو الاختيار من بين عدد محدود من الإجابات المبرمجة.

على النقيض من ذلك، يبدو الصوت الاصطناعي لـ«جي بي تي» سلساً وطبيعياً، مع اختلافات طفيفة في النغمة والإيقاع؛ مما يجعله يبدو أقل آلياً. لقد كان قادراً على إجراء محادثات طويلة ومفتوحة حول أي موضوع تقريباً قمت بتجربته، بما في ذلك المطالبات التي كنت متأكداً من أنه لم يواجهها من قبل.

ربما لن يستخدم معظم الأشخاص روبوتات الدردشة المدعمة بالذكاء الاصطناعي بهذه الطريقة. بالنسبة للكثير من المهام، لا تزال الكتابة أسرع من التحدث، وكان انتظاري للنظام لقراءة ردوده الطويلة أمراً مزعجاً.

كما لم يكن من المفيد؛ كون التطبيق بطيئاً ومعيباً في بعض الأحيان نتيجة لبعض المشكلات الفنية في الإصدار التجريبي من التطبيق الذي اختبرته.

دفء المحادثة مع صوت أكثر إنسانية

إن وجود الذكاء الاصطناعي يتحدث إليك بصوت يشبه الإنسان هو تجربة أكثر حميمية من قراءة ردوده على الشاشة. وبعد بضع ساعات من التحدث مع ChatGPT بهذه الطريقة، شعرت بدفء جديد يتسلل إلى محادثاتنا. ومن دون الارتباط بواجهة نصية، شعرت بضغط أقل للتوصل إلى المطالبة المثالية. لقد تحدثنا بشكل عرضي أكثر، وكشفت المزيد عن حياتي.

قال بيتر دينغ، نائب رئيس المنتجات الاستهلاكية والمؤسساتية في OpenAI، والذي تحدث معي عن الميزة الصوتية الجديدة: «يبدو الأمر وكأنه منتج مختلف تقريباً». وقال: «لأنك لم تعد تنسخ ما لديك في رأسك إلى أصابعك ينتهي بك الأمر إلى طرح أشياء مختلفة».

هل سيقع المستخدمون الوحيدون المتيمون في حب «جي بي تي»، بعد أن أصبح بإمكانه الاستماع إليهم والرد عليهم؟ ذلك ممكن. أنا شخصياً لم أنسَ أبداً أنني كنت أتحدث إلى برنامج الدردشة الآلي. ومن المؤكد أنني لم أقع في خطأ عدّ ChatGPT كائناً واعياً، ولم أطوّر ارتباطات عاطفية به.

لكنني رأيت أيضاً لمحة عن المستقبل الذي قد يسمح فيه بعض الأشخاص لأجهزة الذكاء الاصطناعي المساعدة المعتمدة على الصوت بالدخول إلى الحرم الداخلي لحياتهم، حيث يأخذون معهم روبوتات الدردشة التي تعمل بالذكاء الاصطناعي أثناء التنقل، ويعاملونهم كأصدقاء مقربين لهم على مدار الساعة طوال أيام الأسبوع، ومعالجين، ومبارزين.

إن ذلك يبدو جنوناً، أليس كذلك؟ ومع ذلك، ألم يكن كل هذا يبدو جنونياً بعض الشيء قبل عام؟

«تشات جي بي تي» يرفض التعليق حول الصور البشرية

إن أكبر القيود على ميزة الرؤية في ChatGPT هي أنه يرفض الإجابة عن معظم الأسئلة المتعلقة بصور الوجوه البشرية. وهذا حسب التصميم. وقد أخبرتني شركة «أوين إيه إي» أنها لا تريد تمكينه من التعرف على الوجه أو أي استخدامات مخيفة أخرى، وأنها لا تريد أن يصدر التطبيق إجابات متحيزة أو مسيئة للأسئلة المتعلقة بالمظهر الجسدي للأشخاص. ولكن حتى من دون الوجوه، من السهل أن نتخيل الكثير من الطرق التي يمكن أن يكون بها روبوت المحادثة القائم على الذكاء الاصطناعي القادر على معالجة المعلومات المرئية مفيداً، خاصة مع تحسن التكنولوجيا.

يمكن أن يستخدمه البستاني، والباحث عن الطعام للتعرف على النباتات في البرية. كما يمكن لعشاق التمارين الرياضية استخدامه لتوليد خطط تمرين مخصصة، فقط عن طريق التقاط صورة للمعدات الموجودة في صالة الألعاب الرياضية الخاصة بهم. ويمكن للطلاب استخدامه لحل مسائل الرياضيات والعلوم المرئية، ويمكن للأشخاص ضعاف البصر استخدامه للتنقل حول العالم بسهولة أكبر.

* خدمة «نيويورك تايمز»


مقالات ذات صلة

ما دور الذكاء الاصطناعي في تعزيز الاستدامة بالشرق الأوسط؟

تكنولوجيا باحثون: يمكن من خلال الذكاء الاصطناعي تحقيق توازن بين النمو والمسؤولية البيئية وضمان مستقبل أكثر استدامة (أدوبي)

ما دور الذكاء الاصطناعي في تعزيز الاستدامة بالشرق الأوسط؟

يقول خبراء إن الذكاء الاصطناعي يمكن أن يقدم حلولاً مبتكرة لتعزيز كفاءة الطاقة وتقليل الهدر وتعزيز النمو المستدام.

نسيم رمضان (دبي)
يوميات الشرق آفاق جديدة في سوق الفنّ العالمية (إ.ب.أ)

أول عمل فنّي أنجزه روبوت «بشريّ» يُباع بمليون دولار

بيعت لوحة فنّية أنجزها روبوت الذكاء الاصطناعي لشخصية عالم الرياضيات الشهير، آلان تورينغ، الذي كان رمزاً لفكّ الشيفرات خلال الحرب العالمية الثانية.

«الشرق الأوسط» (لندن)
الاقتصاد جانب من حضور ملتقى «بيبان 24» في العاصمة السعودية الرياض (واس)

إطلاق مبادرة لتمكين الذكاء الاصطناعي في 100 شركة صغيرة ومتوسطة بالسعودية

أطلقت الهيئة العامة للمنشآت الصغيرة والمتوسطة السعودية و«غوغل» مبادرة «SMB Lab»، بهدف تسريع تبني الذكاء الاصطناعي في الشركات الصغيرة والمتوسطة.

«الشرق الأوسط» (الرياض)
الاقتصاد جانب من اجتماع المجموعة التشاورية الإقليمية لمنطقة الشرق الأوسط وشمال أفريقيا بالرياض (ساما)

المجموعة التشاورية الإقليمية التابعة لمجلس الاستقرار المالي تجتمع في الرياض

انعقد اجتماع المجموعة التشاورية الإقليمية لمنطقة الشرق الأوسط وشمال أفريقيا، التابعة لمجلس الاستقرار المالي، في العاصمة السعودية الرياض.

«الشرق الأوسط» (الرياض)
تكنولوجيا أصبحت ثقة نحو 3 أرباع المستهلكين (72%) بالشركات أقل مقارنة بعام 2023 (أدوبي)

65 % من العملاء يشعرون بأن الشركات تتعامل مع بياناتهم باستهتار وتهوّر

تظهر دراسة جديدة لشركة «سايلزفورس» تراجع الثقة بالشركات لدى 72 في المائة من العملاء حول العالم.

نسيم رمضان (لندن)

تقرير استخباراتي: تزايد التهديدات السيبرانية خلال الانتخابات الأميركية

حذّرت شركة «فورتينت» من تهديدات سيبرانية متزايدة استهدفت انتخابات الرئاسة الأميركية 2024 (أدوبي)
حذّرت شركة «فورتينت» من تهديدات سيبرانية متزايدة استهدفت انتخابات الرئاسة الأميركية 2024 (أدوبي)
TT

تقرير استخباراتي: تزايد التهديدات السيبرانية خلال الانتخابات الأميركية

حذّرت شركة «فورتينت» من تهديدات سيبرانية متزايدة استهدفت انتخابات الرئاسة الأميركية 2024 (أدوبي)
حذّرت شركة «فورتينت» من تهديدات سيبرانية متزايدة استهدفت انتخابات الرئاسة الأميركية 2024 (أدوبي)

في الوقت الذي اتجهت فيه أنظار العالم إلى الولايات المتحدة الأميركية خلال انتخاباتها الرئاسية التي فاز بها دونالد ترمب، يكشف تقرير أمن سيبراني تهديدات مرتبطة بالكيانات الأميركية والناخبين وحتى عملية الانتخابات، موضحاً أن عمليات الاحتيال الإلكترونية قد استهدفت الناخبين، كما سُجّلت نطاقات خبيثة تتنكر في شكل مرشحين. ويقدم تقرير أمن الانتخابات من مختبرات «فورتي غارد»، التابعة لشركة «فورتينت» المختصة في مجال الأمن السيبراني، بعنوان: «الجهات المهددة التي تستهدف الانتخابات الرئاسية الأميركية 2024»؛ تحليلاً معمقاً للتهديدات الملاحظة من يناير (كانون الثاني) إلى أغسطس (آب) 2024، عبر فحص مجموعة متنوعة من التهديدات الإلكترونية التي قد تؤثر في الكيانات الأميركية وعملية الانتخابات.

مواقع وهمية

بيّن التقرير تسجيل أكثر من 1000 نطاق وهمي جديد، يحمل محتوى انتخابياً منذ بداية عام 2024، يستهدف خداع الناخبين، مستغلاً الاهتمام المتزايد بالانتخابات لتنفيذ أنشطة ضارة. وحذّر التقرير من خطر تسريب البيانات الشخصية؛ إذ تُعرض مليارات السجلات الأميركية، بما في ذلك أرقام الضمان الاجتماعي والمعلومات الشخصية وكلمات المرور، للبيع على منصات السوق السوداء؛ مما يجعلها عرضة للتضليل والاحتيال واختراق الحسابات.

«فورتينت»: التهديدات الإلكترونية تتطلّب يقظة وتحليلاً دقيقاً لحماية العملية الانتخابية (أدوبي)

شبكة مظلمة

أظهرت التحليلات أن نحو 3 في المائة من المنشورات على «الشبكة المظلمة» (دارك ويب) تحتوي على بيانات حساسة تخص كيانات تجارية وحكومية أميركية. في الوقت نفسه، شهدت الهجمات الإلكترونية على المؤسسات الحكومية الأميركية نمواً ملحوظاً؛ إذ ارتفعت هجمات الفدية بنسبة 28 في المائة خلال عام 2024 مقارنة بالعام الماضي، مما جعل «الدارك ويب» بؤرة رئيسية للتهديدات السيبرانية ضد الولايات المتحدة. وذكر التقرير أن الجماعات المعادية تبادلت المعلومات قبل بدء الانتخابات، وتعاونت لتطوير أساليب جديدة لاستغلال الثغرات الأمنية؛ مما يجعل البيانات الحساسة هدفاً مغرياً للمهاجمين.

وفي هذا السياق، صرّح كبير الاستراتيجيين الأمنيين، نائب رئيس الاستخبارات العالمية للتهديدات في «فورتينت»، ديرك مانكي، بأن حدث مثل الانتخابات الرئاسية الأميركية يستلزم فهماً معمقاً للتهديدات الإلكترونية التي قد تؤثر في نزاهة العملية الانتخابية وموثوقيتها وسلامة المواطنين المشاركين فيها. وأضاف أنها تتطلّب يقظة مستمرة وتحليلاً دقيقاً للتهديدات المحتملة ونقاط الضعف لحماية العملية الانتخابية من أي محاولات تدخل إلكتروني.

خداع الناخبين

رصد فريق «فورتي غارد» عروضاً لبيع أدوات تصيد احتيالي بقيمة 1260 دولاراً لكل مجموعة، مصممة لانتحال صفة مرشحَي الرئاسة، بهدف سرقة المعلومات الشخصية للناخبين وتفاصيل بطاقات الائتمان المستخدمة في التبرعات. ومن بين أكثر من 1000 نطاق جديد يحمل مصطلحات انتخابية وأسماء شخصيات سياسية بارزة يتضمّن بعضها مواقع احتيالية تجمع تبرعات مثل «secure.actsblues.com» الذي يحاكي الموقع الشرعي «ActBlue»، وهو منصة تبرعات غير ربحية.

وبيّن التقرير أن مزودَي استضافة الإنترنت الأكثر استخداماً لهذه المواقع هما: «AMAZON - 02» و«CLOUDFLARENET»؛ إذ تستغل جهات التهديد هذه المنصات لتعزيز مصداقية نطاقاتها الضارة. كما نوهت التحليلات إلى أن عدداً كبيراً من هذه النطاقات يتركز في عناوين «IP» محدودة، مما يعكس نهجاً مركزياً تتبعه هذه الجهات لإدارة الحملات الضارة.

«فورتينت»: الهجمات على المؤسسات الحكومية الأميركية ارتفعت بنسبة 28 % عام 2024 (أدوبي)

مخاطر متصاعدة

أشار التقرير إلى وجود قواعد بيانات على «الدارك ويب» تحتوي على معلومات حساسة، تشمل هذه البيانات أكثر من 1.3 مليار مجموعة تتضمّن بيانات تسجيل الدخول، مثل: أسماء المستخدمين، وعناوين البريد الإلكتروني، وكلمات المرور، وغيرها التي يستخدمها المجرمون للوصول غير المصرح به إلى الحسابات، مما يمثّل تهديداً لنزاهة الانتخابات. بالإضافة إلى ذلك، هناك نحو 300 ألف صف لبيانات بطاقات الائتمان؛ مما يزيد من احتمالات تنفيذ عمليات احتيال مالي ضد الناخبين والعاملين في الانتخابات.

وأوضح التقرير كذلك أن هناك أكثر من ملياري صف من بيانات المستخدمين المتاحة على هذه المواقع؛ مما يزيد من خطر سرقة الهوية وهجمات التصيّد الاحتيالي. ولفتت التقديرات إلى أن 10 في المائة من المنشورات على «الدارك ويب» مرتبطة بأرقام الضمان الاجتماعي، ما يشكّل تهديداً إضافياً لأمن البيانات الشخصية.

تدابير أمنية

تُعدّ تدابير الأمن السيبراني ضرورية لحماية أي عملية انتخابية كبيرة؛ إذ يمكن أن يساعد اتباع أفضل الممارسات الأمنية في منع تأثير الحوادث السيبرانية وتقليلها. وتوصي «فورتينت» المواطنين وقادة الأعمال بالانتباه الدائم ومراقبة أي نشاط مشبوه قبل الأحداث المهمة، مع إعطاء الأولوية للأمن السيبراني، وتدريب الموظفين على الوعي بالمخاطر السيبرانية. علاوة على ذلك، يجب تطبيق سياسة التحقق متعدد العوامل، واستخدام كلمات مرور قوية، وتثبيت حلول حماية نقاط النهاية، بالإضافة إلى تحديث أنظمة التشغيل وخوادم الويب بانتظام لضمان حماية فعالة من التهديدات.