«تشات جي بي تي» الجديد... يرى ويتحادث

اختبارات نظام الذكاء الاصطناعي التوليدي تؤكد تفوقه وتمايزه

«تشات جي بي تي» الجديد... يرى ويتحادث
TT

«تشات جي بي تي» الجديد... يرى ويتحادث

«تشات جي بي تي» الجديد... يرى ويتحادث

«تشات جي بي تي» ChatGPT نظام الذكاء الاصطناعي التوليدي المثير، قاتل العمل المكتبي الممل، العدو اللدود لمعلمي المدارس الثانوية ولكتاب السيناريو في هوليوود على حد سواء، يحصل على بعض الصلاحيات الجديدة.

الرؤية والاستماع والتحدث

أعلنت شركة «أوبن إيه إي» OpenAI، الشركة المصنّعة للنظام، أنها ستمنح برنامج الدردشة الشهير القدرة على «الرؤية والاستماع والتحدث» من خلال ميزتين جديدتين: الأولى، تحديث يسمح لـChatGPT بتحليل الصور والرد عليها؛ إذ يمكنك تحميل صورة لدراجة، على سبيل المثال، والحصول على تعليمات حول كيفية خفض المقعد، أو الحصول على اقتراحات لوصفات الأطعمة بناءً على صورة لمحتويات ثلاجتك. والأخرى، هي ميزة تتيح للمستخدمين التحدث إلى «تشات جي بي تي» والحصول على ردود يتم تسليمها بصوت الذكاء الاصطناعي، بالطريقة التي قد تتحدث بها مع «سيري» Siri أو «أليكسا» Alexa.

تعدّ هذه الميزات جزءاً من التوجه على مستوى الصناعة نحو ما يسمى «أنظمة الذكاء الاصطناعي متعددة الوسائط» التي يمكنها التعامل مع النصوص والصور ومقاطع الفيديو، وأي شيء آخر قد يقرر المستخدم طرحه عليها.

الهدف النهائي، وفقاً لبعض الباحثين، هو تصميم نظام ذكاء اصطناعي قادر على معالجة المعلومات بجميع الطرق التي يستطيع الإنسان القيام بها.

لا يستطيع معظم المستخدمين الوصول إلى الميزات الجديدة حتى الآن، لكن الشركة ستقدمها أولاً لعملاء ChatGPT Plus وEnterprise خلال الأسابيع القليلة المقبلة، وستجعلها متاحة على نطاق أوسع بعد ذلك. وستعمل ميزة الرؤية على كل من سطح المكتب والهاتف الجوال، في حين أن ميزة الكلام ستكون متاحة فقط من خلال تطبيقات ChatGPT على نظم تشغيل «آي أو إس» و«أندرويد».

«تشات جي بي تي» الجديد ينتقل إلى مرحلة «أنظمة الذكاء الاصطناعي متعددة الوسائط»

اختبارات عملية على المزايا الجديدة

حصلت على وصول مبكر إلى ChatGPT الجديد لإجراء اختبار عملي. هذا ما وجدته عندما بدأت بتجربة ميزة التعرف على الصور في النظام الذكي على بعض الأغراض المنزلية؟

* «ما هذا الشيء الذي وجدته في درج النفايات الخاص بي»؟ سألت بعد أن حمّلت صورة لقطعة غامضة من السيليكون الأزرق بها خمسة ثقوب.

- أجاب ChatGPT: يبدو أن الجسم عبارة عن حامل أو قبضة من السيليكون، وغالباً ما يستخدم لربط عناصر متعددة معاً»».

وكان الجواب قريباً للحقيقة بما فيه الكفاية، إنه مقوٍ للأصابع استخدمته منذ سنوات أثناء تعافيي من إصابة في اليد.

* بعد ذلك، غذّيت النظام ببعض الصور للعناصر التي كنت أنوي بيعها على «سوق فيسبوك» Facebook Marketplace، وطلبت منه كتابة تفصيلات لكل منها.

- نجح النظام بشكل فائق في تفسير وشرح كل الأشياء، واصفاً ثلاجة صغيرة من طراز قديم بأنها «مثالية لأولئك الذين يقدرون لمسة من الماضي في منازلهم الحديثة».

* يمكن لـChatGPT الجديد أيضاً تحليل النص داخل الصور. التقطت صورة للصفحة الأولى من النسخة المطبوعة لصحيفة «نيويورك تايمز» يوم الأحد وطلبت من الروبوت تلخيصها.

- لقد كان أداء النظام جيداً، حيث وصف جميع المقالات الخمس الموجودة على الصفحة الأولى في بضع جمل لكل منها، على الرغم من أنه ارتكب خطأً واحداً على الأقل، حيث اخترع إحصائية حول الوفيات المرتبطة بالفنتانيل لم تكن موجودة في المقالة الأصلية.

* عيون ChatGPT ليست مثالية. لقد فشل عندما طلبت منه حل لغز الكلمات المتقاطعة. لقد ظنت خطأ أن لعبة الديناصورات المحشوة لطفلي، هي حوت. وعندما طلبت المساعدة في تحويل واحدة من تلك الرسوم البيانية لتجميع الأثاث التي لا تحتوي على كلمات إلى قائمة تعليمات خطوة بخطوة، أعطاني قائمة مختلطة من الأجزاء، معظمها كان خاطئاً.

صوت اصطناعي سلس وطبيعي

الآن، دعنا نتحدث عما أراه الأكثر إثارة للإعجاب بين الميزتين: الميزة الصوتية الجديدة لـ«جي بي تي»، التي تتيح للمستخدمين التحدث إلى التطبيق وتلقي الردود المنطوقة.

يعدّ استخدام الميزة أمراً سهلاً: فقط اضغط على أيقونة سماعة الرأس وابدأ في التحدث. وعندما تتوقف، يقوم النظام بتحويل كلماتك إلى نص باستخدام نظام «ويسبر» Whisper للتعرف على الكلام المطور من قِبل الشركة، الذي يولد استجابة ويعيد إليك الإجابة باستخدام خوارزمية جديدة لتحويل النص إلى كلام، وذلك باستخدام واحد من خمسة أصوات ذكاء اصطناعي.

تم إنشاء الأصوات، التي تشمل أصوات الذكور والإناث، باستخدام مقتطفات قصيرة أخذت من ممثلين صوتيين محترفين قامت الشركة بتعيينهم. واخترت «إمبر» «Ember»، وهو صوت ذكوري مفعم بالحيوية.

تفوق على أدوات المساعدة الصوتية

اختبرت الميزة الصوتية في «جي بي تي» لساعات عدة في مجموعة من المهام المختلفة، قراءة قصة قبل النوم لطفلي الصغير، والدردشة معي حول التوتر المرتبط بالعمل، ومساعدتي في تحليل حلم رأيته مؤخراً. لقد فعلت كل هذه الأمور بشكل جيد إلى حد ما، خاصة عندما أعطيته بعض المطالبات الذهبية وطلبت منها محاكاة صديق أو معالج أو معلم.

ما برز في هذه الاختبارات هو مدى اختلاف التحدث إلى ChatGPT عن التحدث إلى الأجيال الأقدم من أجهزة المساعدة الصوتية التي تعمل بتقنية الذكاء الاصطناعي، مثل «سيري» و«أليكسا».

تلك الأدوات المساعدة، يمكن حتى في أفضل حالاتها، أن تكون خشبية ومسطحة. إنها تجيب عن سؤال واحد في كل مرة، غالباً من خلال البحث عن شيء ما على الإنترنت وقراءته بصوت عالٍ كلمة بكلمة، أو الاختيار من بين عدد محدود من الإجابات المبرمجة.

على النقيض من ذلك، يبدو الصوت الاصطناعي لـ«جي بي تي» سلساً وطبيعياً، مع اختلافات طفيفة في النغمة والإيقاع؛ مما يجعله يبدو أقل آلياً. لقد كان قادراً على إجراء محادثات طويلة ومفتوحة حول أي موضوع تقريباً قمت بتجربته، بما في ذلك المطالبات التي كنت متأكداً من أنه لم يواجهها من قبل.

ربما لن يستخدم معظم الأشخاص روبوتات الدردشة المدعمة بالذكاء الاصطناعي بهذه الطريقة. بالنسبة للكثير من المهام، لا تزال الكتابة أسرع من التحدث، وكان انتظاري للنظام لقراءة ردوده الطويلة أمراً مزعجاً.

كما لم يكن من المفيد؛ كون التطبيق بطيئاً ومعيباً في بعض الأحيان نتيجة لبعض المشكلات الفنية في الإصدار التجريبي من التطبيق الذي اختبرته.

دفء المحادثة مع صوت أكثر إنسانية

إن وجود الذكاء الاصطناعي يتحدث إليك بصوت يشبه الإنسان هو تجربة أكثر حميمية من قراءة ردوده على الشاشة. وبعد بضع ساعات من التحدث مع ChatGPT بهذه الطريقة، شعرت بدفء جديد يتسلل إلى محادثاتنا. ومن دون الارتباط بواجهة نصية، شعرت بضغط أقل للتوصل إلى المطالبة المثالية. لقد تحدثنا بشكل عرضي أكثر، وكشفت المزيد عن حياتي.

قال بيتر دينغ، نائب رئيس المنتجات الاستهلاكية والمؤسساتية في OpenAI، والذي تحدث معي عن الميزة الصوتية الجديدة: «يبدو الأمر وكأنه منتج مختلف تقريباً». وقال: «لأنك لم تعد تنسخ ما لديك في رأسك إلى أصابعك ينتهي بك الأمر إلى طرح أشياء مختلفة».

هل سيقع المستخدمون الوحيدون المتيمون في حب «جي بي تي»، بعد أن أصبح بإمكانه الاستماع إليهم والرد عليهم؟ ذلك ممكن. أنا شخصياً لم أنسَ أبداً أنني كنت أتحدث إلى برنامج الدردشة الآلي. ومن المؤكد أنني لم أقع في خطأ عدّ ChatGPT كائناً واعياً، ولم أطوّر ارتباطات عاطفية به.

لكنني رأيت أيضاً لمحة عن المستقبل الذي قد يسمح فيه بعض الأشخاص لأجهزة الذكاء الاصطناعي المساعدة المعتمدة على الصوت بالدخول إلى الحرم الداخلي لحياتهم، حيث يأخذون معهم روبوتات الدردشة التي تعمل بالذكاء الاصطناعي أثناء التنقل، ويعاملونهم كأصدقاء مقربين لهم على مدار الساعة طوال أيام الأسبوع، ومعالجين، ومبارزين.

إن ذلك يبدو جنوناً، أليس كذلك؟ ومع ذلك، ألم يكن كل هذا يبدو جنونياً بعض الشيء قبل عام؟

«تشات جي بي تي» يرفض التعليق حول الصور البشرية

إن أكبر القيود على ميزة الرؤية في ChatGPT هي أنه يرفض الإجابة عن معظم الأسئلة المتعلقة بصور الوجوه البشرية. وهذا حسب التصميم. وقد أخبرتني شركة «أوين إيه إي» أنها لا تريد تمكينه من التعرف على الوجه أو أي استخدامات مخيفة أخرى، وأنها لا تريد أن يصدر التطبيق إجابات متحيزة أو مسيئة للأسئلة المتعلقة بالمظهر الجسدي للأشخاص. ولكن حتى من دون الوجوه، من السهل أن نتخيل الكثير من الطرق التي يمكن أن يكون بها روبوت المحادثة القائم على الذكاء الاصطناعي القادر على معالجة المعلومات المرئية مفيداً، خاصة مع تحسن التكنولوجيا.

يمكن أن يستخدمه البستاني، والباحث عن الطعام للتعرف على النباتات في البرية. كما يمكن لعشاق التمارين الرياضية استخدامه لتوليد خطط تمرين مخصصة، فقط عن طريق التقاط صورة للمعدات الموجودة في صالة الألعاب الرياضية الخاصة بهم. ويمكن للطلاب استخدامه لحل مسائل الرياضيات والعلوم المرئية، ويمكن للأشخاص ضعاف البصر استخدامه للتنقل حول العالم بسهولة أكبر.

* خدمة «نيويورك تايمز»


مقالات ذات صلة

شركات الذكاء الاصطناعي التوليدي تلجأ إلى الكتب لتطوّر برامجها

تكنولوجيا شركات الذكاء الاصطناعي تتفق مع دور النشر بما يتيح لهذه الشركات استخدام الأعمال المنشورة لتدريب نماذجها القائمة على الذكاء الاصطناعي التوليدي (رويترز)

شركات الذكاء الاصطناعي التوليدي تلجأ إلى الكتب لتطوّر برامجها

مع ازدياد احتياجات الذكاء الاصطناعي التوليدي، بدأت أوساط قطاع النشر هي الأخرى في التفاوض مع المنصات التي توفر هذه التقنية سعياً إلى حماية حقوق المؤلفين.

«الشرق الأوسط» (باريس)
الاقتصاد بورصة نيويورك للأوراق المالية (وكالة حماية البيئة)

هيمنة الأسهم الأميركية تزداد قوة مع فوز ترمب

تواصل الأسهم الأميركية تعزيز تفوقها على منافسيها العالميين، ويعتقد العديد من المستثمرين أن هذه الهيمنة قد تزداد إذا تمكن دونالد ترمب من تنفيذ برنامجه.

«الشرق الأوسط» (نيويورك)
تكنولوجيا يستعرض مؤتمر «مايكروسوفت إغنايت 2024» أبرز تقنيات الذكاء الاصطناعي المقبلة

مؤتمر «مايكروسوفت إغنايت 2024» يكشف عن أبرز نزعات الذكاء الاصطناعي المقبلة

إطلاق أكبر مشروع للأمن الرقمي بتاريخ البشرية لمواجهة أكثر من 7000 هجمة في الثانية.

خلدون غسان سعيد (جدة)
الاقتصاد علم شركة «إنفيديا» على الحرم الجامعي في سانتا كلارا بكاليفورنيا (إ.ب.أ)

بالأرقام... كيف أصبحت «إنفيديا» الشركة الأكثر قيمة في العالم؟

حققت «إنفيديا» مرة أخرى نتائج ربع سنوية تجاوزت توقعات «وول ستريت».

«الشرق الأوسط» (نيويورك)
الاقتصاد شاشة تسجيل الوصول في مكتب «إنفيديا» في أوستن بتكساس (أ.ف.ب)

«إنفيديا» تتفوق على توقعات الأرباح مع ترقب المستثمرين للطلب على رقائق «بلاكويل» للذكاء الاصطناعي

أعلنت شركة «إنفيديا»، يوم الأربعاء، عن زيادة في أرباحها ومبيعاتها في الربع الثالث مع استمرار الطلب على رقائق الكمبيوتر المتخصصة.

«الشرق الأوسط» (نيويورك)

تعرف على مزايا «بلايستيشن 5 برو»: جهاز الألعاب الأقوى في العالم

«بلايستيشن 5 برو»: جهاز الألعاب الأقوى في العالم
«بلايستيشن 5 برو»: جهاز الألعاب الأقوى في العالم
TT

تعرف على مزايا «بلايستيشن 5 برو»: جهاز الألعاب الأقوى في العالم

«بلايستيشن 5 برو»: جهاز الألعاب الأقوى في العالم
«بلايستيشن 5 برو»: جهاز الألعاب الأقوى في العالم

أطلقت «سوني» جهاز «بلايستيشن 5 برو» PlayStation 5 Pro المطور الذي يُعد الأقوى في العالم في أجهزة الألعاب إلى الآن، من حيث قدرات الرسومات للألعاب الحالية والسابقة، بتصميم أصغر حجماً وأقل وزناً، مقارنة بإصدار «بلايستيشن 5».

ويهدف هذا الإصدار إلى تشغيل الألعاب بالدقة الفائقة وبسرعات عالية مع دعم المؤثرات البصرية المتقدمة وتقنيات الذكاء الاصطناعي. واختبرت «الشرق الأوسط» الجهاز، ونذكر ملخص التجربة.

مؤثرات بصرية متقدمة في لعبة السباقات السريعة «إف1 24»

أداء رسومي وتقني مطور

بداية، جرى رفع سرعة الرسومات بنسبة 45 في المائة، وزيادة عدد نوى الرسومات بنسبة 67 في المائة، ورفع سرعة الذاكرة بنسبة 28 في المائة، وهي نسب عالية تسمح للمطورين تقديم ألعاب بالدقة الفائقة 4K وبسرعة 60 أو 120 صورة في الثانية. وكان يجب على اللاعبين في السابق اختيار إما نمط جودة الصورة أو الأداء، حيث يعرض نمط جودة الصورة الرسومات بالدقة الفائقة 4K ولكن على حساب سرعة اللعب، بينما يقوم نمط الأداء بعكس المعادلة بخفض دقة الصورة وتفاصيلها مقابل الحصول على سرعة لعب أعلى. ويغير «بلايستيشن 5 برو» هذا الأمر، حيث يعرض الصورة بالدقة الفائقة وبسرعة عالية، وذلك بفضل زيادة سرعة وحدة الرسومات واستخدام تقنيات الذكاء الاصطناعي لرفع الدقة من دون أن يشعر اللاعب بأي تأخير في مجريات اللعب.

ويقدم هذا الإصدار تجربة ألعاب مبهرة بالدقة الفائقة 4K ومعدل رسومات يتراوح بين 60 و120 صورة في الثانية، حسب اللعبة، للحصول على صورة أكثر وضوحاً وحركة أكثر سلاسة. يضاف إلى ذلك دعم تقنية تتبع الأشعة الضوئية من مصدرها Ray Tracing بالوقت الفعلي وبشكل متقدم، وهي واحدة من أفضل الابتكارات في مجال الألعاب الحديثة، حيث تصبح الإضاءة والانعكاسات داخل اللعبة أكثر واقعية، وسيستطيع اللاعب مشاهدة انعكاسات الضوء على الأسطح المعدنية وتفاعل الإضاءة في بيئة اللعب.

عالم مفتوح مليء بالتفاصيل الغنية والرسومات المبهرة في لعبة «سبايدر-مان 2»

ويقدم الجهاز تحسينات في التفاصيل والظلال، مثل التفاصيل الدقيقة في كل خصلة شعر في الشخصيات أو كل قطرة ماء على أوراق الشجر، مع عرض الظلال وتدرجات الألوان بدقة أعلى للحصول على تجربة لعب أكثر واقعية وانغماساً من السابق. كما يدعم هذا الإصدار تجربة ألعاب محسَّنة، حيث تبدو الألعاب السابقة أكثر وضوحاً بفضل التحسينات البصرية.

الذكاء الاصطناعي في عالم الألعاب

وبشكل يشابه تقنية Dynamic Learning Super Sampling DLSS على الكومبيوترات الشخصية، يدعم «بلايستيشن 5 برو» تقنية «الدقة الطيفية الفائقة» PlayStation Spectral Super Resolution PSSR المعززة بالذكاء الاصطناعي لمعالجة الصورة داخلياً بدقة معتدلة بشكل سريع جداً، ومن ثم استخدام وحدات معالجة الذكاء الاصطناعي لرفع دقة الرسومات بكل سرعة.

ولدى تجربة لعبتي Marvel’s Spider - Man 2 وThe Last of Us II Remastered وتفعيل نمطي جودة الصورة والأداء وعرض الصورة بتردد 120 هرتز، كانت التجربة انسيابية للغاية، مع ملاحظة أدق التفاصيل دون أي تراجع في الأداء مهما كانت بيئة اللعب مليئة بالعناصر، وكان التحكم بالشخصيات سلساً جداً. ولوحظ أن الأشعة تنعكس بواقعية عن المياه والأسطح المعدنية والزجاجية مما يزيد من مستويات الانغماس.

تطوير الألعاب الحالية والجيل السابق

ويوجد حالياً أكثر من 50 لعبة تدعم القدرات المتقدمة لـ«بلايستيشن 5 برو» تشمل رفع دقة الرسومات وزيادة معدل الرسومات في الثانية وتحقيق تردد عرض الصور يتراوح بين 60 و120 هرتز (تتطلب هذه الميزة دعم تلفزيون المستخدم للتردد المرغوب)، نذكر منها Alan Wake 2 وAlbatroz وApex Legends وAssassin’s Creed Mirage وBaldur’s Gate 3 وCall of Duty: Black Ops 6 وEA Sports College Football 25 وDead Island 2 وDemon’s Souls وDiablo IV وDragon Age: The Veilguard وDragon’s Dogma 2 وDying Light 2 Reloaded Edition وEA Sports FC 25 وEnlisted وF1 24 وFinal Fantasy VII Rebirth وFortnite وGod of War Ragnarök وGran Turismo 7 وHogwarts Legacy وHorizon Forbidden West وHorizon Zero Dawn Remastered وKayak VR: Mirage وLies of P وLords of the Fallen وMadden NFL 25.

ونذكر كذلك ألعاب Marvel’s Spider - Man Remastered وMarvel’s Spider - Man: Miles Morales وMarvel’s Spider - Man 2 وMetal Gear Solid Delta: Snake EaterوNaraka: Bladepoint وNBA 2K25 وNo Man’s Sky وPalworld وPaladin’s Passage وPlanet Coaster 2 وProfessional Baseball Spirits 2024 - 2025 وRatchet & Clank: Rift Apart وResident Evil 4 وResident Evil Village وRise of the Ronin وRogue Flight وStar Wars: Jedi Survivor وStar Wars: Outlaws وStellar Blade وTest Drive Unlimited: Solar Crown وThe Crew Motorfest وThe Finals وThe First Descendant وThe Last of Us Part I وThe Last of Us Part II Remastered وUntil Dawn وWar Thunder وWarframe وWorld of Warships: Legends.

انعكاس الأشعة الضوئية من مصدرها بشكل متقدم في لعبة «ذا كرو موتورفيست»

تجدر الإشارة إلى أنه يجب تحميل تحديث لهذه الألعاب قبل الاستفادة من القدرات الرسومية المطورة لها، واختيار نمط الرسومات المناسب من قائمة الإعدادات الخاصة بكل لعبة. وسنقوم بتجربة ألعاب مطورة لجهاز «بلايستيشن 5 برو» بشكل معمق قريباً ونشارككم النتائج (منها لعبتا Horizon Zero Dawn Remastered وLEGO Horizon Adventures). يضاف إلى ذلك دعم الجهاز تشغيل أكثر من 8500 لعبة لجهاز «بلايستيشن 4» ورفع دقة العديد منها، دون الحاجة لتحميل تحديث برمجي لها.

مواصفات تقنية

وبالنسبة للمواصفات التقنية، يستخدم الجهاز المعالج نفسه ثماني النوى الموجود في «بلايستيشن 5» الأساسي، لكن مع توفير القدرة على رفع سرعته من 3.5 إلى 3.85 غيغاهرتز عند الحاجة وبشكل آلي. إلا أن القفزة الأكبر هي في قدرة وحدة معالجة الرسومات، حيث ازدادت قدرتها بنسبة 62 في المائة من 10.28 إلى 16.67 تيرافلوب Teraflop (تريليون عملية حسابية في الثانية) وزيادة عدد النوى من 36 إلى 60. مع استخدام الذاكرة نفسها بسعة 16 غيغابايت ولكن بسرعة نقل بيانات تبلغ 18 غيغابت في الثانية، مقارنة بـ14 غيغابت في الثانية في الإصدار السابق، مع تقديم 2 غيغابايت إضافية خاصة لنظام التشغيل.

ويقدم الجهاز، الآن، ضِعف السعة التخزينية المدمجة (2 تيرابايت أو 2048 غيغابايت)، مع دعم شبكات «واي فاي 7» فائقة السرعة في الإصدار الجديد. يضاف إلى ذلك دعم تقنية «الدقة الطيفية الفائقة» PSSR لرفع دقة الصورة آلياً. وتبقى المنافذ نفسها مع خفض السماكة من 92 (الإصدار الأساسي الرقمي) إلى 89 ملليمترا وخفض الوزن من 3.9 إلى 3.1 كيلوغرام.

واستطعت نقل الألعاب من جهاز «بلايستيشن 5» الأساسي إلى «بلايستيشن 5 برو» بكل سهولة، حيث تم نسخ جميع الألعاب من وحدة التخزينية المدمجة إلى وحدة تخزين إضافية بتقنية NVME في بضع ثوان، وتم نقل تلك الوحدة من الإصدار السابق إلى الجديد وتشغيل أي لعبة في أقل من دقيقتين.

وتجدر الإشارة إلى أن هذا الإصدار لا يحتوي على مشغل أقراص ليزرية، وتجب إضافته إلى الجهاز بشكل منفصل، الأمر نفسه بالنسبة لقاعدة حمل الجهاز طولياً.

ويبلغ سعر الجهاز 3399 ريالاً سعودياً (نحو 906 دولارات أميركية)، وهو متوفر الآن في متاجر المنطقة العربية.