سماعات أذن صغيرة... أحدث أجهزة الترجمة

تصاميم مستقبلية تعمل من دون الإنترنت

سماعات «أمباسادور».....سماعات «دبليو تي 2»
سماعات «أمباسادور».....سماعات «دبليو تي 2»
TT

سماعات أذن صغيرة... أحدث أجهزة الترجمة

سماعات «أمباسادور».....سماعات «دبليو تي 2»
سماعات «أمباسادور».....سماعات «دبليو تي 2»

باتت أجهزة الترجمة الحديثة قاب قوسين أو أدنى من تكرار تجربة البرامج المشهورة مثل «سمكة بابل» التي يذكر «دليل الجوال إلى المجرّة» من تطوير شركة «هيتشهيكر»، أنها توضع في أذنكم وتترجم لكم أي لغة أجنبية بشكل آنيّ.
انسوا المعاجم والكتب بل وحتّى موقع «غوغل للترجمة»، فقد أصبح بإمكانكم الاستفادة من أجهزة تُثبّت في الأذن وتترجم لكم أي لغة أجنبية إلى لغتكم الأمّ.

سماعات مترجمة
في الأسواق، تجدون مثلاً «سمّاعة الأذن دبليو تي 2 بلاس المترجمة المدعومة بالذكاء الصناعي» WT2 Plus Ear to Ear AI Translator Earbuds، من صنع شركة «تيميكيتل»، بينما تتحضّر سمّاعة «أمباسادور» Ambassador من مختبرات «ويفرلي لابز» لطرحها في الأسواق قبل نهاية هذا العام.
تأتي السماعتان المذكورتان بميزة الاتصالات اللاسلكية، مع قطعتين للأذن تتطلّبان مزامنتهما مع هاتف ذكي واحد متصل بالواي - فاي أو بحزمة بيانات خلوية. اعتبر غراهام نوبيغ، أستاذ مساعد في معهد التقنيات اللغوية التابع لجامعة كارنيغي ميلون، والخبير في التعلّم الآلي ومعالجة اللغات الطبيعية، أنّ «هذه الأجهزة ستقرّبنا أكثر من عصر السفر إلى أماكن مختلفة من العالم يتكلّم سكّانها لغاتٍ مختلفة عن لغتنا، ونستطيع التواصل معهم بسلاسة». منذ عام 2016 أي عندما تمّ إسنادها إلى الشبكات العصبية (سواء بواسطة تقنية مصممة للأذن أو تُحمل باليد على شكل تطبيق)، غالباً ما تتألّف عملية «ترجمة الحديث إلى حديث مقابل» من ثلاث خطوات: أولاً، يحوّل برنامج تمييز الكلام، الكلمات المحكيّة إلى نصّ، ثمّ يتحوّل النص إلى نصّ باللغة الأخرى بواسطة الترجمة الآلية العصبية، وأخيراً، تحوّل الوحدة الصوتية النصّ المترجم إلى كلام منطوق باللغة الأخرى.
تتسبب عملية التحويل هذه ببعض التأخير، ولكنّ الأجهزة الحديثة تتيح للمستخدم الاستمرار في الكلام خلال حدوث الترجمة، مما يسهّل التدفّق الطبيعي للمحادثة.
يرى نوبيغ أنّ «توفّر هذا العامل مهم جدّا، وإلّا سيتضاعف طول المحادثة، لتصبح على الشكل التالي: يتحدّث الطرف الأوّل، فيترجم النظام، ومن ثمّ يتحدّث الطرف الثاني، ويُترجم النظام مجدّداً. هذه العملية مضجرة وقد تؤدّي إلى نفاد صبر المستخدمين».

ترجمة متزامنة
تتطلّب سمّاعة «WT2 بلاس» مكبّرات صوت لتبادل أدوار الكلام، ولكنّها تعمل في الوقت نفسه على نصّ المحادثة بالتزامن مع الترجمة. ويُقال: إنها في أواخر هذا العام ستصبح قادرة على ترجمة الإنجليزية، والصينية، واليابانية، والكورية، والروسية حتّى عندما تكون غير متصلة بالإنترنت.
> سماعة «WT2 بلاس» تتألف من قطعتين للأذن تبدو شبيهة جدّاً بسماعات الإيربود، وتتيح للمستخدم في أي من أوضاعها الثلاثة، التحدّث بأي لغتين من أصل 36 لغة و84 لكنة. (الأوضاع هي التزامن، واللمس، ومكبّر الصوت، يمكن للمستخدم خلالها التحكّم بالسماعات لمعالجة الضجيج المحيط واختيار ما إذا كان يريد تزويد الطرف الآخر بإحدى القطعتين أو أن يستخدم الميكروفون ومكبّر صوت الهاتف).
> أمّا سماعة «أمباسادور»، والتي تدعم 20 لغة، فتتيح للأفراد الكلام عبر قطعة تثبّت بمشبك فوق الأذن، تبدو كسماعة صغيرة. من جهة أخرى، تتيح السماعة في «وضع الإنصات» للمستخدم الاستماع إلى نسخة مترجمة مما يقوله الآخرون الذين يقفون على بُعد بضعة أمتار، بواسطة ميكروفونات مبطّنة في قطعة الأذن. وإلى جانب أوضاع «التحويل» و«الاستماع»، تضمّ سمّاعة «أمباسادور» وضع الدرس لبثّ كلماتكم من خلال الهاتف أو بعد وصل القطعة الأذنية بنظام صوتي.

مقارنة التراجم
للاطلاع على مستوى التقدّم الذي شهدته هذه الأدوات الأذنية، أجرينا مقارنة بينها وبين أداتي ترجمة متوفرتين في السوق هما «غوغل للترجمة» ومترجم «سي إم ترانسليتور» (117 دولارا) من شركة «تشيتا موبايل». كما تمّ اختبار نموذج تجريبي من «أمباسادور» (150 دولارا) في مقرّ الشركة في بروكلين، بينما استخدم سمّاعة «WT2 بلاس» (230 دولارا) اثنان من الطلبة متعدّدا اللغات من جامعة كولورادو بولدر. والنتيجة: يصلح «غوغل للترجمة» و«سي إم ترانسليتور» لطلب العصير أو السؤال عن موقع أحد المتاحف، ولكنّ التطبيقين فشلا عند محاولة من استخدمهما محادثة شخص يجلس إلى جانبه في القطار. في تعليق لها على أداء سماعة «WT2 بلاس»، قالت مايا سينغ، طالبة في السنة الأولى تتكلّم الإنجليزية، والروسية، والإسبانية إنه «لأمر رائع أن تتمكّن من التحدّث بلغة معيّنة، ومن ثمّ يخرج كلامك وفي ثوانٍ معدودة بلغة أخرى».
لكلّ واحدة من سماعات «WT2 بلاس» و«أمباسادور» ميّزاتها المغرية. ففي وضع المحادثة، تتيح «أمباسادور» للمستخدم مقاطعة الطرف الآخر، كما يحصل في الحوارات الحقيقة، فضلاً عن أنّها تترجم للطرفين في وقت واحد. أمّا سماعة «WT2 بلاس»، فتعتمد على مكبرات صوتية لتبادل أدوار الكلام، لكنّها في الوقت نفسه، تحوّل المحادثة إلى نصّ. وخلال مقابلة أجراها في مقرّ الشركة في شنجن الصينية، لفت كازاف يي، رئيس قسم التسويق في «تيميكيتل» إلى أنّ السماعة، ستصبح في وقت لاحقٍ من هذا العام، قادرة على ترجمة الإنجليزية، والصينية، واليابانية، والكورية والروسية دون اتصال بالإنترنت.
ورأى يي أنّ «الفاعلية تلعب دوراً كبيراً في قرار الشخص ما إذا كان يرغب في استكمال المحادثة مع الطرف الآخر أم لا. ففي حال واجه المستخدمون المتاعب أو في حال اضطروا للانتظار لوقت طويل قبل الترجمة، سيفضّل عدم الحديث مع الطرف الآخر، وسيتجه للحديث مع شخص آخر يتقن لغته».

ترجمة بلا إنترنت
من جهته، اعتبر أندرو أوشوا، الرئيس التنفيذي في مختبرات «ويفرلي لابز» أنّ «الهدف الأساسي هو تطوير أجهزة ترجمة على شكل إكسسوارات للأذن تعمل دون اتصال بالإنترنت، في الوقت الحقيقي، وقادرة على ترجمة كلّ ما يسمعه مستخدمها».
وفي حال توصّل الخبراء إلى تطوير هذه الأجهزة، يقول أوشوا إنّ «الناس سيصبحون قادرين على السير وحدهم في قلب طوكيو وسيحصلون على ترجمة لكلّ ما يدور بالقرب منهم».
صحيح أنّ هذه الأجهزة لم تصبح حقيقة بعد، ولكنّ الترجمة الآلية حقّقت قفزة نوعية قبل بضع سنوات، لأنّ ترجمة الآلات العصبية قادرة على معالجة الجمل وليس الكلمات فحسب.
من جهته، اعتبر فلوريان فايس، المدير الإداري لـ«سليتور»، موقع إخباري وتحليلي معني بصناعة اللغة العالمية في زيوريخ، أنّ «الترجمة الآلية تحوّلت من الضبابية والأداء الضعيف إلى مرحلة الدقّة العالية في مجالي النحو والقواعد الكتابية، ولو في اللغات الأساسية على الأقلّ».
أمّا بالنسبة للمستقبل، فيُرجّح فايس أن تزداد الترجمة سرعة، ودقّة، وربّما تصبح أكثر قدرة على تقليد صوت المستخدم ونبرته ومشاعره. تعمل غوغل اليوم على اختبار وسيلة جديدة للترجمة سمتها بـ«ترانسليتوترون».
وكشف جاستن بور، متحدّث باسم قسم الذكاء الصناعي والتعلّم الآلي في غوغل أنّ «هذا العمل الجديد هو النموذج الأوّل القادر على ترجمة محادثة مباشرة من لغة إلى لغة أخرى دون الحاجة إلى تحويله إلى نصّ مكتوب في منتصف العملية».
ولكنّه أكّد أنّ هذا النموذج لا يزال في مرحلة البحث، وأنّ غوغل لم تضع أي خطط لتطويره على شكل جهاز للترجمة.
- خدمة «نيويورك تايمز».



هل أصبحنا على أعتاب مرحلة تباطؤ الذكاء الاصطناعي؟

هل أصبحنا على أعتاب مرحلة تباطؤ الذكاء الاصطناعي؟
TT

هل أصبحنا على أعتاب مرحلة تباطؤ الذكاء الاصطناعي؟

هل أصبحنا على أعتاب مرحلة تباطؤ الذكاء الاصطناعي؟

يوجه ديميس هاسابيس، أحد أكثر خبراء الذكاء الاصطناعي نفوذاً في العالم، تحذيراً لبقية صناعة التكنولوجيا: لا تتوقعوا أن تستمر برامج المحادثة الآلية في التحسن بنفس السرعة التي كانت عليها خلال السنوات القليلة الماضية، كما كتب كاد ميتز وتريب ميكل (*).

التهام بيانات الإنترنت

لقد اعتمد باحثو الذكاء الاصطناعي لبعض الوقت على مفهوم بسيط إلى حد ما لتحسين أنظمتهم: فكلما زادت البيانات التي جمعوها من الإنترنت، والتي ضخُّوها في نماذج لغوية كبيرة (التكنولوجيا التي تقف وراء برامج المحادثة الآلية) كان أداء هذه الأنظمة أفضل.

ولكن هاسابيس، الذي يشرف على «غوغل ديب مايند»، مختبر الذكاء الاصطناعي الرئيسي للشركة، يقول الآن إن هذه الطريقة بدأت تفقد زخمها ببساطة، لأن البيانات نفدت من أيدي شركات التكنولوجيا.

وقال هاسابيس، هذا الشهر، في مقابلة مع صحيفة «نيويورك تايمز»، وهو يستعد لقبول «جائزة نوبل» عن عمله في مجال الذكاء الاصطناعي: «يشهد الجميع في الصناعة عائدات متناقصة».

استنفاد النصوص الرقمية المتاحة

هاسابيس ليس الخبير الوحيد في مجال الذكاء الاصطناعي الذي يحذر من تباطؤ؛ إذ أظهرت المقابلات التي أُجريت مع 20 من المديرين التنفيذيين والباحثين اعتقاداً واسع النطاق بأن صناعة التكنولوجيا تواجه مشكلة كان يعتقد كثيرون أنها لا يمكن تصورها قبل بضع سنوات فقط؛ فقد استنفدت معظم النصوص الرقمية المتاحة على الإنترنت.

استثمارات رغم المخاوف

بدأت هذه المشكلة في الظهور، حتى مع استمرار ضخ مليارات الدولارات في تطوير الذكاء الاصطناعي. في الأسبوع الماضي، قالت شركة «داتابريكس (Databricks)»، وهي شركة بيانات الذكاء الاصطناعي، إنها تقترب من 10 مليارات دولار في التمويل، وهي أكبر جولة تمويل خاصة على الإطلاق لشركة ناشئة. وتشير أكبر الشركات في مجال التكنولوجيا إلى أنها لا تخطط لإبطاء إنفاقها على مراكز البيانات العملاقة التي تدير أنظمة الذكاء الاصطناعي.

لا يشعر الجميع في عالم الذكاء الاصطناعي بالقلق. يقول البعض، بمن في ذلك سام ألتمان الرئيس التنفيذي لشركة «أوبن إيه آي»، إن التقدم سيستمر بنفس الوتيرة، وإن كان مع بعض التغييرات في التقنيات القديمة. كما أن داريو أمودي، الرئيس التنفيذي لشركة الذكاء الاصطناعي الناشئة، «أنثروبيك»، وجينسن هوانغ، الرئيس التنفيذي لشركة «نيفيديا»، متفائلان أيضاً.

قوانين التوسع... هل تتوقف؟

تعود جذور المناقشة إلى عام 2020، عندما نشر جاريد كابلان، وهو فيزيائي نظري في جامعة جونز هوبكنز، ورقة بحثية تُظهِر أن نماذج اللغة الكبيرة أصبحت أكثر قوة وواقعية بشكل مطرد مع تحليل المزيد من البيانات.

أطلق الباحثون على نتائج كابلان «قوانين التوسع (Scaling Laws)»... فكما يتعلم الطلاب المزيد من خلال قراءة المزيد من الكتب، تحسنت أنظمة الذكاء الاصطناعي مع تناولها كميات كبيرة بشكل متزايد من النصوص الرقمية التي تم جمعها من الإنترنت، بما في ذلك المقالات الإخبارية وسجلات الدردشة وبرامج الكومبيوتر.

ونظراً لقوة هذه الظاهرة، سارعت شركات، مثل «OpenAI (أوبن إيه آي)» و«غوغل» و«ميتا» إلى الحصول على أكبر قدر ممكن من بيانات الإنترنت، وتجاهلت السياسات المؤسسية وحتى مناقشة ما إذا كان ينبغي لها التحايل على القانون، وفقاً لفحص أجرته صحيفة «نيويورك تايمز»، هذا العام.

كان هذا هو المعادل الحديث لـ«قانون مور»، وهو المبدأ الذي كثيراً ما يُستشهد به، والذي صاغه في ستينات القرن العشرين المؤسس المشارك لشركة «إنتل غوردون مور»؛ فقد أظهر مور أن عدد الترانزستورات على شريحة السيليكون يتضاعف كل عامين، أو نحو ذلك، ما يزيد بشكل مطرد من قوة أجهزة الكومبيوتر في العالم. وقد صمد «قانون مور» لمدة 40 عاماً. ولكن في النهاية، بدأ يتباطأ.

المشكلة هي أنه لا قوانين القياس ولا «قانون مور» هي قوانين الطبيعة الثابتة. إنها ببساطة ملاحظات ذكية. صمد أحدها لعقود من الزمن. وقد يكون للقوانين الأخرى عمر افتراضي أقصر بكثير؛ إذ لا تستطيع «غوغل» و«أنثروبيك» إلقاء المزيد من النصوص على أنظمة الذكاء الاصطناعي الخاصة بهما، لأنه لم يتبقَّ سوى القليل من النصوص لإلقائها.

«لقد كانت هناك عائدات غير عادية على مدى السنوات الثلاث أو الأربع الماضية، مع بدء تطبيق قوانين التوسع»، كما قال هاسابيس. «لكننا لم نعد نحصل على نفس التقدم».

آلة تضاهي قوة العقل البشري

وقال هاسابيس إن التقنيات الحالية ستستمر في تحسين الذكاء الاصطناعي في بعض النواحي. لكنه قال إنه يعتقد أن هناك حاجة إلى أفكار جديدة تماماً للوصول إلى الهدف الذي تسعى إليه «غوغل» والعديد من الشركات الأخرى: آلة يمكنها أن تضاهي قوة الدماغ البشري.

أما إيليا سوتسكيفر، الذي كان له دور فعال في دفع الصناعة إلى التفكير الكبير، كباحث في كل من «غوغل» و«أوبن أيه آي»، قبل مغادرته إياها، لإنشاء شركة ناشئة جديدة، الربيع الماضي، طرح النقطة ذاتها خلال خطاب ألقاه هذا الشهر. قال: «لقد حققنا ذروة البيانات، ولن يكون هناك المزيد. علينا التعامل مع البيانات التي لدينا. لا يوجد سوى شبكة إنترنت واحدة».

بيانات مركبة اصطناعياً

يستكشف هاسابيس وآخرون نهجاً مختلفاً. إنهم يطورون طرقاً لنماذج اللغة الكبيرة للتعلُّم من تجربتهم وأخطائهم الخاصة. من خلال العمل على حل مشاكل رياضية مختلفة، على سبيل المثال، يمكن لنماذج اللغة أن تتعلم أي الطرق تؤدي إلى الإجابة الصحيحة، وأيها لا. في الأساس، تتدرب النماذج على البيانات التي تولِّدها بنفسها. يطلق الباحثون على هذا «البيانات الاصطناعية».

أصدرت «اوبن أيه آي» مؤخراً نظاماً جديداً يسمى «OpenAI o1» تم بناؤه بهذه الطريقة. لكن الطريقة تعمل فقط في مجالات مثل الرياضيات وبرمجة الحوسبة؛ حيث يوجد تمييز واضح بين الصواب والخطأ.

تباطؤ محتمل

على صعيد آخر، وخلال مكالمة مع المحللين، الشهر الماضي، سُئل هوانغ عن كيفية مساعدة شركته «نيفيديا» للعملاء في التغلب على تباطؤ محتمل، وما قد تكون العواقب على أعمالها. قال إن الأدلة أظهرت أنه لا يزال يتم تحقيق مكاسب، لكن الشركات كانت تختبر أيضاً عمليات وتقنيات جديدة على شرائح الذكاء الاصطناعي. وأضاف: «نتيجة لذلك، فإن الطلب على بنيتنا التحتية كبير حقاً». وعلى الرغم من ثقته في آفاق «نيفيديا»، فإن بعض أكبر عملاء الشركة يعترفون بأنهم يجب أن يستعدوا لاحتمال عدم تقدم الذكاء الاصطناعي بالسرعة المتوقَّعة.

وعن التباطؤ المحتمل قالت راشيل بيترسون، نائبة رئيس مراكز البيانات في شركة «ميتا»: «إنه سؤال رائع نظراً لكل الأموال التي يتم إنفاقها على هذا المشروع على نطاق واسع».

* خدمة «نيويورك تايمز»