«OpenAI» تسعى لخفض تكاليف إنشاء تطبيقات تعتمد على الذكاء الاصطناعي

شعار شركة «OpenAI» يظهر على شاشة هاتف محمول
شعار شركة «OpenAI» يظهر على شاشة هاتف محمول
TT

«OpenAI» تسعى لخفض تكاليف إنشاء تطبيقات تعتمد على الذكاء الاصطناعي

شعار شركة «OpenAI» يظهر على شاشة هاتف محمول
شعار شركة «OpenAI» يظهر على شاشة هاتف محمول

تخطط شركة «OpenAI» لتقديم تحديثات رئيسية إلى المطورين الشهر المقبل، لجعل إنشاء تطبيقات برمجية تعتمد على نماذج الذكاء الاصطناعي أرخص وأسرع، كما أفادت وكالة «رويترز».

وتتضمّن التحديثات إضافة مساحة تخزين للذاكرة إلى أدوات المطورين، لاستخدام نماذج الذكاء الاصطناعي؛ مما قد يؤدي نظريّاً إلى خفض التكاليف التي يتحمّلها صانعو التطبيقات بما يصل إلى 20 مرة. وتسعى الشركة أيضاً للكشف عن أدوات جديدة مثل إمكانات الرؤية التي ستمكّن المطورين من بناء تطبيقات تتمتع بالقدرة على تحليل الصور ووصفها، مع حالات استخدام محتملة في مجالات عدة مثل الترفيه والطب.

وقالت المصادر، التي طلبت عدم الكشف عن هويتها لخصوصية المناقشات، إن المزايا الجديدة مصممة لتشجيع الشركات على استخدام تقنية «OpenAI»، لبناء روبوتات للدردشة ووكلاء مستقلين يعملون بالذكاء الاصطناعي، ويمكنهم أداء المهام دون تدخل بشري.

تتضمّن التحديثات إضافة مساحة تخزين للذاكرة إلى أدوات المطورين لاستخدام نماذج الذكاء الاصطناعي

خفض تكاليف المطورين

إن الإصدار المخطط لما يُسمى واجهة برمجة التطبيقات (API) سيجعل إنشاءها أرخص بالنسبة إلى الشركات من خلال تذكّر تاريخ محادثة الاستفسارات، وقد يؤدي هذا إلى تقليل مقدار الاستخدام الذي يحتاج المطورون إلى دفعه بصورة كبيرة. في الوقت الحالي، يمكن أن تكلف معالجة مستند من صفحة واحدة باستخدام «GPT-4» عشرة سنتات، اعتماداً على طول المدخلات والمخرجات وتعقيدها، وفقاً للتسعير على موقع «OpenAI». وهناك تحديث آخر يُدعى «Vision API» سيسمح للأشخاص ببناء برنامج يمكنه تحليل الصور، بعد أسابيع من توفر الميزة لمستخدمي «ChatGPT».

يمثّل منح هذه الأداة للمطورين أيضاً خطوة مهمة في طرح «OpenAI» لما يُسمى الإمكانات متعددة الوسائط، التي تعالج وتولد أنواعاً مختلفة من الوسائط إلى جانب النص، مثل الصور والصوت والفيديو.

وقد ظهرت «OpenAI» على الساحة في نوفمبر (تشرين الثاني) الماضي عندما أطلقت «ChatGPT»؛ مما أدى إلى إغراء مئات الملايين من الأشخاص لتجربة برنامج الدردشة الآلي، الذي أجاب عن الأسئلة والأوامر بطرق تشبه البشر، وحوّله إلى واحد من أسرع تطبيقات المستهلك نمواً في العالم. ولدى الشركة آمال كبيرة في نمو المبيعات، إذ توقع المسؤولون التنفيذيون فيها أن يختتموا هذا العام بإيرادات قدرها 200 مليون دولار ومليار دولار بحلول عام 2024.


مقالات ذات صلة

بين «رؤية 2030» و«ستار غيت»... الذكاء الاصطناعي محور تحالف سعودي - أميركي جديد

خاص رجل يقف تحت علمَي الولايات المتحدة الأميركية والمملكة العربية السعودية في ساحة بمدينة جدة بالسعودية (أ.ب)

بين «رؤية 2030» و«ستار غيت»... الذكاء الاصطناعي محور تحالف سعودي - أميركي جديد

تدخل السعودية وأميركا مرحلة تعاون استراتيجي جديدة تقودها تقنيات الذكاء الاصطناعي، بين «رؤية 2030» السعودية ومشروع «ستار غيت» الأميركي العملاق.

عبير حمدي (الرياض)
خاص جناح «آي بي إم» خلال «مؤتمر ليب 2025» في الرياض (الشركة)

خاص «آي بي إم»: السعودية مؤهلة لقيادة التحول الرقمي في الشرق الأوسط

بينما تستعد الرياض لاستقبال الرئيس الأميركي دونالد ترمب، يعود الحديث مجدداً عن التحولات الجذرية التي تشهدها السعودية في المشهد الاقتصادي والتقني.

زينب علي (الرياض)
يوميات الشرق الجهاز يستخدم مادة خشبية شبيهة بالإسفنج لامتصاص الماء من الهواء وإطلاقه في كوب (المعهد الملكي للتكنولوجيا في ملبورن)

جهاز «إسفنجي» يحوّل الهواء إلى ماء في دقائق

طوّر مهندسون من المعهد الملكي للتكنولوجيا في ملبورن بأستراليا، بالتعاون مع باحثين صينيين، جهازاً قادراً على جمع الماء من الهواء.

«الشرق الأوسط» (القاهرة )
تكنولوجيا النظام الجديد يمكن توسيعه ليشمل نحو 100 لغة (جامعة ماكاو)

سمّاعات ذكية تترجم لعدة متحدثين في وقت واحد

طوّر باحثون من جامعة واشنطن الأميركية نظام سماعات رأس ذكية يمكنها ترجمة حديث عدة أشخاص في الوقت نفسه.

«الشرق الأوسط» (القاهرة)
تكنولوجيا شعار شركة «أوبن إيه آي» معروض على هاتف جوال مع صورة على شاشة حاسوب مُولّدة بالذكاء الاصطناعي (أ.ب)

هل ستلغي محادثات الذكاء الاصطناعي الآلية تعلّم اللغات الأجنبية؟

مع تنامي قدرات الذكاء الاصطناعي، يوماً بعد يوم، يتساءل العديد من طلاب المدارس عما إذا كانوا لا يزالون بحاجة فعلاً إلى تعلم اللغات الأجنبية.

«الشرق الأوسط» (سان فرانسيسكو)

سمّاعات ذكية تترجم لعدة متحدثين في وقت واحد

النظام الجديد يمكن توسيعه ليشمل نحو 100 لغة (جامعة ماكاو)
النظام الجديد يمكن توسيعه ليشمل نحو 100 لغة (جامعة ماكاو)
TT

سمّاعات ذكية تترجم لعدة متحدثين في وقت واحد

النظام الجديد يمكن توسيعه ليشمل نحو 100 لغة (جامعة ماكاو)
النظام الجديد يمكن توسيعه ليشمل نحو 100 لغة (جامعة ماكاو)

طوّر باحثون من جامعة واشنطن الأميركية نظام سماعات رأس ذكية يمكنها ترجمة حديث عدة أشخاص في الوقت نفسه، مع الحفاظ على نبرة صوت كل متحدث واتجاه صوته بدقة ثلاثية الأبعاد، حتى أثناء حركته.

وأوضح الباحثون أن النظام، الذي أُطلق عليه «الترجمة الصوتية المكانية» قد يُحدث نقلة نوعية في مجال الترجمة الفورية. ونُشرت النتائج، الجمعة، في دورية «جمعية الحوسبة الأميركية (ACM)».

وعلى الرغم من ظهور تقنيات واعدة في مجال الترجمة الفورية مؤخراً، فإن أياً منها لم يوفر حلاً فعّالاً في الأماكن العامة. فعلى سبيل المثال، تعمل نظارات شركة ميتا الجديدة فقط عند وجود متحدث واحد، وتعرض الترجمة الصوتية الآلية بعد انتهاء المتحدث من الكلام. لكن الفريق المصمم للنظام الجديد ابتكر حلاً يُترجم كلام عدة متحدثين في الوقت نسه مع الحفاظ على الاتجاه وخصائص كل صوت.

ويعتمد النظام على سماعات مانعة للضوضاء مُزوّدة بميكروفونات، وتعمل خوارزميات النظام المستندة إلى الذكاء الاصطناعي على فصل أصوات المتحدثين وتتبعهم داخل المكان، ثم ترجمة كلامهم وإعادة تشغيله بصوت يشبه صوتهم الأصلي مع تأخير بسيط يتراوح بين 2 و4 ثوانٍ.

ويتميز النظام بثلاثة ابتكارات رئيسية، أولها قدرته على اكتشاف عدد المتحدثين تلقائياً داخل أي مساحة مغلقة أو مفتوحة، من خلال مسح محيطي بزاوية 360 درجة، وترجمة الكلام مع الحفاظ على تعبيرات الصوت ومستوى ارتفاعه، باستخدام معالجات داخلية مثل شريحة (Apple M2)، دون الاعتماد على الحوسبة السحابية لحماية الخصوصية، بالإضافة إلى متابعة تحركات رؤوس المتحدثين، مع تعديل اتجاه الصوت تبعاً لحركتهم.

وبمشاركة 29 متطوعاً، اختُبر النظام في 10 بيئات مختلفة داخلية وخارجية، مثل الشوارع، والمقاهي، والمتاحف، وأماكن عامة، وأثبت فاعليته في هذه البيئات الواقعية، حتى مع وجود ضوضاء خلفية. وركزت التجربة على 3 لغات هي الإسبانية، والألمانية، والفرنسية، وأظهر النظام أداء جيداً في الترجمة من هذه اللغات إلى الإنجليزية، والعكس.

وأظهرت النتائج أن معظم المستخدمين فضّلوا نظام الترجمة الجديد على الأنظمة التقليدية؛ لما وفره من دقة عالية في الترجمة وتجربة سمعية طبيعية تُحاكي الواقع. كذلك أثبت النظام كفاءته العالية في تتبُّع المتحدثين وتحديد عددهم بدقة، حتى مع تحركهم، مع الحفاظ على اتجاه كل صوت وخصائصه التعبيرية بشكل منفصل.

وقال الباحثون إن النظام يمكّن المستخدمين من فهم ما يقوله عدة أشخاص في الوقت نفسه بلغات مختلفة، في بيئة مزدحمة، مع الحفاظ على أصواتهم الأصلية وتحديد مَن قال ماذا، بما يفتح آفاقاً جديدة للسياحة، والتعليم، والتفاعل الثقافي. ويأمل الفريق بأن يسهم هذا الابتكار، الذي يمكن توسيعه ليشمل نحو 100 لغة، في كسر الحواجز اللغوية بين الثقافات، ليتمكن المستخدم من فهم ما يدور حوله بلغته.