ميزات الفيديو المعهودة تصل إلى التسجيلات الصوتية

تصميمات وتطبيقات من «نوكيا» لأجهزة متعددة اللاقطات

ميزات الفيديو المعهودة تصل إلى التسجيلات الصوتية
TT

ميزات الفيديو المعهودة تصل إلى التسجيلات الصوتية

ميزات الفيديو المعهودة تصل إلى التسجيلات الصوتية

تخيلوا أنكم تصورون مقطع فيديو دون أن تتمكنوا من تقريب الصورة، والتركيز على الموضوع الرئيسي فيها، هذا ما يحدث مع الصوت، إلا أن شركة «نوكيا» تقول إن هذه الميزات نفسها يجب أن تتوفر في التسجيلات الصوتية أيضاً.

تسجيلات متداخلة

يحدث كثيراً أن يصور المحترفون والهواة مقاطع فيديو بواسطة الهاتف الجوال ليكتشفوا لاحقاً أن الجزء الصوتي من التسجيل يوضح الأحاديث الجارية حولهم، بدل إيضاح الصوت الصادر عن موضوع الفيديو نفسه. ويحصل هذا الأمر أثناء تصوير أداء الأولاد في إحدى المسرحيات المدرسية مثلا، بينما أحدهم جالس بالقرب وهو يسعل أو يتحدث.
وكذلك الحال عند اختبار التسجيلات على شاطئ البحر عندما يظن المصوِّر أن تسجيله سيكون مليئاً بأصوات الأمواج والنوارس، ليتبين لاحقاً أنه يحتوي على أصوات أشخاص كانوا يصرخون بقربه. لهذا السبب، يمكن أن نفهم جيداً المشكلة التي قررت شركة «نوكيا» حلّها ببرنامج «أوزو» (OZO) الصوتي الجديد.
ومن المقرّر أن يصبح هذا المنتج، الذي قُدّم خلال معرض الإلكترونيات الاستهلاكية في لاس فيغاس الأسبوع الماضي، متوفراً في جميع الهواتف الذكية في العالم في وقت لاحق من هذا العام.
يهدف برنامج «نوكيا» إلى منح مستخدمي الهواتف الذكية مزيداً من السيطرة على تسجيلات الصوت، بعد أن اعتادوا الحصول عليها في تصوير مقاطع الفيديو أو التقاط الصور. من هنا، ستتيح هذه التقنية للمستخدمين التركيز انتقائياً على نقاط مختلفة من المشهد الذي يصورونه حتى يتمكنوا من التقاط الصوت الصادر من أمام كاميرا أو ميكروفون الجهاز (أو حتى خلفهما). علاوة على ذلك، سيتيح البرنامج للتسجيل الصوتي تعقُّب شخص معين أو حيوان أو شيء، بالإضافة إلى السماح للمستخدم بالتركيز على صوت محدد كشخص يتكلم أو طائر يغني، ودمج التقريب الصوتي مع التقريب التصويري.

صوت متميز

وتحدث جيري هيوبانييمي، رئيس قسم المنتج والتقنية في «نوكيا تكنولوجيز»، ذراع البحث والترخيص التابعة لشركة «نوكيا»، عن هذا البرنامج كان جزءاً من مشروع لتطوير كاميرا تصوير 360 درجة. ولكن الجهود الرامية لصناعة الكاميرا توقفت، ليتابع البرنامج الصوتي تقدمه مستقلاً، على حد تعبيره.
ونقل موقع جمعية المهندسين الكهربائيين الأميركية عن هيوبانييمي: «شهدت الهواتف الذكية تطورات كثيرة في مجال المحتوى الذي يقدمه المستخدم. كما تم تكريس كثير من الجهود لتحسين تصوير الفيديو، ولكن التسجيل الصوتي لم يحظَ بحصّته من هذا الاهتمام. لذا، قررنا أن نبحث في أنواع التسجيلات الصوتية التي يمكننا التقاطها بهواتف متعددة الميكروفونات» (تضم معظم هواتف اليوم ميكروفونين على الأقل). إن القدرة على تقريب الصوت والتركيز انتقائياً على التسجيل الصوتي أثناء تصوير الفيديو هي أولى أدوات معالجة الصوت التي خرجت من هذا البحث، ولكن رئيس قسم المنتج في «نوكيا تكنولوجيز» يعد بالمزيد.
ولأن الخوارزميات التي تستخدمها «نوكيا» لهذه الغاية يجب أن تُضبط بشكل يسمح لها باحتساب الوضعية الدقيقة للميكروفونات في كل هاتف ذكي، يمكن طرح هذه التقنية على شكل تطبيق هاتفي، بحسب ما أفاد به هيوبانييمي. أما الحل الآخر لإيصال هذه الأداة إلى يد المستخدم، فسيكون بحصول صُنّاع الهواتف على رخصة لدمج الأداة في برامج تسجيل الفيديو والصوت في أجهزتهم. أصبحت هذه الأداة متوفرة في بعض موديلات هواتف نوكيا المصنعة من قبل شركة «إتش إم دي» التي تُباع خارج الولايات المتحدة. ولفت هيوبانييمي إلى أنها ستصبح متوفرة على أجهزة جوالة تابعة لشركات أخرى خلال هذا العام.
يمكن القول إن تجربة هذه الأداة كانت مثيرة للإعجاب، فقد استطاع الخبراء لمس شاشة العرض للتركيز على نقاط مختلفة في مشهد معين، بهدف الاستماع إلى أصوات مختلفة. ويشبه هذا النوع من التركيز الصوتي ميزة التركيز على الصورة المتوفرة بعض الهواتف المتعددة الكاميرات إلى حد بعيد. وتروق إمكانية سماع ما يحصل «خلف» الشخص، وقد يشعر بالحماس لتجربة هذه الميزة كأداة معززة للتنصت على مقاطع من محادثات مهمة في مقهى يعج بالناس.


مقالات ذات صلة

كيف تحمي خصوصيتك أثناء استخدام تطبيقات اللياقة البدنية في 2025؟

تكنولوجيا تعد تطبيقات اللياقة البدنية أداة قوية لتتبع التقدم مع ضمان بقاء بياناتك آمنة (أدوبي)

كيف تحمي خصوصيتك أثناء استخدام تطبيقات اللياقة البدنية في 2025؟

إليك بعض النصائح لاستخدام تطبيقات اللياقة البدنية بأمان في العصر الرقمي.

نسيم رمضان (لندن)
الاقتصاد مقر هيئة الاتصالات والفضاء والتقنية في الرياض (الموقع الإلكتروني)

بدء تطبيق المرحلة الإلزامية الأولى لتوحيد منافذ الشحن في السعودية

بدأ تطبيق المرحلة الإلزامية الأولى لتوحيد منافذ الشحن للهواتف المتنقلة والأجهزة الإلكترونية في السوق، لتكون من نوع «USB Type - C».

«الشرق الأوسط» (الرياض)
الاقتصاد جانب من اجتماع خلال منتدى حوكمة الإنترنت الذي عقد مؤخراً بالعاصمة الرياض (الشرق الأوسط)

تقرير دولي: منظومات ذكية ومجتمعات ممكّنة تشكل مستقبل الاقتصاد الرقمي

كشف تقرير دولي عن عدد من التحديات التي قد تواجه الاقتصاد الرقمي في العام المقبل 2025، والتي تتضمن الابتكار الأخلاقي، والوصول العادل إلى التكنولوجيا، والفجوة…

«الشرق الأوسط» (الرياض)
تكنولوجيا تتميز سمكة «موبولا راي» بهيكلها العظمي الغضروفي وأجنحتها الضخمة ما يسمح لها بالانزلاق بسهولة في الماء (أدوبي)

سمكة تلهم باحثين لتطوير نموذج مرشّح مياه صناعي!

طريقة تغذية سمكة «موبولا راي» تدفع باحثي معهد ماساتشوستس للتكنولوجيا لتطوير أنظمة ترشيح فعالة.

نسيم رمضان (لندن)
تكنولوجيا تعمل استراتيجيات مثل الأمن متعدد الطبقات واستخبارات التهديدات المتقدمة على تعزيز دفاعات الشركات السعودية (شاترستوك)

السعودية تسجل 44 % انخفاضاً في الهجمات الإلكترونية حتى نوفمبر مقارنة بـ2023

تواجه السعودية التحديات السيبرانية باستراتيجيات متقدمة مع معالجة حماية البيانات وأمن السحابة وفجوات مواهب الأمن السيبراني.

نسيم رمضان (لندن)

تعرّف على تقنيات الذكاء الاصطناعي المقبلة في عام 2025

ثورة تقنيات الذكاء الاصطناعي الجديدة... تأثيرات عميقة مقبلة على حياتنا اليومية
ثورة تقنيات الذكاء الاصطناعي الجديدة... تأثيرات عميقة مقبلة على حياتنا اليومية
TT

تعرّف على تقنيات الذكاء الاصطناعي المقبلة في عام 2025

ثورة تقنيات الذكاء الاصطناعي الجديدة... تأثيرات عميقة مقبلة على حياتنا اليومية
ثورة تقنيات الذكاء الاصطناعي الجديدة... تأثيرات عميقة مقبلة على حياتنا اليومية

يستمر تطور تقنيات الذكاء الاصطناعي، خصوصاً مع تطور قدرات الحوسبة والتخزين وسرعة نقل البيانات وتطوير خوارزميات جديدة مفيدة للمستخدمين في شتى جوانب الحياة.

سيزداد تبني تقنيات الذكاء الاصطناعي مباشرة على الأجهزة المختلفة دون الحاجة إلى الاتصال بالإنترنت

وسنسلط الضوء في هذا المقال على أبرز تقنيات الذكاء الاصطناعي الجديدة التي سنشهدها خلال عام 2025، مثل تطور تقنيات الرؤية الذكية وظهور الأنظمة المركبة للذكاء الاصطناعي، وانتشار الذكاء الاصطناعي الطرفي، وتطور مساعدات الذكاء الاصطناعي. كما سنتعرّف على أحدث المزايا المقبلة لـ«ذكاء أبل» وكيف ستُسهم في تعزيز تجربة المستخدم. دعونا نستكشف هذا العالم المثير من الذكاء الاصطناعي، ونكتشف كيف سيغيّر هذا التطور من شكل حياتنا في المستقبل.

تستطيع تقنيات الذكاء الاصطناعي الجديدة التعرّف على العناصر الموجودة في الصور والفيديوهات بدقة فائقة

اقتراب «ذكاء» المستقبل

التقنية الأولى التي يُتوقع أن تتقدم بشكل كبير هي التعرف على العناصر الموجودة في الصور والفيديوهات بدقة فائقة وتصنيفها بشكل صحيح والتعرف على النصوص فيها «AI Vision»، وذلك بسبب زيادة إنتاج المستخدمين للصور والفيديوهات وتحليل الذكاء الاصطناعي لها من خلال منصات مشاركة هذه الملفات وفهمه للمشاهد المعقدة فيها. ومن المتوقع أن تساعد هذه التقنية في إنتاج صور وفيديوهات توليدية بشكل أكثر إبهاراً، بالإضافة إلى دعم الشركات لها من خلال كاميرات الهواتف الجوالة (مثل «عدسة غوغل» Google Lens للتعرف على العناصر المحيطة بالمستخدم) ومراقبة الأصناف الموجودة في المتاجر والسيارات ذاتية القيادة، وغيرها. ولكن هذا الأمر قد يشكّل خطراً على خصوصية المستخدمين واحتمال مراقبتهم دون علمهم ما لم يتم اتخاذ التدابير اللازمة لمنع ذلك.

ومن المتوقع أن يتم استخدام نظم ذكاء اصطناعي مركبة «Composite AI» من أكثر من مصدر تستطيع إتمام مهام أكثر تعقيداً مما يستطيع نظام واحد القيام به. وتستطيع هذه التقنيات إيجاد روابط عميقة بين البيانات المعقدة بسهولة وتقديم فيديوهات تحتوي على الأشخاص أنفسهم عبر الكثير من المشاهد وتعديل الإضاءة حسب البيئة وتغيير لغة المحادثات على الفور، وغيرها. وليس من البعيد تطوير خدمات تقدم مجموعات كبيرة من تقنيات الذكاء الاصطناعي ليختار المستخدم ما يحتاج إليه منها لتلبية طلبه وتحقيق هدفه، وكأنها «متجر» للذكاء الاصطناعي يقدم للمستخدم الخدمة حسب الحاجة والرغبة.

وبسبب انتشار المعالجات التي تدعم تقنيات الذكاء الاصطناعي في الكمبيوترات والهواتف الجوالة والكثير من الأجهزة الأخرى، فمن المتوقع أن نشهد إطلاق مزيد من التقنيات التي تدعم الذكاء الاصطناعي مباشرة من على الجهاز عوضاً عن الحاجة إلى الاتصال بالإنترنت للقيام بذلك عبر «Edge AI».

مثال على ذلك: استخدام معالجات متقدمة في كاميرات المراقبة للتعرف على الكثير من الحالات غير الطبيعية، مثل الحوادث أو السرقات، أو في الأجهزة الطبية لتسريع عملية التشخيص أو التحليل، وغيرها. هذا الأمر من شأنه زيادة مستويات الخصوصية بسبب عدم مشاركة البيانات الحساسة مع الأجهزة الخادمة عبر الإنترنت، والعمل بكفاءة عالية دون وجود أي اتصال بالإنترنت.

كما سينتشر «عملاء الذكاء الاصطناعي» AI Agents بشكل متسارع، حيث سنشهد ظهور «برامج» تفهم طلب المستخدم وتقوم بتقسيمه إلى وظائف صغيرة، وتعمل على إتمامها بشكل آلي يحاكي التصرف البشري، وقد تساعد الأطباء في إجراء سلاسل فحوصات على المرضى وتعديل الفحص التالي وفقاً لنتائج الفحص السابق، وهكذا. وقد نشهد دخول هذه التقنية إلى مجال التعليم أيضاً.

تحديثات عديدة مقبلة لـ«ذكاء أبل» على الهواتف الجوالة والكومبيوترات الشخصية

مزايا «ذكاء أبل» المقبلة

أطلقت «أبل» مزايا «ذكاء أبل» Apple Intelligence للذكاء الاصطناعي، وقدمت مجموعة من التحديثات عبر نظامي التشغيل «آي أو إس» و«ماك أو إس»، ولكن لا تزال هناك مزايا ستطلقها خلال العام الجاري، نذكر مجموعة منها:

* الميزة الأولى هي «فيلم الذكريات» Memory Movie على الكومبيوترات التي تعمل بنظام «ماك أو إس»، والتي تقوم بصنع فيلم قصير مكون من الصور وعروض الفيديو الموجودة في تطبيق الصور وفقاً لوصف المستخدم، مثل قيام الميزة بإيجاد فيديو يحتوي على أهم لحظات الإجازة في البحر مع العائلة، أو فيديو للمنزل الجديد الذي انتقل المستخدم إليه، مع القدرة على اختيار مدة الفيلم والموسيقى ومشاركته مع الأهل والأصدقاء عبر الشبكات الاجتماعية. وعلى الرغم من أن هذه الميزة موجودة على هواتف «آيفون» المحدثة، فإنها ستصبح متوافرة على كمبيوترات «ماك» قريباً.

* وبالحديث عن نظام التشغيل «ماك أو إس»، فمن المتوقع أن يحصل الإصدار 15.3 (سيتم إطلاقه في أواخر يناير «كانون الثاني») على ميزة «الرموز التعبيرية التوليدية» Genmoji التي تسمح بصنع «رموز تعبيرية» Emoji مخصصة وفقاً لرغبة المستخدم، بواسطة الذكاء الاصطناعي وكتابة الوصف النصي المرغوب للحصول على رمز تعبيري يمكن مشاركته مع الآخرين بكل سهولة. ويمكن استخدام هذه الأداة لإيجاد شخصيات تشابه الأصدقاء باستخدام صورهم وكتابة وصف للرمز التعبيري الجديد المطلوب.

* وسيحصل مساعد «سيري» على تحسينات مزايا ذكاء اصطناعي ممتدة، تشمل إمكانية البحث عن الملفات وفهم ما يظهر على شاشة المستخدم والتكامل مع الكثير من التطبيقات الأخرى. وسيتمكن «سيري» من تتبع مكان كل شيء على جهاز المستخدم، مثل: الرسائل النصية، والبريد الإلكتروني، والملفات، والصور؛ للمساعدة في العثور على أي شيء يتم البحث عنه. كما سيتمكن المساعد من فهم ما يظهر على الشاشة وتنفيذ الأوامر بناء على ذلك، مثل معاينة ملف ما وقول «سيري، أرسل هذه الملف إلى مديري في العمل عبر رسالة بريد إلكتروني»، لتتم العملية بكل سلاسة. كما سيتمكن «سيري» من تنفيذ المهام المعقدة التي تتطلب استخدام أكثر من تطبيق لتنفيذها، مثل تحرير صورة ومشاركتها مع صديق محدد، من خلال أمر واحد.

اصنع فيديوهات مبهرة من صورك وفيديوهاتك آليا باستخدام "فيلم الذكريات" على الهواتف الجوالة والكومبيوترات الشخصية cut out

تجدر الإشارة إلى أن ميزة «ذكاء أبل» تدعم حالياً اللغة الإنجليزية فقط، ولكن من المتوقع أن تدعم الشركة اللغات التالية خلال عام 2025: الصينية والفرنسية والألمانية والإيطالية واليابانية والكورية والبرتغالية والإسبانية والفيتنامية.