بتغييرات بسيطة في العتاد، مثل حلقة مصابيح الأشعة تحت الحمراء العاملة بالصمام الثنائي الباعث للضوء «إل إي دي»، يمكن الآن تعديل كاميرا «مايكروسوفت لايف كام» للعمل ك«كاميرا عمق»؛ أي ثلاثية الأبعاد.
كثيرون منا يحمل اليوم كاميرا معه بفضل الهاتف الجوال، لكن القليل منها تلتقط التضاريس والتعاريج الثلاثية الأبعاد الخاصة بالأجسام، كما تفعل عادة الكاميرات من هذا النوع.
وشرعت الكاميرات من هذا النوع تحوز بسرعة على أهمية كبيرة وإمكانية تطبيقها في الأجهزة التي توضع في الجيب، والفكرة من وراء ذلك تمكين هواتفنا من التقاط كل شيء، وخطوطه العريضة، ابتداء من زوايا الشوارع، إلى ترتيب غرف الجلوس والمعيشة؛ مما يمكن المطورين إنتاج تطبيقات تراوح بين ألعاب تفاعلية أفضل، إلى دليل يساعد الذين يعانون من إعاقة بالنظر.
* كاميرات العمق
ومع الجهود الساعية، كقيام «بروجيكت تانغو» من «غوغل» مثلا بإضافة كاميرات عمق في الأجهزة الجوالة، أظهر بحث جديد أنه مع بعض التعديلات البسيطة، وأساليب تعليم الآلات، يمكن استخدام كاميرا الهاتف الذكي العادي، أو كاميرا الشبكة «ويبكام»، ككاميرا عمق ثلاثية الأبعاد، والفكرة هي في جعل تطوير التطبيقات الثلاثية الأبعاد أكثر سهولة، عن طريق تخفيض كلفة الحواجز الفنية لإدخال ذلك في هذه الأجهزة، ولجعل كاميرا العمق ثلاثية الأبعاد ذاتها، أصغر حجما، وأقل استهلاكا للطاقة.
وتمكن الباحثون في «مايكروسوفت» من تعديل الكاميرا في الهاتف الذكي لكي تلتقط عمق اليدين والوجوه وأبعادها الثلاثة.
وكان فريق بقيادة شون ريان فانيلو، وسيم كيسكن، وشهرام إزادي من مركز أبحاث «مايكروسوفت»، قد قدم ورقة بحث بهذا الشأن في مؤتمر «سيغراف» للرسوم البيانية (غرافكس) الكومبيوترية المتفاعلة الذي عقد أخيرا في فانكوفر في كندا.
ولتعديل الكاميرا، قامت المجموعة بإزالة راشح التقريب العامل بالأشعة تحت الحمراء، الذي غالبا ما يستخدم في كاميرات اليوم العادية لحجب الإشارات الضوئية غير المرغوب بها عادة، ثم قاموا بإضافة راشح يسمح فقط بمرور أشعة الضوء تحت الحمراء، فضلا عن إضافة حلقة من بعض صمامات «إل إي دي» الرخيصة القريبة العاملة بالأشعة تحت الحمراء، وبذلك يمكن جعل الكاميرات كافة تعمل ككاميرا بهذه الأشعة بالذات. كما أنه مع بعض التعديلات، يمكن للباحثين في «مايكروسوفت» استخدام الكاميرات العادية لرسم تفاصيل عمق اليدين والوجوه، «بشكل كما لو أننا قلبنا الكاميرا رأسا على عقب»، كما نقلت «تكنولوجي ريفيو» عن إزادي.
ويقول فريق «مايكروسوفت» إنه راغب في استخدام شدة أشعة الأشعة تحت الحمراء الانعكاسية، كحل وسط بين إشارات السونار (الموجات الصوتية) والمصباح الكشاف في الغرف المظلمة؛ إذ يقوم الضوء بالارتداد من الأجسام القريبة، ليعود إلى المستشعر بشدة وحدة مماثلة. والأجسام عادة تكون براقة مشعة عندما تكون قريبة، وباهتة معتمة قليلا عندما تكون بعيدة، وهي بديهية حدسية عندما تكون وسط الضوء المرئي، لكن توجب على المجموعة تدريب الآلات على هذه العلاقة؛ بحيث يمكن للكاميرا تقرير ما إذا كانت ترى يدا كبيرة من مسافة بعيدة، أو يدا صغيرة عن قرب.
ولهذا الغرض قرر الباحثون التركيز على تحد واحد، وهو وضع نموذج للأيدي والوجوه البشرية، وليس جميع أنواع الأجسام والبيئات، وبعد قيامهم بتشييد مجموعة من البيانات التدريبية التي ضمت صورا للأيدي، وجدت المجموعة أن بمقدورها قياس حركات الشخص بسرعة 220 إطار صورة في الثانية الواحدة، وأظهرت هذه المجموعة مدى درجة التعقب التي يمكن استخدامها للتنقل وفق خريطة عن طريق القيام بحركات مختلفة باليدين، أو ممارسة لعبة بسيطة، مثل تقطيع موزة افتراضية محلقة في الهواء.
وعلى الرغم من أن بيانات التدريب ركزت على الوجوه واليدين، فإن المجموعة لم تكن في الحقيقة تدرب الآلات على التعرف على اليدين أو الوجوه، بل التعرف فقط على خصائص انعكاسات الجلد. وتتيح الكمية الهائلة من بيانات التدريب للآلات، بناء روابط كافية مع مؤشرات البيانات في الصور، لكي تستخدم بعد ذلك خصائص إضافية لها لتقدير العمق، وقد اختارت «مايكروسوفت» الجلد، لأن له الكثير من الانعكاسات على صعيد التجوال في لعبة «إكسبوكس» وبيئات «ويندوز»، لكن كوهلي، لاعب الكريكت الهندي، أشار إلى أن أساليب تعلم الآلة يمكن نقلها وتحويلها إلى أي مكان، «والقصور، أو المحدودية الوحيدة هنا، هو نوع بيانات التدريب الموجهة لها»، كما يقول، «فالمسعى هنا بحد ذاته يمكن تفصيله لكي يعمل في أي سيناريو».









