تقنية جديدة تتيح للكومبيوتر قراءة لغة الجسد

رصد إشارات مجموعة من البشر بكاميرا واحدة

تقنية جديدة تتيح للكومبيوتر قراءة لغة الجسد
TT

تقنية جديدة تتيح للكومبيوتر قراءة لغة الجسد

تقنية جديدة تتيح للكومبيوتر قراءة لغة الجسد

تتيح تقنية جديدة للكومبيوتر فهم إشارات وحركات جسم الإنسان بعد تسجيلها على مقطع فيديو. وكان فريق من الباحثين في معهد دراسة الروبوتات بجامعة كارنيغي ميلون الأميركية توصل إلى التقنية.
وتم تطوير التقنية الجديدة بمساعدة «استوديو بانوبتيك»، وهي قبة من طابقين تحتوي على 500 كاميرا فيديو. وتتيح التقنية الجديدة إمكانية رصد إشارات مجموعة من البشر باستخدام كاميرا واحدة وجهاز كومبيوتر محمول.
ونقل الموقع الإلكتروني «ساينس ديلي» المعني بالأبحاث العلمية والتكنولوجية عن ياسر شيخ الأستاذ المساعد بقسم أبحاث الروبوتات بالجامعة قوله إن التقنية الجديدة لتسجيل الإشارات الحركية للبشر بشكل ثنائي الأبعاد تفتح الباب على مصراعيه أمام نهج جديد للتفاعل بين البشر والآلات، وأمام استخدام البشر للآلات لفهم العالم من حولهم بشكل أفضل.
وأوضح أن إدراك الإشارات الحركية لليد على سبيل المثال سوف يتيح للبشر التفاعل مع أجهزة الكومبيوتر بشكل جديد وطبيعي، مثل التخاطب مع الكومبيوتر مع طريق الإشارة إلى الأشياء. وتنطوي مراقبة الإشارات الحركية للكثير من الأشخاص في آن واحد لا سيما في المحافل الاجتماعية حيث يتواصلون مع بعضهم البعض على الكثير من التحديات، حيث إن استخدام برامج لرصد تحركات شخص بعينه لا تعمل على نحو جيد عند تطبيقها على كل فرد داخل المجموعة، ولذلك قام شيخ وزملاؤه بتطبيق نهج مختلف حيث قاموا أولا بتحديد أجزاء الجسم المختلفة في المشهد مثل الأذرع والأرجل والوجوه وما إلى ذلك ثم قاموا بربط هذه الأجساد بكل فرد يظهر في المشهد.
ويؤكد الباحثون أن رصد أنماط التخاطب غير اللغوية بين البشر سوف يسمح للروبوتات بالعمل في الأوساط الاجتماعية وإدراك ما الذي يفعله البشر من حولهم وفهم حالتهم المزاجية وهو ما يتيح إمكانية تطبيق مناهج جديدة في مجالات تشخيص الأمراض السلوكية وإعادة تأهيل حالات نفسية معينة مثل مرضى الاكتئاب والتوحد على سبيل المثال.



الذكاء الصناعي يقرأ الأفكار وينصّها

فك تشفير إعادة بناء الكلام باستخدام بيانات مسح الرنين المغناطيسي (جامعة تكساس)
فك تشفير إعادة بناء الكلام باستخدام بيانات مسح الرنين المغناطيسي (جامعة تكساس)
TT

الذكاء الصناعي يقرأ الأفكار وينصّها

فك تشفير إعادة بناء الكلام باستخدام بيانات مسح الرنين المغناطيسي (جامعة تكساس)
فك تشفير إعادة بناء الكلام باستخدام بيانات مسح الرنين المغناطيسي (جامعة تكساس)

طُوّر جهاز فك ترميز يعتمد على الذكاء الصناعي، قادر على ترجمة نشاط الدماغ إلى نص متدفق باستمرار، في اختراق يتيح قراءة أفكار المرء بطريقة غير جراحية، وذلك للمرة الأولى على الإطلاق، حسب صحيفة «الغارديان» البريطانية.
وبمقدور جهاز فك الترميز إعادة بناء الكلام بمستوى هائل من الدقة، أثناء استماع الأشخاص لقصة ما - أو حتى تخيلها في صمت - وذلك بالاعتماد فقط على مسح البيانات بالتصوير بالرنين المغناطيسي الوظيفي فقط.
وجدير بالذكر أن أنظمة فك ترميز اللغة السابقة استلزمت عمليات زراعة جراحية. ويثير هذا التطور الأخير إمكانية ابتكار سبل جديدة لاستعادة القدرة على الكلام لدى المرضى الذين يجابهون صعوبة بالغة في التواصل، جراء تعرضهم لسكتة دماغية أو مرض العصبون الحركي.
في هذا الصدد، قال الدكتور ألكسندر هوث، عالم الأعصاب الذي تولى قيادة العمل داخل جامعة تكساس في أوستن: «شعرنا بالصدمة نوعاً ما؛ لأنه أبلى بلاءً حسناً. عكفت على العمل على هذا الأمر طيلة 15 عاماً... لذلك كان الأمر صادماً ومثيراً عندما نجح أخيراً».
ويذكر أنه من المثير في هذا الإنجاز أنه يتغلب على قيود أساسية مرتبطة بالتصوير بالرنين المغناطيسي الوظيفي، وترتبط بحقيقة أنه بينما يمكن لهذه التكنولوجيا تعيين نشاط الدماغ إلى موقع معين بدقة عالية على نحو مذهل، يبقى هناك تأخير زمني كجزء أصيل من العملية، ما يجعل تتبع النشاط في الوقت الفعلي في حكم المستحيل.
ويقع هذا التأخير لأن فحوصات التصوير بالرنين المغناطيسي الوظيفي تقيس استجابة تدفق الدم لنشاط الدماغ، والتي تبلغ ذروتها وتعود إلى خط الأساس خلال قرابة 10 ثوانٍ، الأمر الذي يعني أنه حتى أقوى جهاز فحص لا يمكنه تقديم أداء أفضل من ذلك.
وتسبب هذا القيد الصعب في إعاقة القدرة على تفسير نشاط الدماغ استجابة للكلام الطبيعي؛ لأنه يقدم «مزيجاً من المعلومات» منتشراً عبر بضع ثوانٍ.
ورغم ذلك، نجحت نماذج اللغة الكبيرة - المقصود هنا نمط الذكاء الصناعي الذي يوجه «تشات جي بي تي» - في طرح سبل جديدة. وتتمتع هذه النماذج بالقدرة على تمثيل المعنى الدلالي للكلمات بالأرقام، الأمر الذي يسمح للعلماء بالنظر في أي من أنماط النشاط العصبي تتوافق مع سلاسل كلمات تحمل معنى معيناً، بدلاً من محاولة قراءة النشاط كلمة بكلمة.
وجاءت عملية التعلم مكثفة؛ إذ طُلب من ثلاثة متطوعين الاستلقاء داخل جهاز ماسح ضوئي لمدة 16 ساعة لكل منهم، والاستماع إلى مدونات صوتية. وجرى تدريب وحدة فك الترميز على مطابقة نشاط الدماغ للمعنى باستخدام نموذج لغة كبير أطلق عليه «جي بي تي - 1»، الذي يعتبر سلف «تشات جي بي تي».