نظارات تراقب تعابير الوجه وترصد المؤشرات الصحية

مجسات تتابع نشاط عضلات الوجه قرب العينين والفم

الصورة من «إمتيك لابس»
الصورة من «إمتيك لابس»
TT

نظارات تراقب تعابير الوجه وترصد المؤشرات الصحية

الصورة من «إمتيك لابس»
الصورة من «إمتيك لابس»

تسعى شركة «إمتيك لابس» لإنتاج نظارة تشكل الذروة الجديدة للتكنولوجيا الصحية القابلة للارتداء. وبالفعل، طرحت الشركة، ومقرها برايتون في إنجلترا، نظارة جديدة قادرة على استشعار المشاعر البشرية، وتحت اسم «سنس» Sense.

رصد تعابير الوجه

وتحوي النظارة تسعة مجسات بصرية، موزعة عبر الحواف لرصد التغييرات الدقيقة في تعبيرات الوجه، بمستوى دقة يتجاوز 93 في المائة، عند اقترانها ببرنامج «إمتيك» الحالي.

في هذا الصدد، شرح ستين ستراند، الرئيس التنفيذي الجديد للشركة: «إذا تحرك وجهك، يمكننا التقاطه». وبالاعتماد على مثل هذه البيانات التفصيلية، «يمكنك الشروع حقاً في فك شفرة جميع البيانات التفصيلية».

ويمكن لهذه البيانات المستمرة معاونة الأفراد على اكتشاف أنماط محددة في سلوكهم وحالتهم المزاجية، على غرار تطبيقات تعقب النشاطات أو النوم.

وتسعى «إمتيك لابس» (Emteq Labs)، في الوقت الراهن، إلى دفع التكنولوجيا الخاصة بها إلى خارج حدود المختبرات وتحويلها إلى تطبيقات مستخدمة على أرض الواقع. وتنتج الشركة حالياً عدداً ضئيلاً من نظارات «سنس»، ومن المقرر إتاحتها لشركاء تجاريين في ديسمبر (كانون الأول).

ويأتي هذا الإعلان بعد أسابيع فقط من كشف كل من «ميتا» و«سناب» عن نظارات واقع معزز لا تزال قيد التطوير.

إلا أن نظارات «سينس» لا تزال بعيدة عن طور الاستخدام كما يقول ستراند، الذي كان يشغل سابقاً القسم المعني بنظارات الواقع المعزز. ويضيف: «يمكننا لاحقاً طرح نظارات خفيفة الوزن نعتقد أن بإمكانها توفير بعض المزايا الصحية الرائعة حقاً».

الصورة من «إمتيك لابس»

خفة التصميم وثقل البطاريات

وفي الوقت الذي تتطلب سماعات الواقع المعزز الحالية التي يجري ارتداؤها على الرأس، حزم بطاريات كبيرة لتشغيل الأجهزة، فإن النظارات بطبيعتها تستلزم تصميماً خفيف الوزن.

وعن ذلك، قال ستراند في حديث لمجلة «سبيكترم» الصادرة عن جمعية المهندسين الكهربائيين الأميركية: «تكتسب كل ذرة من الطاقة، وكل ذرة من الوزن أهمية حيوية». جدير بالذكر أن النسخة الراهنة من نظارات «سنس» تبلغ زنتها 62 غراماً، مما يجعلها أثقل قليلاً عن نظارات «راي بان ميتا» الذكية، التي يقدر وزنها بنحو 50 غراماً.

وبسبب القيود التي تفرضها مسألة الوزن، لم تتمكن «إمتيك» من استخدام الكاميرات التي تستهلك الكثير من الطاقة، والتي تستخدم عادة في خوذ الرأس. وفي العادة ومن خلال الكاميرات في تلك الخوذ يجري اكتشاف الحركة عبر النظر في كيفية تغير البكسل بين الصور المتتالية. وتعتبر هذه الطريقة فاعلة، لكنها تلتقط الكثير من المعلومات المكررة، وتستهلك المزيد من الطاقة.

«رؤية الذبابة»

وبدلاً من ذلك، اختار مهندسو النظارات الاعتماد على أجهزة استشعار بصرية، تلتقط بكفاءة «المتجهات» عندما تتحرك النقاط على الوجه بسبب حركة العضلات الأساسية. واستوحى مبتكرو النظارة هذه الفكرة من كفاءة رؤية الذبابة.

في هذا الصدد، قال تشارلز ندوكا، مؤسس شركة «إمتيك»: «يتميز الذباب بفعالية يتعذر تصديقها فيما يخص قياس الحركة. ولهذا السبب تحديداً يعجز المرء عن ضرب هذه الأشياء اللعينة، فهي تتمتع بمعدل التقاط عينات مرتفع للغاية داخلياً».

بوجه عام، يمكن لنظارات الاستشعار التقاط البيانات بمعدل يصل إلى 6 آلاف مرة في الثانية. كما يضيف النهج القائم على المتجهات بعداً ثالثاً إلى عرض الكاميرا النموذجي ثنائي الأبعاد للبكسلات في مستوى واحد.

وتبحث هذه المستشعرات أو المجسات عن تنشيط عضلات الوجه. ولذا فإن المنطقة المحيطة بالعينين مكان مثالي في هذا الصدد. وأوضح ندوكا، الذي يعمل كذلك جراح تجميل في المملكة المتحدة، أنه في حين أنه من السهل قمع الابتسامة أو فرضها على الوجه، فإن النصف العلوي من وجهنا عادة ما يكون مسرحاً للمزيد من الاستجابات اللاإرادية.

ومع ذلك، يمكن للنظارات كذلك جمع معلومات حول منطقة الفم، عبر مراقبة عضلات الخد التي تتحكم في حركات الفك، والواقعة بالقرب من الحافة السفلية للنظارة. بعد ذلك، يجري نقل البيانات، التي جرى جمعها من النظارات، لتمريرها عبر خوارزميات «إمتيك»، من أجل ترجمة بيانات المتجهات إلى معلومات قابلة للاستخدام.

وجبات الطعام والمؤشرات الصحية

بجانب تفسير تعبيرات الوجه، يمكن الاستعانة بـ«سنس» لتتبع عملية تناول الطعام، وهو تطبيق جاء اكتشافه بالصدفة عندما كان أحد مطوري «إمتيك»، يرتدي النظارات في أثناء تناول الإفطار. وعبر مراقبة حركة الفك، تكتشف النظارات متى يمضغ المستخدم طعامه، ومدى سرعة تناوله للطعام. وفي الوقت نفسه، تلتقط الكاميرا الموجهة لأسفل صورة بغرض تسجيل الطعام، وتعتمد على نموذج لغوي ضخم لتحديد ما هو موجود بالصورة.

وفي الوقت الحاضر، تعتمد «إمتيك» على نسخة من نموذج «جي بي تي - 4 GPT - 4» اللغوي الكبير لإنجاز هذه المهمة. ومع ذلك، لدى الشركة خطط لإنشاء خوارزميتها الخاصة في المستقبل. كما أن هناك تطبيقات أخرى، بما في ذلك مراقبة النشاط البدني والوضعية، قيد التطوير.

ويعبر ندوكا عن اعتقاده بأن نظارات «إمتيك» تمثل «تكنولوجيا أساسية»، على غرار الطريقة التي يستخدم بها مقياس التسارع لمجموعة من التطبيقات في الهواتف الذكية، بما في ذلك إدارة اتجاه الشاشة، وتتبع النشاط، وحتى الكشف عن أضرار البنية التحتية.

وعلى نحو مماثل، اختارت «إمتيك» تطوير التكنولوجيا كمنصة عامة لبيانات الوجه لمجموعة من الاستخدامات. على سبيل المثال، يبدي ندوكا حماسه إزاء تطوير أداة لمساعدة المصابين بشلل الوجه. إلا أن الجهاز المتخصص لهؤلاء المرضى سيتسم بتكلفة مرتفعة للوحدة، ولن يكون في متناول المستخدم المستهدف. وعليه، فإن السماح لمزيد من الشركات باستخدام الملكية الفكرية وخوارزميات «إمتيك» من شأنه أن يخفض التكلفة.

وفي ظل هذا التوجه، يتمثل الهدف العام لاستخدامات «سنس» المحتملة في ابتكار تطبيقات صحية. وإذا نظرنا إلى تاريخ الأجهزة القابلة للارتداء، فستجد أن الصحة لطالما شكلت المحرك الأساسي لها.

وقد ينطبق القول ذاته على النظارات. وهنا، أوضح ستراند أن هناك إمكانية لأن تصبح البيانات المتعلقة بالنظام الغذائي والعواطف، «الركيزة التالية لتطبيقات الصحة»، بعد النوم والنشاط البدني.

إلا أنه حتى الآن، لم يتحدد بعد السبيل لتوصيل البيانات إلى المستخدم. ففي بعض التطبيقات، يمكن استخدام النظارات لتوفير ردود فعل في الوقت الحقيقي - على سبيل المثال، عبر الاهتزاز لتذكير المستخدم بإبطاء تناول الطعام. أو يمكن استخدامها من قبل المتخصصين بمجال الصحة فقط لجمع بيانات أسبوع كامل، من داخل المنزل، للمرضى الذين يعانون من حالات صحية.

تفسيرات متفاوتة وخروقات الخصوصية

وتخطط شركة «إمتيك» للعمل مع مقدمي الخدمات من الخبراء لتعبئة المعلومات بشكل مناسب للمستخدمين. في هذا الصدد، قالت فيفيان جينارو موتي، الأستاذة المساعدة بجامعة جورج ميسون، التي تقود مختبر التصميم المرتكز على الإنسان، إن تفسير البيانات يجب أن يجري بعناية. وقد تختلف معاني التعبيرات، بحسب العوامل الثقافية والديموغرافية. وهنا، كما أضافت موتي: «نحن بحاجة إلى الأخذ في الاعتبار أن الناس يستجيبون أحياناً للعواطف بطرق مختلفة». وشرحت أنه في ضوء ضعف التنظيم للأجهزة القابلة للارتداء، من المهم ضمان الخصوصية وحماية بيانات المستخدم. وحرصت موتي على إثارة هذه النقاط ببساطة لأن هناك إمكانات واعدة للجهاز. وعن ذلك، قالت: «إذا انتشرت هذه التكنولوجيا على نطاق واسع، من المهم أن نفكر بعناية في الآثار المترتبة عليها».

بالمثل، ينصب اهتمام إدوارد سازونوف، أستاذ الهندسة الكهربائية والحاسوبية بجامعة ألاباما، الذي طور جهازاً مشابهاً لتتبع النظام الغذائي في مختبره، على مسألة الخصوصية. بالتأكيد وجود كاميرا مثبتة على نظارات «إمتيك» يمكن أن يخلق مشكلات، سواء فيما يتعلق بخصوصية المحيطين بالمستخدم أو المعلومات الشخصية للمستخدم نفسه. وبالنظر إلى أن الكثير من الأشخاص يتناولون طعامهم أمام أجهزة الكومبيوتر أو الهواتف المحمولة، لذا قد تكون البيانات المرئية حساسة.

وعليه، عبر سازونوف عن اعتقاده بأنه من أجل اعتماد تكنولوجيا مثل تلك الخاصة بنظارات «سنس»، يجب أولاً الإجابة عن الأسئلة المتعلقة بسهولة الاستخدام ومخاوف الخصوصية. وأضاف: «إن التكنولوجيا القائمة على النظارات لديها إمكانات مستقبلية عظيمة - إذا نجحنا في استغلالها على النحو الصائب».



الذكاء الاصطناعي... من مكافحة «الهلوسة» إلى تصميم «الوكلاء»

الذكاء الاصطناعي... من مكافحة «الهلوسة» إلى تصميم «الوكلاء»
TT

الذكاء الاصطناعي... من مكافحة «الهلوسة» إلى تصميم «الوكلاء»

الذكاء الاصطناعي... من مكافحة «الهلوسة» إلى تصميم «الوكلاء»

كتب جون ليكاتو(*) الباحث في مجالات تقاطع الذكاء الاصطناعي ومعالجة اللغة الطبيعية والمنطق البشري، يقول: «بصفتي مدير (مختبر تطوير المنطق البشري والآلي/ Advancing Human and Machine Reasoning lab)، في جامعة جنوب فلوريدا، فإني أقوم بتقديم هذه الأبحاث إلى الجهات الأخرى لتوفير أدوات لمسح ورصد الثغرات في تلك النماذج اللغوية».

تطورات نماذج الذكاء الاصطناعي

ويضيف: «من وجهة نظري، فقد لاحظت تطورات كبيرة في مجال نماذج لغة الذكاء الاصطناعي في عام 2024، سواء في ميدان البحث أو الصناعة. وربما من أكثر هذه التطورات إثارة كانت قدرات نماذج اللغة الصغرى، ودعم معالجة هلوسة الذكاء الاصطناعي، وأطر تطوير وكلاء الذكاء الاصطناعي».

قدرات الذكاء الاصطناعي الصغير

في قلب منتجات الذكاء الاصطناعي التوليدي المتاحة تجارياً مثل «تشات جي بي تي (ChatGPT)» توجد نماذج لغة كبيرة (LLMs)، التي يتم تدريبها على كميات هائلة من النصوص، وتنتج لغةً مقنعةً شبيهةً بالإنسان.

ويقاس حجم هذه النماذج عموماً بـ«معاملات (parameters)»، وهي القيم العددية التي يستمدها النموذج من بيانات التدريب الخاصة به.

* النماذج الكبرى

تحتوي النماذج التي تنتجها شركات الذكاء الاصطناعي الكبرى على مئات المليارات من المعاملات. وتقوم المنظمات التي لديها أكبر قدر من الموارد الحسابية بتجربة وتدريب نماذج لغة أكبر وأقوى بشكل متزايد. وتنتج هذه النماذج قدرات جديدة لنماذج اللغة الكبرى، ومعايير، ومجموعات تدريب، وحيل تدريب أو تحفيز.

* النماذج الصغرى

هناك تفاعل متكرر بين نماذج اللغة الكبرى ونماذج اللغة الصغرى، الذي يبدو أنه تسارع في عام 2024. وتُستخدم الكبرى لإنشاء نماذج لغوية صغرى - في نطاق 3 مليارات معامل أو أقل - التي يمكن تشغيلها على إعدادات كومبيوتر، وتتطلب طاقة وذاكرة أقل للتدريب، ويمكن ضبطها بدقة باستخدام بيانات أقل.

* إصدارات النماذج الصغرى

ليس من المستغرب إذن أن يصدر المطورون مجموعة من نماذج اللغة الأصغر حجماً والقوية - على الرغم من أن تعريف الصغير يتغير باستمرار مثل إصدارات «Phi-3»، ثم «Phi-4» من «مايكروسوفت»، و«Llama-3.2 1B»، ثم «3B»، وكذلك «Qwen2-VL-2B»... وهي ليست سوى أمثلة قليلة.

مهام محددة

يمكن تخصيص نماذج اللغة الصغرى هذه لمهام أكثر تحديداً، مثل تلخيص مجموعة من التعليقات بسرعة أو التحقق من صحة النص مقابل مرجع محدد. ويمكنها العمل مع «أبناء عمومتها» الأكبر حجماً لإنتاج أنظمة هجينة قوية بشكل متزايد.

التضليل والهلوسة

* تضليل وتزييف

يمكن أن يكون الوصول المتزايد إلى نماذج اللغة عالية القدرة الكبرى والصغرى نعمة مختلطة؛ إذ يمكن أن تمنح نماذج اللغة المستخدمين الضارين القدرة على إنشاء منشورات على وسائل التواصل الاجتماعي، والتأثير بشكل مخادع في الرأي العام.

وكان على شركة «أوبن إيه آي» المنتجة لـ«تشات جي بي تي» التدخل لتعطيل أكثر من 20 عملية وشبكة خادعة حاولت استخدام نماذجها في حملات انتخابية خادعة، حيث تم إنشاء مقاطع فيديو وصور ساخرة مزيفة ومشاركتها بمساعدة أدوات الذكاء الاصطناعي.

* «روبوتات» مشاغبة ومهلوسة

بدأت «غوغل» بتضمين على الذكاء الاصطناعي في نتائج البحث الخاصة بها، ما أسفر عن بعض النتائج التي كانت خاطئة بشكل مضحك وواضح؛ مثل الغراء في البيتزا الخاصة بك. ومع ذلك، ربما كانت النتائج الأخرى خاطئة بشكل خطير، مثل عندما اقترحت خلط مواد التنظيف للتبييض والتعقيم مع الخل لتنظيف الملابس.

وفي حادثة أخرى، قال روبوت محادثة يقدم المشورة بشأن قوانين ولوائح مدينة نيويورك بشكل غير صحيح إنه «من المسموح قانونياً لصاحب العمل طرد عامل يشكو من التحرش الجنسي، أو امرأة لا تكشف عن الحمل، أو رجل يرفض قص ضفائره».

«تخفيف» الهلوسة

إن نماذج اللغة الكبرى، كما يتم تصميمها بشكل شائع، معرَّضة للهلوسة. وهذا يعني أنها يمكن أن تذكر أشياء كاذبة أو مضللة، غالباً بلغة واثقة. على الرغم من أنني وآخرين ندق الطبول باستمرار حول هذا الأمر، فإن عام 2024 لا يزال يشهد محاولة كثير من المنظمات تعلّم المخاطر الناجمة عن هلوسة الذكاء الاصطناعي.

ولحسن الحظ، شهد عام 2024 أيضاً طرقاً جديدة للتخفيف من هلوسات الذكاء الاصطناعي والتعايش معها؛ إذ تعمل الشركات والباحثون على تطوير أدوات للتأكد من أن أنظمة الذكاء الاصطناعي تتبع القواعد المحددة قبل تقديمها للنتائج، فضلاً عن البيئات لتقييمها.

ولكن على الرغم من أن الباحثين يجدون باستمرار طرقاً للحد من الهلوسة، فإن الأبحاث في عام 2024 أظهرت بشكل مقنع أن هلوسات الذكاء الاصطناعي ستظل موجودة دائماً في شكل ما.

الوكلاء: الموجة الثالثة للذكاء الاصطناعي

لا تزال نماذج اللغة الكبرى، خصوصاً تلك التي تعمل بإصدارات مختلفة من بنية نظام المحول المصمم في داخلها، تقود أهم التطورات في مجال الذكاء الاصطناعي.

على سبيل المثال، يستخدم المطورون نماذج اللغة الكبرى ليس فقط لإنشاء روبوتات الدردشة، ولكن أيضاً لتكون بمثابة أساس لوكلاء الذكاء الاصطناعي. برز مصطلح «الذكاء الاصطناعي الوكيل» في عام 2024، حتى إن بعض الخبراء أطلقوا عليه «الموجة الثالثة من الذكاء الاصطناعي».

* ما هو الوكيل الذكي؟

لفهم ما هو وكيل الذكاء الاصطناعي، فكر في روبوت الدردشة الموسع بطريقتين:

- أولاً، امنحه إمكانية الوصول إلى الأدوات التي توفر القدرة على اتخاذ الإجراءات. قد تكون هذه القدرة على الاستعلام من محرك بحث خارجي، أو حجز رحلة، أو استخدام الآلة الحاسبة.

- ثانياً، امنحه استقلالية متزايدة، أو القدرة على اتخاذ مزيد من القرارات بمفرده.

على سبيل المثال، قد يكون روبوت الدردشة للسفر قادراً على إجراء بحث عن الرحلات بناءً على المعلومات التي تقدمها له، ولكن قد يخطط وكيل السفر المجهز بأدوات، لمسار الرحلة بالكامل، بما في ذلك تنفيذ الحجوزات، وإضافة الأحداث المهمة والفعاليات في أثناء السفرة، إلى التقويم الخاص بك.

إصدارات الوكلاء

في عام 2024، ظهرت أطر عمل جديدة لتطوير وكلاء الذكاء الاصطناعي. على سبيل المثال لا الحصر، تم إصدار أو تحسين «LangGraph»، و«CrewAI»، و«PhiData»، و«AutoGen/Magentic-One» في عام 2024.

بدأت الشركات للتو في تبني وكلاء الذكاء الاصطناعي. وبدأت أطر العمل لتصميم وكلاء الذكاء الاصطناعي جديدة تتطور بسرعة. ولكن ومع ذلك، لا تزال مخاطر الأمن والخصوصية والهلوسة تشكَّل مصدر قلق.

* توقعات المستقبل

ويتوقَّع محللو السوق العالمية أن تخطط 82 في المائة من المنظمات التي شملتها الاستطلاعات لاستخدام الوكلاء في غضون بين 1 و3 سنوات، ومن المرجح أن تتبنى 25 في المائة من جميع الشركات، التي تستخدم الذكاء الاصطناعي التوليدي حالياً، وكلاء الذكاء الاصطناعي في عام 2025.

* أستاذ مشارك في علوم الكومبيوتر بجامعة جنوب فلوريدا.

مجلة «فاست كومباني» - خدمات «تريبيون ميديا».

حقائق

82 %

من المنظمات التي شملتها الاستطلاعات لاستخدام الوكلاء في غضون بين 1 و3 سنوات