How Does A Computer Know Where You're Looking?

تخيل أنك تقود سيارة ، باستخدام عرض شاشة للرأس على الزجاج الأمامي للتنقل عبر مدينة غير مألوفة. هذا هو الواقع المعزز (AR) ؛ يتم استخدام المعلومات ليس فقط لإرشادك على طول الطريق ، ولكن أيضًا لتنبيهك إلى المعلومات البارزة في محيطك ، مثل راكبي الدراجات أو المشاة. لا يعتبر وضع المحتوى الافتراضي الصحيح أمراً بالغ الأهمية فحسب ، بل قد يكون مسألة حياة أو موت.

لا يمكن للمعلومات أن تحجب المواد الأخرى ، ويجب أن تظهر لفترة طويلة بما يكفي لفهمها ، ولكن ليس أطول من ذلك بكثير. يجب أن تقوم أنظمة الكمبيوتر بإجراء هذه التحديدات في الوقت الفعلي ، دون التسبب في تشتيت أو تشتيت أي من المعلومات. نحن بالتأكيد لا نريد تحذيرًا من وجود سائق دراجة على وشك عبور سيارته لإخفاء الدراج بنفسه!

بصفتي باحثًا في AR ، أقضي الكثير من الوقت في محاولة لمعرفة كيفية الحصول على المعلومات الصحيحة على شاشة المستخدم ، في المكان المناسب ، في اللحظة المناسبة. تعلمت أن عرض الكثير من المعلومات يمكن أن يربك المستخدم ، ولكن عدم عرض ما يكفي يمكن أن يجعل التطبيق عديم الفائدة. علينا العثور على البقعة الحلوة بينهما.

وقد تبين أن أحد العناصر الحاسمة في ذلك هو معرفة مكان المستخدمين. عندها فقط يمكننا تقديم المعلومات التي يريدونها في موقع يمكنهم معالجته. بحثنا ينطوي على قياس أين المستخدم يبحث في المشهد الحقيقي، كوسيلة للمساعدة في تحديد مكان وضع المحتوى الافتراضي. مع AR تستعد للتسلل إلى العديد من مجالات حياتنا - من قيادة إلى العمل إلى استجمام - سنحتاج إلى حل هذه المشكلة قبل أن نتمكن من الاعتماد على AR لتقديم الدعم للإجراءات الجادة أو الحرجة.

تحديد مكان وضع المعلومات

من المنطقي أن تظهر المعلومات في المكان الذي يبحث فيه المستخدم. عند التنقل ، يمكن للمستخدم أن ينظر إلى مبنى أو شارع أو أي كائن حقيقي آخر للكشف عن المعلومات الافتراضية المرتبطة ؛ سيعرف النظام لإخفاء جميع شاشات العرض الأخرى لتجنب ازدحام المشهد المرئي.


innerself subscribe graphic


لكن كيف نعرف ما ينظر إليه شخص ما؟ اتضح أن الفروق الدقيقة في الرؤية البشرية تسمح لنا بفحص عين الشخص و حساب أين يبحثون. من خلال إقران تلك البيانات بالكاميرات التي تعرض مجال رؤية الشخص ، يمكننا تحديد ما يراه الشخص وما الذي ينظر إليه.

ظهرت أنظمة تتبع العين لأول مرة في 1900s. في الأصل كانت تستخدم في الغالب لدراسة أنماط القراءة. قد يكون بعضها تدخليًا جدًا للقارئ. وفي الآونة الأخيرة ، ظهرت تقنية تتبع العين في الوقت الحقيقي وأصبحت أكثر بأسعار معقولة وأسهل في التشغيل وأصغر.

تعقب العين يمكن أن تعلق على الشاشة أو دمجها في نظارات يمكن ارتداؤها أو شاشات محمولة على الرأس. يتم تعقب العيون باستخدام مزيج من الكاميرات والتوقعات وخوارزميات الرؤية الكمبيوتر لحساب موضع العين ونقطة الرؤية على الشاشة.

نحن ننظر بشكل عام إلى مقياسين عند فحص بيانات تتبع العين. الأول يسمى تثبيت، ويستخدم لوصف وقت إيقاف نظرنا ، غالبًا في مكان مثير للاهتمام في مشهد لأنه جذب انتباهنا. والثاني هو رمش، واحدة من حركات العين السريعة المستخدمة لوضع النظرة. وتتبع فترات قصيرة من التثبيت من خلال حركات سريعة ، تسمى ساكسيديس. في الأساس ، سرعان ما تراهن أعيننا من مكان إلى آخر تأخذ أجزاء من المعلومات حول أجزاء من المشهد. ثم تضع أدمغتنا المعلومات من هذه التثبيتات معا لتشكيل صورة مرئية في أذهاننا.

{youtube} tdFIvRMvFQI {/ youtube}

الجمع بين تتبع العين مع AR

غالبًا ما يكون محتوى AR مرتكزًا على كائن أو موقع حقيقي. على سبيل المثال ، يجب عرض تسمية افتراضية تحتوي على اسم شارع في هذا الشارع. من الناحية المثالية ، نود أن تظهر علامات AR على مقربة من الكائن الحقيقي المرتبط به. ولكننا نحتاج أيضًا إلى توخي الحرص في عدم السماح بتداخل علامات AR المتعددة وتصبح غير قابلة للقراءة. هناك العديد من الطرق لإدارة وضع العلامات. نحن نستكشف خيارًا واحدًا: حساب المكان الذي يبحث فيه الشخص في المشهد الحقيقي وعرض تسميات AR فقط في تلك البقعة.

لنفترض مثلاً أن المستخدم يتفاعل مع تطبيق جوّال يساعده في التسوق للحصول على حبوب منخفضة السعرات الحرارية في متجر البقالة. في تطبيق AR ، تحتوي كل حبوب على معلومات السعرات الحرارية المرتبطة بها. وبدلاً من التقاط كل مربع من الحبوب وقراءته للمحتوى التغذوي ، يمكن للمستخدم حمل جهازه المحمول وتوجيهه إلى صندوق حبوب خاص للكشف عن المعلومات ذات الصلة.

ولكن فكر في كيفية ازدحام ممر الحبوب في المتجر باستخدام حزم متنوعة. وبدون طريقة لإدارة عرض ملصقات AR ، سيتم عرض تسميات معلومات السعرات الحرارية لجميع صناديق الحبوب. سيكون من المستحيل تحديد محتوى السعرات الحرارية للحبوب التي يهتم بها.

من خلال تتبع عينيه ، يمكننا تحديد مربع الحبوب الفردية التي يبحث عنها المستخدم. ثم نعرض معلومات السعرات الحرارية لهذا النوع من الحبوب. عندما ينقل نظره إلى مربع آخر ، نعرض الأرقام للأرقام التالية التي يراها. شاشته مرهونة ، المعلومات التي يريدها متوفرة بسهولة وعندما يحتاج إلى معلومات إضافية ، يمكننا عرض ذلك.

هذا النوع من التطوير يجعله وقتًا ممتعًا للبحث في AR. تتحسن قدرتنا على دمج مشاهد العالم الحقيقي مع رسومات الكمبيوتر على شاشات المحمول. وهذا يغذي احتمالية إنشاء تطبيقات جديدة مذهلة توسع من قدرتنا على التفاعل مع العالم من حولنا والتعلم منه وإمتاعه.

نبذة عن الكاتب

آن مكنمارا ، أستاذ مشارك في التمثيل البصري ، جامعة تكساس ايه اند ام

تم نشر هذه المقالة في الأصل المحادثة. إقرأ ال المقال الأصلي.

كُتبٌ ذاتُ صِلَةٍ

at