التحدث معي الكمبيوتر: التحكم الصوتي هو الإقلاع

إذا بدأت الحزم غير المتوقعة في الظهور على باب منزلك ، فقد ترغب في الحصول على كلمة مع أحد أجهزتك الذكية.

في وقت سابق من هذا الشهر ، طلبت فتاة تبلغ من العمر ست سنوات في دالاس من عائلتها الأمازون صدى المتحدث الذكية لدمية. واليكسا ، مساعد الأمازون الاصطناعي سيري ، على الفور أمر واحد إلى منزلهم.

التقطت إحدى أخبار سان دييجو التلفزيونية القصة ، وكررتها بشكل غير متعمد عندما علق أحد مذيعي الأخبار: "أحب الفتاة الصغيرة ، قائلة" أليكسا تطلب مني دمية ". سماع هذا ، عدة أجهزة أخرى في الأمازون في المنازل عبر سان دييغو حاول شراء المزيد من الدمى.

CW6 San Diego news report on Alexa's accidental dollhouse purchase.

{youtube} oI2KLIULjXc {/ youtube}

قد تبدو القصة مألوفة لدى أي شخص حاول إجراء محادثة مع سيري من شركة أبل أو شركة سيكوريت التابعة لشركة مايكروسوفت. لقد أصبحت أجهزتنا جيدة جدًا في الاستماع إلينا ، ولكن هذا لا يعني دائمًا فهمها.

وقد أوضح باحثون في شركة مايكروسوفت هذا مؤخراً على أنه مشكلة محتملة في واجهات التحدث اليوم: يتم تسويقها كمساعدين "أذكياء" ، مع نكت ذكية ومعرفة دنيوية ، ومع ذلك فهي غالباً ما تحبطنا بسبب افتقارهم إلى الحس السليم.


رسم الاشتراك الداخلي


في باقة دراسة صغيرةوجد الباحثون أن الأشخاص الذين استمروا في التحدث إلى مساعديهم الرقميين مع مرور الوقت كانوا أولئك الذين بدأوا بأقل التوقعات.

ماذا تفعل فعلا واجهة الصوت؟

عندما تتحدث إلى واجهة صوت ، يجب أن:

  • "سماع" صوتك ، وتمييزه عن ضوضاء الخلفية
  • معرفة أين تبدأ كل كلمة وتنتهي ، متجاهلة "أمهاتك" و "ahhs"
  • قم بمطابقة صوت كل كلمة بكلمة في القاموس ، مع اختيار الصوت المناسب من السياق إذا كان موجودًا الهوموفون
  • يفسر بشكل صحيح معنى الجملة كاملة
  • توليد استجابة مجدية ومفيدة تطابق طلبك.

يمثل كل واحد منها تحديًا فنيًا معقدًا ، وقد حققت شركات التكنولوجيا المختلفة تقدمًا في مختلف المجالات.

يُعد تطبيق Google Now جيدًا في تقديم الردود ذات الصلة على نطاق واسع من الطلبات ؛ لأنه يستفيد من مجموعة البيانات التي توفرها Google حول الويب وأنشطتك الشخصية ، إذا كنت تستخدم خدمات Google.

الأمازون صدى جيد بشكل خاص في سماع طلباتك من خلال غرفة صاخبة ، بفضل صفيف الميكروفون بعيد الغاء الضوضاء. بالطبع ، إنها جيدة أيضًا في إجراء عمليات شراء عبر Amazon.

خلال السنوات القليلة الماضية ، أصبحت الواجهات الصوتية أفضل بكثير في فهم الكلام اليومي أو "الطبيعي" بدلاً من الأوامر المتميزة والمصممة بعناية. إنها لا تزال أفضل في التعامل مع الاستفسارات البسيطة ، مثل "من يلعب في بطولة أستراليا المفتوحة؟" ، وتميل إلى النضال مع طلبات أكثر تعقيدًا ، مثل "من يلعب في بطولة أستراليا المفتوحة للمرة الأولى هذا العام؟" ، ومتابعته أسئلة ، مثل "هل ستمطر خلال نهائيات كأس العالم؟".

والوضع أكثر اختلاطًا للغات الأخرى غير الإنجليزية: بينما يدعم سيري أكثر من لغات ولهجات 40 ، فإن اليكسا متوفرة فقط باللغتين الإنجليزية والألمانية. لكن كل هذه الميزات تتحسن باطراد.

حيث تتلألأ واجهات الصوت

لذا ، ستتسلم واجهات الصوت قريبًا جميع تقنياتنا ، كما هو متوقع في الفيلم هدايا نسائية؟ غارتنر ، شركة أبحاث التكنولوجيا ، لديها توقعات أنه بحلول العام القادم ، ستكون 30٪ من تفاعلاتنا مع التكنولوجيا محادثات مع واجهات ممكّنة للصوت.

لكن واجهات الصوت لها حدود ، ولا يمكن حلها كلها بتكنولوجيا أفضل.

Voice هو وسيلة مركزية للتواصل مع التكنولوجيا في فيلم Spike Jonze Her.

{youtube} ne6p6MfLBxc {/ youtube}

التلوث الضجيج هو عقبة رئيسية واحدة. هل يمكن لجهازك تمييز ما تقوله من ضجيج الخلفية من حولك؟ يمكن للتقنية المساعدة في ذلك ، بما في ذلك الحد من الضوضاء ، التعرف على الصوت المخصص وقراءة الشفاه.

ولكن ماذا عن ضجيج الخلفية الذي تقوم بإنشائه للآخرين من خلال التحدث إلى جهازك الذكي؟ تخيل شخصًا يجلس إلى جانبك في المكتب - أو على متن طائرة - قم بالدردشة مع سيري أثناء محاولتك القراءة ، ويمكنك معرفة السبب في أن واجهات الصوت قد لا تكون مقبولة اجتماعيًا دائمًا.

مجموعة أخرى من القضايا تأتي من المتطلبات العقلية للواجهات الصوتية. قد يكون من الصعب تعلم استخدام نظام صوتي ، خاصةً إذا لم تكن هناك شاشة ، كما هو الحال مع Amazon Echo.

إذا كنت قد استدعت بنكًا أو شركة هاتفًا ، فستعرف تركيبة بائسة من التركيز والملل التي تأتي من الاستماع إلى قائمة صوتية مركبة من جميع خياراتك بينما تنتظر الشخص الذي تحتاجه وتحاول عدم مزجها فوق. تتفادى واجهات الرسوم البيانية التقليدية هذه المشكلة من خلال عرض الخيارات المتاحة لك والسماح لك بالنقر سريعًا على اختيارك.

بعد أن تعلمت الأوامر الصوتية ، يمكن أن يؤدي استخدامها إلى تشتيت الانتباه. وقد وجد الباحثون أن الأوامر الصوتية تعطل القطار الخاص بك من الفكر أكثر من الماوس ولوحة المفاتيح.

هذا خطير بشكل خاص لواجهات الصوت في السيارة: زوج من الدراسات من جامعة يوتا وجدت أن السائقين كانوا مشتت لمدة تصل إلى 27 ثانية بعد استخدام الأوامر الصوتية.

جامعة يوتا / مؤسسة AAA لأبحاث السلامة المرورية على إلهاء السائقين.

{vimeo} 108281698 {/ vimeo}

العثور على صوته؟

لذلك من غير المرجح أن تتولى واجهات الصوت كاملًا ، ولكنها ستجد منافذًا مفيدة في حياتنا. وهي شائعة بالفعل في السيارات ، حيث من المأمول أن تصبح أقل تشتيتًا مع تحسن التكنولوجيا.

في المطبخ ، يمكنك أن تطلب من Alexa التحدث إليك عبر وصفة أو تحديث قائمة التسوق الخاصة بك بينما تكون يديك مشغولة بالطهي. في الواقع الافتراضي والواقع المعزز ، يمكن أن تسمح لك واجهات الصوت بالتحكم في النظام عندما لا تستطيع رؤية يديك على الإطلاق.

في تعلم اللغة ، يمكن استخدامها لممارسة النطق. والأهم من ذلك ، أن واجهات الصوت تساعد المستخدمين الذين يعانون من إعاقة حركية أو RSI أو عسر القراءة للتغلب على إعاقاتهم.

واجهات الصوت هي تقنية طال انتظارها ، وهناك أسباب وجيهة للتفكير في أن وقتهم قد حان أخيراً. فقط تذكر أنهم قد لا يكونوا أذكياء كما يبدو. وقد ترغب في وضع رمز PIN على مشتريات الصوت إذا كان الأطفال موجودون.

المحادثة

نبذة عن الكاتب

فريزر أليسون ، طالب دكتوراه في التفاعل بين الإنسان والحاسوب ، جامعة ملبورن

تم نشر هذه المقالة في الأصل المحادثة. إقرأ ال المقال الأصلي.

منتجات مرتبطة

{amazonWS: searchindex = KindleStore؛ keywords = AmazonEcho "target =" _ blank "rel =" nofollow noopener "> InnerSelf Market و Amazon