Мария Кокухина

Мария Кокухина
руководитель компании PROF-MK.RU

Объединение графических и голосовых интерфейсов для лучшего UX

Объединение графических и голосовых интерфейсов для лучшего UX
28 декабря 2017
Подпишитесь на нас в Telegram

С появлением голосовых пользовательских интерфейсов, каково будущее графических? В каких ситуациях лучше использовать голосовой и графический интерфейс? В этой статье вы получите ответы на данные вопросы.

Наши первичные датчики

Наш мозг – это машина для обработки изображений. Мы можем понять сложную информацию быстрее, когда видим ее. Мы поглощаем большую часть информации с помощью нашего зрения. Короче говоря, наши глаза - наши первичные датчики.

Наши уши являются вторыми по важности датчиками. И в некоторых ситуациях голосовой разговор является очень эффективным каналом связи. Представьте себе на мгновение простой опыт покупок. Заказать вашу любимую пиццу намного проще, если вы просто назовете ее и закажете, вместо того чтобы проходить через все различные предложения на сайте. Но в более сложной ситуации недостаточно полагаться только на вербальное общение. Например, вы бы купили платье, не увидев его в первую очередь? Конечно, нет. Пользовательские интерфейсы все больше будут адаптироваться к нашим датчикам.

Наши глаза и уши - основные входные датчики. Мы очень хорошо разбираемся в распознавании образов и обработке изображений. Это означает, что мы можем обрабатывать сложную информацию быстрее визуально. С другой стороны, время реакции на звук быстрее, поэтому голос является хорошим вариантом для предупреждений.

Наш рот - самое эффективное устройство вывода. Потому что большинство людей могут говорить быстрее, чем они печатают или пишут.

Поскольку люди хорошо сочетают разные каналы, это приведет к тому, что компьютеры будут использовать мультимодальные интерфейсы для адаптации к возможностям человека. Интерфейсы будут адаптироваться к людям, используя среду и формат сообщений, наиболее удобный для людей в данной ситуации. Давайте рассмотрим некоторые примеры.

Чат-боты

Chatbot.jpg

Для базовой связи чат более эффективен, чем традиционные пользовательские интерфейсы. С помощью него продавцы и покупатели могут найти друг друга и обсудить различные сделки. В этом случае чат является оптимальным из-за общения «один на один». Но когда дело доходит до более сложного взаимодействия, например, для сравнения большого количества товаров, нам нужен более продвинутый пользовательский интерфейс. В этом случае добавляется возможность голосового общения с менеджером: позвонить в чате.

Цифровые помощники

Voice helper.jpg

В будущем более точное распознавание голоса и обработки речи помогут людям сказать команды своими словами. Это важный и необходимый шаг для более широкого использования смешанных интерфейсов.

Например, готовить на кухне и говорить «Красный перец Чили» проще, чем прокручивать каталог руками. С голосовым интерфейсом вы сможете автоматически добавить что-то в свой список покупок. Вам показываются продукты и голосом вы выбираете те, которые вам нравятся.

Когда пользователь находится на кухне и руки заняты, использование голосового управления - удобнее, чем прикосновение к экрану. Голосовой интерфейс – отличная функция и будет обязательной в будущих продуктах.

Для мультимодальных интерфейсов важно поддерживать синхронизацию голосовых и визуальных выходов. В противном случае люди легко запутаются. Например, когда мы разговариваем с кем-то, мы можем легко посмотреть на их лицо, чтобы узнать, получили ли они наше сообщение. В случае с мультимодальным интерфейсом мы захотим сделать то же самое, когда говорим с продуктом. Это нужно учитывать при разработки смешанных интерфейсов.

Приложение для здоровья

maxresdefault.jpg

Например, приложение для измерения расстояния между зрачками для людей, которые носят очки (PD Measure). Это хороший пример объединения визуальных и голосовых интерфейсов.

Любой клиент должен знать данное расстояние, чтобы купить очки онлайн. Если они не знают, тогда им придется пойти в розничный магазин и измерить там. Инструмент измерения, доступный для любого пользователя, открывает огромный рынок онлайн-оптики.

С помощью такого приложения клиент сможет встать перед зеркалом и фотографировать себя, держа свой телефон в определенном положении и следуя точным инструкциям. Затем приложение автоматически вычисляет расстояние между зрачками. Этого достаточно, чтобы сделать онлайн-заказ.

В этом примере визуальные и голосовые интерфейсы работают вместе: анимированные иллюстрации показывают, как удерживать телефон, в то время как голосовая инструкция помогает достичь идеального положения.

***

Давайте подытожим, когда лучше использовать голос, а когда использовать визуальный пользовательский интерфейс.

Визуальные пользовательские интерфейсы работают лучше в следующих ситуация:

  • списки с большим количеством предметов (где чтение всех предметов вслух займет слишком много времени);
  • сложная информация (графики, диаграммы и данные со многими атрибутами);
  • вещи, которые вы должны сравнить;
  • продукты, которые вы хотели бы видеть перед покупкой;
  • информация о состоянии, которую вы хотели бы периодически проверять (время, таймер, скорость и т. д.).

Голосовые пользовательские интерфейсы работают лучше в следующих ситуациях:

  • команды (т.е. любая ситуация, в которой вы точно знаете, что хотите. Чтобы вы могли пропустить навигацию и просто диктовать свою команду);
  • инструкции пользователям. Поскольку люди склонны следовать голосовым инструкциям лучше, чем письменным инструкциям;
  • звуковая обратная связь для успешных ситуаций и ситуаций с ошибками, с разными сигналами;
  • предупреждения и уведомления (потому что время реакции на голос быстрее);
  • простые вопросы, которые требуют относительно простых ответов.

Несколько советов для работы с мультимодальными интерфейсами:

  • Синхронизация голосовых и визуальных интерфейсов. Всегда имейте визуальную обратную связь о том, что происходит.
  • Показывайте визуальные индикаторы, когда устройство прослушивает или думает об ответе.
  • Выделите слова голосовой команды в графическом интерфейсе.
  • Задайте правильные ожидания пользователей о возможностях интерфейса и убедитесь, что продукт объясняет, как он работает.
  • Продукт должен знать о контексте разговора и должен отвечать соответствующим образом.
  • Не игнорируйте безопасность и конфиденциальность. Разрешите людям отключать компоненты (например, микрофон).
  • Не читайте длинные аудиомонологи. Если он не может быть кратко изложен в нескольких словах, отобразите его на экране.
  • Потратьте время, чтобы понять специфику каждой платформы и выбрать правильный вариант.

Заключение

В будущем голосовой интерфейс станет обычным явлением. Новый интерфейс не означает, что мы должны игнорировать все, что успешно применяли к графическим интерфейсам. Произойдет объединение графических и голосовых интерфейсов, как более человечный способ общения между пользователем и компьютером.

Подобная мультимодальная эволюция уже происходила раньше. Радио и немые фильмы были объединены в фильмы, которые дополнительно улучшены с помощью 3D и т.д. В скором времени этот процесс произойдет и в интерактивном цифровом мире.  

Друзья, теперь вы можете поддержать Лайкни https://pay.cloudtips.ru/p/8828f748
Ваши донаты помогут нам и дальше радовать вас полезным контентом.

Нас удобно читать в соцсетях. Подписывайся!

Кое-что интересное:

Комментарии

0 комментариев
Чтобы оставить комментарий, войдите на сайт через:

Будь в курсе

Главные новости, кейсы и статьи за месяц – у тебя в почте:

Отправляя форму, вы принимаете условия обработки персональных данных