Голосовое управление устройством представляется большинством как очередная игрушка, не представляющая особого смысла. Это большое заблуждение, ведь голосовое управление является ничем иным, как следующим витком эволюции интерфейса управления и согласно закону Мура, массовое применение технологии голосового управления экспоненциально ускорит развитие интерфейсов взаимодействия человека и компьютера. Но давайте обо всем по порядку. В этой статье мы разберемся с определением интерфейса и подробно изучим тонкости голосового управления умным домом.
Что такое интерфейс пользователя и какие они бывают?
Простыми словами, интерфейс — это способ взаимодействия человека с компьютером или устройством, который решает задачи передачи команд устройств и информирование пользователя о состоянии устройства. Интерфейсы бывают следующих видов:
- текстовый — старая добрая командная строка. Хочешь включить свет? Напиши команду!
- графический — это то, к чему мы привыкли. Красивая картинка с кнопочками и слайдерами.
- голосовой — команду нужно произнести вслух. Чтобы узнать состояние устройства, нужно спросить и прослушать ответ.
- жестовый — любые действия активируются жестом. Надо включить свет? Махни рукой. Обратная связь не предусмотрена. Концепция есть, реализации нет.
- нейроинтерфейс — светлое будущее. Общение с устройствами происходит с помощью перекодирования мыслей пользователя в команды. Обратная связь работает также. Попытки реализации есть, но больше в качестве экспериментов.
Что мы получаем от графического интерфейса?
Мы все принимаем графический интерфейс как нечто традиционное и свыклись с его недостатками.
Давайте вспомним о них, чтобы понять, как голосовое управление облегчает жизнь:
1. Обязательное наличие панели управления в зоне досягаемости
Использование графического интерфейса подразумевает наличие панели управления. Вы скажете, что сейчас у каждого есть собственный смартфон, который может выступать как панель управления, и будете правы, но в этом случае для того, чтобы выставить температуру в комнате вам потребуется достать смартфон, разблокировать его, найти приложение для управления, дождаться, когда оно запустится, найти виджет управления кондиционером и выставить нужную температуру. Согласитесь, что такой подход крайне неудобен для пользователей, и для решения этой задачи, интегратор устанавливает стационарную панель управления в каждую комнату, что приводит к большому удорожанию проекта. К тому же остается необходимость подойти к панели управления, что является крайне неудобным.
2. Обязательное наличие свободной руки
Графический интерфейс подразумевает, что пользователь будет с ним взаимодействовать через нажатие. И вот тут кроется проблема “А что если заняты руки?” Ответа тут нет…
3. Необходимость изучения
Новый графический интерфейс — это как новое приложение. Его надо изучать и запоминать расположение функциональных элементов, особенности навигации и прочие особенности интерфейса.
4. Дополнительные затраты на разработку
Помимо покупки панелей управление, придется потратится на разработку дизайна и разработку самого интерфейса
Когда голосовое управление удобно? Кейсы использования.
Голосовое управление необходимо в тех случаях, когда затруднен доступ к графическому интерфейсу, а именно:
- Нет необходимости подходить к панели. Если у пользователя большая комната, то удобнее отдать команду голосом, чем идти к панели в другой конец комнаты.
- Занятые руки — больше не проблема. Приходя домой, у пользователя могут быть заняты руки пакетами с покупками или маленьким ребенком и управление с графического интерфейса будет неуместным. Голосовое управление не требует наличия свободных рук.
- Упрощенная работа с устройствами. Если дом пользователя насчитывает более 5 комнат, то для утреннего приготовления кофе придется покопаться в графическом интерфейсе, открыть комнату управления устройствами на кухне, найти виджет кофе-машины, нажать на кнопку приготовления кофе. При использовании голосового управления, проснувшись утром, пользователь может, не вставая с кровати, отдать голосом команду на приготовление кофе.
- Вау эффект. Голосовое управление не является распространенным явлением и оно будет оценено гостями.
Концепция голосового управления
Итак, для реализации голосового управления нужно устройство, которое будет “слушать” команды пользователя. Тут есть 2 варианта:
- Колонка — устройство, специально разработанное, для голосового управления. Оснащено множеством чувствительным микрофонов и целиков заточено под голосовое управление.
- Планшет — каждый планшет имеет микрофон и встроенного голосового ассистента. Это значит, что с помощью планшета можно реализовать комбинированный интерфейс. В комнате будет установлен планшет с графическим интерфейсом, и одновременно пользователь сможет отдать голосовую команду.
Проектирование системы голосового управления довольно просто. В каждую комнату ставим по колонке или планшету. Если выбрали колонку, то лучше ее располагать ближе к центру комнаты. Если планшет, то вешаем на стену, поближе к предполагаемому месту отдачи команды.
Определившись со стратегией проектирования, осталось только выбрать голосового ассистента, и в этом нам поможет обзор наиболее популярных голосовых ассистентов в следующей главе.
Как работает голосовое управление?
- Колонка или планшет воспринимают речь. При произношении кодового слова (Алиса, Сири, Алекса, ОК Google) — начинается запись речи.
- После паузы в речи, эта звукозапись отправляется в облако.
- В облаке нейросеть преобразует запись в текст.
- Текст отправляется в словарь.
- Например мы сказали “Сири, включи свет”
- В словаре ищутся совпадения.
- Если совпадения найдены, то определяется, к какой группе они относятся.
- В нашем случае Сири понимает, что команда относится к группе устройств “Лампы”.
Какие группы есть относительно умного дома:
- лампы
- переключатели
- розетки
- термостаты
- окна
- вентиляторы
- шторы
- кондиционеры
- увлажнители
- очистители воздуха
- сенсоры
- системы безопасности
- замки
- двери
- моторы
Рассмотрим на примере «включи свет»
Давайте рассмотрим работу голосовых ассистентов на примере включения света. Рассмотрим нюансы настройки ассистента и форматы команд, для выполнения устройствами.
Apple HomeKit (Siri)
Устройства могут быть объединены в комнаты (группы), что позволяет управлять как каждым устройством индивидуально, так и группой устройств в комнате. Более того, каждое устройство имеет свой собственный тип. Чтобы выключить весь свет в комнате, надо сказать фразу “Привет, Сири, выключи свет в кухне”. В этом случае Сири найдет все устройства в группе с названием “кухня”, выделит из них все устройства с типом “свет” и отправит на них команду выключения.
Сири имеет собственный словарь звуковых команд. Это значит, что вы можете сказать “Привет, Сири, выключи свет на кухне”, “Привет, Сири, свет в кухне выключи”, “Привет, Сири, погаси весь свет на кухне” и Сири поймет, что вы имеете в виду и выключит свет.
Также, комнаты могут быть объединены в зоны. Например, можно создать зону “первый этаж”, добавить в эту зону все комнаты с первого этажа и отдавать команду “Привет, Сири, выключи свет на первом этаже”. В этом случае Сири выделит комнаты в указанной зоне, в них найдет устройства с типом “свет” и выключит их.
Есть и неоднозначные приемы. Например, в вашей комнате есть верхний свет и есть светильники. Вам нужно включить только светильники, как же об этом сказать ассистенту? Для выполнения этой задачи, вам понадобится дать всем светильникам одинаковые имена “светильник” и дать голосовую команду “Привет, Сири, включи светильники в кухне” и тогда ассистент включит только те лампы, которые имеют имя “светильник”.
Комнаты объединяются в дом. Если вам нужно выключить весь свет в доме, то стоит просто сказать “Привет, Сири, выключи весь свет” и ассистент выключит все устройства с типом “свет” во всем доме. Если же у вас несколько домов, то надо указать в каком именно доме свет должен быть выключен: “Привет, Сири, выключи свет на даче”
Google Home
Хоть Google Home и не поддерживает русский язык, мы все равно рассмотрим принципы работы с ним, потому что это решение функционирует каждый день и поддержка русского языка рано или поздно появится.
При подключении устройства к системе, пользователь должен установить имя устройства и задать комнату, в которой устройство работает. Далее, пользователь может или отдать прямую команду устройству, указав его имя, например “Окей, гугл, включи свет на кухне”, либо обратится к комнате “Окей, гугл, выключи свет на кухне”. Также, гугл хоум знает типы устройств и при получении команды “выключи весь свет”, выключит все устройства с типом “свет”. Гугл хоум не умеет объединять устройства в зоны и не знает о существовании нескольких домов. Для расширения возможностей пользователь может настраивать сценарии и включать\выключать их голосовыми командами. Например, “Окей, гугл, активируй сценарий вечеринка”, включит сценарий, в котором заданы настройки цвета RGB-ламп.
Amazon alexa
Напомню, что Алекса тоже не знает русский язык, но все равно ее стоит рассмотреть.
При подключении устройства к системе, пользователь должен подключить “навык”. Навыки — это подпрограммы, которые говорят Алексе, куда перенаправить сообщение пользователя. Например, если в умном доме используется система iRidium, то интегратору потребуется установить навык “iRidium” в свою колонку amazon echo. В этом навыке прописаны команды, которые следует перенаправлять в облако iRidium для дальнейшей обработки. Когда пользователь произносит команду “Алекса, включи свет”, Алекса определяет, что эта команда относится к навыку “iRidium”, превращает команду пользователя в набор параметров, в которых отражается, что нужно сделать и с каким устройством, после чего этот набор параметров попадает в навык и перенаправляется в облако “iRidium”, которое обработает их и выполнит.
Алекса знает названия устройств, их типы и позволяет объединять устройства в группы. Соответственно, для управления устройствами нужно либо четко указать название устройства (Алекса, выключи лампу 1), либо указать группу устройств (Алекса, выключи свет в кухне), либо тип устройств (Алекса, выключи весь свет)
Яндекс.Алиса
Считаю Алису самым неоднозначным ассистентом. Она понимает русский язык, у нее очень хороший словарь фраз, и среду русскоговорящих ассистентов она лучше всех понимает пользователя. Однако, дьявол кроется в деталях.
- Она не имеет автоматического вызова с панели управления. То есть, на панели управления надо запустить приложение яндекса и оно должно всегда работать. Только в этом случае можно привлечь внимание Алисы голосом. Либо использовать станцию.
- Для работы со сторонними системами (например системой автоматизации), у Алисы есть навыки (как у Алексы). Однако, чтобы пользоваться навыком надо его активировать. Не получится просто сказать “Алиса, включи свет”. Нужно сначала сказать “Алиса, запусти навык iRidium” и только после активации навыка можно включать свет. Может быть только один активный навык в единицу времени. Это означает, что для получения прогноза погоды потребуется сначала выйти из навыка системы автоматизации и только потом запрашивать прогноз погоды.
- Алиса ничего не знает о умных устройствах и не знает как ими управлять. Процесс настроен так:
– запускается навык системы автоматизации,
– Алиса переводит речь пользователя в текст и передает в навык,
– навык пересылает текст команды серверу.
Что делать с командой дальше решает сервер. Это означает, что интегратор должен сам составить словарь фраз, которые будут работать для объекта автоматизации. Если вы хотите поддерживать фразы “включи свет”, “свет включи”, “погаси свет” и т.д., то вам надо самостоятельно описать набор всех возможных фраз и указать, что должно произойти при получении команды. За группировку устройств в комнаты, зоны, этажи, дома, тоже отвечает интегратор и должен проделать эту работу самостоятельно и описать набор фраз для управления всеми зонами в доме.
В итоге, Алиса не является коробочным решением. Ее нужно настраивать и кастомизировать самостоятельно. Однако, такие сложности подразумевают потенциально большие возможности, чем у других голосовых ассистентов, ведь имея такой потенциал кастомизации, интегратор может реализовать буквально любые запросы клиента при работе с голосовым управлением
Что мешает стать голосовому управлению единственным интерфейсом?
Голосовое управление только зарождается и имеет ряд недостатков, которые не позволяют стать единственным интерфейсом. К ним относятся:
- Необходимость быть услышанным. Если в комнате шумно (например, громко играет музыка), то придется кричать голосовую команду, чтобы быть услышанным.
- Привязанность к устройству. Голосовое управление позволяет управлять устройствами находясь в удалении от панели, но все-таки нужно быть в зоне досягаемость микрофонов.
- Привязка к интернету. Если графический интерфейс может работать офлайн, то голосовому управлению жизненно необходим доступ к интернету. Убрав интернет, голосовое управление становится бесполезным
- Необходимость запроса. Графический интерфейс всегда показывает текущий статус устройств, достаточно просто посмотреть на панель, чтобы узнать текущую температуру в комнате. При использовании голосового управления нужно постоянно просить ассистента сказать текущую температуру.
- Нужно помнить название комнаты или группы устройств. Голосовое управление позволяет управлять устройствами, объединенными в группы. Например, можно выключить свет в группе «кухня». В сценарии обязательным требованием является указать название группы, которым обычно выступает название комнаты. Если комнат много, то помнить уникальное название каждой является неудобным условием, а управлять устройствами в зависимости от местонахождения пользователя ассистенты пока не научились.
Заключение
Голосовые ассистенты — это будущее интерфейсов управления умным домом. Да, сейчас они только начинают набирать силу, но на них уже стоит обратить внимание и начать предлагать пользователям как хорошее дополнение графического интерфейса.
Главный минус сейчас это:
– Проблемы с восприятием команд. Не всегда понимают и слышат.
– Непонимание контекста, я не могу сказать включи свет, находясь в какой-то конкретной комнате, я должен сказать “включи свет на кухне” (при этом такая команда должна быть заранее запрограммирована). Если я скажу “на кухне включи свет”, то буду понят только Siri. (остальным такую фразу надо настроить). В итоге мне придется помнить, какие команды для какой комнаты я настроил. Это неудобно в использовании (особенно, если комнат много). Есть понимание общения с тупым роботом, а не интеллектуальным устройством.
В итоге, на мой взгляд, наиболее удобный способ использования голосового ассистента — это вызов заранее настроенных сценариев.
Например:
“Сири, я ушел” (включится сценарий “я ушел”, климат переведется в эко-режим, свет выключится, поставится охрана и т.д.)
“Сири, включи просмотр кино” (включится сценарий “просмотр кино” — закроются шторы, включится нижняя подсветка, включится телевизор и т.д.)
“Сири, я лег спать” (включится сценарий “я лег спать”)
“Сири, я читаю книжку” (включится соответствующая сцена света)
Вышеописанные варианты возможны для любого ассистента.
Надеяться на непринужденное общение и управление умным домом через ассистента пока не стоит. Только заранее настроенные команды и сценарии.
По мере развития технологии проблемы будут решаться. И в горизонте 3-5 лет эти вопросы будут решены.
Сравнение голосовых ассистентов
Прямо сейчас вы можете получить бесплатную, тестовую версию нашей программы для управления умным домом с помощью голосового помощника. И использовать это решение в своем шоуруме для демонстрации клиентам..
Чтобы это сделать, а также узнать стоимость и скидки для инсталляторов пройдите регистрацию.