Зачем умному дому голосовое управление?

Голосовое управление устройством представляется большинством как очередная игрушка, не представляющая особого смысла. Это большое заблуждение, ведь голосовое управление является ничем иным, как следующим витком эволюции интерфейса управления и согласно закону Мура, массовое применение технологии голосового управления экспоненциально ускорит развитие интерфейсов взаимодействия человека и компьютера. Но давайте обо всем по порядку. В этой статье мы разберемся с определением интерфейса и подробно изучим тонкости голосового управления умным домом.

 

Что такое интерфейс пользователя и какие они бывают?

Простыми словами, интерфейс — это способ взаимодействия человека с компьютером или устройством, который решает задачи передачи команд устройств и информирование пользователя о состоянии устройства. Интерфейсы бывают следующих видов:

  • текстовый — старая добрая командная строка. Хочешь включить свет? Напиши команду!
  • графический — это то, к чему мы привыкли. Красивая картинка с кнопочками и слайдерами.
  • голосовой — команду нужно произнести вслух. Чтобы узнать состояние устройства, нужно спросить и прослушать ответ.
  • жестовый — любые действия активируются жестом. Надо включить свет? Махни рукой. Обратная связь не предусмотрена. Концепция есть, реализации нет.
  • нейроинтерфейс — светлое будущее. Общение с устройствами происходит с помощью перекодирования мыслей пользователя в команды. Обратная связь работает также. Попытки реализации есть, но больше в качестве экспериментов.

 

Что мы получаем от графического интерфейса?

Мы все принимаем графический интерфейс как нечто традиционное и свыклись с его недостатками.

Давайте вспомним о них, чтобы понять, как голосовое управление облегчает жизнь:

1. Обязательное наличие панели управления в зоне досягаемости

Использование графического интерфейса подразумевает наличие панели управления. Вы скажете, что сейчас у каждого есть собственный смартфон, который может выступать как панель управления, и будете правы, но в этом случае для того, чтобы выставить температуру в комнате вам потребуется достать смартфон, разблокировать его, найти приложение для управления, дождаться, когда оно запустится, найти виджет управления кондиционером и выставить нужную температуру. Согласитесь, что такой подход крайне неудобен для пользователей, и для решения этой задачи, интегратор устанавливает стационарную панель управления в каждую комнату, что приводит к большому удорожанию проекта. К тому же остается необходимость подойти к панели управления, что является крайне неудобным.

2. Обязательное наличие свободной руки

Графический интерфейс подразумевает, что пользователь будет с ним взаимодействовать через нажатие. И вот тут кроется проблема “А что если заняты руки?” Ответа тут нет…

3. Необходимость изучения

Новый графический интерфейс — это как новое приложение. Его надо изучать и запоминать расположение функциональных элементов, особенности навигации и прочие особенности интерфейса.

4. Дополнительные затраты на разработку

Помимо покупки панелей управление, придется потратится на разработку дизайна и разработку самого интерфейса

 

Когда голосовое управление удобно? Кейсы использования.

Голосовое управление необходимо в тех случаях, когда затруднен доступ к графическому интерфейсу, а именно:

  1. Нет необходимости подходить к панели. Если у пользователя большая комната, то удобнее отдать команду голосом, чем идти к панели в другой конец комнаты.
  2. Занятые руки — больше не проблема. Приходя домой, у пользователя могут быть заняты руки пакетами с покупками или маленьким ребенком и управление с графического интерфейса будет неуместным. Голосовое управление не требует наличия свободных рук.
  3. Упрощенная работа с устройствами. Если дом пользователя насчитывает более 5 комнат, то для утреннего приготовления кофе придется покопаться в графическом интерфейсе, открыть комнату управления устройствами на кухне, найти виджет кофе-машины, нажать на кнопку приготовления кофе. При использовании голосового управления, проснувшись утром, пользователь может, не вставая с кровати, отдать голосом команду на приготовление кофе.
  4. Вау эффект. Голосовое управление не является распространенным явлением и оно будет оценено гостями.

 

Концепция голосового управления

Итак, для реализации голосового управления нужно устройство, которое будет “слушать” команды пользователя. Тут есть 2 варианта:

  1. Колонка — устройство, специально разработанное, для голосового управления. Оснащено множеством чувствительным микрофонов и целиков заточено под голосовое управление.
  2. Планшет — каждый планшет имеет микрофон и встроенного голосового ассистента. Это значит, что с помощью планшета можно реализовать комбинированный интерфейс. В комнате будет установлен планшет с графическим интерфейсом, и одновременно пользователь сможет отдать голосовую команду.

Проектирование системы голосового управления довольно просто. В каждую комнату ставим по колонке или планшету. Если выбрали колонку, то лучше ее располагать ближе к центру комнаты. Если планшет, то вешаем на стену, поближе к предполагаемому месту отдачи команды.

Определившись со стратегией проектирования, осталось только выбрать голосового ассистента, и в этом нам поможет обзор наиболее популярных голосовых ассистентов в следующей главе.

Как работает голосовое управление?

  1. Колонка или планшет воспринимают речь. При произношении кодового слова (Алиса, Сири, Алекса, ОК Google) — начинается запись речи.
  2. После паузы в речи, эта звукозапись отправляется в облако.
  3. В облаке нейросеть преобразует запись в текст.
  4. Текст отправляется в словарь.
  5. Например мы сказали “Сири, включи свет”
  6. В словаре ищутся совпадения.
  7. Если совпадения найдены, то определяется, к какой группе они относятся.
  8. В нашем случае Сири понимает, что команда относится к группе устройств “Лампы”.

 

Какие группы есть относительно умного дома:

  • лампы
  • переключатели
  • розетки
  • термостаты
  • окна
  • вентиляторы
  • шторы
  • кондиционеры
  • увлажнители
  • очистители воздуха
  • сенсоры
  • системы безопасности
  • замки
  • двери
  • моторы

Рассмотрим на примере «включи свет»

Давайте рассмотрим работу голосовых ассистентов на примере включения света. Рассмотрим нюансы настройки ассистента и форматы команд, для выполнения устройствами.

 

Apple HomeKit (Siri)

Устройства могут быть объединены в комнаты (группы), что позволяет управлять как каждым устройством индивидуально, так и группой устройств в комнате. Более того, каждое устройство имеет свой собственный тип. Чтобы выключить весь свет в комнате, надо сказать фразу “Привет, Сири, выключи свет в кухне”. В этом случае Сири найдет все устройства в группе с названием “кухня”, выделит из них все устройства с типом “свет” и отправит на них команду выключения.

Сири имеет собственный словарь звуковых команд. Это значит, что вы можете сказать “Привет, Сири, выключи свет на кухне”, “Привет, Сири, свет в кухне выключи”, “Привет, Сири, погаси весь свет на кухне” и Сири поймет, что вы имеете в виду и выключит свет.

Также, комнаты могут быть объединены в зоны. Например, можно создать зону “первый этаж”, добавить в эту зону все комнаты с первого этажа и отдавать команду “Привет, Сири, выключи свет на первом этаже”. В этом случае Сири выделит комнаты в указанной зоне, в них найдет устройства с типом “свет” и выключит их.

Есть и неоднозначные приемы. Например, в вашей комнате есть верхний свет и есть светильники. Вам нужно включить только светильники, как же об этом сказать ассистенту? Для выполнения этой задачи, вам понадобится дать всем светильникам одинаковые имена “светильник” и дать голосовую команду “Привет, Сири, включи светильники в кухне” и тогда ассистент включит только те лампы, которые имеют имя “светильник”.

Комнаты объединяются в дом. Если вам нужно выключить весь свет в доме, то стоит просто сказать “Привет, Сири, выключи весь свет” и ассистент выключит все устройства с типом “свет” во всем доме. Если же у вас несколько домов, то надо указать в каком именно доме свет должен быть выключен: “Привет, Сири, выключи свет на даче”

 

Google Home

 

Хоть Google Home и не поддерживает русский язык, мы все равно рассмотрим принципы работы с ним, потому что это решение функционирует каждый день и поддержка русского языка рано или поздно появится.

При подключении устройства к системе, пользователь должен установить имя устройства и задать комнату, в которой устройство работает. Далее, пользователь может или отдать прямую команду устройству, указав его имя, например “Окей, гугл, включи свет на кухне”, либо обратится к комнате “Окей, гугл, выключи свет на кухне”. Также, гугл хоум знает типы устройств и при получении команды “выключи весь свет”, выключит все устройства с типом “свет”. Гугл хоум не умеет объединять устройства в зоны и не знает о существовании нескольких домов. Для расширения возможностей пользователь может настраивать сценарии и включать\выключать их голосовыми командами. Например, “Окей, гугл, активируй сценарий вечеринка”, включит сценарий, в котором заданы настройки цвета RGB-ламп.

 

Amazon alexa

 

Напомню, что Алекса тоже не знает русский язык, но все равно ее стоит рассмотреть.

При подключении устройства к системе, пользователь должен подключить “навык”. Навыки — это подпрограммы, которые говорят Алексе, куда перенаправить сообщение пользователя. Например, если в умном доме используется система iRidium, то интегратору потребуется установить навык “iRidium” в свою колонку amazon echo. В этом навыке прописаны команды, которые следует перенаправлять в облако iRidium для дальнейшей обработки. Когда пользователь произносит команду “Алекса, включи свет”, Алекса определяет, что эта команда относится к навыку “iRidium”, превращает команду пользователя в набор параметров, в которых отражается, что нужно сделать и с каким устройством, после чего этот набор параметров попадает в навык и перенаправляется в облако “iRidium”, которое обработает их и выполнит.

Алекса знает названия устройств, их типы и позволяет объединять устройства в группы. Соответственно, для управления устройствами нужно либо четко указать название устройства (Алекса, выключи лампу 1), либо указать группу устройств (Алекса, выключи свет в кухне), либо тип устройств (Алекса, выключи весь свет)

 

Яндекс.Алиса

 

Считаю Алису самым неоднозначным ассистентом. Она понимает русский язык, у нее очень хороший словарь фраз, и среду русскоговорящих ассистентов она лучше всех понимает пользователя. Однако, дьявол кроется в деталях.

  1. Она не имеет автоматического вызова с панели управления. То есть, на панели управления надо запустить приложение яндекса и оно должно всегда работать. Только в этом случае можно привлечь внимание Алисы голосом. Либо использовать станцию.
  2. Для работы со сторонними системами (например системой автоматизации), у Алисы есть навыки (как у Алексы). Однако, чтобы пользоваться навыком надо его активировать. Не получится просто сказать “Алиса, включи свет”. Нужно сначала сказать “Алиса, запусти навык iRidium” и только после активации навыка можно включать свет. Может быть только один активный навык в единицу времени. Это означает, что для получения прогноза погоды потребуется сначала выйти из навыка системы автоматизации и только потом запрашивать прогноз погоды.
  3. Алиса ничего не знает о умных устройствах и не знает как ими управлять. Процесс настроен так:
    – запускается навык системы автоматизации,
    – Алиса переводит речь пользователя в текст и передает в навык,
    – навык пересылает текст команды серверу.

Что делать с командой дальше решает сервер. Это означает, что интегратор должен сам составить словарь фраз, которые будут работать для объекта автоматизации. Если вы хотите поддерживать фразы “включи свет”, “свет включи”, “погаси свет” и т.д., то вам надо самостоятельно описать набор всех возможных фраз и указать, что должно произойти при получении команды. За группировку устройств в комнаты, зоны, этажи, дома, тоже отвечает интегратор и должен проделать эту работу самостоятельно и описать набор фраз для управления всеми зонами в доме.

В итоге, Алиса не является коробочным решением. Ее нужно настраивать и кастомизировать самостоятельно. Однако, такие сложности подразумевают потенциально большие возможности, чем у других голосовых ассистентов, ведь имея такой потенциал кастомизации, интегратор может реализовать буквально любые запросы клиента при работе с голосовым управлением

 

Что мешает стать голосовому управлению единственным интерфейсом?

Голосовое управление только зарождается и имеет ряд недостатков, которые не позволяют стать единственным интерфейсом. К ним относятся:

  • Необходимость быть услышанным. Если в комнате шумно (например, громко играет музыка), то придется кричать голосовую команду, чтобы быть услышанным.
  • Привязанность к устройству. Голосовое управление позволяет управлять устройствами находясь в удалении от панели, но все-таки нужно быть в зоне досягаемость микрофонов.
  • Привязка к интернету. Если графический интерфейс может работать офлайн, то голосовому управлению жизненно необходим доступ к интернету. Убрав интернет, голосовое управление становится бесполезным
  • Необходимость запроса. Графический интерфейс всегда показывает текущий статус устройств, достаточно просто посмотреть на панель, чтобы узнать текущую температуру в комнате. При использовании голосового управления нужно постоянно просить ассистента сказать текущую температуру.
  • Нужно помнить название комнаты или группы устройств. Голосовое управление позволяет управлять устройствами, объединенными в группы. Например, можно выключить свет в группе «кухня». В сценарии обязательным требованием является указать название группы, которым обычно выступает название комнаты. Если комнат много, то помнить уникальное название каждой является неудобным условием, а управлять устройствами в зависимости от местонахождения пользователя ассистенты пока не научились.

 

Заключение

Голосовые ассистенты — это будущее интерфейсов управления умным домом. Да, сейчас они только начинают набирать силу, но на них уже стоит обратить внимание и начать предлагать пользователям как хорошее дополнение графического интерфейса.

 

Главный минус сейчас это:

– Проблемы с восприятием команд. Не всегда понимают и слышат.

– Непонимание контекста, я не могу сказать включи свет, находясь в какой-то конкретной комнате, я должен сказать “включи свет на кухне” (при этом такая команда должна быть заранее запрограммирована). Если я скажу “на кухне включи свет”, то буду понят только Siri. (остальным такую фразу надо настроить). В итоге мне придется помнить, какие команды для какой комнаты я настроил. Это неудобно в использовании (особенно, если комнат много). Есть понимание общения с тупым роботом, а не интеллектуальным устройством.

В итоге, на мой взгляд, наиболее удобный способ использования голосового ассистента — это вызов заранее настроенных сценариев.

Например:

“Сири, я ушел” (включится сценарий “я ушел”, климат переведется в эко-режим, свет выключится, поставится охрана и т.д.)

“Сири, включи просмотр кино”  (включится сценарий “просмотр кино” — закроются шторы, включится нижняя подсветка, включится телевизор и т.д.)

“Сири, я лег спать” (включится сценарий “я лег спать”)

“Сири, я читаю книжку” (включится соответствующая сцена света)

 

Вышеописанные варианты возможны для любого ассистента.

Надеяться на непринужденное общение и управление умным домом через ассистента пока не стоит. Только заранее настроенные команды и сценарии.

По мере развития технологии проблемы будут решаться. И в горизонте 3-5 лет эти вопросы будут решены.

 

Сравнение голосовых ассистентов

 

Прямо сейчас вы можете получить бесплатную, тестовую версию нашей программы для управления умным домом с помощью голосового помощника. И использовать это решение в своем шоуруме для демонстрации клиентам..

Чтобы это сделать, а также узнать стоимость и скидки для инсталляторов пройдите регистрацию.