Голос – новый вид интерфейса, который скоро может стать вполне привычным и часто используемым. Бренды активно используют новые возможности и разрабатывают голосовой контент для Amazon Echo, Google Home и устройств Samsung. Что нужно учесть при создании голосового приложения, рассказывают специалисты Convince & Convert.
Хороший контент начинается с потребностей пользователя
Делать голосовое приложения исходя из стратегии «Все делают голосовой контент, давайте мы тоже!» – не самая лучшая идея. Вместо этого стоит тщательно подумать и изучить, как потребители взаимодействуют с брендом, что они в действительности хотят узнать у него и является ли голосовой контент подходящим средством для этого.
Например, функция «Ask Purina», реализованная компанией по производству корма для животных Purina для умной колонки Alexa, была создана исходя из потребности пользователей узнать, как ведут себя разные породы собак и какая из них больше подойдет в качестве первого питомца. Конечно, не обошлось без аудиорекламы корма для собак, но ее быстро убрали, т.к. она мешала восприятию информации.
Объединение голоса и чата
Самые эффективные голосовые приложения сегодня – это новости и информационные вопросы-ответы. Что касается функции «вопрос-ответ», как например, Ask Purina, упомянутая выше, взаимодействие с ней очень похоже на то, как люди используют чатботов. На самом деле, если это приложение перевести в чат-бота на сайте, Facebook Messenger или WhatsApp, проблем с его использованием не возникнет.
Компания KLM Airlines подошла к этому иначе – они взяли свое успешный и популярный чатбот и превратили его в голосовую функцию Alexa для устройств Amazon Echo. В итоге неважно, идете вы от голоса к чату, или от чата к голосу, правда в том, что многие такой информационный функционал будет одинаково хорошо работать и там, и там.
Объединение голоса и визуальной части
Интерфейсы, которые изначально были визуальными теперь дополняются голосом – к примеру, Siri в MacBook. И обратно, интерфейсы, которые изначально были только голосовыми (как Amazon Echo) теперь включают визуальную часть.
Такое объединение голоса и визуальной части приводит к следующему:
-
Усложняется разработка голосовых приложений.
-
Появляются дополнительные возможности. Например, приложение Purina было бы намного полезнее, если бы мы могли видеть изображения собак на экране умной колонки. К тому же мы гораздо быстрее выдаем информацию голосом, но при этом медленнее ее воспринимаем. Например, мы печатаем 40 слов в минуту, согласно исследованию Willowtree, а говорим 130. При этом мы можем прочитать 250 слов в минуту, а прослушать 130. Получается, нам удобнее задать запрос голосом, а результат прочитать.
Разница в форматах
На рынке есть несколько игроков (Amazon, Google, Apple, Samsung), которые предъявляют абсолютно разные подходы к разработке голосового контента. Единых стандартов нет, и разработка голосовых приложений похожа на процесс создания мобильного приложения и под iOS, и под Android одновременно.
Реклама и маркетинг
Только в США у Amazon Alexa есть более 60 тысяч приложений, и каждый день добавляются новые. При этом компания не торопится добавить в систему функционал, помогающий пользователям находить новые приложения, и пока поиск новых приложений больше похож на блуждания по огромной библиотеке. Поэтому если вы хотите, чтобы пользователи нашли и использовали ваш голосовой контент, это полностью ваша задача. Не стоит ждать помощи от Amazon и Google.
Намеренно ограниченная функциональность
Возможности голосовых приложений разнообразны, но вместо того, чтобы «засыпать» пользователя обилием команд и функций, лучше выбрать несколько основных, которые приложение выполняет лучше всего.
Возможность внутреннего использования
Есть интересные кейсы по внутреннему использованию голосовых приложений. Например, внутри приложения мы создаем группу с ограниченным доступом, и участники группы записывают короткий апдейт проекта, а потом это все соединяется в единый аудиофайл.
Этика на первом месте
По данным опроса читателей The New York Times, в отношении голосовых колонок и контента в целом есть предубеждение, что создатели намеренно заставляют голоса звучать так, будто они принадлежат исключительно людям со светлой кожей. А значит, там скрывается какой-то подтекст, что не может остаться незамеченным многими пользователями. В итоге KLM airlines записали голоса сотен своих сотрудников и сделали пользовательский многоголосый режим, чтобы звучать как можно более нейтрально.
Другие этические вопросы, которые волнуют разработчиков голосового контента:
-
Возможность колонки считывать тональность запроса пользователя и соответствующе отвечать.
-
Приватность пользовательской информации. 60% пользователей задумываются о безопасности своих данных и потенциальном доступе хакеров к информации через умные колонки.