4Sep

Персональные помощники открывают эпоху искусственного интеллекта дома

гoogle Home — новейший вариант виртуального помощника. голосовой динамик может помочь вам забронировать столик на ужин, напомнить о необходимости успеть на самолет, включить любимый плейлист и даже перевести слова на лету. Хотя ожидается, что голосовой интерфейс облегчит повседневные задачи, он также даст компании беспрецедентный доступ к человеческим моделям и предпочтениям, которые имеют решающее значение для следующего этапа искусственного интеллект.

Сравнивая ИИ-агент личному помощнику, как в последнее время поступает большинство компаний, — мощная метафора. Это показатель человеческих способностей, которые большинство крупных технологических компаний хотят перенять у своих бестелесных помощников. За последние пару лет, благодаря усовершенствованиям в технологии распознавания речи, Siri, Cortana и Google Now постепенно научились выйдите за рамки основных обновлений погоды и возьмите на себя более сложные обязанности, такие как управление календарем или ответы на ваши вопросы. запросы. Но продукты, которые вторгаются в наше личное пространство, например

Эхо Амазонки и Главная страница Google — указывают на более масштабный сдвиг во взаимодействии человека и устройства, который происходит в настоящее время.

Демонстрации на сцене Главная страница Google, в который встроен помощник компании, предполагает возможность общения, требующую глубокого понимания человеческих намерений и контекста. Устройство почти полностью опирается на технологию распознавания речи компании, которая разрабатывалась уже почти десять лет, с первых дней существования компании. ГУГ 411. Но с годами базовый поиск по телефонному справочнику превратился в гораздо более сложный Google Now.

Экосистема Amazon Echo использует виртуального помощника Alexa, который отвечает на голосовые команды.

Резкий скачок в возможностях Android-помощника произошел благодаря обучению нейронных сетей и методам глубокого обучения, которые позволили ученые должны усовершенствовать технологию распознавания речи до такой степени, что теперь она начинает изучать нюансы человеческого поведения через среду голоса.

Использование голоса для общения с внешним существом создает интимный и изначально человеческий опыт. «Речь — это наиболее доминирующий способ общения человечества друг с другом», — сказал по телефону Дэвид Нахаму, технический директор IBM Research. «Когда мы общаемся с внешним миром, мы говорим. Но снаружи внутрь мы гораздо лучше воспринимаем информацию визуально. Это из-за нашего наследия и эволюции, через которую мы прошли. С точки зрения эффективности речь — самый быстрый способ донести свою точку зрения».

«Голос меняет способ взаимодействия людей со своими системами». – Франсуаза Бофе, Google

Например, такие устройства, как Echo и Google Home, основаны на распознавании речи, которое может помочь вам оставаться на связи и без помощи рук, пока вы выполняете несколько задач по дому. Таким образом, вместо того, чтобы тратить время на перелистывание и набор текста, вы можете сказать личному помощнику, что вам нужно или что вы ищете. Именно такую ​​легкость и продуктивность компании предлагают пользователям, чтобы заставить их использовать чат-ботов и личных помощников в их повседневном общении, но общение с устройствами также открывает двери новому виду отношение.

«Я думаю, что голос меняет способ взаимодействия людей со своими системами», — говорит Франсуаза Бофейс, научный сотрудник, занимающийся распознаванием речи в Google. «В течение долгого времени, когда люди вводили в браузере информацию, они писали что-то загадочное, например, «высота Эйфелевой башни». Строка, казалось бы, случайных слов мгновенно вызывала результаты поиска на google.com с изображениями, деталями и размерами культового французского языка. состав. Но когда распознавание речи начало обретать форму с помощью помощников на смартфонах, говорит Бофейс, в общении произошли явные изменения.

«Когда люди начали чувствовать себя комфортно в речи, вместо того, чтобы быть загадочными, они начали говорить: «Эй, а какая высота Эйфелевой башни?» или «Какая высота Эйфелевой башни?», — говорит она. «Мы увидели этот сдвиг в том, как люди сначала обращались к своим устройствам в речи, а затем печатали. Использование голоса приводит к более дискурсивному типу взаимодействия, и хотя вы прекрасно знаете, что это машина, вы ведете себя с ней немного более человечно».

Кадр из фильма Ее (2013), режиссер Спайк Джонз.

Хотя словесный обмен мнениями с виртуальным помощником может облегчить выполнение задач, он также облегчает задачу. компании, чтобы получить бесценную информацию о человеческом мире, наполненную голосовыми подсказками о чувствах и предпочтения. «Мы идем от вычислений к пониманию», — говорит Джеймс Баррат, автор книги Наше последнее изобретение: искусственный интеллект и конец человеческой эры. «Мы не только болтаем. Эти машины слушают то, что нам нравится и не нравится, как мы говорим и о чем говорим. Это больший доступ к тому, как мы думаем».

В мире искусственного интеллекта данные — это валюта, которая отличает одну компанию от другой. С помощью голосового поиска, миллионы вокальных сэмплов станут доступны компаниям, которые настраивают личных помощников. Поток информации возвращается в систему для повышения точности алгоритмов, но также дает компаниям доступ к сложностям человеческих намерений. По сути, использование голоса для общения с помощником ИИ только делает его умнее.

Многое можно почерпнуть из голосового общения. Слова и интонации со временем начинают выдавать пользовательские шаблоны, предпочтения и даже эмоции. Такое понимание образа мышления пользователя имеет решающее значение для следующей волны персонализированного искусственного интеллекта, которая уже формируется в таких компаниях, как Google, Amazon и Facebook.

Умные, говорящие ИИ дома запустят экосистему Интернета вещей, превратив ее из новейших машин в предметы первой необходимости. Поскольку компании стремятся сделать своих помощников вездесущими, а машины более взаимозависимыми, для выполнения своей работы им необходимо распознавание речи.

«Существует параллельная тенденция», — говорит Влад Сейноха, технический директор компании Nuance Communications, одного из лидеров в области технологий распознавания голоса. «Вы будете взаимодействовать со своим умным холодильником или принтером более естественным образом, но также увидите портативного личного помощника, который живет в облаке и следует за вами. вы вокруг, чтобы помочь вам ориентироваться в сложном мире». Google Home, как и Echo от Amazon, уже имеет партнерские отношения, которые полезны во всем мире. дом. Вы можете использовать динамик для управления подсветкой Chromecast, Nest и Philips Hue.

Помимо навигации по реальному физическому миру, вездесущий помощник потенциально может стать воротами в незнакомые места или иностранные языки. в место В эфире во время мероприятия Google на этой неделе компания продемонстрировала, что Home имеет возможность использовать Google Translate для точного перевода с английского на испанский. Но сможет ли машина понять иностранные акценты и перевести обратное, еще предстоит выяснить.

«Эти машины слушают то, что нам нравится и не нравится, как мы говорим и о чем говорим. Это более широкий доступ к тому, как мы думаем», — Джеймс Баррат.

Неспособность понять разные акценты был одним из самые большие падения большинства цифровых помощников на смартфонах сегодня. Ученые, создающие эти системы, часто говорят об отсутствии данных как об одном из самых больших препятствий для понимания новых акцентов и языков. Огромные объемы информации, необходимые для того, чтобы сделать это возможным, требуют огромных инвестиций со стороны компаний. Внедрение технологии прямо в дома людей открывает постоянный поток данных, которые можно использовать для испытаний в исследовательских лабораториях.

Многие строительные блоки начинают становиться на свои места, чтобы такие устройства, как Google Home, стали эффективными личными помощниками. И хотя необходимо более внимательно следить за тем, как взаимодействие человека и устройства начинает меняться; большинство разработчиков голосовых интерфейсов считают, что это необходимое изменение, которое расширит человеческие возможности.

«Иметь ИИ, который является вашим агентом и помогает вам лучше существовать в мире, предоставляет вам более качественную информацию и услуги, — это очень интересно», — говорит Сейноха. «Как и во всем, что может быть негативным, мы все знакомы с данными о конфиденциальности и майнинге. Об этом нам следует задуматься, но выгоды от таких сценариев намного перевешивают».