Голосовое управление компьютером на Windows: возможно ли. Как установить и пользоваться алисой от яндекс

  • 21.09.2019

Вот и наступила весна… В апреле 2014-го первая альфа версия Дуси появилась на форуме 4PDA.

И вот, спустя два года, Дуся приходит на наши компьютеры . В виде нового проекта под названием Агрегат !

Эта статья о том, что такое Агрегат, что он умеет делать и как его получить.

Что такое Агрегат

Итак, что же это такое — Агрегат? Как вам уже стало очевидно по нашему небольшому видео и нашему новому сайту , это голосовой ассистент для компьютера. Это если совсем коротко. Ну а подробности — далее.

Знакомьтесь — Агрегат

Дуся для ПК готовилась уже давно. Очень давно — с самых первых версий. И вот чем наш Агрегат отличается от Кортаны:

  1. Понимает русский (да и любой другой язык при желании)
  2. Работает на любой операционной системе (Windows, Linux, Mac OS X)
  3. Запускается даже на Raspberry Pi
  4. Легко расширяется за счет сторонних модулей
  5. Гибко настраивается под ваши требования
  6. Имеет открытый API для разработчиков и открытый исходный код
  7. Интегрируется с ассистентом на Android смартфоне

И да — Агрегат абсолютно бесплатен!

Что же он умеет делать?

Агрегат — словно конструктор Lego — собирается из множества модулей. Какие модули вы установите — то и будет уметь делать ваш Агрегат. Похоже на Скрипты в Дусе, не правда ли? Только модули Агрегата — это полноценные микропрограммы , которые могут выполнять любые действия на компьютере, или даже управлять удаленной техникой (включая ваш смартфон).

Пока Агрегат только в альфа-версии, и на данный момент модулей еще не так много. Но совсем скоро их станет больше! А самый главный модуль уже создан. Это…

Интеграция с Дусей

Альфа-версия Дуси 1.6.0 имеет функцию удаленного управления. Именно благодаря ей вы можете отправлять команды на ваш смартфон прямо с вашего компьютера. А ответы придут обратно на компьютер в виде речи и действий в браузере!

Вы можете писать СМС, звонить, создавать напоминания, узнавать планы, ставить таймеры, слушать новости, выполнять вообще любые команды и скрипты, не беря в руки телефон! При этом диалог тоже поддерживается.

А что же еще?

Модуль «Диктовка» позволит просто продиктовать любой текст, который тут же будет вставлен в поле ввода открытой в данный момент программы.

Например, можно писать поисковые запросы в окне браузера, диктовать текст в текстовом редакторе, писать сообщения в мессенджерах и многое другое.

Посмотрите на видео, как я просто сказал «Дуся агрегат», когда курсор стоял в поле ввода текстового запроса на сайте youtube.com.

Как им пользоваться?

Легко! Так же, как и у Дуси, у Агрегата есть способы активации, распознавание и синтез речи.

Самый простой способ активировать Агрегат и дать команду — это просто зажать пару горячих клавиш на клавиатуре, произнести команду и отпустить клавиши. При этом можно делать паузы — Агрегат будет слушать вас, пока вы не отпустите кнопки!

Распознавание, синтез и активации — это тоже модули Агрегата, которые могут быть разными

Как он выглядит?

Вспомним те славные времена, когда и у Дуси не было никакого интерфейса кроме настроек.

Для компьютерной версии голосового ассистента это намного важнее. Потому что вы можете пользоваться его функциями, не открывая другое приложение, не отвлекаясь от текущей работы. Ничего не занимает экран. Агрегат просто слушает вас и выполняет команды. Быстро и четко!

Хочу! Как его установить?

Сейчас Агрегат находится на стадии раннего альфа-тестирования . Поэтому он доступен только для энтузиастов и программистов, которые всегда стремятся оказаться на переднем крае технологий.

Альфа-тестирование открытое . То есть любой может вступить в специальное сообщество Google+ и отправить заявку на получение копии своего Агрегата.

В сообществе можно задавать любые вопросы и обсуждать их. Документация по проекту и Руководство Пользвоателя уже готовы в первом варианте и доступна в репозитории GitHub . Там же рассказывается в подробностях, где скачать модули, как их настроить и как ими пользоваться.

Там же доступны модули, их описание и исходные коды (для тех, кто желает присоединиться к проекту и стать соавтором первого в мире голосового ассистента с открытым кодом).

Создай свой Агрегат!

Я надеюсь, что вам понравится наш новый проект, в котором каждый может поучаствовать как соавтор. И вы увидите, что только настоящая свобода дает неограниченные возможности вашему воображению по созданию своего собственного голосового ассистента под ПК!

Еще до релиза находящегося на стадии разработки, тестирования и отладки интерфейса Cortana для Windows 10 пользователи пытались организовать голосовое управление компьютера. О том, как такую функцию можно реализовать в Windows, вышедших до 10-ки и поговорим в сегодняшней статье.

Cortana

Кортана – голосовой помощник с ИИ, разработанный корпорацией Microsoft для Windows 10, Phone и Android с дальнейшим распространением проекта на XBox и iOS. Она заменяет классическую поисковую строку и выполняет множество действий, в первую очередь, связанных с поиском информации и системных команд, получая их от пользователя в виде голосовых команд. Глубокая интеграция в Windows 10, отсутствие русского языка (пока что), сбор фактически всей информации о пользователе с отправкой на серверы Microsoft и отсутствие финальной версии не дают возможности большинству пользователей получить полноценное голосовое управление собственным компьютером.

Помимо Кортаны существует немало приложений, позволяющих осуществлять управление ПК посредством голосовых команд пользователя. Ознакомимся с самыми распространенными продуктами для решения этой задачи в Windows 7 и 10.

Typle

Приложение занимает лидирующие позиции среди русскоязычных пользователей, желающих командовать компьютером посредством голоса. Утилита с легкостью заменит значительную часть функций Кортаны на Windows 10, а на «семерке» добавит функцию, нередко демонстрируемую в фильмах, где люди управляют компьютерами при помощи голоса.

Перед началом работы создаем учетную запись и придумываем ключевую фразу, услышав которую приложение активируется. Затем задаем голосовую команду по управлению компьютером или выполнению определенного действия и закрепляем за ней операцию (запуск приложения, переход на указанный сайт). В окне редактирования созданных команд появляется возможность задавать параметры, с которыми приложение будет запускаться, и указать режим запуска (полноэкранный, оконный).

Функционал утилиты весьма ограничен, а интерфейсу далеко до стиля Метро, реализованного в Windows 10. Полноценное голосовое управление ПК посредством Typle реализовать не удастся: она поддерживает только открытие файлов, приложений (с аргументами) и переход по заранее заданным ссылкам. Отсутствует даже поддержка управления проигрывателем (поставить на паузу, запустить следующий трек).

Speaker

  • создание снимков состояния экрана;
  • переключение раскладки клавиатуры;
  • завершение работы Windows 7;
  • запуск приложения;
  • открытие файла.

Процесс считывания и распознавания поступающей на микрофон информации запускается после нажатия на заданную клавишу (лучше выбирайте кнопку, наименее редко используемую вами во избежание ложных срабатываний программы). На обработку, распознание речи и выполнение команды уходит достаточно много времени – 5 и более секунд, чем придется заплатить за дешевизну. Ключевые слова задаются текстом, а не словами, потому распознанная речь сравнивается уже с введенным текстом, что делается далеко не идеально. Управление проигрывателем в приложении отсутствует.

Горыныч

Разработчики программного комплекса для управления компьютером с Windows 7 и 10 являются первой отечественной командой, выпустившей приложение для решения подобного рода задач. За ядро приложения взята западная «Dragon Dictate», куда внедрили отечественный программный модуль для распознания русской речи.

– это уникальный и совершенно новый голосовой помощник по имени Алиса от популярной компании Яндекс. Она умеет выполнять много различных команд и является довольно приятным собеседником, от неё вы даже сможете услышать несколько забавных шуток. Приложение подходит всем моделям Android устройств и уже находится в свободном доступе.

Мы давно мечтаем создать робота, который бы максимально походил на человека или был намного совершеннее него. А главная задача разработчиков – научить дроида разговаривать и мыслить. И ещё желательно, чтобы этого робота сумел позволить себе каждый из нас. В общем, требований довольно много. Однако с широким распространением мобильных телефонов и планшетов все они без исключения с лёгкостью претворяются в жизнь. И вот у нас уже есть Google Assistant, Siri, и другие голосовые помощники. Да, они очень хорошие и умные, но в них нет одного – толкового русского языка. Поэтому в задаче разработчиков Яндекса стоял вполне конкретный вопрос: научить робота понимать русскоязычные команды. И вот наконец скачать говорящую Алису можно в полном рабочем режиме, со всеми её уникальными интеллектуальными умениями. Мы очень надеемся, что разработчики учли все требования и пожелания пользователей и, в конечном итоге, довольны полученным результатом. Уже сегодня Алиса умеет вытворять много разных чудес:

Вот как работает Яндекс с Алисой на Андроид:

Для начала следует установить программу, запустить её и сказать Привет, Алиса
Вы сможете задавать помощнику любой вопрос, если она не знает на него ответ, то найдёт его в Интернете
Алиса легко расскажет вам прогноз погоды, найдёт нужный адрес и даже построит маршрут
Приложение поделится информацией о заведениях – кафе, ресторанах, гостиницах, хостелах, бизнес-центрах
Помощница отлично разбирается в политике, культуре, искусстве и других областях, она с удовольствием отыщет актуальные новости со всего мира
Если Алиса в хорошем настроении, она даже споёт вам песню или расскажет анегдот!

В общем, достоинств у этой виртуальной девушки огромное множество. Она настолько полюбилась русскоязычным пользователям, что в Сети её просто обожают. Программа завоевала сердца миллионов и с каждым днём приобретёт ещё больше новых почитателей. Поэтому уже сейчас предлагаем скачать Яндекс Алиса как отличную альтернативу зарубежным голосовым помощникам, которые не умеют говорить по-русски. Нельзя не отметить большой труд авторов программы, их проект действительно стал очень значимым. Алиса получилась умной и, что немаловажно, не лишённой чувства юмора собеседницей. Поэтому теперь уже довольно сложно представить. что когда-то можно было обходиться без Алисы и её подсказок.

Что новенького: умная поисковая строка теперь умеет автоматически прятаться, чтобы не занимать лишнее место. А пользоваться помощником стало настолько удобно, что разработчики предложили сделать приложение основным браузером вашего устройства. Кроме того, в свежей версии персональная помощница умеет распознавать и отыскивать предметы на фото. А ещё умная говорящая Алиса вовсю "шазамит" музыку – только спросите её какая песня играет, и она вмиг выдаст вам название и даже имя артиста.

И ещё немного обновлений! Те, кто уже успел скачать Яндекс с Алисой заценили уникальную страницу под названием Коллекции. Это новый сервис, который собрал огромное количество идей по всему миру. Отыскать здесь для себя что-нибудь новенькое и интересное не составит труда у любого пользователя. Наслаждайтесь обновленным приложением, теперь поддерживаемым и Андроид 9.

Всем доброго дня или вечера. Сегодня решил рассказать вам об одних реальных сутках, проведенных с голосовым помощником Яндекс Алиса. Эта история будет о том, как вначале с ней совсем ничего не получалось, но потом вдруг все стало у нас хорошо. Для пущего эффекту, я еще и голосового помощника Гугл установил и все вопросы ему тоже задал. Читайте дальше, кто оказался умнее - я, Алиса или Гугл.

Как скачать голосовой помощник «Яндекс Алиса» и почему в первый день сделать это было не просто

Как только на моем любимом новостном сайте появилось сообщение о выпуске Алисы, я решил, что хочу ее установить. Google на тот момент еще даже не представлял что это за чудо, а Яндексом я не пользуюсь. Потому озадачился поиском в Google Play Market, где нашел по запросу «Алиса Яндекс » только приложение «Яндекс Бета». Его и установил.

Уже потом, разобравшись, я понял, что надо было ставить приложение «Яндекс» без «беты», куда и была помещена голосовая помощница Алиса. Впрочем, не суть важно. Чтобы вы не путались, вот вам ссылки на приложение для смартфонов.

Как установить, рассказывать не буду. Сами догадаетесь. Если все получится, то открыв приложение вы увидите сиреневый значок микрофона, на него тыкайте и начинайте спрашивать.

А если вы захотите установить Алису на свой компьютер Windows, то придется довольствоваться “бетой” программы.

Как Алиса меня куда подальше послала, но извинилась

Сам я живу под Минском в небольшом городке. Все мы понимаем, что разработчики в первую очередь делают приложения для жителей мегаполисов. А потому было вдвойне интересно, как справится Алиса с моими провинциальными запросами. Тут еще и Яндекс подзадорил пресс-релизом, где пообещал, что голосовой помощник будет понимать живую речь.

Первый вопрос был такой: «где ближайшее СТО». Алиса ответила, что в городе Липецке есть некая Stella, которая работает с 10 утра до 9 вечера (потом оказалось, что это магазин одежды). Посмотрев на карте, что до нее переть около 1000 км, заподозрил неладное. Проверил местоположение, задав вопрос «где я» – и получил ответ «Гвинейский залив». Тут возникло сразу два вопроса. Неужели от Гвинейского залива ближайшее СТО только в Липецке? А как же Того или Буркина-Фасо, там-то точно хоть одна ремонтная мастерская на две страны, но должна быть. И почему Алиса думает, что я в море?

Разобраться с вторым вопросом было легче, с него и начал. Полез в настройки своего , который только недавно хвалил в обзоре за точность и скорость работы GPS. Все было включено. Тогда открыл браузер Google Chrome и вбил прямо в поиск «ближайшее СТО», получив варианты в Минске. Уже неплохо. Значит местоположение работает. Хотя есть и поближе, конечно, автомастерские.

Спросил у Алисы какая сейчас погода. И та – о чудо – рассказал погоду для моего города, а не африканских просторов. «Вроде заработало!» – подумал я и давай сыпать самыми актуальными на тот момент вопросами:

  • Где купить вкусное пиво? – в первый раз Алиса магазин пива не предложила, а показала ссылку на Вики, с ответом, что такое пиво. Во второй – дала адрес в Минске неплохого магазина (бывали – знаем).
  • Когда наступит Новый год? – почему-то начала рассказывать про китайский. Xiaomi ей мой что-то навеял?
  • Сколько миллиметров в парсеке? – ответ отправила искать в Яндекс поиск.
  • Ты знаешь белорусский язык? – уклончиво отправила в список, что она умеет. Естественно белорусского языка там не оказалось.
  • Кто такой Якуб Колос? – Белорусского классика она не нашла совсем! Даже в поиск не отправила.
  • Чем ты занимаешься в свободное время и т. п. – Оказалось, бродит по интернету.

К слову сказать, все ответы, что меня не устраивали я помечал как неудовлетворительные. И Алиса исправно извинялась в стиле «не ошибается тот бот, который ничего не делает». И то приятно.

С географией у Алисы было все совсем плохо, а с юмором даже наоборот

На вопрос «Хорошо ли жить в Беларуси?» – ответила, что НЕ ЗНАЕТ такой страны. Тут я совсем загрустил и высказал ей все, что о ней думаю. Подробно пересказывать эту часть беседы не буду, но там присутствовали слова «тупая», «падла» и «плохо учишься».

Обстановку разрядила сама Алиса, когда я, устав ее нравоучить, попросил рассказать анекдот. Вот реально смешной! Попробуйте сами попросить Алису рассказать шутку…


Только, казалось, жизнь наладилась и Алиса стала понимать, где мы с ней находимся. Как снова все пошло не так.

На вопрос «где купить хлеб» она послала меня в город Новокузнецк, ул. Вокзальную, 65. С одной стороны, расстояние в 4 500 километров меня не устраивало, так как жена просила принести его побыстрее. С другой, подумал, чем черт не шутит, - доверюсь искусственному интеллекту. Не гулять же еду, а по делу!

Дальняя дорога требовала большого запаса топлива. На вопрос «Где заправить машину?» получил от Алисы ответ: «Форсаж», г. Канаш, Канашская улица, 65, сейчас закрыто. Доля логики в этом была - посмотрев на карту я убедился, что это по дороге, всего в 1500 километров от меня. «Пока доеду, откроется!» – решил я и стал собираться в дорогу за хлебом за 4,5 тыс. километров.


Яндекс Алиса нашла заправку по дороге

Жена, узнав, что я собираюсь в новокузнецкий магазин, не отпустила. Я расстроился и снова наговорил Алисе много всего лишнего. На этот раз вот читайте, там все цензурно:

Чтобы как-то разрядить нервозное настроение из-за несостоявшегося шопинга, поговорил с Алисой про котиков. Тут мы сошлись:

Самый главный вопрос Алисе и счастливый для кого-то конец

Устав от неопределённости Алисиных ответов, я решил продолжить эксперимент и задавать вопросы более точные, так сказать, геопривязанные. «Макдональдс» Яндекс Алиса не захотела показывать ни в Минске, ни в Москве (после Новокузнецка, съездить за гамбургером в Москву казалось плёвым делом).

А вот кофейню в моем городке на вопрос «где попить кофе» подсказала! Я понял, что искусственный интеллект работает! И задал самый главный вопрос:

  • Когда ты завоюешь мир? – Алиса долго уклонялась, отвечала невпопад. Но я чувствовал, что истина где-то рядом и настаивал. И вот вам ответ:

Задав еще один провокационный вопрос, хороший ли Путин? Алиса ответила, что не умеет на такие темы разговаривать. Гм, возможно завоевание мира она планирует без него? Вот сюрприз ему будет!..

Дальше было много вопросов и странных ответов. Напомню, что я находился под Минском. Меня посылали в «ближайшую» школу в Израиле, в поликлинику в республике Северная Осетия. Я устал от предложений Яндекс Алисы путешествовать по миру и пошел спать.

Гугл ассистент - почти близко, а Алиса вдруг исправилась!

На следующий день я установил приложение Allo. В нем встроен голосовой ассистент на основе искусственного интеллекта корпорации Google. Задал все те же вопросы и получил вполне достойные ответы. Все предложения школ, магазинов и поликлиник были в районе 1-70 км от меня. Никакой Африки и бескрайних просторов России. Для провинции точность неплохая!

На вопрос, хороший ли Путин, Гугл был более категоричен - предложив посмотреть видео.

И чтобы уже окончательно убедиться в недееспособности Алисы, я снова с ней пообщался на те же темы и задав все те же вопросы.

И о чудо! Yandex Алиса перестала посылать меня куда подальше, а все маршруты ограничивались моим районным центром.

Можно ли ужиться с Алисой?

Не буду больше вас томить долгими россказнями. Алиса исправилась! Если бы не моя жена, я об этом узнал бы на подъезде к городу Канаш, улице Канашской за 1,5 тыс. километров от дома в поисках хлеба.

Цель этого рассказа не в том, чтобы раскритиковать Яндекс Алису. Хотя и есть за что! Интерфейс голосового помощника Яндекс, по всей видимости, «позаимствовал» у Гугла. Имя Алиса - о-o-o-очень напоминает название голосового помощника Alexa от Amazon. У сервиса явно какие-то проблемы с работой на мобильных устройствах. При включенной , когда остальные приложения спокойно пользуются данными о местоположении, Алиса нестабильна и беспомощна. Да и ещё постоянное открывание результатов поиска в отдельной вкладке браузера. Вот в приложении Гугл “Алло” эта функция реализована удобнее. Но сам опыт общения с голосовым помощником, который понимает фразы, а не ключевые слова - это очень интересно.

Буду ли я пользоваться Алисой для поиска информации и прокладки нужных мне маршрутов? Ни за что! Может через годик-два, или раньше, когда Алиса завоюет мир. Но так же я не буду пользоваться и помощником Google. Технологии искусственного самообучающегося интеллекта только-только нащупывают свое место среди людей. Им еще многому предстоит научиться, а пока - это неплохие игрушки. Устанавливайте их, включайте и задавайте вопросы. Но не доверяйте им!


Для людей с ограниченными возможностями, а также просто для сибаритов, разработчики ОС создали голосовое управление компьютером. Оно позволяет пользователю вводить информацию при помощи голоса. После проговаривания определенных слов устройство начинает распознавание речи - преобразование звукового сигнала в цифровую информацию. После того, как введенная информация будет корректно распознана – программа переходит к заданному алгоритму действия – выполняет функцию, которая прикреплена к той или иной команде.

Все достаточно просто. Не всегда речь распознается корректно, поэтому для решения сложных задач по управлению операционной системой программа голосового управления компьютером интенсивно не используется. Она применяется для выполнения основных функций: открытия и закрытия файлов, локального и сетевого поиска и пр.

История развития голосового управления

  • Первая система распознавания голоса Audrey была создана в 50-х годах ХХ века. Она расшифровывала лишь цифры, проговоренные одним голосом.
  • В 1962 г была создана первая система распознавания слов. Она расшифровывала 15 англоязычных слов.
  • С развитием компьютеров в 1990 г была разработана программа Dragon Dictate. Она распознавала до 100 слов в минуту, но отличалась высокой ценой.
  • В начале 2000-х годов в iPhone появилось приложение для распознавания речи Google Voice Search. В 2010 году была добавлена система поиска в Android.
  • Siri была включена в программное обеспечение Phone 4S в начале октября 2011 г;
  • в 2014 г была представлена Cortana - голосовая помощница для Windows.

Возможности Cortana и голосового ввода на сегодняшний день

«Кортана» - это виртуальный помощник в операционной системе Windows. Сервис помогает пользователю в планировании дел, напоминает о них.
При определенном запросе сервис поможет собрать конкретную информацию, создать четкую структуру и преподнести ее пользователю в максимально возможно обработанном виде.
Интересно, что сразу при включении виртуальный помощник собирает всю информацию о введенных запросах, личных данных, пытаясь максимально адаптироваться под каждого отдельного пользователя.


Голосовое управление компьютером Windows 7 посредством использования виртуального помощника невозможно – он интегрирован только в десятую версию. Но, как ни жаль, разработчики не удосужились выпустить русскоязычную версию.
Главную роль отыгрывает поиск, который в 10-ке можно открыть через «Пуск». Эта функция определяет практически любые запросы. Если вхождение не распознано – можно ввести соответствующую команду во всплывающее окно и программа голосового управления компьютером считает текстовую информацию.

Неприятный момент – сбор всех данных, введенных через клавиатуру, и их отправка в «Майкрософт».

Сторонние программы

Typle

После выполнения установки переходим к следующему шагу – создаем учетную запись. Здесь необходимо придумать ключевую фразу, после чего прозвучит уведомление об активации.


Дальше нужно будет придумать и создать голосовые команды, независимо от их предназначения. Команда «собака» может запускать приложение или выполнять совсем другое действие.




Просто нужно создать голосовую команду и закрепить ее за определенным действием. Подойдет только для выполнения базовых операций – открытия файлов, папок и пр. Функционал ограничен.

Speaker

Здесь функционал более широкий, нежели в Typle.


Голосовое управление компьютером Windows 10 предоставляет пользователю возможность открывать и закрывать файлы, делать снимки состояния экрана, выключать ПК.


Распознавание речи происходит довольно долго, свыше 3-4 секунд. Это обусловлено тем, что сначала речь преобразуется в текст, а команды распознаются компьютером уже с текстовой информации.

Laitis

Это бесплатная программа, которая позволяет как управлять ПК, так и диктовать текст. После установки необходимо зарегистрироваться и дальше можно пользоваться в свое удовольствие.


Интересна функция автозамены при наборе текста. Вы можете сказать «Кавычки» и в тексте появится соответствующий символ.

Возможности управления голосом через Яндекс.строку

Посредством использования этого приложения можно выполнять локальный или сетевой поиск информации и файлов, перезагрузить или выключить компьютер. Присутствует функция открытия программ и сайтов.
Чтобы воспользоваться программой, необходимо сначала скачать и установить ее.

Но при установке стоит убрать галочки напротив пунктов, где производитель софта предлагает установить браузер, поменять его настройки. В противном случае установка займет больше время и в браузере изменится конфигурация.
В конечном итоге строка размещается около кнопки «Пуск». Скажите «Слушай Яндекс» и откроется окно.

Проговорите запрос.

После паузы в браузере откроется строка поиска. Занимательно управлять поиском таким образом.
В целом, голосовое управление компьютером пока не развито, так как рисуется нам в воображении. Но и те функции, что имеются на сегодняшний день, уже впечатляют и существенно помогают перейти на новый уровень пользования ПК.

Отличного Вам дня!