Ход выполнения работы.
· Для выполнения работы выбрать современный язык программирования, например, Python, который, на мой взгляд, предоставляет прекрасные возможности для данной разработки (большое количество библиотек, гибкость, простой и понятный синтаксис и т. д).
· Создать распознавание речи и голосовое сопровождение помощника
· Создать распознавание голосовых команд с их последующим выполнением (например, открыть нужную программу, сказать точное время, рассказать шутку)
· Разработать распознавание лица пользователя
· Написать сайт- визитку для дальнейшего продвижения проекта
· Отладить возникающие и баги
Использованные ресурсы.
Для написания голосового помощника были использованы библиотеки для языка программирования Python: FuzzyWuzzy(для сравнения голосовых команд с существующей базой слов в ассистенте), pytts3(для того, чтобы Вова умел разговаривать), speech_recognition(для распознавания речи), datetime(для определения времени), cv2(для распознавания лиц), yandex-weather-api(для определения погоды).
Существующие аналоги:
Голосовой ассистент “Горыныч”. «Горыныч» – продукт отечественных разработок. Предназначен для ПК. Выполняет запросы пользователя, работает с программами и приложениями. Команды подают голосом или с помощью мыши и клавиатуры. Он выполняет такие команды, как: запускать установленные на компьютеры программы и приложения, искать информацию, создавать и преобразовывать текстовые файлы.
Проанализировав потребности пользователей, мы выявили, что некоторые функции из аналогичного ассистента “Горыныч” не пользуются особой популярностью среди потребителей.
Поэтому, было решено не добавлять в нашу разработку “Вова” функцию создания и преобразования текстовых файлов. Мы решили не останавливаться на достигнутом результате и продолжили реализовывать наши идеи. После доработки ассистента он может выполняет такие команды, как: распознавание лиц, развлечение пользователя путем рассказывания шуток и анекдотов, отображение точного времени и погоды.
«Алиса»: плюсы и минусы голосового помощника
* Можно выполнять поиск без помощи рук.
* Может поддерживать живой диалог
* В технологии выбора метода ответа на основе полученных данных применяются фильтры, исключающие дерзость и гнев, а также обсуждение нежелательных тем. «Алиса» говорит только по делу, а когда тема касается запретной зоны, плавно уходит от ответа.
Недостатки
-Алиса не всегда слышит, а если слышит не всегда понимает.
- не умеет делать два дела сразу
- нельзя настроить отдельно громкость будильника
- очень громкие напоминания
- не понимает контекст во время беседы
-использует ограниченное количество фраз
-система часто даёт сбой
Разработка голосового ассистента “Вова”.
Вова- это голосовой ассистент, написанный на высокоуровневом языке программирования Python.
Для разработки Вовы использовалась программа PyCharm, были установлены opensource библиотеки: FuzzyWuzzy, pytts3, speech_recognition, datetime, cv2 и yandex-weather-api.
На данный момент в нашей разработке реализованы функции распознавания речи, лица, открытия программ при помощи голосовых команд, рассказывание анекдотов, а также, выполнение базовых задач.
Голосовой ассистент пока что работает в консольном режиме, так как находится на раннем этапе разработки, но скоро планируется сделать UI, а также улучшить и добавить многие функции