Наиболее распространенные системы синтеза (иностранные языки)




Наиболее распространенными системами синтеза речи на сего­дня, очевидно, являются системы, поставляемые в комплекте со зву­ковыми платами. Если ваш ком­пьютер оснащен какой-либо из них, существует значительная ве­роятность того, что на нем уста­новлена система синтеза речи - увы, не русской, а английской ре­чи, точнее, ее американского ва­рианта. К большинству оригиналь­ных звуковых плат Sound Blaster прилагается система Creative Text- Assist, а вместе со звуковыми кар­тами других производителей час­то поставляется программа Mono­logue компании FirsfByte.

TexAssist представляет собой реализацию формантного синте­затора по правилам и базируется на системе DECTalk, разработан­ной корпорацией Digital Equip­ment при участии известного аме­риканского фонетиста Денниса Клатта (к сожалению, рано ушед­шего из жизни). DECTalk до сих пор остается своего рода стандар­том качества для синтеза речи аме­риканского варианта английско­го. Компания Creative Technologies предлагает разработчикам использовать TextAssist в своих программах.

Поддерживаемые операционные системы - MS Windows и Windows 95; для Windows NT существует вер­сия системы DECTalk. изначально создававшейся для Digital Unix. Новая версия TextAsslst, объявлен­ная фирмой Associative Computing, Inc. и разработанная с использо­ванием технологий DECtalll и Cre­ative, является в то же время мно­гоязычной системой синтеза, поддерживая английский, немец­кий, испанский и французский языки. Это обеспечивается преж­де всего использованием соот­ветствующих лингвистических мо­дулей. разработчик которых- фирма Lemout & Hausple Speech Produсts признанный лидер в поддержке многоязычных рече­вых технологий. В новой версии будет встроенный редактор сло­варя, а также специализирован­ное устройство TextReader с кно­почным управлением работой синтезатора в разных режима), чтения текста.

Программа Monologue, пред­назначенная для озвучивания тек­ста, находящегося в буфере обме­на MS Windows, использует сис­тему ProVoice. ProVoice- ком­пилятивный синтезатор с исполь­зованием оптимального выбора режима компрессии речи и со­хранения пограничных участков между звуками, разновидность TD-PSOLA. Рассчитан на амери­канский и британский английский, немецкий, французский, латино­американскую разновидность ис­панского и итальянский языки. Ин­вентарь сегментов компиляции - смешанной размерности: сегмен­ты- фонемы или аллофоны. Компания FirstByte позициониру­ет систему ProVoice и программ­ные продукты, основанные на ней, как приложения с низким потреба пением процессорного времени. FirstByte также предлагает рассчитанную на мощные компьютеры систему артикуляторного синтеза PrimoVox для использования в приложениях телефонии. Для разработчиков: Monologue Win32 поддерживает спецификацию MicrosoftSAPI.

Синтезатор русской речи

В качестве примера рассмот­рим разработку «Говорящая мышь» клуба голосовых техноло­гий научного парка МГУ.

В основе речевого синтеза ле­жит идея совмещения методов конкатенации и синтеза по пра­вилам.Метод конкатенации при адекватном наборе базовых эле­ментов компиляции обеспечивает качественное воспроизведение спектральных характеристик ре­чевого сигнала, а набор правил - возможность формирования ес­тественного интонационно-про­содического оформления выска­зываний. Существуют и другие ме­тоды синтеза, может быть, в пер­спективе более гибкие, подающие пока менее естественное озвучи­вание текста. Это, прежде всего параметрический (формантный'' синтез речи по правилам или на основе компиляции, развиваемый для ряда языков зарубежными ис­следователями. Однако для реа­лизации этого метода необходи­мы статистически представитель­ные акустика-фонетические ба­зы данных и соответствующая компьютерная технология, кото­рые пока доступны не всем.

Инструментарий синтеза русской речи

Упоминавшийся выше инструмен­тарий синтеза русской речи по тексту позволяет читать вспух сме­шанные русско-английские тек­сты. Инструментарий представляет собой набор динамических библиотек (DLL), в который входят модули русского и английского синтеза, словарь ударений рус­ского языка, модуль правил про­изнесения английских слов. На вход инструментария подается слово или предложение, подле­жащее произнесению, с выхода поступает звуковой файл в фор­мате WAV или VOX, записываемый в память или на жесткий диск.

Что дальше?

А дальше... С одной стороны, нужно не забывать, что речь - эта все-таки одно из проявлений выс­шей нервной деятельности челове­ка, и потому вряд пи в ближайшие несколько лет стоит ожидать появ­ления систем распознавания речи по эффективности и удобству срав­нимых с секретарем-машинисткой, печатающей «со слов». С другой стороны, в мире технологий все ме­няется очень быстро, и не известие, что сложнее: расслышать непри­нужденно сказанную фразу или ра­зыграть красивый эндшпиль...

 

Думаю не будет секретом то, что любой находящийся в этой аудитории человек если он болен машиной, если он фанатик врятли воспринимает её как неодушевлённый предмет, как мебель. Скорее в кучку железа под таинственным названием компьютер мы вкладываем душу,вкладываем себя посредством непрерывного общения в прямом смысле этого слова. Лично я не раз замечала за собою безсознательные вещи: набивая текст, составляя программу,инсталируя приложения я регулярно бросаю компьютеру нелестные отзывы о ней же.Типа: Чего ты еще хочешь Захлопнись, или Ну и кретин же ты. Наивно пологая что когда нибудь она меня всё-таки услышит и на реплику: «Какой же ты балбес» ласково произнесет питание компьютера отключено, потеря всех не сохраненных данных. Именно по-этому темой своего реферата я выбрала близкую мне: Речевые технологии.Хотя я назвала бы ее более лирично: Узнай меня по голосу. В своем выступлении я хотела бы осветить не только проблемы и перспективы развития речевого интерфейса, но по рассуждать о том нужен ли он вообще и ой как не скоро окупят надежды потери времени и денег.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2020-03-31 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: