Классификация речи по энергии в полосе частот




Энергия вокализованных звуков, как правило, выше энергии невокализованных звуков и пауз. Значение энергии можно определить так

, (4.1)

где x(n) - отсчет речевого сигнала; i1, i2 - границы кадра анализа; KE ‑ нормирующий множитель. KE=3.

Рис. 4.1 Слово "Четыре" диктор мужчина: а) осциллограмма исходного произнесения; б) функция энергии исходного произнесения; в) функция энергии исходного произнесения, прошедшего ФНЧ с частотой среза 1000Гц.

На рис. 4.1 представлены осциллограммы произнесения слова "Четыре", функции энергии исходного произнесения и функции энергии исходного произнесения, прошедшего через ФНЧ с частотой среза 1000Гц. Энергию вычисляли синхронно с ОТ. Марками 2‑5 показаны границы участков с разным источником возбуждения речевого тракта. Участок сигнала между марками 2‑3 соответствует шумовому звук "ч", участок сигнала между марками 3‑4 соответствует взрывной звук "т", участок 4‑5 соответствует вокализованным звукам "ыре". Стрелкой показана пауза, соответствующая смычке "т". Остальная часть звука "т" соответствует взрыву и имеет шумовое возбуждение.

Из рис. 4.1б видно, что звук "ч" имеет энергию, сравнимую с энергией вокализованных звуков. В данном случае затруднительно провести однозначное разделение звуков на тональные и нетональные.

На рис. 4.1в энергия звука "ч" в значительной степени подавлена фильтром нижних частот. В данном случае можно легко отделить шипящий звук "ч" от вокализованных звуков.

Для оценки возможности использования энергии сигнала в полосе частот, как признака Т/НТ необходимо знание распределений энергии для рассматриваемых классов в зависимости от частоты среза ФНЧ. На рисунке 4.2. показаны гистограммы распределения энергии звуков для полной полосы частот и для ограниченной полосы частот.

На рисунке 4.3 показан процесс выбора частоты среза ФНЧ для ограничения полосы частот обрабатываемого речевого сигнала. По рис. 4.3а видно, что сужение полосы пропускания ФНЧ до 300Гц приводит к медленному снижению вероятности ошибки классификации, а дальнейшее сужение полосы пропускания приводит к очень быстрому росту вероятности ошибки классификации. Т.о. частота среза ФНЧ установленного перед вычислением функции энергии должна гарантировать попадание хотя бы одной гармоники ОТ в поло су пропускания ФНЧ, т.е. должна быть не менее 300 Гц для исследуемых сигналов. При этом, из рис. 4.3б следует, что величина порога классификации практически не изменяется при частотах среза от 300 Гц, что говорит о том, что порог классификации по энергии в полосе частот слабо зависит от частоты среза ФНЧ.

 


5. Классификация речи по
частоте пересечения нулевого уровня

Частоту пересечений нулевого уровня сигналом можно определить как

, (5.1)

где t ‑ длительность интервала анализа; m ‑ количество переходов через нулевой уровень за время t.

Рис. 5.1 Частота пересечения нулевого уровня речевого сигнала: а) осциллограмма слова "четыре ", диктор мужчина; б) ЧПН сигнала, изображенного на рис. 5.1а.

На рис. 5.1 изображены осциллограмма изолированного слова "четыре" и соответствующий ей график ЧПН. Марки 3,4,5 и 6 установлены на границах интервалов вокализации. Частота пересечений нуля вокализованных звуков ниже частоты пересечений нуля невокализованных звуков.

Атал и Рабинер в работе [11] пришли к выводу, что большинство ошибок классификации появляются на границе между тональными и нетональными звуками. В работе [4], также говорится о том, что практически все методы классификации речи по признаку Т/НТ на стационарных интервалах тональных звуков работают с большей надежностью, чем на переходах между звуками, особенно тональными и нетональными. Из рис. 5.1б видно, что график признака ЧПН значительно изрезан, как на тональном, так и на нетональном участках. Изрезанность графика ЧПН говорит о том, что короткие интервалы анализа при синхронном с ОТ способе вычисления ЧПН недостаточно сглаживают значения ЧПН, единичные случайные пересечения нулевого уровня на коротких интервалах анализа могут значительно изменить значение ЧПН на данном интервале.

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-06-13 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: