Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Джеймс Л. Фланаган -> "Анализ, синтез и восприятие речи" -> 66

Анализ, синтез и восприятие речи - Джеймс Л. Фланаган

Джеймс Л. Фланаган Анализ, синтез и восприятие речи. Под редакцией Пирогова А.А. — М.: Связь, 1968. — 395 c.
Скачать (прямая ссылка): analizsintivocrech1968.djvu
Предыдущая << 1 .. 60 61 62 63 64 65 < 66 > 67 68 69 70 71 72 .. 149 >> Следующая


—Г—оо

OO

= j е~"1x1 9.(t,j) cos Cordt. (5.25)

-OO

Подставляя вместо ср(т, t) его значение из (5.15) и заменяя переменные, придем к

(5.26)

Поскольку jtc(t)dt= \h2(t)dt= 1, то 1F(Co, t)=-±- [|Я(со)|2 * Ф(со)]>

OO 2л

что соответствует результату, полученному в (5.24).

5.1.7. Измерение среднего спектра мощности речи

Имеются многочисленные данные по экспериментальным измерениям среднего спектра мощности речи (например, Сайвай-

184

устройства для анализа речи

ен, Данн и Уайт—Sivian, Dunn and White). В большинстве методов, по существу, используется устройство с полосовым

Рис. 5.14. Схема для измерения усредненного за длительное время спектра мощности сигнала

фильтром, показанное на рис. 5.4, дополненное квадратичным детектором и интегратором с большой постоянной времени (усреднителем). Такое устройство показано на рис. 5.14. Если переключатель Пер замкнуть в момент ?=0 и оставить замкнутым в течение T сек, накопленное емкостью напряжение приблизительно будет равно |F(co, t)\2 и может быть записано как

t 1

V6(T) = j>(co, l)-2-e~^iT~l)dl. (5.27)



Если /?С>7\ то экспонента в выражении (5.27) для 0<Х<Г мало отличается от единицы и

т

Ус(Г)^^-|а'2(со, X)dX«|F(©, t)\2. (5.28)

о

Описываемый выражением (5.28) способ измерения был использован в одном из исследований речевого спектра. В частотном диапазоне ниже 500 гц применялись полуоктавные полосовые фильтры, а выше 500 гц—октавные. Время интегрирования равнялось 1/8 сек (Данн и Уайт). Распределение абсолютной среднеквадратичной величины речевого давления в этих полосах, измеренное на расстоянии 30 см от рта диктора, непрерывно произносившего разговорный текст, показано на рис. 5.15. Результаты получены путем усреднения данных для шести мужчин. Отметками на левой оси ординат показано аналогичное распределение для нефильтрованной (речи.

СПЕКТРАЛЬНЫЙ АНАЛИЗ РЕЧИ

18S

Частота,гц

Рис. 5.15. Среднеквадратичная величина звукового давления, измеренная с интервалами длительностью в '/в сек на расстоянии 30 CAt от рта диктора. В качестве параметра выбрано процентное количество интервалов, имеющих уровни, которые превышают данное значение по ординате

-25

-30

-35

-НО

-45 в

-50

I

Если время интегрирования взять достаточно большим, скажем не менее минуты для связной речи (включая все естественные паузы между слогами и предложениями), либо если усреднить большое число измеренных кратковременных спектральных распределений, то получим спектр мощности, усредненный за длительный промежуток времени, в котором будут полностью сглажены все изменения, соизмеримые с длительностью слогов. Результаты измерений спектра мощности !речи Ф(со), усредненного за длительный промежуток времени, которые получены в предположении, что мощность речи в полосах

-70

-80















/

N V









(

















к-



























\
>





























\












.л__



























62,5 /25 250 500 1000 2000 WOO 8000 Частота, гц

Рис. 5.16. Усредненный за длительный промежуток времени спектр мощности слитной речи, ,измеренной иа расстоянии 30 см

от рта диктора: сплошная кривая—среднее для шести мужчин; пунктирная кривая—среднее для шести женщин

устройства для анализа речи

пропускания октавных и полуоктавных фильтров распределена равномерно, приведены на рис. 5.16. Здесь по оси ординат отложена среднеквадратичная величина звукового давления, приходящегося на 1 гц полосы частот. Усреднение позволило не показывать на рис. 5.15 и 5.16 подробную формантную структуру отдельных звуков.

5.2. Формантный анализ речи

5.2.1. О формантной структуре речи

Формантный анализ речи можно рассматривать как особый вид спектрального анализа. Задача состоит в определении комплексных частот формант речеобразующего механизма в процессе их изменения во времени. Эти изменения, очевидно, обусловлены перестройкой артикуляционных органов голосового тракта. Один из возможных подходов к такого рода анализу состоит в выяснении того, в каком виде проявляются в мгновенном спектре сигнала резонансные максимумы системы речевого тракта. В качестве предварительной иллюстрации на спектрограмме рис. 5.17 показаны в идеализированной форме траекто-

Рис. 5.17. Звуковая спектрограмма с нанесенными на нее идеализированными траекториями первых трех формант речи

рии временных изменений первых трех формант речи. Во многих случаях, в частности для систем компрессии речевого спектра, эти данные необходимо получать автоматически в реальном масштабе времени.

Из гл. III следует, что потери в голосовом тракте относительно постоянны, особенно в пределах частотного диапазона данной форманты, и могут быть вычислены заранее. Ввиду этого
Предыдущая << 1 .. 60 61 62 63 64 65 < 66 > 67 68 69 70 71 72 .. 149 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed