Анализ, синтез и восприятие речи - Джеймс Л. Фланаган
Скачать (прямая ссылка):
174
УСТРОЙСТВА ДЛЯ АНАЛИЗА РЕЧИ
симости от ширины частотного диапазона и используемых технических приемов. В процессе анализа записанный образец воспроизводится несколько сотен раз. Скорость перемещения фильтра составляет обычно величину порядка , .... w ^^^^ш" 20 гц на один оборот маг-
г^а. ШНЯВ ННЯВ нитного диска.
Рисунок 5.9 позволяет і ¦¦¦¦ ,тщ1тЩШг~ установить, каким обра-
—/ '^1*^ зом на спектрограмме,
изготовленной с использованием широкополосного фильтра, проявляются резонансные области голосового тракта или форманты для (различных положений артикуляционного аппарата. Для четырех гласных звуков /і, а, ээ,,и/ приведены диаграммы положений артикуляторных органов и соответствующие им спектрограммы, полученные с помощью фильтра с полосой пропускания 300 гц. Темные полосы обозначают участки концентрации спектральной энергии и характеризуют положение резонансных областей для данной конфигурации артикуляционного аппарата (эти спектрограммы можно сопоставить с образцами рассчитанных для тех же гласных звуков !резонансных областей, приведенных на рис. 3.28 и 3.29).
Типичной областью применения таких спектрограмм в исследовательских целях является изучение в больших масштабах частот, амплитуд и положений фронтов формант гласных зву-
Прімрил»
Рис. 5.9. Диаграммы положений артикуляторных органов и соответствующие «м спектрограммы, полученные с помощью широкополосных фильтров для гласных /і, эе, а, и/, произнесенных взрослыми дикторами мужского и женского пола (Пот-тер, Копп и Грин)
СПЕКТРАЛЬНЫЙ АНАЛИЗ РЕЧИ
175
ков для большого числа различных дикторов (Петерсон и Барни — Peterson and Barney). Значения формантных частот гласных звуков английского языка, произнесенных 33 дикторами-мужчинами, приведены на рис. 5.10. Эти гласные произносились между двумя согласными в составе слога /h—Aj.
3S00
3000
2WO
1 1800
1200
ООО
WIO-is
7!777Zi,
2290.
270-и ШВІ,
гц дб 25SL2J
7ZZZZZ
'1-а
390 _3
•% Об
530-
гц дб
¦22
1720-12
SSO4
гц S6
mm
ги дб 7-зі
840-7
570 о
ги іб
mm*
W.
*ч дб 22W,
370
-it,
ги іб
mm
SiO.,
ги Ot
шт
L
V
Рис. 5.10. Средние формантные частоты и относительные амплитуды для гласных звуков английского языка, произнесенных 33 дикторами мужского пола в составе слога /h—d/. Относительные амплитуды формант приведены в дб по отношению к первой форманте гласного звука (о) (Петерсон и Барни); взято из материалов Хас-киноких лабораторий
Было сконструировано и применено на практике большое число приборов типа звукового спектрографа как его прототипов, так и модификаций, причем обычно каждый из них предназначался для вполне определенной цели. В этих устройствах использовались самые различные способы анализа от гребенки фильтров со сканированием до корреляторов. Ограниченный объем настоящего издания не позволяет даже упомянуть о многих из них. Одним из видов спектрографа является так называемый «резонограф» (Хаггинс — Huggins, 1952). Этот прибор предназначен для подчеркивания формантных частот и подавления межформантной энергии. Другой вид прибора выявляет не просто амплитудный спектр, а его производную по времени (Мейер-Эпплер — Meyer-Eppler, 1951; Кок и Миллер — Kock and Miller). Желаемый эффект состоит в том, чтобы подчеркнуть в спектре динамику временных изменений и не реагировать на его квазистационарные участки. При этом наиболее ярко выявляются такие особенности речи, как наличие взрывных согласных или формантных переходов.
1
176 УСТРОЙСТВА ДЛЯ АНАЛИЗА РЕЧИ
Ближайшим «родственником» этих приборов является так называемое устройство «видимой речи» (Дадли и Грюенц — Dudley and Gruenz; Райз и Шотт — Riesz and Schott), в котором обычная звуковая спектрограмма электронным способом вырисовывается в реальном масштабе времени либо на люминесцентном покрытии непрерывно движущейся ленты, либо на экране вращающейся электронно-лучевой трубки. Еще одним видом прибора служит коррелограф (Беннет — Bennett, 1953; Биддалф — Biddulph), который воспроизводит изображение кратковременной функции корреляции сигнала в виде следов различной плотности; при этом по оси ординат откладывается время задержки, а по оси абсцисс — текущее время.
Было также описано несколько схем, позволяющих осуществить квантование в измерении интенсивности для обычных спектрограмм (Керсга — Kersta, 1948; Престиджиакомо — Prestigiacomo, 1957). В результате вычерчивается «топологическая карта» сигнала, в которой градиент интенсивности проявляется в виде сгущения или разрежения контурных линий.
5.1.5. Кратковременная функция корреляции и мгновенный спектр мощности
Если x(t) есть стационарный случайный процесс, то его автокорреляционная функция ф(т) и спектр мощности Ф(со) связаны преобразованием Фурье (Винер, Ли — Wiener, Lee):
+Г оо
Ф (т) = 1іт— Г X (t) X (і +т) = — f Ф (со) еішт d со
Ф(е>)= f ф(т)е~іштс(т (5.10)
—-оо
[заметим, что ф(0) представляет собой среднее значение квадрата, или среднюю мощность сигнала].