Анализ, синтез и восприятие речи - Джеймс Л. Фланаган
Скачать (прямая ссылка):
87
A1
tg?/2 = ctg?/,
(3.84>
Поскольку речевой тракт характеризуется относительно низ-кими потерями, ур-ние (3.84) пригодно для анализа распреде-
а)
Дг=1снг
En
I1-Sc*. 1л=всн * IU 2
Ff
250
¦1875
2825
Д2=8смг Л,=1смг і
IxI
Ff Ff
в25
^1700
¦2325
й2=7см2
U1=ICM2^—*
IfdCM U=8Crt /а/ F,.=75,0 F2=!250 F3=2750
U1=H2=BcM2
I2=OcH
/зі F1=SOO F2=IbOO F3=2500
Рис. 3.2в. Двухтрубные модели для гласных /І, эз, а, э / и распределение «х спектральных максимумов (формант) при отсутствии потерь
ления полюсов в двухтрубной аппроксимирующей модели. Например, рассмотрим модели (рис. 3.28), аппроксимирующие артикуляционные конфигурации для четырех различных глас-
Ю00 2000 Частота,гц
3000
88
АКУСТИЧЕСКИЕ СВОЙСТВА РЕЧЕВОГО АППАРАТА
ных. На этом же рисунке приведены функции реактивных сопротивлений ур-ния (3.84) для каждого случая и обозначены частоты полюсов.
Как видно, максимальный разнос частот первых двух формант наблюдается для звука /і/, а для звука /а/ эти частоты наиболее близки. Нейтральный гласный /э/, соответствующий
тракту без артикуляторного сужения, характеризуется формантами, разнесенными равномерно с интервалом 1000 гц. Согласно рассмотренным графикам с увеличением отношения площадей поперечного сечения задней и передней полостей А\1А2 частота первой форманты понижается. На классическом графике Fi^F2 первые два полюса четырех моделей расположены, как показано на рис. 3.29. Звук / э/, соответствующий отсутствию артикуляторного сужения, занимает центральное положение. Для сравнения на рисунке показаны также формантные частоты для четырех гласных, произносимых взрослым мужчиной (Петерсон и Барни — Peterson and Barney) '). В нижнем левом углу диаграммы обозначено положение гласного /и/. Однако вследствие огуб-ления гласного /и/ этот звук нельзя получить на модели, состоящей только из двух труб.
Выражение (3.84) делает очевидной одну из возможных форм компенсаторной артикуляции. Распределения полюсов для случая U = a, 12 = Ь и для случая U = b, I2 = а оказываются одинаковыми. Иными словами, при постоянном соотношении
') Размеры голосового тракта, приводимые в настоящей главе для иллюстрации акустических соотношений, характерны для взрослого мужчины. Женщины и дети имеют голосовой аппарат меньших размеров. Так как частоты ірезонансав обратно пропорциональны длине тракта, то форманты гласных для женского нли детского голоса расположены выше, чем для муж-акото голоса. Согласно Чибе .и Каджияме (Chiba and Kajiyama) длина речевого тракта молодой женщины составляет 0,87 от длины тракта молодого мужчины. Поэтому форманты женского голоса должны быть на 15% выше формант мужского голоса. Это обстоятельство отражено также в измерениях Петерсона и Барни.
2W 2200 2000 1800 S- WOO
1200 WOO 800 600
о
о \
-
IaI \
\ °
_
/
I
і
100 800 SOO ТОО вое
Рис. 3.29. Положение гласных на плоскости первой (F,) и второй (F2) формант. Точками обозначены усредненные значения Петерсона и Барни для реальных гласных, произнесенных мужским голосом; кружками обозначены гласные, полученные на двухтрубных моделях, изображенных на рис. 3.28
ПЕРЕДАТОЧНАЯ ФУНКЦИЯ РЕЧЕВОГО ТРАКТА
89
площадей поперечного сечения задней и передней полостей взаимная замена длин полостей не сказывается на формантных. частотах. Это положение, безусловно, справедливо для идеализированного случая отсутствия потерь в трубах и с некоторым приближением приложимо к практическим условиям потерь в трубах. Такая взаимозаменяемость предоставляет одну из степеней свободы для чревовещателя. Из (3.84) также ясно, что если /і = 2/г, то частоты, при которых ctg?/i и tg?/2 обращаются в бесконечность, совпадают (при ?/2 = n./2), что соответствует второму резонансу. Таким образом, при отношении длин труб, равном 2: 1, частота второй форманты всегда остается постоянной. Третья форманта также будет постоянной при отношении длин, равном 3 : 2.
3.7.6. Возбуждение источником, смещенным вперед по продольной оси тракта
Как указывалось выше, фрикативные звуки (за исключением /hf) возбуждаются источником, расположенным в точке, смещенной вперед вдоль оси речевого тракта. Рассмотрим звуковой поток, создаваемый подобным источником у губ.
В предыдущем разделе было показано, что в случае голосового возбуждения максимумы характеристики передачи голосовой щели ко рту имели место на собственных частотах (полюсах) речевой системы и нули при этом отсутствовали. Если возбуждение прикладывается в некоторой другой точке той же системы, то полюса возбуждаемых колебаний остаются неизменными. (В передаточной функции, однако, появляются нули. При последовательном возбуждении эти нули располагаются на тех частотах, для которых импеданс в направлении от источника к голосовой щели является бесконечно большим.
В качестве примера обратимся снова к рассмотренной выше простой двухтрубной модели. Вследствие пространственного-характера турбулентного источника глухих звуков его точное местоположение определить трудно. В большинстве случаев можно считать, что он расположен в точке максимального сужения либо несколько впереди нее. Первый случай более соответствует звукам /j , f, р, к/; второй — звукам /s, t/. Рассмотрим сначала случай, когда источник расположен перед щелью. Эквивалентная схема двухтрубной модели приведена на рис. 3.30. Задняя полость показана закрытой, причем предполагается, что импеданс голосовой щели и гортани велик (по сравнению с величиной импеданса задней полости), даже если голосовая щель открыта. Импеданс излучения, как и ранее, считается малым по сравнению с величиной импеданса у рта, и