Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Джеймс Л. Фланаган -> "Анализ, синтез и восприятие речи" -> 96

Анализ, синтез и восприятие речи - Джеймс Л. Фланаган

Джеймс Л. Фланаган Анализ, синтез и восприятие речи. Под редакцией Пирогова А.А. — М.: Связь, 1968. — 395 c.
Скачать (прямая ссылка): analizsintivocrech1968.djvu
Предыдущая << 1 .. 90 91 92 93 94 95 < 96 > 97 98 99 100 101 102 .. 149 >> Следующая


нулей и полюсов, согласующиеся со спектром одного периода основного тона натурального гласного звука, показаны на рис. 6.24. В процессе анализа не делается различия между нулями в правой и левой полуплоскостях, и все нули изображены на левой полуплоскости. Приведенный результат предполагает время открывания колебания голосовых связок равным примерно 0,4 периода основного тона.

Вопрос о важности точного положения нулей источника возбуждения для восприятия остается открытым. Большую роль положение нулей источника возбуждения может играть лишь в равновесии всего спектра и при грубых изменениях его формы. В связной речи форма колебаний сигнала возбуждения из-

266

СИНТЕЗ РЕЧИ

Основной тон Ііїгц Среднее расстояние между щлями 27чги

/Л/

меняется настолько быстро, что расположение нулей остается постоянным на время, недостаточное для того, чтобы повлиять

на восприятие. Говорящий может также, пользуясь слуховой обратной связью, устанавливать такую форму колебаний голосовых связок, при которой нежелательное подавление частот формант минимизируется. Имеется свидетельство, позволяющее предположить, что такое внимание к форме колебаний голосовых связок и распределению нулей могут привести к значительному улучшению качества синтезированной речи (Холмс— Holmes, 1961).

Имитация турбулентного возбуждения. В гл. III указывалось на недостаточность наших знаний об источниках турбулентного возбуждения. Проведенные измерения (Гейнц—Heinz, 1958) наводят на мысль о том, что спектр источника при фрикативных звуках сравнительно равномерен в области средних звуковых частот, а сопротивление источника почти чисто активное. В электрических синтезаторах речи фрикативные звуки обычно генерируются возбуждением эквивалентов голосовых резонаторов от генератора широкополосного шумового сигнала. Взрывные же звуки часто генерируются как переходные процессы этих резонаторов при их возбуждении электрическими импульсами или короткими обрывками шума. Звонкие фрикативные звуки, в реальном голосовом тракте возбуждаемые синхронными с основным тоном отрезками шума, могут быть синтезированы перемножением синтезированных колебаний голосовых связок и широкополосного шума.

о
-WOO

о о
-3000

OX
о


о
-2000

о


о* о
-1000 •

о
I-L-O-
-то

X Полюсы О Нули.

WO 200 O Дейстдитемьная часть,гц

Ріне. 6.24 Наиболее подходящая модель расположения нулей и полюсов в спектре отдельного периода основного тона натурального гласного звука (Мэтьюз, Миллер н Дэвид, 1964, Ь)

6.2.5. Факторы, связанные с излучением

Конструкторы электрических синтезаторов обычно стараются учесть характеристики источника, голосового тракта и излучения изо рта и ноздрей. В синтезаторах-четырехполюсниках влияние излучения точно определено функциональной зависимостью между звуковым давлением в данной точке пространства и величиной потока, проходящего через излучающее отверстие.

ЭЛЕКТРИЧЕСКИЕ МЕТОДЫ СИНТЕЗА РЕЧИ

267

В синтезаторах-аналогах линии передачи картина иная. Они должны иметь нагрузку, импеданс который является эквивалентом акустической нагрузки излучающего отверстия. Для большинства частот речевого диапазона она хорошо аппроксимируется нагрузкой излучения поршня, помещенного в большой экран (см. раздел 3.3). Для частот ниже 4000 гц его свойства достаточно точно описываются соотношениями для малого сферического источника (см. раздел 3.4). Отсюда следует, что давление в любой точке перед говорящим пропорционально производной от величины потока у рта.

Для учета излучения в синтезаторах-четырехполюсниках к передаточной функции голосового тракта можно добавить частотный выравниватель с подъемом 6 дб на октаву. Аналогичным образом в синтезаторах-аналогах линии передачи можно продифференцировать ток, протекающий через нагрузку излучения, и таким образом получить выражение для звукового давления на выходе (или же можно [принять за давление 'непосредственно напряжение на нагрузке). Поскольку расстояние между ртом и ноздрями мало (меньше длины волны, особенно на низких частотах), эффект одновременно излучения из этих двух точек может быть получен путем линейной суперпозиции их потоков или звуковых давлений.

6.2.6. Моделирование синтеза речи на вычислительных

машинах

Работу упрощенных моделей речевого тракта, полученных в разделе 6.2.2, можно описать линейными дифференциальными уравнениями с постоянными коэффициентами, которые, в свою очередь, можно аппроксимировать уравнениями разностей. Последние могут быть решены на цифровой вычислительной машине арифметическими операциями над дискретными значениями переменных. Например, входное и выходное напряжения каскадного электрического синтезатора (рис. 6.10а) связаны соотношением

et=LC^ +RC^+e0. (6.65)

at2 at

Если заменить дифференциалы конечными приращениями функции между равномерно взятыми дискретными значениями аргумента, выражение (6.65) примет віид Єі = во+ЯСАео + +LCA2e0, где Д—первая обратная разность, поделенная «а 'Интервал .между отсчетами аргумента. Более подробно,
Предыдущая << 1 .. 90 91 92 93 94 95 < 96 > 97 98 99 100 101 102 .. 149 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed