Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Джеймс Л. Фланаган -> "Анализ, синтез и восприятие речи" -> 88

Анализ, синтез и восприятие речи - Джеймс Л. Фланаган

Джеймс Л. Фланаган Анализ, синтез и восприятие речи. Под редакцией Пирогова А.А. — М.: Связь, 1968. — 395 c.
Скачать (прямая ссылка): analizsintivocrech1968.djvu
Предыдущая << 1 .. 82 83 84 85 86 87 < 88 > 89 90 91 92 93 94 .. 149 >> Следующая


Пока излучение происходит из одного отверстия, коэффициент передачи тракта по постоянному току должен быть равен единице. При излучении одновременно ртом и ноздрями звуковая энергия разделяется в соответствии с проводимостями полостей носа и рта, и коэффициент передачи по постоянному току к одному из отверстий определяется потерями в соответствующей ветви.

Каскадные синтезаторы. Приводимые ниже элементарные соображения должны показать правомочность аппроксимации функции передачи T(s) голосового тракта любой формы и при любом возбуждении несколькими первыми (низкочастотными) полюсами и нулями, т. е. несколькими первыми корнями P(s) и Z(s). В одном из простейших электрических аналогов речевого тракта передаточная функция, равная произведению элементарных функций, определенных своим нулем или полюсом, получается путем последовательного соединения отдельных электрических резонаторов. Передаточная функция для гласного

звука может быть записана в виде T(s) =P(s) — f| _s"s"

n (s-sn)(s- s*)

Такая функция может быть представлена в терминах своих полюсов каскадным соединением последовательных несвязанных одиночных контуров (рис. 6.1 0й). Передаточная функция одного контура

242

СИНТЕЗ РЕЧИ

ев (s) еп (s)

1

LC

S2

+ — S+ — (s-s«)(s-s;)

LC

где

¦л Г 1 Я2

ш»= V Tc-Hj

s„ = — on + І COn

(6.26)

а)

6)

Резона -

Резона-

Резона-
Выход
вход
Сопряжен
ный полке

Сопряженный нуль

тор 1

тор Z

тор п




выход

С^(

Пара полюсов

Рис. 6Л0. Каскадное соединение несвязанных ^LC-резонаторов. для моделирования передаточной функции при гласных звуках (а) и цепей имитации полюса и нуля при наличии бокового ответвления на низких частотах (б). Каждая пара полюсов, или резонанс в тракте, представляется последовательной цепью. Пара нулей аппроксимируется передаточной функцией последовательного контура

Частота форманты управляется при изменении емкости конденсатора C1 а ширина форманты — изменениями R. При последовательном соединении резонаторов задание частот полюсов Sn определяет также спектральные пики или амплитуды формант. Это обстоятельство подробно рассмотрено в литературе (Фант, 1956; Фланаган, 1957, с).

Полученные в гл. III результаты и приведенные выше соображения позволяют высказать мысль о том, что такие звуки, как глухие согласные, носовые, назализованные гласные и, по-видимому, плавные, могут иметь, по крайней мере, один нуль

ЭЛЕКТРИЧЕСКИЕ МЕТОДЫ СИНТЕЗА РЕЧИ

243

на низких частотах, который, возможно, имеет значение для восприятия1). Цепь резонаторов, применяемая для синтеза гласных звуков (рис. 6.10а), может быть легко приспособлена для проведения указанных изменений в передаточной функции. В схему синтезатора можно, как показано на верхней части рис. 6.106, включить элементы с резонансом и антирезонансом (Фланаган, Кокер, Бёрд — Goker, Bird).

Пока генерируется чисто гласный звук, частоты дополнительных нуля и полюса совпадают и передаточная функция соответствующих элементов равна единице. При синтезе носового звука эти частоты раздвигаются и их величины устанавливаются в соответствии с тем влиянием, которое оказывается боковым ответвлением в тракте.

Практически такой комплексно сопряженный нуль может быть аппроксимирован электрической цепью, показанной в нижней части рис. 6.106. Ее передаточная функция равна

-^- = LC(sz + s— + —) (6.27)

et(s) \ L LC)

— величине, обратной передаточной функции сопряженного полюса. Как и в резонаторе, дающем пару полюсов, усиление на низкой частоте (по постоянному току) здесь принято равным единице, что точно соответствует действительности при излучении из одного отверстия и приблизительно — при излучении ртом назализованных гласных звуков.

Своими нулями и полюсами могут быть описаны также и глухие согласные звуки с передним возбуждением. Согласно полученным в этом разделе и в гл. III результатам достаточная точность получается при такой аппроксимации:

П (S-sn)(s-s*m) T(S)=P(S)Z(S) = Ks—-— , (6.28)

П (S-Sn)(S-s*n) я

где с точки зрения слухового восприятия часто достаточно иметь тип равными 1 или 2 (плюс коррекция полюсов и нулей более высокого порядка). Нуль на нулевой частоте появляется из-за полного закрытия задней полости (см. рис. 3.31). Масштаб амплитуд К считается общим уровнем сигнала.

') Влияние нулей в спектре звука (как нулей в возбуждении, так и в тракте) иа его восприятие окончательно не установлено. Вопрос о том, в какой степени качество синтезированной речи зависит от этих факторов,' в настоящее время внимательно изучается. Он будет рассмотрен в одном из последующих разделов.

244

СИНТЕЗ РЕЧИ

Параллельные синтезаторы. Мы рассмотрели представление передаточной функции речевого тракта в виде отношения рядов произведений, которые при усечении образуют рациональные мероморфные функции. Так как их полюсы простые, передаточная функция может быть разложена на элементарные дроби с членами первой степени:

А*

_ 2a„s + 2 (оп ап -4- тп Ьп) д=| j (6 29)
Предыдущая << 1 .. 82 83 84 85 86 87 < 88 > 89 90 91 92 93 94 .. 149 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed