Анализ, синтез и восприятие речи - Джеймс Л. Фланаган
Скачать (прямая ссылка):
где Sn= (—Gn + ісо„), а Cin= (s—sn)T(s) =(ап + \Ьп) есть вы-
п
чет в п-м полюсе, функция всех полюсов и нулей. Обратное преобразование дает h(t)= 2^HnI е J" cos(co„t + cpn), где Л„ =
л
= \Ап\ е "> или, после разложения косинуса,
Л U) = 2 2 И" І Є ^ IC0S Фл cos ид * — sin Фл Si" мл /]• (6.30) л
Передаточная функция, соответствующая каждому члену последнего выражения, может быть реализована с помощью схемы, приведенной на рис. 6.11, где обозначенные квадратиками фильтры являются обыкновенными резонансными контурами.
9
A4 SLnyn
Рис. 6.11I. Схема моделирования переходной функции, определяемой ур-нием (6.30)
При чисто гласных звуках Z(s)-*\ и T(s)^P(s), в результате чего в передаточной функции остаются одни полюсы. Ее
ЁыхоЗ
ЭЛЕКТРИЧЕСКИЕ МЕТОДЫ СИНТЕЗА РЕЧИ
245-
числитель зависит только от Sn и не зависит от s, т. е. П SnSn =
=f(sn). В этом случае вычет в q-ш полюсе равен
2і % П [К - ^)2 + ( - 4 ) + 2i <*>„ (и, - <тя) ]
Пфд
- . (6.31>
Если все а одинаковы (что близко к истине для низших нулей и полюсов голосового тракта),
Aq -
f(*n)
21 со, П
ИЛИ
f(8«)
2 0,,(-1)'-1 ПК-«Si
(6.32>
л*<7
Получается, что вычеты являются чисто мнимыми (т. е. coscp„ = 0), а их знаки чередуются в соответствии с номером полюса. Обратное преобразование (импульсная реакция) такой передаточной функции равна
А(*) = 2(- О""'21 A,|e "«'sin aw,
(6.33)
где каждому члену соответствует электрическая цепь, показанная на рис. 6.12. По существу, это нижняя половина предыду-
?xo7
Выход
6п
Рис. 6.12 Схема моделирования импульсной реакции вокализованного звука [см. ур-ние (6.33)]
щей схемы, в которой — sincpn = —sinГ(—l)"^.jj=(—^)" а /<?іС-резонатор имеет импульсную реакцию (cone sinconO-
246
СИНТЕЗ РЕЧИ
Каждому значению п соответствует своя отдельная схема; сложение всех их выходных напряжений позволяет получить отклик (6.33).
Величина вычета в первом приближении очень просто связана с амплитудой соответствующей форманты. Если учесть, что она равна \Ап\ = (s—sn)T(s)\s^$п , то для малого затухания |ст„ < и„| получаем
или
I (s — Sn) T (s) = і (і со„ — sn) T (і со„) a An,
a„|7(i Con)I^I 4L (6.34)
Если, например, как в выражении (6.28), в передаточной функции обнаруживаются нули, вычеты принимают вид
Aq = (s- Sq) T (S) U? = Z (s) (s - sq) P (S) U? =
= z (sq) A9 = Ks J П (S0 — Sn) (sq —Sl1)) A9 =
- т
¦= A4Ks9 П [К - °mf + « - + і 2«К - О] • (6.35) Для примерно одинаковых величин а имеем
A'q= A9Ks9UK-^). (6.36)
m
Знак А' определяется соотношением между величинами <om и <д9. Выражение (6.36) можно записать и так:
A9 = A9(-\rKs9U\^m-^9[ (6.37)
m
где р — номер нулей, лежащих ниже полюса сов. Подставляя A9 из ур-ния (6.32), получаем
f(sn) (-іу/Св,ПК-®2|
А' =-2-, (6.38)
2ісоя(-1)«-'ПК-а,?2|
Где результирующий знак вычета определяется разностью между числами полюсов и нулей, лежащих ниже q-ro полюса.
И в этом случае вычет связан со спектром в реальных частотах, определенным на частоте данного полюса, простым соот-
ЭЛЕКТРИЧЕСКИЕ МЕТОДЫ СИНТЕЗА РЕЧИ
247
ношением An=(S—sn)T(s)|s — sn. Для малых
Sn-*'Шп, Т. Є.
An а; (і со„ — Sn) T (і со„) An ^ °п T (і со„) = ап J T (і con) IJ7-
К настоящему времени построен и испытан ряд синтезаторов-четырехполюсников (см., например, Фант — Fant, 1959, а; Стивене—Stevens; Бестайд и Смит — Bastide and Smith; Лоу-ренс — Lawrence, 1953; Стед и Джонс — Stead and Jones; Кампанелла — Campanella; Чанг — Chang; Фланаган — Flanagan, 1956, а, 1960, b). В 'большинстве этих устройств рассмотренные выше соотношения либо непосредственно описывают их работу, либо качественно характеризуют ее. Обычно использовавшиеся соотношения связаны с формантной частотой и величиной вычета или частотой и амплитудой форманты. Насколько известно автору, (почти не использовалась комплексная величина вычета, т. е. его угол или знак. Анализ мгновенного фазового спектра речи1) наряду с мгновенным спектром амплитуд до сих пор, по-видимому, не производился. Однако приведенные далее результаты наводят на мысль о том, что информация о фазе может иметь значение для натуральности и качества звучания синтезированной речи.
6.2.3. Аналоги речевого тракта, построенные на основе линии передачи
Другой метод моделирования функции передачи речевого аппарата основан на использовании неоднородной электрической линии передачи. В гл. III показано, как неоднородные акустические трубы полости рта и носовой полости можно представить в виде сочленения прямых цилиндров (см. рис. 3.35). Такая аппроксимация тем точнее, чем больше цилиндрических элементов.
Каждый цилиндрический отрезок длиной / может быть представлен своим Т-образным эквивалентом (рис. 6.13а, где za = = Zothy//2 и Zb=ZoCSchryO- Один из возможных электрических аналогов такого Т-звена получается в результате разложения гиперболических функций в ряд и использования его первых