booksshare.net -> Добавить материал -> Лингвистика -> Джеймс Л. Фланаган -> "Анализ, синтез и восприятие речи" -> 89

Анализ, синтез и восприятие речи - Джеймс Л. Фланаган

Джеймс Л. Фланаган Анализ, синтез и восприятие речи. Под редакцией Пирогова А.А. — М.: Связь, 1968. — 395 c.
Скачать (прямая ссылка): analizsintivocrech1968.djvu

Предыдущая << 1 .. 83 84 85 86 87 88 < 89 > 90 91 92 93 94 95 .. 149 >> Следующая

где Sn= (—Gn + ісо„), а Cin= (s—sn)T(s) =(ап + \Ьп) есть вы-

п

чет в п-м полюсе, функция всех полюсов и нулей. Обратное преобразование дает h(t)= 2^HnI е J" cos(co„t + cpn), где Л„ =

л

= \Ап\ е "> или, после разложения косинуса,

Л U) = 2 2 И" І Є ^ IC0S Фл cos ид * — sin Фл Si" мл /]• (6.30) л

Передаточная функция, соответствующая каждому члену последнего выражения, может быть реализована с помощью схемы, приведенной на рис. 6.11, где обозначенные квадратиками фильтры являются обыкновенными резонансными контурами.

9

A4 SLnyn

Рис. 6.11I. Схема моделирования переходной функции, определяемой ур-нием (6.30)

При чисто гласных звуках Z(s)-*\ и T(s)^P(s), в результате чего в передаточной функции остаются одни полюсы. Ее

ЁыхоЗ

ЭЛЕКТРИЧЕСКИЕ МЕТОДЫ СИНТЕЗА РЕЧИ

245-

числитель зависит только от Sn и не зависит от s, т. е. П SnSn =

=f(sn). В этом случае вычет в q-ш полюсе равен

2і % П [К - ^)2 + ( - 4 ) + 2i <*>„ (и, - <тя) ]

Пфд

- . (6.31>

Если все а одинаковы (что близко к истине для низших нулей и полюсов голосового тракта),

Aq -

f(*n)

21 со, П

ИЛИ

f(8«)

2 0,,(-1)'-1 ПК-«Si

(6.32>

л*<7

Получается, что вычеты являются чисто мнимыми (т. е. coscp„ = 0), а их знаки чередуются в соответствии с номером полюса. Обратное преобразование (импульсная реакция) такой передаточной функции равна

А(*) = 2(- О""'21 A,|e "«'sin aw,

(6.33)

где каждому члену соответствует электрическая цепь, показанная на рис. 6.12. По существу, это нижняя половина предыду-

?xo7

Выход

6п

Рис. 6.12 Схема моделирования импульсной реакции вокализованного звука [см. ур-ние (6.33)]

щей схемы, в которой — sincpn = —sinГ(—l)"^.jj=(—^)" а /<?іС-резонатор имеет импульсную реакцию (cone sinconO-

246

СИНТЕЗ РЕЧИ

Каждому значению п соответствует своя отдельная схема; сложение всех их выходных напряжений позволяет получить отклик (6.33).

Величина вычета в первом приближении очень просто связана с амплитудой соответствующей форманты. Если учесть, что она равна \Ап\ = (s—sn)T(s)\s^$п , то для малого затухания |ст„ < и„| получаем

или

I (s — Sn) T (s) = і (і со„ — sn) T (і со„) a An,

a„|7(i Con)I^I 4L (6.34)

Если, например, как в выражении (6.28), в передаточной функции обнаруживаются нули, вычеты принимают вид

Aq = (s- Sq) T (S) U? = Z (s) (s - sq) P (S) U? =

= z (sq) A9 = Ks J П (S0 — Sn) (sq —Sl1)) A9 =

- т

¦= A4Ks9 П [К - °mf + « - + і 2«К - О] • (6.35) Для примерно одинаковых величин а имеем

A'q= A9Ks9UK-^). (6.36)

m

Знак А' определяется соотношением между величинами <om и <д9. Выражение (6.36) можно записать и так:

A9 = A9(-\rKs9U\^m-^9[ (6.37)

m

где р — номер нулей, лежащих ниже полюса сов. Подставляя A9 из ур-ния (6.32), получаем

f(sn) (-іу/Св,ПК-®2|

А' =-2-, (6.38)

2ісоя(-1)«-'ПК-а,?2|

Где результирующий знак вычета определяется разностью между числами полюсов и нулей, лежащих ниже q-ro полюса.

И в этом случае вычет связан со спектром в реальных частотах, определенным на частоте данного полюса, простым соот-

ЭЛЕКТРИЧЕСКИЕ МЕТОДЫ СИНТЕЗА РЕЧИ

247

ношением An=(S—sn)T(s)|s — sn. Для малых

Sn-*'Шп, Т. Є.

An а; (і со„ — Sn) T (і со„) An ^ °п T (і со„) = ап J T (і con) IJ7-

К настоящему времени построен и испытан ряд синтезаторов-четырехполюсников (см., например, Фант — Fant, 1959, а; Стивене—Stevens; Бестайд и Смит — Bastide and Smith; Лоу-ренс — Lawrence, 1953; Стед и Джонс — Stead and Jones; Кампанелла — Campanella; Чанг — Chang; Фланаган — Flanagan, 1956, а, 1960, b). В 'большинстве этих устройств рассмотренные выше соотношения либо непосредственно описывают их работу, либо качественно характеризуют ее. Обычно использовавшиеся соотношения связаны с формантной частотой и величиной вычета или частотой и амплитудой форманты. Насколько известно автору, (почти не использовалась комплексная величина вычета, т. е. его угол или знак. Анализ мгновенного фазового спектра речи1) наряду с мгновенным спектром амплитуд до сих пор, по-видимому, не производился. Однако приведенные далее результаты наводят на мысль о том, что информация о фазе может иметь значение для натуральности и качества звучания синтезированной речи.

6.2.3. Аналоги речевого тракта, построенные на основе линии передачи

Другой метод моделирования функции передачи речевого аппарата основан на использовании неоднородной электрической линии передачи. В гл. III показано, как неоднородные акустические трубы полости рта и носовой полости можно представить в виде сочленения прямых цилиндров (см. рис. 3.35). Такая аппроксимация тем точнее, чем больше цилиндрических элементов.

Каждый цилиндрический отрезок длиной / может быть представлен своим Т-образным эквивалентом (рис. 6.13а, где za = = Zothy//2 и Zb=ZoCSchryO- Один из возможных электрических аналогов такого Т-звена получается в результате разложения гиперболических функций в ряд и использования его первых

Предыдущая << 1 .. 83 84 85 86 87 88 < 89 > 90 91 92 93 94 95 .. 149 >> Следующая