Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Джеймс Л. Фланаган -> "Анализ, синтез и восприятие речи" -> 91

Анализ, синтез и восприятие речи - Джеймс Л. Фланаган

Джеймс Л. Фланаган Анализ, синтез и восприятие речи. Под редакцией Пирогова А.А. — М.: Связь, 1968. — 395 c.
Скачать (прямая ссылка): analizsintivocrech1968.djvu
Предыдущая << 1 .. 85 86 87 88 89 90 < 91 > 92 93 94 95 96 97 .. 149 >> Следующая


Переменная площадь

Переменная длина

8см -

¦ ОтЗдоПсн-

Рис. 6.15. Аналог голосового тракта с линией передачи, управляемый непрерывно (Розеи, Хеккер)

устройства и точки их управления показаны на рис. 6.15. Устройство может управляться или системой электронной памяти (Розен), или от большой ЭВМ (Деннис — Dennis).

ЭЛЕКТРИЧЕСКИЕ МЕТОДЫ СИНТЕЗА РЕЧИ

251

Синтезаторы с линиями передачи открывают исключительные возможности прямого введения сужений, характеризующих речевой механизм. Но их применимость в системах компрессии речи определяется достоверностью, с которой могут быть получены данные о площадях и длинах тракта. В исследованиях артикуляторного анализа речевых сигналов, позволяющего получить эти данные, достигнуты некоторые успехи1).

Помимо очевидного применения в системах компрессии речи, синтезаторы с линиями передачи могут, наряду с другими типами синтезаторов, использоваться и для других целей, как, например, в качестве выходного устройства ЭВМ при связи человека с машиной; в качестве генератора возбуждения для психоакустических и биоакустических экспериментов; как генератор стандартных звуков при изучении патологии и терапии речи и в лингвистике. В последнем примере применения возможность представления закона, по которому происходит управление артикуляционным трактом, в терминах артикуляционного аппарата является, по-видимому, ценным свойством этого метода синтеза.

6.2.4. Возбуждение электрических синтезаторов

В предыдущих разделах рассматривалось моделирование речевого тракта передачи как с точки зрения его іпередаточной функции, так и с точки зрения построения эквивалентной линии передачи. Построив по тому или иному принципу синтезатор речи, необходимо обеспечить его возбуждение от источников сигналов, аналогичных имеющимся в речевом тракте. В этом разделе предлагается рассмотреть некоторые характеристики таких источников, которые представляются существенными для синтеза.

Имитация колебаний голосовых связок. В гл. III показано, что голосовые связки являются генератором потока звуковых колебаний с высоким выходным импедансом. Поэтому речевой тракт и источник возбуждения связаны слабо и изменения конфигурации тракта мало влияют на колебания голосовых связок. В пределах справедливости этого положения источник и

') Следует заметить, что в общем случае задача должна ставиться широко—создать синтезатор, пригодный для «подражания» речи любого человека. Для систем синтетической телефонии высокого класса качества именно такая постановка задачи—требование получить при синтезе необходимое приближение к речи различных людей—является практически, по-видимому, наиболее целесообразной (прим. ред.).

252

СИНТЕЗ РЕЧИ

- Площадь

---Поток

Рис. 6.16. Отдельные периоды колебаний площади голосовых связок и штока у двух мужчин (А и Б), произносящих гласный звук/ае/ ори четырех значениях основного тона и интенсивности. F0—частота основного тона, a Ps-давление под голосовыми связками. Колебания скорости рассчитаны по методу, описанному в разделе 3.5.2 (Фланаган,

1958)

электрические методы синтеза речи

253

тракт с точки зрения анализа и построения эквивалентных схем могут рассматриваться независимо друг от друга.

Форма и период колебаний голосовых связок могут существенно изменяться. Частично это видно из рис. 6.16, где показаны отдельные периоды изменения площади голосовых связок и колебаний воздушного потока. Не очень ясно, насколько изменчивость формы и периода связана с качеством и натуральностью речи. Недостаточно точно установлена роль в восприятии речи взаимодействия источник — тракт и синхронных с периодом основного тона флуктуации колебаний голосовых связок.

Во многих существующих электрических синтезаторах свойства голосовых связок как источника возбуждения аппроксимируются очень грубо. Стало привычным представлять частоту основного тона как гладкую непрерывную функцию времени и использовать некоторую стандартную форму колебаний, имитирующих работу голосовых связок, характеризующуюся тем, что ее амплитудный спектр спадает примерно на —12 дб на октаву. Bb многих синтезаторах сигнал возбуждения генерируется периодическим импульсным возбуждением какого-нибудь устройства формирования спектра. Такое неадекватное копирование подлинных характеристик работы голосовых связок несомненно ухудшает натуральность речи и уменьшает возможность имитации заданного голоса.

Нерегулярные детали в колебаниях голосовых связок влияют на спектр источника, и сейчас также нет ясности, как это сказывается на слуховом восприятии. Однако ясно, что эти колебания в общем случае являются неминимально фазовыми и имеют многочисленные нули и в правой, и в левой спектральных полуплоскостях. (Хорошие примеры спектральных нерегулярностей с такими комплексными нулями приведены на рис. 3.17.)

Спектральные свойства колебаний треугольной формы. При некоторых условиях вибрации (средние величины основного тона и интенсивности) колебания голосовых связок имеют приблизительно треугольную форму. Поэтому по своим спектральным характеристикам треугольные колебания, по-видимому, пригодны для голосового возбуждения. Они подверглись подробному изучению для лучшего понимания связи между формой колебаний и спектром реальных голосовых связок (Данн, Фланаган и Джестрин — Gestrin) ').
Предыдущая << 1 .. 85 86 87 88 89 90 < 91 > 92 93 94 95 96 97 .. 149 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed