Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Джеймс Л. Фланаган -> "Анализ, синтез и восприятие речи" -> 125

Анализ, синтез и восприятие речи - Джеймс Л. Фланаган

Джеймс Л. Фланаган Анализ, синтез и восприятие речи. Под редакцией Пирогова А.А. — М.: Связь, 1968. — 395 c.
Скачать (прямая ссылка): analizsintivocrech1968.djvu
Предыдущая << 1 .. 119 120 121 122 123 124 < 125 > 126 127 128 129 130 131 .. 149 >> Следующая


После извлечения корня из спектра вычисляется кратковременная функция автокорреляции для определенных значений задержки. Это производится умножением сигнала с соответствующего отвода линии задержки без отражений на ее входной спшал и последующей фильтрацией произведения фильтром нижних частот ФНЧ (в данном случае фильтром с частотой среза 20 гц). Импульсная, реакция этого фильтра есть k(t) в (8.1). Так как функция автокорреляции ограничена той же полосой частот, что и сам сигнал, она полностью определяется отсчетами на интервале Найквиста (т. е. через интервалы, определяемые величиной, обратной удвоенной полосе частот). Для сигнала с полосой 3000 гц достаточно иметь интервал задержки At = = 0,167 мсек. Практически функцию корреляции следует определять на интервале не более 3 мсек (Шредер—Schroeder, 1962). Для этого требуется 18 отсчетов, из которых каждый занимает полосу около 20 гц. Отсюда общая ширина полосы получается около 360 гц, т. е. примерно столько же, что и у полосного вокодера.

В синтезаторе вокализованные звуки создаются генерацией периодического колебания, каждый период которого имеет форму корреляционной функции, описанной своими п отсчетами в данный момент. Это колебание получается, если возбуждающие импульсы основного тона будут «брать пробы» значений отсчетов функции корреляции. Соответствующая операция выполняется перемножением сигнала возбуждения и каждого из управляющих каналов (отсчетов функции корреляции). «Пробы» собираются в нужном порядке линией задержки синтезатора, и на выходе стоящего далее ФНЧ получается непрерывная функция корреляции. Поскольку она четная, синтезированное колебание должно быть симметричным относительно отсчета то-Практически этого можно добиться, если линию задержки сделать согласованно нагруженной на одном (входном) конце и не-нагруженной на другом (рис. 8.8). Отсчеты с выхода линии поступают на ФНЧ, восстанавливающий непрерывный сигнал.

Поскольку в этом методе используется конечная задержка, измеренная функция корреляции оказывается обрезанной и в синтезированном колебании обычно имеются разрывы непрерывности. Эти искажения можно уменьшить взвешиванием корреляции при больших задержках таким образом, чтобы они меньше влияли на синтезированное колебание. Это сглаживает разрывы, и речь получается сравнимой с речью на выходе полосного вокодера с той же компрессией.

340

СИСТЕМЫ СИНТЕТИЧЕСКОЙ ТЕЛЕФОНИИ

8.5. Формантные вокодеры

8.5.1. Принцип формантного анализа и синтеза речи

Результаты акустических исследований (гл. III) наводят на мысль о том, что эффективное кодирование речи можно получить, используя для этого информацию о резонансные максимумах речевого тракта. Эти результаты показывают, например,, что соседние отсчеты мгновенного спектра амплитуд не независимы, а сильно коррелированы. Действительно, задав комплексные нули и полюсы, мы тем самым задаем спектр на всех частотах. Это обстоятельство используется в формантном вокодере, где речевой сигнал кодируется по спектральным максимумам речевого тракта. Отсутствие в формантном вокодере большого числа управляющих сигналов, описывающих сильно коррелированные отсчеты спектра, дает основание надеяться на то, что он позволит получить большую компрессию речи, чем полосный вокодер.

Практичность формантного вокодера определяется тем, насколько хорошо удастся автоматически выделить данные о формантных максимумах или их эквивалентах. Кроме того, в формантном вокодере, как и в полосном вокодере, необходимо иметь информацию о возбуждении. Пока еще не создан работающий в реальном времени формантный вокодер, разборчивость и качество которого были бы лучше или такие же, как у полосного вокодера, хотя компрессия и получается больше. Однако тщательные исследования, возможные благодаря применению цифровых вычислительных машин, позволяют считать, что решение этой задачи будет получено в недалеком будущем.

Разработано и построено много типов формантных вокодеров. Хотя и невозможно рассмотреть каждый из них подробно, в этом разделе предполагается отметить типичные схемные решения и полученные с ними результаты.

Обычно формантные вокодеры разделяют на две группы, в принципе, определенные приведенными в гл. VI методами синтеза. Эта классификация связана с каскадным или параллельным соединением цепей синтезатора. В случае каскадного соединения стремятся воссоздать сигнал моделированием, обычно поочередным, важных для восприятия нулей и полюсов передаточной функции речевого тракта. Параметрами кодирования здесь являются комплексные частоты нулей и полюсов и информация о возбуждении (основной тон и сигнал тон-шум).

В случае параллельного синтеза пытаются воссоздать сигнал несколько иным, но эквивалентным способом, а именно — на основе данных о частотах формант (полюсов) и их амплитудах

ФОРМАНТНЫЕ ВОКОДЕРЫ

341

(вычетах). Строго говоря, частоты максимумов и их вычеты комплексны. Последние однозначно определяются нулями спектра. В разделе 6.2 установлена с некоторыми подробностями связь между последовательным и параллельным представлениями речевого сигнала. Если требуемые в обоих случаях данные удастся автоматически выделить с достаточной точностью, фор-маитный вокодер, по-видимому, должен синтезировать разборчивую речь лучшего качества, чем полосный вокодер. Поскольку с помощью формантного вокодера пытаются скопировать структуру речевого тракта со свойственней этому тракту комплексной функцией передачи, этот вокодер позволяет получить лучшее и более естественное описание спектра речи.
Предыдущая << 1 .. 119 120 121 122 123 124 < 125 > 126 127 128 129 130 131 .. 149 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed