Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Джеймс Л. Фланаган -> "Анализ, синтез и восприятие речи" -> 131

Анализ, синтез и восприятие речи - Джеймс Л. Фланаган

Джеймс Л. Фланаган Анализ, синтез и восприятие речи. Под редакцией Пирогова А.А. — М.: Связь, 1968. — 395 c.
Скачать (прямая ссылка): analizsintivocrech1968.djvu
Предыдущая << 1 .. 125 126 127 128 129 130 < 131 > 132 133 134 135 136 137 .. 149 >> Следующая


12—71

354

системы синтетической телефонии

вость речи, преобразованной по обоим методам. Полученные данные показаны на рис. 8.13.

Если длительность интервала квантования превышала 0,5 мсек, слушатели почти ничего не понимали. Звучание кван-

0,7 O^ 0,3 0,2 OJO 0,08 0,06 0,05 0,025 тод Б обеспечивал более Интервал квантования,мсек ВЫСОКуЮ разборчивость,

Рис. 8,13. Разборчивость слов квантован- чем метод А~ В обоих Mf

ной по времени клиллированной речи. По- тодах по мере укороче-.

казаны результаты для двух методов кван- ния интервала квантова-

тования шкалы времени (Ликлайдер, 1960) НИя вначале повышалась

затем — согласных. Причина, по-видимому, заключается в том, что для гласных плотность перехода через нуль меньше, чем для согласных, особенно глухих. Если интервал квантования был короче 0,1 мсек, разборчивость сохранялась почти такой же, как и для не квантованной во времени клиппированной речи, т. е. около 95% (Ликлайдер и Поллак).

Качество звучания квантованного по времени сигнала оказалось хуже, чем следовало бы ожидать по данным разборчивости. Остаточный шум в первоначальном сигнале за счет клиппирования подчеркивается, а интервал квантования обычно не связан с периодом основного тона сонорных звуков. Тем не менее передача прямоугольных посылок с частотой перемены знака не менее 10 кгц обеспечивает достаточно высокую разборчивость.

Если передавать информацию об экстремумах исходного речевого сигнала, а также об интервалах между экстремумами, качество речи улучшается. Идея метода состоит в определении амплитуд максимумов и минимумов речевой волны, а также временных интервалов между ними (Мэтьюз—Mathews). Эти параметры подвергаются дискретному кодированию и передаются по каналу связи. В месте приема сигнал восстанавливается путем интерполяции данных об экстремумах. При наличии буф-ферного накопителя с емкостью, рассчитанной на время заполнения порядка одной секунды, достигается средняя скорость передачи около 15 000 де. ед/сек. Разборчивость и качество при этом оказались сравнимыми с достигаемыми при ИКМ и скорости передачи от 30 000 до 40 000 де. ед./сек.

§ 100 1 во

%. 60

- Метод 6Sy"

i_j_L

тованной речи напоминало «журчание» в случае А и было подобно фиксированному тону в случае Б. При длительности интервала квантования от 0,5 до 0,1 мсек не-

разборчивость гласных, а

ДРУГИЕ МЕТОДЫ СОКРАЩЕНИЯ ПОЛОСЫ

355

Предложен также метод амплитудного квантования, в котором низкочастотные составляющие речевого сигнала передаются большим числов уровней квантования при низкой частоте дискретизации по времени, а высокочастотные составляющие подвергаются дискретизации с высокой частотой, а квантуются при малом числе уровней (Дэвид и Макдоналд — David and McDonald, 1956, b) '). Низкочастотные составляющие, которые квантуются с большей точностью, эффективно маскируют шумы квантования высокочастотных компонентов. В типичном устройстве передачи речи диапазон 4000 гц делится фильтром нижних и верхних частот с частотой среза 1000 гц. Низкочастотный поддиапазон подвергается дискретизации с частотой 2000 гц и квантуется на 6 двоичных разрядов. В высокочастотном поддиапазоне частота дискретизации выбирается равной 8000 гц, а число двоичных разрядов равно двум. Общая емкость канала при этом составляет 28000 дв. ед./сек.

8.7.3. Частотное деление и умножение. Временное сжатие и расширение

Изобретен целый ряд систем деления и умножения спектральных составляющих речевого сигнала. При этом обычная мотивировка состоит в том, что деленный сигнал требует для передачи пропорционально меньшей ширины полосы канала. Без существенного снижения разборчивости коэффициент деления частоты может быть равен двум или трем. При соответствующем увеличении скорости воспроизведения исходные спектральные составляющие восстанавливаются. Конечно, восстановление путем увеличения скорости приводит к сжатию сигнала во времени.

Для осуществления операций деления и умножения применяются различные методы, в том числе электрические, механические, оптические и цифровые. В деталях все они здесь не описываются. Однако изложение некоторых из них будет служить хорошей иллюстрацией имеющего место разнообразия разработок применений рассматриваемых методов.

Одним из методов деления спектров для сужения полосы является «вобэнк» (Богерт—Bogert, 1956) 2). Принцип системы поясняется упрощенной схемой (рис. 8.14) (без применения ге-теродинирования). Речевой спектр в полосе 200-4-3200.2? разде-

') Аналогичный метод, применяется и при кодировании телевизионных сигналов (см.* Д. С. Лебедев и И. И. Цу к к е р м а н. Прим. перев.).

2) Система была предложена и опубликовама в 1943 г. * В. Н. Листовым (ирим. іред.).

12"

356

СИСТЕМЫ СИНТЕТИЧЕСКОЙ ТЕЛЕФОНИИ

ляется на три полосовых канала: A1, A2, A3. Ширина полосы каждого канала составляет около 1000 гц, что примерно соответствует ширине формант. С помощью регенеративных делителей в каждой полосе осуществляется деление частоты в два
Предыдущая << 1 .. 125 126 127 128 129 130 < 131 > 132 133 134 135 136 137 .. 149 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed