Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Джеймс Л. Фланаган -> "Анализ, синтез и восприятие речи" -> 120

Анализ, синтез и восприятие речи - Джеймс Л. Фланаган

Джеймс Л. Фланаган Анализ, синтез и восприятие речи. Под редакцией Пирогова А.А. — М.: Связь, 1968. — 395 c.
Скачать (прямая ссылка): analizsintivocrech1968.djvu
Предыдущая << 1 .. 114 115 116 117 118 119 < 120 > 121 122 123 124 125 126 .. 149 >> Следующая


') Канал основного тона более чувствителен к переходным помехам. Поэтому в ием желательно обеспечить затухание около 40 дб.

2) См. работу * Ю К. Трофимова (прим. ред.).

3) См. примечание редактора иа стр. 16.

326

системы синтетической телефонии

ляет всего лишь около 20 дб. Таким образом, метод временного уплотнения при отсутствии дополнительного кодирования, по-видимому, несколько уступает по точности частотному методу уплотнения с квадратурной модуляцией. С другой стороны, простота и возможность сглаживания спектральных характеристик аналоговым методом делают привлекательным метод временного уплотнения.

Принцип временного уплотнения используется в так называемом скэн-вокодере (Фильбиг и Хаазе — Vilbig and Haase, 1956, a, b). Схема вокодера показана на рис. 8.4. С помощью ста

Входной речевой

Схема быделенш основного тона.

ІЗОкгц

фильтр] Выпря- і j Мишель —

Комму та тор*

Диализатор

, Шумовой

Мультивибратор генератор

I Модуляторні—

ІЗОкгц

тор І і І і > 1-,-

Ыемоду -I лятор

Канал передачи

Синтезатор

Выходной

'Распределитель речевой н сигнал

Рис. 8.4. Полосный вокодер с временным уплотнением (Фильбиг и Хаазе, 1956)

спектральных каналов, в каждом из которых используются высокочастотные (130 кгц) магнитострикционные фильтры, получается информация о мгновенном спектре. Выходные сигналы каналов сканируются с частотой 30 гц; полученный таким обра-

ПОЛОСНЫЕ ВОКОДЕРЫ

327

зом сигнал, представляющий развернутую во времени огибающую спектра, сглаживается фильтром нижних частот с полосой 200 гц. На приемной стороне сигнал огибающей разводится по ста каналам с помощью распределителя, осуществляющего синхронное сканирование. Информация об основном тоне передается по отдельному каналу.

Цифровая передача вокодерных сигналов. Передача сигналов в виде двоичных импульсов имеет ряд преимуществ. Одним из них является возможность борьбы с шумами путем многократного применения регенерации, полностью восстанавливающей форму сигнала. Подобный эффект нельзя получить в аналоговом канале с усилителями. Другим преимуществом является возможность «перемещать» импульсы сообщения различными сложными способами с целью обеспечения скрытности или секретности связи. Для получения этих важных преимуществ обычно приходится увеличивать ширину полосы частот передаваемого сигнала. Временное уплотнение спектральных сигнал-параметров с применением импульсно-кодовой модуляции (ИКМ) является, таким образом, важным методом передачи вокодерных сигналов. Значение отсчета сигнала в каждом канале представляется последовательностью двоичных импульсов. Упорядоченные импульсы «кадрами» передаются через относительно широкополосный канал; на приемной стороне импульсы синхронно распределяются и превращаются из цифровой формы в аналоговую.

Хотя цифровые сигналы требуют относительно большую полосу частот, использование вокодера позволяет осуществить передачу речи в цифровом виде по каналу примерно с той же шириной полосы, какая обычно используется в стандартных аналоговых системах телефонной связи. Важно знать, сколько двоичных импульсов достаточно иметь для представления каждого отсчета полосных сигналов. Ответ зависит от того качества принятого сигнала, которое считается приемлемым. По современному состоянию техники в различных конкретных условиях могут использоваться скорости от 1200 до 4800 дв. ед./сек. (Ягги и Масон — Jaggi and Mason). В качестве типичного примера можно привести систему с 18 спектральными каналами, в которой отсчеты берутся с частотой 40 гц и производится нормирование амплитуд. В каналах с номерами от 1 до 14 используются трехзначные кодовые комбинации; в каналах с номерами с 15 по 18—двузначные, сведения об общем уровне передаются трехзначными комбинациями, а на передачу основного тона и сигнала тон-шум отводится 7 дв. ед. Таким образом, на один цикл развертки или «кадр» приходится 60 дв. ед., а скорость передачи данных составляет 2400 дв. ед./сек.

328

СИСТЕМЫ СИНТЕТИЧЕСКОЙ ТЕЛЕФОНИИ

8.1.3. Эксплуатационные качества вокодера

Хотя качество и натуральность речи при передаче по вокодеру обычно ухудшаются, относительно высокая разборчивость синтезированной речи сохраняется даже в вокодере, имеющем всего лишь десять каналов. При работе с высококачественным микрофоном на входе системы и использовании схемы выделения основного тона по частоте первой гармоники характерные значения слоговой разборчивости для 10-канального вокодера (диапазон рабочих частот от 250 до 2950 гц) составляет 83— 85% (Халси и Сваффелд—Halsey and Swaffield). Характерные значения разборчивости начальных согласных приведены в табл. 8.1.

Таблица ЯЛ

РАЗБОРЧИВОСТЬ СОГЛАСНЫХ В ВОКОДЕРЕ

Согласные
b
f
h
к
1
m
п
P
г
s
t
V
W
Sh
th
отсутствие

Правильный прием, %
90
74
100
85
97
85
99
77
100
94
91
96
100
100
43
70

Примечание. Проценты правильно понятых начальных согласных получены при прослушивании слогов (односложных слов) (По Халси н Сваффолду).
Предыдущая << 1 .. 114 115 116 117 118 119 < 120 > 121 122 123 124 125 126 .. 149 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed