Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Джеймс Л. Фланаган -> "Анализ, синтез и восприятие речи" -> 130

Анализ, синтез и восприятие речи - Джеймс Л. Фланаган

Джеймс Л. Фланаган Анализ, синтез и восприятие речи. Под редакцией Пирогова А.А. — М.: Связь, 1968. — 395 c.
Скачать (прямая ссылка): analizsintivocrech1968.djvu
Предыдущая << 1 .. 124 125 126 127 128 129 < 130 > 131 132 133 134 135 136 .. 149 >> Следующая


8.7.2. Амплитудное квантование и кодирование. Клиппированная речь

Разборчивость предельно ограниченного по амплитуде речевого сигнала лишь слегка ниже разборчивости обычной речи (Ликлайдер и Поллак — Licklider and Pollack). Однако по каче-

352

системы синтетической телефонии

ству звучания клиппированная речь жестка и неприятна для слуха. Если исходный сигнал зашумлен, на выходе клиппирую-щего устройства в паузах речи прослушивается клиппирован-ный шум, сравнимый по уровню с полезным речевым сигналом. Это оказывает сильное мешающее действие. Применение операций дифференцирования до клиппирования и интегрирования после него несколько повышает разборчивость и качество звучания.

Поскольку звуки речи отличаются высоким пик-фактором, клиппирование дает выигрыш в тех случаях, когда пиковая мощность передатчика ограничена (например, при амплитудной модуляции). При некоторых значениях уровня шума применение операции клиппирования приводит к повышению разборчивости, эквивалентному повышению уровня исходного сигнала на 12 дб (Уотен-Данн и Липке — Wathen-Dann and Lipke).

Речь хорошего качества получается при дискретной передаче с частотой следования отсчетных значений, равной 8000 гц (для полосы 4000 гц), при квантовании семью двоичными разрядами1). В тех случаях, когда приемлемо качество, характерное для клиппированной речи, число двоичных разрядов и емкость канала могут быть уменьшены в 7 раз.

Клиппирование однополярного сигнала. Обычно полоса частот, необходимая для передачи речи, простирается от 300 до 3000 гц и перекрывает диапазон более трех октав. Предельное ограничение спектральных компонентов в этом диапазоне сопровождается нелинейными искажениями, комбинационные частоты которых попадают в тот же диапазон. Если же применить операцию гетеродинирования, т. е. переноса спектра в область более высоких частот, то исходная полоса речевого сигнала будет перекрывать только часть октавы. Однако временная огибающая смещенного по спектру сигнала повторяет форму исходного сигнала. Продукты нелинейности, образованные клиппированием смещенного сигнала, теперь выходят за пределы полосы. Ограничением спектра смещенного клиппированного сигнала с сохранением исходной ширины полосы и последующим переносом в первоначальный диапазон частот можно получить сигнал с постоянной амплитудой, нули временной функции которого приблизительно совпадают с нулями исходного сигнала. Однако компоненты нелинейности, вызванные клиппированием, теперь исключены.

Обычным методом реализации операции смещения спектра является однополосная модуляция. В одном из первых исследо-

') При квантовании семью двоичными разрядами число уровней кванто--ваиия равно 128 (прим. перев.).

ДРУГИЕ МЕТОДЫ СОКРАЩЕНИЯ ПОЛОСЫ

353

ваний сообщалось о том, что сигнал постоянного уровня воспринимается на слух так же, как и исходный, с сохранением разборчивости и хорошего качества (Марку и Даге — Marcou and Daguet).

Аналогичные преобразования использованы в системе «Фре-на», в которой, кроме клиппированного однополосного сигнала, передается медленно меняющийся сигнал огибающей непреоб-разованного сигнала. Спектр огибающей ограничен полосой 100 гц. Этот сигнал используется в приемнике для амплитудной модуляции клиппированного сигнала (де Джаге и Грифкес — de Jager and Greefkes). Следовательно, сигнал огибающей действует как автоматический регулятор громкости. В интервалах, где его уровень невелик, помехи от клиппированного шума полностью подавляются. Кроме того, восстанавливается естественная динамика речевого сигнала. И в то же время клишированный однополосный сигнал обеспечивает глубокую модуляцию в передатчике, даже при тихой речи. Упомянутая система относится не к системам сжатия спектра, а к системам повышения эффективности связи в условиях помех и ограниченной пиковой мощности.

Артикуляционные испытания показывают, что этот метод при низком соотношении сигнал/шум обеспечивает выигрыш по разборчивости по сравнению с обычной однополосной передачей, эквивалентный повышению отношения сигнал/шум порядка 15 дб.

Квантование по времени клиппированного сигнала. Незначительное влияние операции клиппированния на разборчивость речи позволяет предположить, что большая часть информации содержится в нулях временной функции. В связи с этим возникает вопрос о допустимых погрешностях воспроизведения моментов перехода через нуль. Ответ на этот вопрос экспериментально получен при исследовании влияния квантования по времени предварительно продифференцированной клиппированной речи с последующим интегрированием (Ликлайдер — Licklider, 1950).

Рассматривались два метода квантования интервалов перехода через нуль. В методе А в конце заданного интервала времени формировался фронт двухуровневого сигнала только в том случае, если в течение этого интервала входной сигнал клиппированной речи менял свою полярность не менее одного раза.

В методе Б фронт формировался только, если входной сигнал менял свою полярность нечетное число раз в течение интервала. Параметром была длительность квантующего интервала. Результаты артикуляционных испытаний с применением фонетически сбалансированных таблиц позволяют оценить разборчи-
Предыдущая << 1 .. 124 125 126 127 128 129 < 130 > 131 132 133 134 135 136 .. 149 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed