Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Джеймс Л. Фланаган -> "Анализ, синтез и восприятие речи" -> 69

Анализ, синтез и восприятие речи - Джеймс Л. Фланаган

Джеймс Л. Фланаган Анализ, синтез и восприятие речи. Под редакцией Пирогова А.А. — М.: Связь, 1968. — 395 c.
Скачать (прямая ссылка): analizsintivocrech1968.djvu
Предыдущая << 1 .. 63 64 65 66 67 68 < 69 > 70 71 72 73 74 75 .. 149 >> Следующая


Во втором методе мгновенный спектр подразделяется на частотные диапазоны, которые в идеальном случае содержат только одну форманту. После этого в пределах каждого сегмента измеряется частота спектрального максимума. Работа устройства иллюстрируется рис. 5.20. В простейшем варианте границы сегментов фиксированы. При этом может быть использована дополнительная цепь управления, которая автоматически регулирует эти границы так, что частотный диапазон данного сегмента оказывается зависимым от частоты соседней низшей форманты. Энергия сигналов в спектральных сегментах нормируется с помощью схемы нормализации на основе оценки либо пиковых, либо средних значений сигналов. Произведенная этой схемой нормировка дает возможность следующей схеме селекции по пикам работать в широком диапазоне амплитуд. Максимумы каждого сегмента выделяются с высокой скоростью, например 100 раз в секунду, и к выходу подводится напряжение, пропорциональное частоте выделенного канала. Выборки могут быть сфазированы во времени так, чтобы границы спектральных сегментов регулировались последовательно и расставлялись в соответствии с измеренным местоположением соседней низшей форманты. Описанный метод подвергался многочисленным усо-

Запуст генератора, пилообразных импульсов

Генератор гкиюсорауных

импульсов

Діщнреренцириющі устройства а

выпрямители Устройства \\ Г Оля получения

отсчетов

nfJIMln^ г^У^Ч уди

— Т —

С).

T t

їтгїїїґ

T f

t,. h

(В)

=УУ -rV

t t ff

(A)

JZL

TT

JL-

fr

Рис. 5.19. Метод развертывания спектра во времени для автоматического выделения формантных

(Фланаган, 1956, а)

ФОРМАНТНЫИ АНАЛИЗ РЕЧИ

193

вершенствованиям посредством !введения частотной интерполяции (Ширм—Shearme, 1959), более утонченной логики регулирования границ сегментов (Холмс и Келли-—Holmes and Kelly) и большего динамического диапазона для селекторов пиковых значений (Стэд и Джонс — Stead and Jones). При изготовлении всех этих устройств стремились создать работающий в реальном масштабе времени практически пригодный прибор для непосредственного применения в системе передачи.

Схема нормализации.
F,

Селектор максимальной амплитуды Ft

і >



Регулировка, границ_

Схема нормализации

Селектор максимальной амплитуды

Регулировка границ

>FJt)

Схема нормализации F3
I
Селектор максимальной амплитуды Fs






-OF3 ft)

Рис. 5,20. Метод отбора по пиковым значениям для автоматического выделения формантных частот (Фланаган, 1956, а)

Типичные сигналы на выходе устройства, показанного на рис. 5.20, с фиксированными границами сегментов даны на рис. 5.21. Как видно, устройство работает с ошибками. На спектрограмме имеются значительные искажения при выделении третьей форманты звука /г/ в слове «rain», которые устраиваются при автоматическом управлении границей F2—F3. Для сравнительно грубой оценки работы устройства можно привести следующие данные: установлено, что на выходе устройства для первой форманты Fi гласных звуков, лежащей в пределах ±150 гц, правильные результаты получаются более чем в 93% времени, а для второй форманты F2, лежащей в пределах ±200 гц,— более чем в 91% времени (Фланаган, 1956, а). Хотя обычно требуется большая точность, этот метод (вследствие его простоты и удобства осуществления анализа в реальном масштабе времени) оказался пригодным для исследования некоторых систем формантного вокодера (Фланаган и Хаус—House; Стэд и Джонс — Stead and Jones; Ширм, Смит и Келли — Shearme, Smith and Kelly). 7—71

194

устройства для анализа речи

Рис. 5.21. Сигналы на выходе формантного выделителя, показанного на рис. 5.20 при передаче фразы «Beat, beat, і can't stand in the Rain» («Идет, идет, я не могу стоять под дождем»)

Методы выделения формант с помощью вычислительных

машин. Создание больших быстродействующих вычислительных машин позволило использовать более сложные программы обработки речи, в частности, благодаря способности машин запоминать и обрабатывать с большой скоростью значительный объем данных. Данные о некотором исследуемом образце могут удерживаться в ,машине в течение всего комплекса испытаний и измерений его характерных особенностей, вплоть до принятия решения. Эти преимущества распространяются не только на процесс обнаружения формант, но и на все другие фазы обработки речи. Определенные связи между системами с дискретным действием и аналоговыми системами (см., например, Pa-газзини и Франклин—Ragazzini and Franklin) позволяют моделировать на вычислительной машине всю систему передачи в целом. Однако этот вопрос имеет самостоятельное значение, и мы вернемся к нему в одной из следующих глав.

Анализ речевых формант в цифровом виде первоначально выполнялся посредством обработки спектральных распределений. Информация о спектре либо вводилась в машину в диокретизи-рованном виде от внешней гребенки фильтров, либо определялась путем вычисления в машине из предварительно квантового по уровню и дискретизированного во времени речевого сигнала. Один подход в соответствии с последним из упомянутых вариантов состоит в синхронном с основным тоном анализе вокализованных звуков (Мэтьюс, Миллер и Дэвид — Mathews, Miller and David, 1961, b). Отдельные периоды основного тона выделяются путем визуальной обработки осциллограммы речи. Затем каждый период с помощью вычислительной машины раз-
Предыдущая << 1 .. 63 64 65 66 67 68 < 69 > 70 71 72 73 74 75 .. 149 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed