Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Деркач М.Ф. -> "Динамические спектры речевых сигналов" -> 47

Динамические спектры речевых сигналов - Деркач М.Ф.

Деркач М.Ф., Гумецкий Р.Я., Гура Б.М., Чабан М.Е. Динамические спектры речевых сигналов — Лв.: Высшая школа, 1983. — 168 c.
Скачать (прямая ссылка): dinamichspektrrechsignal1983.djvu
Предыдущая << 1 .. 41 42 43 44 45 46 < 47 > 48 49 50 51 52 .. 53 >> Следующая

146
теристики с очень крутым склоном в сторону высоких частот. Предварительное формирование таких характеристик обеспечивается первыми 8 блоками. Последующие 120 блоков образуют «длинную линию», воспроизводящую прохождение волны вдоль улитки. На начальные звенья «длинной линии» приходятся высокие частоты, на конечные — низкие. На выходе каждого из указанных звеньев подключены дополнительные активные низкочастотные фильтры второго порядка с более высокой добротностью. Они обеспечивают дополнительное «обострение» частотных характеристик и приближение их ширины к критическим полоскам слуха. Выходной сигнал каждого из фильтров представляет колебания определенной области основной мембраны вдоль по оси улитки.
Как указывают авторы [18, 19, 20], вид слуховых спектрограмм определяется частотно-координатными свойствами модели. Средние частоты ее 120 каналов лежат в диапазоне от 30 до 9500 Гц. В области до 800 Гц ширина полос фильтров постоянна, связь между номером координаты и частотой фильтра линейна. В области выше 800 Гц постоянной сохраняется относительная ширина полос фильтров, связь между номером координаты и частотой фильтра — логарифмическая. Скорость реакции зависит от характеристической частоты координаты: время задержки ответа на импульсное возбуждение имеет порядок 0,25 мс для частоты 7000 Гц, 2 мс для 1000 Гц, 5 мс для 250 Гц. Разделение «длинной линии» на три цепочки дало возможность сократить время задержки импульсного ответа модели и приблизить его к наблюдаемому для соответствующих частотных координат улитки внутреннего уха.
Для снятия динамических спектрограмм, которые были названы слуховыми спектрограммами, анализируемый сигнал, многократно повторяется с помощью специального магнитофона с вращающейся головкой и подается на вход модели. Электронный коммутатор с каждым новым оборотом головки последовательно подключает к регистратору по одному из выходов модели. Синхронно с каждым оборотом магнитной головки смещается на одну строчку оптическая головка записи на фотобумагу. Сигналы с выходов модели после логарифмирования и детектирования используются для модуляции яркости неоновой лампы оптической головки записи. В результате на фотобумаге регистрируется изображение слуховой спектрограммы речевого сигнала с осями — время, частота, интенсивность аналогично как и в случае сонограмм.
На слуховых спектрограммах речевых сигналов четко выделяются участки гласных звуков. Сравнение сонограмм и слуховых спектрограмм показывает ряд интересных особенностей последних. Так, на сонограммах, снятие которых производится фильтрами с шириной полосы 300 Гц, хорошо выделяются форманты, лежащие в области средних частот 800—2000 Гц. Более высокочастотные максимумы проявляются здесь с чересчур большой детализацией, не свойственной слуху в этой частотной области.
147
В то же время изображение низкочастотных спектральных составляющих оказывается «смазанным», и в области частот ниже 600 Гц на спектре гласных часто наблюдается расплывчатая темная полоса с трудно разделимыми формантными максимумами и полосой основного тона.
Слуховые спектры в этом отношении проявляют то преимущество, что в них визуализируется та часть низкочастотного спектра, которая в действительности выделяется слуховым рецептором. Это первая и вторая форманты гласных. Поэтому сравнительная бедность слуховых спектрограмм гласных по своему составу по сравнению с сонограммами не является их недостатком, а лучше, чем у последних, скоррелирована с событиями, осуществляющимися на основной мембране внутреннего уха. Сглаженность деталей слуховых спектрограмм в высокочастотной области подтверждается рядом электрофизиологических данных.
В сонограммах отражение гармонической структуры в полосе основного тона часто мешает выделению первой форманты, в то время как на слуховых спектрограммах гармоническая структура, связанная с основным тоном, выражена слабее, а факт работы голосовых связок прослеживается по характерным колебаниям в низкочастотном диапазоне и по вертикальной полосатости в высокочастотной области. Это оказывается существенным для локализации гласных и сонорных согласных. Хорошо выделяется на слуховых спектрограммах информация о шумах щелевых согласных, а также о быстропротекающих процессах, таких как взрывные сегменты взрывных согласных.
Существенным при регистрации слуховых спектраграмм фактором является более высокая, чем у сонограмм, скоррелирован-ность полос анализа с критическими полосками слуха — они узки в низкочастотной области и расширяются к высоким частотам. Это позволяет обойтись без подьема высоких частот при регистрации слухового спектра, а следовательно, уменьшить несоответствие технического и физиологического анализа динамических спектров речи.
Разработчики модели спектрального анализа указывают, что в ответах модели сохраняется информация о быстро протекающих изменениях сигнала, которые способен воспринимать человек, а на спектральных изображениях сигналов, создаваемых моделью, могут быть выделены подробности, соответствующие минимально воспринимаемым спектральным максимумам [18, 19]. Это дает основание считать, что слуховые спектрограммы речевых сигналов отражают существенные характеристики речевых звуков. Читателя не должен смущать тот факт, что регистрируемые на фотобумаге лабораторные образцы слуховых спектрограмм по качеству исполнения уступают сонограммам лучших фирм, претерпевшим многолетнюю техническую эволюцию. Адекватность получаемой на слуховых спектрограммах информации, несомненно, внесет свои коррективы в развитие техники динамической спектрографии речи в будущем.
Предыдущая << 1 .. 41 42 43 44 45 46 < 47 > 48 49 50 51 52 .. 53 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed