booksshare.net -> Добавить материал -> Лингвистика -> Деркач М.Ф. -> "Динамические спектры речевых сигналов" -> 5

Динамические спектры речевых сигналов - Деркач М.Ф.

Деркач М.Ф., Гумецкий Р.Я., Гура Б.М., Чабан М.Е. Динамические спектры речевых сигналов — Лв.: Высшая школа, 1983. — 168 c.
Скачать (прямая ссылка): dinamichspektrrechsignal1983.djvu

Предыдущая << 1 .. 2 3 4 < 5 > 6 7 8 9 10 11 .. 53 >> Следующая

* За иитеисивиость нулевого уровня принята величина /= Ю-12 Вт/м2, соответствующая звуковому давлению 2,04-10~5 Па.
12
4 6 6 10 12 14 16 Расстояние от губ, см
18
Рис. 1.2.2. Способ получения ступенчатого приближения к функции площади на основании рентгенограмм [28]. Определяются площади для ряда поперечных сечеиий речевого тракта, перпендикулярных к осевой линии на протяжении от голосовой щели до губ. Эти площади показаны на рисунке справа, а места соответствующих разрезов — слева сверху для произносимого звука [ы]. На основании этих данных строится плавная кривая, представляющая собой функцию площади в зависимости от расстояния (средняя часть рисунка). Эта кривая разбивается на ряд ступеней для проведения количественных расчетов по модели речевого тракта (нижняя часть рисунка).
Существенную роль в образовании и восприятии гласных играют максимумы передаточной функции, которые характеризуют основные резонансы речевого тракта и называются формантами спектра. Они обозначаются /""І, Ґ2, F3 и т. д., начиная от низкочастотного конца спектра. Основные резонансные полости, расположенные вдоль речевого тракта, накладывают на передаточную функцию ограничения, которые можно в допустимом приближении рассматривать как последовательную формантную фильтрацию. Амплитуды и частоты формант связаны
13
функционально, что облегчает вычисление их параметров. Таким образом, форманты — это резонансные пики, .проявляющиеся в картине спектра и соответствующие набору собственных частот речевого тракта. Частоты формант обычно обозначаются /ч, Fз и т. д., а ширины полос формант на уровне 3 дБ от вершины огибающей спектра — В4, В%, В3 и т. д. Описание звуков речи при помощи частот их формант, как правило, не более первых двух или трех, дает в результате так называемую ^-картину, или Т7-паттерн этого звука. Формантное описание звуков речи, в частности гласных, является более компактным и экономичным, чем описание в виде совокупности всех гармоник. В принципе для заданной Г-картины можно установить существенные параметры функции поперечного сечения речевого тракта. Эта связь, многократно подтвержденная методами синтеза речи, дает возможность рассматривать переход от F-кapтины к артикуляционным параметрам как ценный метод уменьшения избыточности описания речевого сигнала.
Однако методы определения формант не всегда однозначны. Они связаны с рядом неразрешенных проблем. Прежде всего частота форманты может не совпадать с частотой какой-либо гармоники, что видно, например, в правой нижней части рис. 1.2.1. Это обусловливается взаимной независимостью характеристик источника и передаточной функции. Поэтому частота форманты в случае гармонического спектра практически определяется с точностью до ошибки А/7, которая пропорциональна Fo и имеет порядок Fo/4 [29]. Кроме F-кapтины спектральных резонансов, в ряде согласных звуков, а также при назализации гласных проявляются антирезонансы, или нули. Картина спектральных нулей, или 2-паттерн, значительно менее определенная, чем F-кapтинa спектральных формант. Сами по себе они не столь существенны для восприятия, однако наличие антирезонанса изменяет относительные уровни соответствующих формант, образуя своеобразные полюсно-нулевые пары.
Одновременно спектрально-временные характеристики турбулентных шумов и импульсных взрывов согласных не только дополняют фонетическую информацию, содержащуюся в речевом потоке, но и существенно усложняют характер F- и 2-картин в динамических спектрограммах речевых сигналов. Наконец, следует иметь в виду, что детальные механизмы выделения формант непосредственно слуховым анализатором человека представляют собой еще не решенную задачу. Необходимо также предостеречь читателя от ожидания легкого успеха в визуальном выделении и интерпретации формант при чтении динамических спектрограмм. Он сможет убедиться в дальнейшем, что для решения этой задачи в ряде случаев необходимы априорные языковые знания.
Тем не менее акустическая теория речеобразования представляет собой хорошую теоретическую основу для метода нахождения в динамических спектрах речи акустических коррелятов наиболее важных артикуляционных событий и жестов, свидетель-
14
ствующих о характере источника, способе и месте образования звуков речи. В течение последних десяти лет эта теория развивалась весьма бурно, что привело к детализации многих ее классических положений. Тех, кто желает рассмотреть более подробно вопросы теории частотного и временного анализа речи и их связи с процессом речеобразования, мы отсылаем к классическим работам Г. Фанта и Дж. Фланагана, а также к более новым обзорам и руководствам [28, 29, 30, 34].
1.3. ДИНАМИЧЕСКАЯ СПЕКТРОГРАФИЯ РЕЧЕВОГО СИГНАЛА
Итак, все разнообразие звуков речи так или иначе отображается в разнообразии их спектров, характер которых постоянно изменяется в речевом потоке. Основу этих изменений составляют меняющиеся резонансы основных /""-картин и меняющиеся добавочные полюсно-нулевые пары, возникающие из-за конкретных особенностей артикуляции и местоположения источника.

Предыдущая << 1 .. 2 3 4 < 5 > 6 7 8 9 10 11 .. 53 >> Следующая