Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Деркач М.Ф. -> "Динамические спектры речевых сигналов" -> 6

Динамические спектры речевых сигналов - Деркач М.Ф.

Деркач М.Ф., Гумецкий Р.Я., Гура Б.М., Чабан М.Е. Динамические спектры речевых сигналов — Лв.: Высшая школа, 1983. — 168 c.
Скачать (прямая ссылка): dinamichspektrrechsignal1983.djvu
Предыдущая << 1 .. 2 3 4 5 < 6 > 7 8 9 10 11 12 .. 53 >> Следующая

Спектральное представление речевого сигнала во времени является его адекватным представлением также с точки зрения восприятия речи человеком. Слуховая система, в частности основная мембрана внутреннего уха, осуществляет разложение акустической речевой волны в спектр, передавая по слуховому нерву в высшие отделы центральной нервной системы информацию о том, как-перераспределяется во времени энергия в речевой волне, включая весь диапазон слышимых человеком звуковых частот. Динамическая спектрография речи явилась, по единодушному признанию специалистов, мощным и общепринятым методом акустического анализа речи в плане ее экспериментально-фонетического исследования. С ее помощью получена подавляющая часть данных, составивших современные сведения о структуре речи многих языков [34].
Принцип метода и первая аппаратура были разработаны в 1946 г. Бэлловской лабораторией (США) в виде звукового спектрографа. Вскоре появилась его усовершенствованная модификация — Кэйевский сонограф (рис. 1.3.1). Эта модель позволяет анализировать 2,4 с речи, записанной на магнитный диск. После записи сигнал многократно воспроизводится и на специальной бумаге регистрируется динамическая спектрограмма — картина, на которой ось времени расположена горизонтально, ось частоты — вертикально, а от интенсивности зависит степень потемнения бумаги. В связи с наклоном спектра голосового источника около 6 дБ на октаву, в современных сонографах имеется возможность вводить подъем высоких частот от 6 до 12 дБ на октаву и тем самым визуализировать высокочастотные компоненты спектра речевого сигнала.
В 1947 г. в книге Р. Поттера, Г. Коппа и Г. Грина «Видимая речь» были опубликованы спектрограммы звуков для английского и других языков [46]. С тех пор методы спектрографии получили широкое распространение не только в экспериментальной фонети-
15
ке, но и во многих прикладных областях исследования речевого сигнала, а устройства, использующие данный метод, часто стали называть приборами «видимой речи».
В настоящее время приборы «видимой речи» широко применяются в различных областях речевой коммуникации, в частности для информативного описания речевых сигналов в задачах автоматического распознавания речи отдельных дикторов. В такой модификации широкую популярность приобрели приборы серии «Воиспринт». Динамические спектрографы типа «Воиспринт» отличаются от сонографов только конструктивными деталями. Помимо удобного и компактного расположения функциональных блоков, в последних моделях этих приборов имеется возможность подъема высоких частот до 18 дБ на октаву, что позволяет выявлять на спектрограммах значительно больше индивидуальных деталей, расположенных в высокочастотной области спектра.
В наиболее распространенных современных модификациях приборов «видимой речи» анализируемый участок речевого сигнала длительностью около 2,5 с, записанный на фиксируемом участке магнитной ленты, многократно воспроизводится при помощи быстро вращающейся магнитной головки с автоматической подачей снимаемого сигнала на вход полосового фильтра. На диаграмме, представляющей результаты анализа, вычерчивается линия, степень черноты которой отражает интенсивность выходного сигнала упомянутого фильтра. Запись производится на специальной электрочувствительной бумаге. С каждым циклом частота настройки фильтра сдвигается, на диаграмме вычерчивается новая линия, несколько сдвинутая от предыдущей. В результате возникает трехмерное изображение с осями: время, частота, интенсивность. В приборах обычно используется принцип гетеродинного анализатора — абсолютная величина ширины полосы фильтра сохраняется постоянной по всей частотной шкале. Наиболее часто ширина полосы пропускания фильтра берется довольно большой — порядка 300 Гц.
Общий уровень интенсивности, при котором проводится снятие динамической спектрограммы, устанавливается по наиболее интенсивной • компоненте снимаемого сигнала (как правило — это ударные гласные) с тем, чтобы избежать перегрузки анализатора, а следовательно — артефактов на самой спектрограмме. Вследствие этого элементы речевого сообщения, произнесенные с малой громкостью (например, звуковые элементы некоторых безударных слогов), могут оказаться ниже порога чувствительности регистрирующей части спектрометра. Разрешающая способность электрочувствительной бумаги значительно уступает чувствительности слуха, так что на участках безударных слогов часто не удается выявить визуально детали спектральной динамики речевого сигнала, если в течение его произнесения имелись существенные перепады в интенсивности, что часто имеет место в естественной речи. В таких случаях приходится снимать динамическую спектрограмму речевого сообщения по частям.
16
Рис. 1.3.1. Сонограф фирмы Kay Electric Corp.
На рис. 1.3.2 приведены примеры динамических спектрограмм двух звукосочетаний — ивУ (слева) и укА (справа). На спектрограммах отмечается характерная структура в виде вертикальных полос в области гласных и звонких согласных звуков, которая отражает работу голосовых связок. Частота следования вертикальных полос определяется частотой основного тона голоса Р0. Особенно четко выделяются области концентрации акустической энергии, положение которых изменяется по частоте и во времени. Это форманты гласных, особенно Fl и ^2, и шумные признаки согласных звуков.
Предыдущая << 1 .. 2 3 4 5 < 6 > 7 8 9 10 11 12 .. 53 >> Следующая
Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed