booksshare.net -> Добавить материал -> Лингвистика -> Деркач М.Ф. -> "Динамические спектры речевых сигналов" -> 42

Динамические спектры речевых сигналов - Деркач М.Ф.

Деркач М.Ф., Гумецкий Р.Я., Гура Б.М., Чабан М.Е. Динамические спектры речевых сигналов — Лв.: Высшая школа, 1983. — 168 c.
Скачать (прямая ссылка): dinamichspektrrechsignal1983.djvu

Предыдущая << 1 .. 36 37 38 39 40 41 < 42 > 43 44 45 46 47 48 .. 53 >> Следующая

130
кГц 7т
;!¦•• Рис. 5.2.1. Динамические спектрограммы слитных
1 ' 1 ' фраз [хърашОвл'исУл'Этьм], [сланЫйЭл'ис'Эна]— 1.2 1.3 с верхний ряд; [нАшъс'им'йАбал'шАйа] — нижний.
назального [н] в ударном слоге с его неподвижными носовыми резонансными полосами. Установив место на спектрограмме звуков [с] и [н], мы получаем необходимые основания для идентификации находящегося между ними сегмента со сложно движущимися вверх формантами не как одного гласного звука, а как звукосочетания [ла]. Одновременно легко обнаружить место палатального согласного [й] по шумовой составляющей и высокочастотному положению второй форманты в его начале. Для нас становится отчетливее дифтонгоидная формантная структура главного [ы], и, кроме этого, удается обнаружить факт назализации этого гласного по продолжающейся от согласного [н] носовой форманте.
Звук [с'] занимает центральное положение в анализируемой фразе, поэтому нельзя не использовать его для разделения фразы на более мелкие слоговые участки. Слева от него располагается звукосочетание [йэл'и], в котором переднеязычный сонант [л'] отмечен незначительными импульсными щелчками языка. Палатализация в виде ы-образного положения второй форманты удерживается до самого начала последующего ударного гласного [э] в слове [с'эна], в котором нетрудно декодировать составляющие его звуки.
На примере предложения «Наша семья большая» (нижний ряд рис. 5.2.1) показана роль глухих щелевых согласных как активных идентификаторов слов на динамических спектрограммах слитной речи. После опознания звука [ш] в слове «наша» легко идентифицируются звуки [н], ударное и безударное [а]; после глухого [с] можно локализовать и распознать звуки [и], [м'], сегмент [й] и ударное [а] с характерным и—а-образным движением формант. Перед глухим щелевым [ш] без труда можно локализовать отдельные звуки звукосочетания [бал'], а после него — звукосочетание [айа] с тенденцией к редукции последнего элемента этого трифтонга.
Очень важно подчеркнуть, что использование спектрально-временной информации в процессе «чтения» динамических спектрограмм требует системного, комплексного подхода, который, однако, нелегко представить в виде последовательности формально осуществляемых операций фонемной дешифровки звуковых элементов анализируемой фразы. Одна из основных трудностей анализа динамических спектрограмм в режиме их фонемного «чтения» состоит в невозможности уверенно сегментировать речь на отдельные звуки. Последовательности фонем (например, звонких или сонорных согласных или их сочетаний с гласными) можно легко принять за неделимые звуковые элементы, и тогда возникают ошибки сегментации типа пропуска фонем. В других случаях небольшая шероховатость в спектре может быть расценена как свидетельство отдельного фонетического элемента, уменьшение общей интенсивности звука — как свидетельство паузы и т. п., а это приводит к ошибкам сегментации типа выявления ложных сегментов.
132
о
7т
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.6 0.9 1.0 1.1 1.2 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 с
М 0.2 0.3 0.4 0.5 0.6 0.7 0.6 0.8 1.0 1.1 1.2 1.3 1.4 1.5 с
Рис. 5.2.2. Динамические спектрограммы слитных фраз [унАзбылАгАлка], [задОмъм-растУдубЫ] — верхний ряд; [тУдбЫл'ишА-р'ьк'итУз'ьк] — нижний, в которых обра-щается внимание на примеры ассимиляции признаков согласных.
Другая сложность при «чтении» динамических спектрограмм заключается в трудностях самой фонемной идентификации звуковых сегментов в условиях неполно или ненадежно выявленных признаков. Как правило, задача идентификации решается при отсутствии всего комплекса отличительных признаков фонем, а следовательно, принятие решения имеет большую или меньшую неопределенность.
Приводимые ниже примеры «чтения» динамических спектрограмм фраз иллюстрируют сложность выявления и интерпретации идентифицирующих ключей в ходе их визуального анализа.
Нахождение надежных спектрально-временных ключевых идентификаторов может быть затруднено в силу разных сопутствующих причин. К ним, в первую очередь, следует отнести ряд уже известных нам фонетически значимых закономерностей, присущих литературному стилю произношения. Это явление ассимиляции признаков согласных, редукции гласных в безударных положениях, разной степени коартикуляционных воздействий смежных звуков друг на друга и т. п. Примеры этих явлений приведены на рис. 5.2.2 в динамических спектрограммах фраз, где обращается внимание на факты озвончения глухих согласных на стыках слов перед звонкими согласными.
В верхнем ряду рис. 5.2.2. на динамической спектрограмме фразы «У нас была галка» слитное сочетание с и б произнесено как звукосочетание [зб]. Вокализацию глухого согласного г и его переход в звонкий звук [д] перед последующим звонким согласным [б] мы видим в нижнем ряду рисунка на спектрограмме фразы «Тут были Шарик и Тузик», начальная часть которой реализована звуковой последовательностью [тудбыл'и]. В верхнем ряду этого же рисунка мы можем наблюдать пример ассимиляции глухого взрывного т следующим за ним звонким согласным [д] на стыке слов «растут дубы» во фразе «За домом растут дубы». На динамической спектрограмме этой фразы видно, что звуки [т] и [д] сливаются в единый сегмент озвученной смычки с последующим переднеязычным взрывом.

Предыдущая << 1 .. 36 37 38 39 40 41 < 42 > 43 44 45 46 47 48 .. 53 >> Следующая