Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Джеймс Л. Фланаган -> "Анализ, синтез и восприятие речи" -> 101

Анализ, синтез и восприятие речи - Джеймс Л. Фланаган

Джеймс Л. Фланаган Анализ, синтез и восприятие речи. Под редакцией Пирогова А.А. — М.: Связь, 1968. — 395 c.
Скачать (прямая ссылка): analizsintivocrech1968.djvu
Предыдущая << 1 .. 95 96 97 98 99 100 < 101 > 102 103 104 105 106 107 .. 149 >> Следующая


') Термины «дифференциальный порог», «едва заметное различие» является синонимами, относящимися к понятию о едва заметном изменении.

ДИФФЕРЕНЦИАЛЬНАЯ РАЗРЕШАЮЩАЯ СПОСОБНОСТЬ

279

мерена с помощью психоакустических экспериментов. Например, имеются данные о едва заметных отклонениях частоты формантных максимумов, частоты основного тона, общей интенсивности и ширины формант. Не вдаваясь в детали экспериментов, приведем основные результаты.

7.2.2. Пороговые значения для частот формантных максимумов

Едва различимые изменения частот максимумов первой и втоірой формант были измерены (Фланаган, 1956, Ь) на синтетических гласных звуках, формируемых синтезатором с сосредоточенными параметрами (см. раздел 6.2.2). Управление синтезатором осуществлялось по принципу формантного вокодера. Дифференциальные пороги в значительной степени зависят от интервалов между формантами и составляют около 3—5% от частоты формантного максимума1).

7.2.3. Пороговые значения для амплитуд формантных максимумов

Из гл. III и VI известно, что относительная амплитуда любого формантного максимума речевого сигнала является функцией нескольких переменных, в том числе частоты этого максимума, затухания речеобразующего тракта, положения нулей передаточной функции и характеристик источника возбуждения. Измерения дифференциальной чувствительности к амплитудам формант проводились с помощью синтезатора параллельного типа с сосредоточенными параметрами (Фланаган, 1957,а). Порог интенсивности для второй форманты почти нейтральной гласной /эе/ оказался порядка 3 дб.

Подобные же измерения пороговых значений общей интенсивности синтезированных гласных дали величину порядка 1,5 дб (Фланаган, 1955,а). Поскольку первая форманта обычно в гласных звуках является наиболее интенсивной, общий показатель может служить в качестве приближенной оценки порога чувствительности для первой форманты.

]) В этих экспериментах рассматривалось изменение частоты только одного формантного максимума. В естественной речи и в формантных вокодерах одновременно перемещаются максимумы нескольких формант. Важным и практически полезным обобщением эксперимента было бы определение объемной «области дифференциальных порогов» в пространстве F]—F2—F3. Эффект близости формант должен, вообще говоря, придать этим «областям» эллипсоидальную форму. Это замечание остается в силе и для случаев различения одновременных изменений координат сигнала в любом из описанных ниже экспериментов.

280

ВОСПРИЯТИЕ РЕЧИ И РЕЧЕПОДОБНЫХ ЗВУКОВ

7.2.4. Пороговая чувствительность к ширине формант

Прямые измерения различимости изменений ширины формант или коэффициента затухания для синтезированных гласных не проводились. Однако некоторые родственные измерения и их экстраполяция подсказывают ожидаемые результаты.

Стивене (Stevens, 1952) исследовал различимость изменений настройки и затухания одиночного электрического резонатора. Резонатор возбуждался периодической последовательностью импульсов с частотой первой гармоники 125 гц. Следовательно, выходной сигнал представлял одноформантную гласную. В общем едва различимыми оказались изменения ширины форманты в пределах от 20 до 40%.

Как следует из гл. III, амплитуда формантного максимума связана с коэффициентом затухания обратной зависимостью. Величина 1,5 дб, найденная для порогового значения амплитуды первой форманты, соответствует изменениям ширины полосы пропускания порядка 20%. Аналогично величина 3 дб для второй форманты соответствует изменениям ширины около 40%1).

7.2.5. Пороговая чувствительность к частоте основного тона

Дифференциальные пороги для частоты основного тона (ОТ) синтетических гласных звуков определялись с помощью таких же экспериментов, как и при измерениях формант (Фланаган и Саслоу — Saslow). Для звуков, соответствующих мужскому голосу, порог составляет 0,3—0,5% от частоты ОТ. Интересно, что пороговая чувствительность слуха к изменениям частоты формант на порядок выше, чем к изменениям ширины формант, а к изменениям ОТ, в свою очередь, — на порядок выше, чем к изменениям формантной частоты.

7.2.6. Пороговые значения для интенсивности возбуждения

При постоянной форме импульсов основного тона и фиксированной передаточной характеристике речевого тракта общая интенсивность сонорных звуков прямо пропорциональна амплитуде импульсов. Известно, что пороговые значения общей интенсивности гласных составляют величину порядка 1,5 дб.

1) Другие многомерные дифференциальные порош можно определить при одновременном изменении частоты <и ширины формант. Другими мовами, можно найти «область» дифференциальных порогов для полюсов речевого тракта на плоскости комплексных частот.

ДИФФЕРЕНЦИАЛЬНАЯ РАЗРЕШАЮЩАЯ СПОСОБНОСТЬ

281

Точно так же общая интенсивность глухих звуков непосредственно связана с эффективной амплитудой шумового возбуждения. Фрикативные согласные являются относительно широкополосными продолжительными турбулентными звуками. Можно ожидать, что различимость изменений их эффективной амплитуды будет такого же порядка, как и в случае белого шума. Для последнего порог интенсивности измерялся (Миллер, 1947). Было найдено, что при общем уровне около 30 дб он составляет величину порядка 0,4 дб. Хотя относительно равномерным спектром характеризуется лишь несколько фрикативных согласных, тем не менее указанные данные могут быть использованы для оценки порядка величины порога и в остальных случаях. Опыт по синтезу речи подтверждает эту точку зрения.
Предыдущая << 1 .. 95 96 97 98 99 100 < 101 > 102 103 104 105 106 107 .. 149 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed