Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Джеймс Л. Фланаган -> "Анализ, синтез и восприятие речи" -> 102

Анализ, синтез и восприятие речи - Джеймс Л. Фланаган

Джеймс Л. Фланаган Анализ, синтез и восприятие речи. Под редакцией Пирогова А.А. — М.: Связь, 1968. — 395 c.
Скачать (прямая ссылка): analizsintivocrech1968.djvu
Предыдущая << 1 .. 96 97 98 99 100 101 < 102 > 103 104 105 106 107 108 .. 149 >> Следующая


7.2.7. Порог чувствительности к нулям спектра импульсов

основного тона

Различимость изменений в положениях нулей спектра источника голосового возбуждения (см. п. 6.2.4) или других деталей спектра импульсов ОТ исследовалась, насколько известно, лишь с качественной стороны (Фланаган, 1961, b). Источник импульсов ОТ в значительной степени определяет качество речи и узнаваемость диктора. Следовательно, измерения порогов для таких параметров, как скважность и асимметрия импульсов ОТ, были бы весьма полезными для определения границ их влияния на натуральность речи.

7.2.8. Различимость максимумов и минимумов спектра шума

Передаточная характеристика речевого тракта при формировании фрикативных согласных и других звуков определяется положением нулей и полюсов. Широкополосное шумовое возбуждение фильтруется этим трактом. Некоторые из нулей и полюсов (и соответствующих им минимумов и максимумов спектров) существенны для восприятия, другие — нет. Имеются данные измерения дифференциальной чувствительности для одиночных всплесков или провалов в гладком спектре шума (Малм — Malme). На рис. 7.1 показаны вариации спектра, полученные фильтрацией широкополосного шума цепью с одним полюсом или нулем. На том же рисунке нанесены эквиваленты комплексных частот (зависимости ширины полосы на уровне 0,5 по мощности от частоты настройки) едва различимых нерегулярностей в гладком спектре. Числа в децибелах возле

-282

ВОСПРИЯТИЕ РЕЧИ И РЕЧЕПОДОБНЫХ ЗВУКОВ

отмеченных точек указывают высоту едва различимых всплесков и глубину провалов соответственно. Эти данные показы-, вают, что, по крайней мере, при белом шуме спектральные всплески с величиной Q (т. е. отношением центральной частоты к ширине полосы) не более 5 и провалы в спектре с Q менее 8 на слух не ощущаются.

Ширина поросы, гц

Рис. 7.1. Ощутимость нерегулярностей в спектре широкополосного шума (Малм)

Отсюда возникает предположение, что многие слабо выраженные нерегулярности спектра, наблюдаемые в таких фрикативных, как /f/, не имеют никакого значения для восприятия. Однако некоторые спектральные пики в таких звуках, как

/s/ или /J/, безусловно, отличают их спектр от плоского. Имеются данные о синтезе фрикативных согласных на основе представления их спектра двумя полюсами и одним нулем (Гейнц и Стивене — Heinz and Stevens). Соответствующие значения Q для полюсов находились в пределах от 5 до 13. Для нулей подходящими значениями Q оказались значения порядка 2—4. Возникает мысль о том, что в пределах применимости результатов, отраженных на рис. 7.1, полюсы более существенны для восприятия, чем нули. Последние, очевидно, становятся важными только в случае сильно выраженных нерегулярностей

ДИФФЕРЕНЦИАЛЬНАЯ РАЗРЕШАЮЩАЯ СПОСОБНОСТЬ

283.

спектра. Вероятно, это является причиной того, что положение частот нулей сравнительно некритично. Часто при синтезе их автоматически располагают на октаву «иже первого полюса (Гейнц и Стивене).

Подобные измерения проводились также для шума с периодически следующими (по оси частот) друг за другом максимумами спектра, т. е. при условии, что шум предварительно пропускался через гребенчатый фильтр (Атал и Шредер— Atal and Schroeder). Задача состояла в том, чтобы выяснить влияние нерегулярностей частотной характеристики помещения на восприятие звуков. Белый шум сравнивался с шумом такой же мощности на выходе гребенчатого фильтра, и были найдены пороговые значения едва ощутимых периодических нерегулярностей. Минимально различимое отношение спектральных амплитуд на частотах всплесков и провалов оказалось порядка 1,5 дб. Эта оценка хорошо согласуется с порогом интенсивности, измеренным для белого шума (см. раздел 7.2.5).

Результаты подобных экспериментов дают сведения о весовой функции мгновенного спектрального анализа в слуховом аппарате. Весовая функция, найденная по этим результатам,, имеет почти экспоненциальную форму с начальным наклоном, соответствующим постоянной времени 9 мсек. Эта величина совпадает с постоянной времени, найденной по результатам громкости периодически следующих щелчков (см. раздел 4.3.3).

7.2.9. Другие оценки, полученные методом непосредственного сравнения

Целый ряд других психофизических измерений в той или иной степени характеризует дифференциальную чувствительность к различным параметрам речевого сигнала. Некоторые из них полезно рассмотреть в качестве иллюстрации многогранной природы полученных данных.

В одном из экспериментов оценивалось восприятие одиночной перестраиваемой во времени форманты (Брэди, Хаус и Стивене — Brady, House and Stevens). Непрерывно перестраиваемая резонансная цепь возбуждалась пятью эквидистантными импульсами ОТ. Частота следования импульсов равна 100 гц. Резонансная частота менялась от 1000 до 1500 гц по возрастающим и падающим траекториям, показанным на рис. 7.2. Переход через форманту совершался за 20 мсек. Чтобы оценить, как воспринимаются вариации форманты, операторов-слушателей просили так настроить фиксированную форманту, чтобы ее звучание возможно более соответствовало перестраиваемой. Типичные результаты сравнения показаны
Предыдущая << 1 .. 96 97 98 99 100 101 < 102 > 103 104 105 106 107 108 .. 149 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed