Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Джеймс Л. Фланаган -> "Анализ, синтез и восприятие речи" -> 107

Анализ, синтез и восприятие речи - Джеймс Л. Фланаган

Джеймс Л. Фланаган Анализ, синтез и восприятие речи. Под редакцией Пирогова А.А. — М.: Связь, 1968. — 395 c.
Скачать (прямая ссылка): analizsintivocrech1968.djvu
Предыдущая << 1 .. 101 102 103 104 105 106 < 107 > 108 109 110 111 112 113 .. 149 >> Следующая


Зависимость восприятия согласных от типа последующих гласных наводит авторов на мысль, что акустическими единицами для слухового восприятия могут служить отрезки длительностью слога или полуслога '). Однако взаимнооднозначного соответствия между звуками и фонемами не найдено, и в слитной речи нет фонем в свободной форме. Следовательно, нет надежды найти для всех случаев акустические инварианты индивидуальных фонем2).

Описанные выше эксперименты относились к звукам, воспроизводимым по упрощенным спектрограммам с применением частного типа синтезатора. Подобные же эксперименты проводились и с другими видами синтезаторов. Задача состояла в том, чтобы проверить их адекватность с точки зрения восприятия, а также выяснить влияние других акустических факторов на опознавание. В одном из подобных экспериментов синтезировались изолированные фрикативные, а также слоги типа «фрикативный — гласный» (Гейнц и Стивене — Heinz and Stevens). Фрикативные согласные формировались путем фильтрации шума электрической цепью с одним нулем и полюсом. Частота нуля поддерживалась всегда на октаву ниже частоты полюса. Целью эксперимента было выяснение возможности опознавания фрикативных согласных при таком идеализированном представлении спектра, а также стремление установить расположение нулей и полюсов для тех или иных оценок опознаваемости. По данным гл. III спектральные диаграммы фрикативных

') Эта и другие точки зрения обсуждаются ниже, в п. 7.5.

2) На этом основании, по-видимому, ие следует считать безнадежной задачу распознавания фонем, решение которой должно состоять в применении алгоритма перехода от звукосочетаний (слогов), распознаваемых по акустическим признакам, к фонемам (прнм. ред.).

296

ВОСПРИЯТИЕ РЕЧИ И РЕЧЕПОДОБНЫХ ЗВУКОВ

2000 3000 5000 8000

Центральная частота, гц

всегда содержат несколько нулей и полюсов. Однако, как следует из п. 7.2.8, многие из этих особых точек не существенны для восприятия.

В одном из опытов синтезировались и испытывались изолированные согласные. Частоты и полюсы нулей и полюсов менялись в широких пределах. Опознавание проводилось для ансамбля, состоящего из пяти фонем: / j",?, s, 0 и f/. Длительность синтетических звуков составляла 200 мсек. Результаты опыта показывают, что изменение ширины полосы резонаторов в пределах, соответствующих значениям добротностей Q от 5 до 10, не приводит к существенным изменениям оценок опознаваемости. Однако изменение резонансной частоты существенно отражается на оценках. Этот эффект иллюстрируется графиком зависимости процента пра-

„,„ „ вильно опознанных зву-

Рис. 7.13. Оценки опознаваемости на слух па0п о " ог-тп

при абсолютной идентификации синтетиче- ков °т резонансной[ часш-ских фрикативных, сформированных путем ты (рис. 7.13). Оценки фильтрации шума с одним нулем и полю- опознаваемости /f/ И /О/ сом. Частота полюса определяется абсцис- объединены сой, а частота нуля приблизительно на ок- п„„ „чист

таву ниже (Гейнц и Стивене) Для формирования

слогов типа «согласная— гласная» с теми же синтетическими фрикативными применялся синтезирующий четырехполюсник. Во всех случаях гласным звуком был /а/. Упрощенные спектрограммы синтезированных слогов показаны на рис. 7.14. Сигналы, управляющие синтезирующим четырехполюсником, показаны графически в нижней части рис. 7.14. Первые два графика описывают закон нарастания и спадания интенсивности шумов (турбулентного) и импульсного (сонорного) возбуждения. Третий график показывает траекторию формантных переходов. Переход Fi для гласных всегда начинался от 200 гц. Первоначальное значение F2 составляло 900, 1700 или 2400 гц. Резонансная частота фрикативных устанавливалась на 2500, 3500, 5000, 6500 и 8000 гц. Слушатели должны были опознать начальную консонанту среди возможных /f, 6, s или!/.

Оценки опознаваемости согласных как функции резонансной частоты фрикативных и типа перехода второй форманты

АБСОЛЮТНОЕ РАЗЛИЧЕНИЕ РЕЧИ И РЁЧЕПОДОБНЫХ

приведены на рис. 7.15. Представленные результаты соответствуют значениям отношения интенсивностей согласной и гласной: —5 дб и —25 дб. Обозначены два контура оценок. Область, ограниченная пунктирной линией, соответствует правильному опознаванию более чем 90% звуков, а сплошной линией—более 75%. Данные для двух значений отношения интенсивностей согласной и гласной подчеркивают важность относительных уровней при восприятии IQl и в меньшеи степени Js/. Приведенные оценки показывают, что фрикативная /f/ отличается от /9/ в основном за счет перехода в гласной. Ha-

g_____оборот, формантний пере-

~ " 1 ход'почти не влияет на раз-

личение /s/ и /|/. Здесь большую роль играет резонансная частота фрикативной. Подобное исследование, очень похожее по методике и цели на описанное

I

%200

I WO ^ п 3 200

1 100

% о

І 2щ 1 JOO

й о

t--C-

-г-

Ff

F2

F1

Дмплитуда шумо8ого возбуждения

Амплитуда, импульсного возбуждения

Относительное изменение формантной частоты
Предыдущая << 1 .. 101 102 103 104 105 106 < 107 > 108 109 110 111 112 113 .. 149 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed