Анализ, синтез и восприятие речи - Джеймс Л. Фланаган
Скачать (прямая ссылка):
284
ВОСПРИЯТИЕ РЕЧИ И РЕЧЕПОДОБНЫХ ЗВУКОВ
на рис. 7.3. Обозначенные по горизонтали образцы а, Ь, с, d, е и / соответствуют нумерации, принятой на рис. 7.2. По результатам видна весьма четкая тенденция устанавливать частоту
фиксированного резонанса по конечному значению частоты перестраиваемой форманты, в особенности, когда формантный переход совершается в начале звука. Эта тенденция проявляется несколько сильнее при перестройке форманты
вверх.
Несколько иначе сказывается влияние тонкой временной структуры голосового возбуждения. Форма и периодичность импульсов ОТ подвержены различным вариациям, которые существенно влияют на качество речи. Так, при известной особенности голоса, определяемой термином «дипло-фония», чередуются импульсы неодинаковой высоты (С. Смит — S. Smith). Соседние периоды ОТ могут также различаться по длительности. Для количественной оценки последнего эффекта Либерман (Lieberman) анализировал длительности 7000 периодов ОТ естественной речи. В отрезках длительностью по 3 периода вариации длительности периодов превышали ±0,1 мсек в 86% случаев. В 20% случаев наблюдалось чередование длинных и коротких периодов. При отсутствии корреляции между соседними периодами проявлялась сильная корреляция через один период.
Первым шагом на пути выяснения возможной корреляции этих факторов с особенностями восприятия были предварительные исследования эффекта восприятия регулярных отклонений амплитуды и моментов появления импульсов периодической последовательности (Фланаган, Гуттман и Уотсон — Flanagan, Guttman and Watson; Гуттман и Фланаган — Guttman and Flanagan, 1962). Форма исследуемых импульсов показана на рис. 7.4 слева. Начиная со строго периодической последова-
Время —*-
Импульсы 111 дозбуждения I I I
Юмсек
Рис. 7.2. Частотные траектории имитируемых перестраиваемых формант и эпюры возбуждающих импульсов (Брэдн, Хаус и Стивене)
ДИФФЕРЕНЦИАЛЬНАЯ РАЗРЕШАЮЩАЯ СПОСОБНОСТЬ
285
1600
1500
з 'чий
%
I
g 1300
IZOO
I
Рис. 7.3. Результаты орав- g нения фиксированного и g иаа nepecTpaHiBaeMOTO резо- * нансов (по рис. 7.2).? Сплошной линиеій обт-^юоо начены средние значения, ^ вертикальными линия-10 ми — границы стандарт- яоо ного отклонения ,(Брэди, Хаус и Стивене)
юоо^Ш a-*f
_ Траектории г 'перестроит
образцы f(t)
в с а е f Образцы
F(W)
ага±-T
2а
AT
'JU
I
» 1 / \ I / \ I /
о ы/т Stc Ij
г— т—и
* TLJIi
-1
5.
0 klCfr 87t/j
6)
1500
—
a-~f
Траектории перестройки
г В с a е f Образцы
Диаграммы нулей а палюсоб
; Плоскость S
ІШ
Рис. 7.4. Форма периодических импульсов при определении влияния аременных и амплитудных отклонений на восприятие основного тана. Слева показаны импульсы экспериментальных последовательностей: Al — с вариациями амплитуды; Лт — временными вариациями; В — эталонная последовательность. В центре представлены соответствующие спектральные диаграммы, а справа — диаграммы на комплексной плоскости (Фланаган, Гуттмая и Уотсон; Гуттман и Фланаган, 1962)
286
ВОСПРИЯТИЕ РЕЧИ И РЕЧЕПОДОБНЫХ ЗВУКОВ
«Si«*
6)
10 12
16 13 20
Параметр: частота f*~ следоЬания RT I
тельности (периода —), постепенно увеличились либо ампл
туда (образец AL), либо запаздывание (образец АТ) каждо* четного импульса. Получаемый эффект оценивался слушателя^ <0 путем подстройки частот
эталонной периодически последовательности до с гласования с тоном исслё lkpammpmcnm^ дуемой последовательности!, С увеличением разности ам плитуд AL либо длительно-; стей периодов А7' вскоре достигался момент, поел которого высота тона пони* жалась на октаву.
Иа рис. 7.4 посередине^ показаны частотные спектры образцов Аь с неодинаковой амплитудой импульсов, образцов АТ с неодинаковым периодом и образцов В эталонной последовательности. На этом же рисунке справа изображены соответствующие диаграммы нулей и полюсов для всех трех упомянутых периодических последовательностей. Характерно, что относительные амплитуды соседних спектральных линий сигнала AL полностью определяются амплитудами а\ и U2 импульсов. Но спектральные амплитуды сигнала АТ зависят от длительности T периода ОТ и формы циклоидальной огибающей, которая, в свою очередь, определяется интервалом т.
Усредненные по показаниям большого количества слушателей результаты сравнения при отклонениях AL и AL приведены на
1074
671
413
264
164
102
64
40
'2
Рис. 7.5. Результаты сравнения эталонной последовательности импульсов В:
а) с периодической последователо-ностью Al, в которой четные импульсы отличаются по амплитуде от нечетных на AL; б) с периодической последовательностью At, в которой четные импульсы сдвинуты по времени на ДТ. В обоих случаях параметром является частота следования образцов А (Фланаган, Гуттман и Уотсон; Гуттман п Фланаган, 1962)
ДИФФЕРЕНЦИАЛЬНАЯ РАЗРЕШАЮЩАЯ СПОСОБНОСТЬ
287
рис. 7.5 а и б соответственно. Ha общих графиках параметром является частота следования, т. е. удвоенная частота первой гармоники. Результаты для AL (рис. 7.5 а) показывают, что в диапазоне частот ОТ голоса человека различие амплитуд AL на 6—9 дб или более приводит к субъективному ощущению понижения основного тона на октаву. Аналогичное понижение на октаву ощущается в том же диапазоне (т. е. от 100 гц и