Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Джеймс Л. Фланаган -> "Анализ, синтез и восприятие речи" -> 109

Анализ, синтез и восприятие речи - Джеймс Л. Фланаган

Джеймс Л. Фланаган Анализ, синтез и восприятие речи. Под редакцией Пирогова А.А. — М.: Связь, 1968. — 395 c.
Скачать (прямая ссылка): analizsintivocrech1968.djvu
Предыдущая << 1 .. 103 104 105 106 107 108 < 109 > 110 111 112 113 114 115 .. 149 >> Следующая


Образцы группы С конструировались еще более подобными речевым сигналам. Многие их характеристики вполне

300 ВОСПРИЯТИЕ РЕЧИ И РЕЧЕПОДОБНЫХ ЗВУКОВ

приемлемы для звукосочетаний синтетической речи. Подобно Bj образцы С представляли собой слоги типа «гласная—согласная», но, в отличие от В, гласные формировались с помощью-четырех резонаторов, настроенных на фиксированные частоты 500, 1500, 2500 и 3350 гц. Полосы пропускания примерно соответствовали характеристикам естественных гласных. Первая форманта была с падающим переходом вплоть до паузы аналогично переходу от гласной к согласной в естественной речи. Часть, относящаяся к согласной, формировалась фильтрацией-шума с одним нулем и одним полюсом. Фильтрующая цепь, подобна цепи, описанной в предыдущем параграфе для синтеза фрикативных согласных (Гейнц и Стивене—Heinz and Stevens). Частота основного тона при формировании гласных менялась от 120 до 150 гц. Система координат и варьируемые-параметры такие же, как и в сигналах типа В. В подгруппе Ct резонансная частота для согласных менялась от 500 до 5000 гц восемью ступенями. Длительность гласной равна 250 мсеку паузы — 50 мсек и согласной — 100 мсек, так что общая длительность всегда оставалась равной 400 мсек. В подгруппе-С7 имелись два значения по каждой координате: частоте резонанса, интенсивности, длительности паузы.

Образцы D были односложными звукосочетаниями естественной речи, произносимыми одним диктором. Они составляли единственную подгруппу в трехмерной системе координат. Из двух гласных /I/, /Л/ и четырех согласных /f, s, р, t/ составлялось восемь слогов. Четыре из них были односложными английскими словами, а остальные слоги смысла не имели. В процессе испытаний образцы представлялись изолированно по одному. Операторы-слушатели должны были каждому образцу сопоставить одну из восьми необозначенных кнопок на панели ответов. После того как оператор делал выбор, зажигалась, одна из восьми лампочек, обозначая кнопку правильного ответа, с которой ассоциируется образец. Затем представляется следующее звукосочетание. Относительно скорости никаких требований не предъявлялось.

Результаты показывают рост вероятности правильного ответа в ходе обучения. На рис. 7.16 показаны усредненные данные для 12 операторов, соответствующие образцам, квантованным по одной координате — частоте. Каждая испытательная серия состояла из 16 следующих друг за другом в случайном порядке образцов данного восьмикомпонентного ансамбля. Оценки для трехкоординатных образцов представлены на рис. 7.17. Эти две серии результатов показывают, что на трехкоординатных образцах обучение завершается быстрее, чем на од-нокоординатных. Среди трехкоординатных образцов быстрейшее

АБСОЛЮТНОЕ РАЗЛИЧЕНИЕ РЕЧИ И РЕЧЕПОДОБНЫХ ЗВУКОВ 301

обучение достигается на звукосочетаниях естественной речи (D7). На следующем месте по скорости обучения стоят речеподобные искусственные сигналы A7. Результаты позволяют сделать два вывода. Во-первых, обучение более эффективно для образцов, квантованных по нескольким физическим координатам, по сравнению с находящимися в одномерном континууме. Во-вторых, по мере приближения характеристик образцов к характеристикам речи наблюдается снижение эффективности процесса обучения. Исключением являются сами образцы естественной речи!

о 7 2 3 4 5 6 Номер испытательной серии

Рис. 7.16. Усредненная вероятность правильного ответа для образцов, квантованных по одной координате—частоте (Хаус, Стивене, Сандел и Арнолд)

Последний, несколько странный, результат объясняется тем, что ни один из ансамблей образцов А, В и С не является достаточно подобным речи, чтобы МОГЛИ ПРОЯВИТЬСЯ ЛИНГ- a, UO

вистические ассоциации. Сле-1 довательно, процесс их иден-°§ °? тификации отличен от про- g цесса идентификации об- § °>6 разцов речи. Звуки естест-1 венной речи подразделяют- I

Трехмерные образцы оЛ7 -В7 L С7 kD7

7 8

ся слушателями на катего- | рии весьма успешно, и, по«|а-^ видимому, при различении

образцов D операторы при- д 12 3 IF

влекают лингвистические HoWo испЫтатЪ'лЫой сёрШ

ассоциации. Сигналы А, В Рис. 7.17. Усредненная вероятность пра-и С, лишенные лингвисти- «ильного олвета для образцов, иванто-' „ ванных по трем координатам: время,

ческих ассоциации, рЭЗЛИ- 4atT0Taj интенсивность (Хаус, Стивене, чаются на основе «естест- ' Сандел, Арнолд)

302

ВОСПРИЯТИЕ РЕЧИ И РЕЧЕПОДОБНЫХ ЗВУКОВ

венной» для восприятия системы координат, т. е. по громкости, основному тону и длительности. Различение по этим основным координатам оказывается наиболее четким для образцов Л. Сигналы В и С не вполне подходят для такой системы координат, поскольку в их составе имеется фиксированный начальный сегмент, соответствующий гласной.

Такая интерпретация результатов согласуется с предположением о существовании речеподобного континуума. Сигналы могут быть в той или иной степени подобными речи с физической точки зрения, однако при субъективном восприятии они четко делятся на две категории. Воспринимаемые звуки либо ассоциируются с лингвистическими образами, либо нет. В описанном эксперименте ни один из синтетических звуков не ассоциировался с лингвистическими категориями. Для лингвистического подхода характерна тенденция определять категорию сигнала на основе координат, устанавливаемых структурой языка. Восприятие сигналов как лингвистических единиц в сильной степени определяется процессами, происходящими в центральной нервной системе. Мелкие детали сигнала, воздействующие на периферические органы слуха, не являются первостепенно важными. Для нелингвистических сигналов характерна тенденция сопоставлять их по естественным психологическим параметрам. Вероятно, их различение требует меньшего, по сравнению с восприятием речи, участия центральной нервной системы.
Предыдущая << 1 .. 103 104 105 106 107 108 < 109 > 110 111 112 113 114 115 .. 149 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed