Научная литература
booksshare.net -> Добавить материал -> Медицина -> Чистович Л.А. -> "Физиология речи. Восприятие речи человеком" -> 9

Физиология речи. Восприятие речи человеком - Чистович Л.А.

Чистович Л.А. , Венцов А. В., Гранстрем М.П. Физиология речи. Восприятие речи человеком — Л.: Наука, 1976. — 388 c.
Скачать (прямая ссылка): fizrech1976.djvu
Предыдущая << 1 .. 3 4 5 6 7 8 < 9 > 10 11 12 13 14 15 .. 159 >> Следующая

На рис. 1.9 показана динамическая спектрограмма фразы Тоня топила баню (запись ее артикуляторных параметров изображает рис. 1.3). Видно, что на динамической спектрограмме на протяжении всей фразы, за исключением участков, отнесенных к [1], [I] и [р'], имеются области почернения (наличия звуковой энергии) в тех или иных зонах частотной шкалы. Наибольшей степенью почернения отличается область нижних частот до 1000 Гц, здесь располагаются максимально выраженные спектральные составляющие гласных. Можно видеть, что на участках гласных звуков наблюдается несколько областей почернения, положение которых по шкале частот изменяется на протяжении звука. Эти области соответствуют формантам гласного.
Более точная количественная характеристика амплитудно-частотного спектра, соответствующая некоторому моменту изучаемого сигнала, может быть получена с помощью регистрации на той же диаграмме «видимой речи» так называемого спектрального среза. На рис. 1.9 темкая вертикальная линия отмечает момент к которому относится измерение, а кривая в правой части диаграммы отражает спектр в логарифмическом масштабе.
При рассмотрении рис. 1.9 отмечается также характерная структура динамической спектрограммы в виде вертикальных полос (в областях гласных звуков и звонких согласных). Эта структура отражает работу голосовых связок. Частота следования вертикальных полос определяется частотой основного тона голоса.
24
На спектрограмме, например, четко отмечается уменьшение этой частоты к концу фразы.
На спектрограмме можно легко видеть также общее уменьшение энергии (по сравнению с гласными) и некоторое снижение частоты основного тона на участках, относимых к звонким согласным [п'], [1], [Ь], [п']; шум взрывных согласных Ш, [р'] представлен узкой вертикальной полоской, занимающей большую часть частотной шкалы, что и характерно для импульсного звука.
Огромное число исследований, выполнявшихся с помощью метода «видимой речи», было направлено на выявление характерных инвариантных свойств тех или иных речевых звуков, нахождение различительных признаков соответствующих звуковых групп и многих других фонетически значимых особенностей сложной картины речевого сигнала. Большая практика позволила сформулировать определенные правила чтения «видимой речи» [135,254' 358], однако уже сравнительно давно стало ясно, что возможности метода в отношении расшифровки структуры речевого сигнала далеко не беспредельны и по сути исчерпались на этапах работ, проводившихся в пятидесятых и шестидесятых годах [344].
Были поставлены специальные исследования для выявления предельных возможностей «чтения» речи на основе динамических спектрограмм. Выяснилось [53> 327 ¦ 362], что полностью достоверного распознавания достичь не удается, но окончательные результаты распознавания могут быть существенно улучшены, если спектрограммы относятся только к ограниченному набору фраз, содержание которых заранее известно.
1.3. СИНТЕЗ РЕЧЕВЫХ СИГНАЛОВ
Кроме прикладного использования (создание «говорящих машин»), методы искусственного синтеза речевых сигналов применяются и в исследовательских целях. Здесь выделяются две основные группы задач. Во-первых, синтезаторы разрабатываются как функциональные модели процессов, имеющих место при рече-образовании. В данном случае они используются для разработки и подтверждения правильности тех или иных положений теории речеобразования. Во-вторых, синтезаторы используются как устройства, способные генерировать речеподобные звуки с точно задаваемыми параметрами. Звуки эти применяются и при исследовании механизмов восприятия речи.
Широкое использование синтезированных звуков для исследования особенностей восприятия речи началось со времени работ, проводившихся в пятидесятых годах в Хаскинских лабораториях в США [75- 220]. Идея исследований сводилась к попыткам найти полезные признаки звуковых сигналов, на основании которых человеком производится различение определенных звуков речи. В опытах создавались звуки, физические характеристики которых точно задавались и изменялись согласно желанию эксперимента-
25
тора. Слушатели идентифицировали эти звуки с теми или иными элементами речи.
Было изготовлено специальное мектро-оптическое устройство, создающее речеподобные звуки. Управляющие сигналы рисовались на лентах; вдоль ленты шла ось времени, поперек — ось частот [221]. С помощью этого в общем достаточно примитивного устройства и были начаты современные исследования связи физических особенностей речевого сигнала с особенностями его восприятия.
К настоящему времени созданы значительно более совершенные средства синтеза речевых сигналов. Наибольшее приближение
±
±
2*3
Н 5 - 6 - 7 \-\
10 —
11
12
13 - 14 - 15
т ^4"
16
Рис. 1.10. Блок-схема синтезатора речевых сигналов ОУЕ-Ш. По [Щ.
Обозначения см. в тексте.
к естественной речи дают системы, в той или иной форме моделирующие основные явления, которые имеют место при речеобразо-вании. Не имея возможности хоть в какой-то мере охватить все разнообразные системы ш> 138, 261], рассмотрим в качестве примера принципы устройства хорошо известного современного аналогового синтезатора (ОУЕ-Ш), разработанного в Лаборатории передачи речи Стокгольмского технологического инсти тута [35 1.
Предыдущая << 1 .. 3 4 5 6 7 8 < 9 > 10 11 12 13 14 15 .. 159 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed