Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Джеймс Л. Фланаган -> "Анализ, синтез и восприятие речи" -> 115

Анализ, синтез и восприятие речи - Джеймс Л. Фланаган

Джеймс Л. Фланаган Анализ, синтез и восприятие речи. Под редакцией Пирогова А.А. — М.: Связь, 1968. — 395 c.
Скачать (прямая ссылка): analizsintivocrech1968.djvu
Предыдущая << 1 .. 109 110 111 112 113 114 < 115 > 116 117 118 119 120 121 .. 149 >> Следующая


и для оценки систем синтетической телефонии, в которых для передачи речевой информации кодируется не сама речевая волна, а некоторые ее параметры.

Методика расчета индекса артикуляции (ИА) подробно описана в литературе. Остановимся здесь на изложении основных принципов, и вкратце на применимости и оценке метода. Диаграмма для расчета индекса артикуляции приводится на рис. 7.24 (Бера-нек — Beranek, 1954). Сплошные линии обозначают некоторые спектральные плотности, представленные на специальной шкале частот. Частотная шкала примерно соответствует тональной (в масштабе мелов). По экспериментальным данным она делится на двадцать полос равной артикуляции.

Простейшая методика расчета индекса артикуляции состоит в следующем. Вначале изображенный на рис. 7.24 график спектра речи преобразуется по форме и по уровню в соответствии

270490*77641

п 380 630 920 U30 IFlO 192В 23Wm 3950 5600 Средние частоты рабнаартикуляционных полос , ги

Рис. 7.24. Диаграмма для расчета индекса артикуляции (Беранек). Общий уровень среднеквадратичного давления на расстоянии 1 м от источника речи равен 69 дб:

1 — пиковый уровень речи, 2 — средний уровень речи, 3 — минимальный уровень речи, 4 — порог ощущения Для звуков с непрерывным спектром

34

57

РАСЧЕТ РАЗБОРЧИВОСТИ

315»

с усилением и частотной характеристикой тракта передачи. Затем наносится график спектра аддитивного маскирующего шума. Если частотная характеристика системы и уровень шума таковы, что весь заштрихованный «диапазон речи» (между минимальным и максимальным уровнями) лежит выше порога,, выше уровня маскирующего шума, но ниже уровня перегрузки,, го разборчивость будет почти идеальной. В таких случаях индекс артикуляции равен 100%. Если диапазон речи перекрывается шумом, пересекает порог или уровень перегрузки, индекс артикуляции равен 100%. в процентном отношении перекрываемой площади.

Полученную величину ИА необходимо пересчитать в величину разборчивости. Соотношения между этими величинами установлены эмпирически на основе артикуляционных испытаний. Поскольку результаты артикуляционных испытаний не всегда однозначны и в сильной степени зависят от методики, получаемые абсолютные оценки разборчивости следует использовать и интерпретировать с максимальной осторожностью. Обычно

более уместно рассматривать различие в разборчивости, полученной при одинаковой методике испытаний. Эмпирические соотношения между численными значениями разборчивости и индекса артикуляции для различных условий испытаний показаны на рис. 7.25 (Крайтер— Kxyter) 1).

0,1

<$ W

0,2 0,3 ОЛ 0,5 Ofi 0,7 0,8 0,9 I? Индекс артикуляции

Рис. 7.25. Некоторые экспериментальные соотношения между индексом артикуляции и разборчивостью (Крайтер). Эти соотношения приближенные. Они зависят от типа материала, тренированности дикторов и слушателей:

/ — ограниченный словарь из 32 фонетически сбалансированных слов, 2 — предложения, 3 — ограниченный словарь из 256 фонетически сбалансированных слов, 4 — фонетически сбалансированные слова (1000 различных слов), 5 — бессодержательные слоги (1000 различных слогов)

') Более подробно об объективной методике расчета разборчивости в телефонных каналах см. Сапожков, * Покровский (прим. ред.).

316

ВОСПРИЯТИЕ РЕЧИ И РЕЧЕПОДОБНЫХ ЗВУКОВ

7.8. Дополнительные сенсорные каналы восприятия речи

7.8.1. Спектрограф «видимой речи»

Вспомогательные методы речевой коммуникации чрезвычайно важны для лиц с частичной или полной потерей слуха. Такие люди зачастую лишены возможности не только слышать чужую речь, но даже свою собственную. Вследствие этого они нередко испытывают трудности при разговоре.

Исследования вспомогательных каналов восприятия и разработки соответствующей аппаратуры для речевой связи ведутся в трех основных направлениях. Они основаны на использовании визуальных, дактильных и остаточных слуховых ощущений. Каждое из этих направлений может быть кратко иллюстрировано специфическим примером. В рассматриваемой области имеются также и другие интересные результаты.

Хорошо известным методом визуального представления речевой информации является так называемая «видимая речь» (Поттер, Копи и Грин—Potter, Kopp and Green). При помощи спектрографа «видимой речи» 1) в реальном масштабе времени на экране электронно-лучевой трубки получается текущее, непрерывное, изображение спектра (Риш и Шотт — Riess and Schott; Дадли и Груэнц—Dudley and Gruens). Это изображение подобно обычным спектрограммам звуков (см. раздел 5.1.4), однако отличается от них непрерывностью. Накапливающаяся по мере отклонения луча речевая информация сохраняется и отображается вследствие послесвечения экрана.

Проводились эксперименты по обучению зрительному «чтению» изображения «видимой речи» (Поттер, Копп и Грин). Результаты показали, что после сравнительно продолжительной тренировки операторам удается успешно «переговариваться» с умеренной скоростью. Их обучали поддерживать беседу в пределах ограниченного словаря, соответствующего уровню знаний иностранного языка учеников старших классов школы. Скорость обучения характеризуется усвоением примерно 350 новых слов за 100 часов тренировки.
Предыдущая << 1 .. 109 110 111 112 113 114 < 115 > 116 117 118 119 120 121 .. 149 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed