Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Джеймс Л. Фланаган -> "Анализ, синтез и восприятие речи" -> 99

Анализ, синтез и восприятие речи - Джеймс Л. Фланаган

Джеймс Л. Фланаган Анализ, синтез и восприятие речи. Под редакцией Пирогова А.А. — М.: Связь, 1968. — 395 c.
Скачать (прямая ссылка): analizsintivocrech1968.djvu
Предыдущая << 1 .. 93 94 95 96 97 98 < 99 > 100 101 102 103 104 105 .. 149 >> Следующая


ЭЛЕКТРИЧЕСКИЕ МЕТОДЫ СИНТЕЗА РЕЧИ

275

дел ей большой интерес (Хаус, Стивене и Пол — House, Stevens and Paul; Линдблом — Lindblom).

Подобное запоминание фонем использовалось также при цифровом моделировании аналогового речевого тракта (Келли и Лохбаум—Kelly and Lockbaum). В этом случае при указании синтезируемой фонемы запрашиваются данные о конфигурации тракта, который аппроксимируется сочлененными прямыми круговыми цилиндрами; при этом функция передачи от одного цилиндра 1K другому моделируется «ак функция ,коэффициента отражения в каждом стыке. При указании какой-нибудь фонемы производится опрос памяти машины о законе изменения площади поперечных сечений тракта и о наборе коэффициентов отражения, характеризующих разрывы в законе распределения площади. Запоминаемые правила переходов здесь относятся не к данным о формантах, а к артикуляторным параметрам.

Исследуется также ряд других синтезаторов, моделированных на ЭВМ или управляемых от ЭВМ, которые здесь не описываются. Укажем лишь, что их диапазон очень широк—от управляемых ЭВМ аналоговых голосовых трактов (Деннис — Dennis) и формантных синтезаторов (Истее, Керби, Мексей и Уолкер—Estes, Kerby, Махеу and Walker) до вокодероподобяых синтезаторов спектра (Олсон—Olson; Смит—Smith, 1963; Мик-кер—Meeker, Нелсон и Скотт—Nelson and Scott). Во всех случаях способность цифровой ЭВМ хранить большое количество информации и выполнять логические операции с исключительно большой скоростью является весьма важным фактором.

VII. ВОСПРИЯТИЕ РЕЧИ И РЕЧЕПОДОБНЫХ

ЗВУКОВ

Слуховое восприятие рассматривают в различных аспектах. С точки зрения теорнн связи можно выделить классическую психофизическую теорию слуха н лингвистическое опознавание слуховых образов. Первый раздел принципиально связан со свойствами органов слуха как !преобразователей акустических сигналов в механические колебания н затем в нервные импульсы. Второй касается в основном проблемы классификации н опознавания слуховых образов, существенных с точки зрения слушателя.

Классическая психофизическая теория направлена на определение «разрешающей способности» механизма слуха. Способность различения обычно проверяется для основных параметров (координат) возбуждающих стимулов, а чаще всего — лишь для одного параметра, выбранного при постановке опыта. Как правило, измерения проводятся в условиях, наиболее приспособленных для соответствующих различений, т. е. определением дифференциального порога нлн методом сравнения. Подобным образом определяются дифференциальные пороги для таких параметров, как интенсивность нлн частота.

Интуитивно чувствуется, что нн сложность процессов, происходящих в центральной нервной системе, ни огромная емкость ее памяти, по-внднмому, не играют роли в различении этих порогов. Количественные результаты скорее

276

ВОСПРИЯТИЕ РЕЧИ И РЕЧЕПОДОБНЫХ ЗВУКОВ

всего отражают способность преобразующего органа, а также периферической нервной системы выявлять детали того или иного параметра возбуждения. В гл. IV упоминалось об этих свойствах периферической системы. Тем же анализировались очевидные соотношения между физиологическими и психоакустическими откликами на некоторые виды возбуждения. Акустические сигналы выбирались «классического» типа, т. е. они были прерывистыми во времени, либо характеризовались простой спектральной структурой, либо в них сочетались оба упомянутых признака.

С другой стороны, речь является многомерным сигналом, вызывающим лингвистические ассоциации. Для эффективного кодирования передаваемой информации в ее сущности должны быть заложены некоторого вида абсолютно воспринимаемые категории. Другими словами, сигнал должен делиться на конечное число дискретных информационных элементов. «Объем» этих элементов и сам процесс их восприятия являются предметом споров и ряда домыслов. Современный уровень знаний лишь приближается к надлежащему пониманию этого процесса. Построение теории слухового восприятия, учитывающей все лингвистические и обучающие функции, наталкивается на непреодолимые трудности. Еще более сложной задачей является согласование физиологических, психофизических и лингвистических факторов. Как во всяких трудных ситуациях, предпринимаются попытки отыскать наиболее существенные особенности завершающего этапа процесса принятия решения, который является основой восприятия.

Хотя построение завершенной теории восприятия речи остается задачей будущего, уже сейчас можно многое сказать о различении звуковых образов. Результаты некоторых «классических» измерений тесно связаны с существенными характеристиками речи, хотя при этих измерениях лингвистические или контекстуальные вопросы оставались в стороне. Кроме того, значительная информация об акустических явлениях накопилась в ходе экспериментов по искусственному синтезу простейших элементов речи, например-слогов и фонем.

С практической точки зрения артикуляционные испытания и оценит рт-борчивости, основанные на абсолютном опознавании предложений, слов, слогов и изолированных фонем, могут быть использованы при разработке систем передачи. При рассмотрении тех или иных систем преобразования речевых сигналов эти оценки зачастую позволяют выявить факторы, влияющие иа восприятие (хотя они мало пригодны, а может быть, и вовсе бесполезны для описания самого процесса восприятия). При некоторых условиях так называемые индексы артикуляции могут применяться для расчета разборчивости по данным измерений физических характеристик тракта передачи. Наряду с определением разборчивости можно получить некоторые данные о влиянии лингвистических, контекстуальных и грамматических ограничений. Однако просодические свойства и натуральность звучания речи до сих пор не определены.
Предыдущая << 1 .. 93 94 95 96 97 98 < 99 > 100 101 102 103 104 105 .. 149 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed