Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Деркач М.Ф. -> "Динамические спектры речевых сигналов" -> 49

Динамические спектры речевых сигналов - Деркач М.Ф.

Деркач М.Ф., Гумецкий Р.Я., Гура Б.М., Чабан М.Е. Динамические спектры речевых сигналов — Лв.: Высшая школа, 1983. — 168 c.
Скачать (прямая ссылка): dinamichspektrrechsignal1983.djvu
Предыдущая << 1 .. 43 44 45 46 47 48 < 49 > 50 51 52 .. 53 >> Следующая

В верхнем ряду справа на рис. 5.4.3 и посредине на рис. 5.4.4 соответственно сонограмма и слуховая спектрограмма фразы «Я играю с подругами». Бросается в глаза предельная редуцированность звука [у] в звукосочетании [йу], которая выступает в безударном положении и одинаково хорошо видна в обоих случаях регистрации динамической спектрограммы. Используя контекстуальную информацию и накопленный опыт чтения спектрограмм, не трудно локализовать и фонемно идентифицировать соответствующие звуковые реализации фонем этой фразы.
Несомненно, лабораторные образцы слуховых спектрограмм в настоящее время не могут конкурировать по'качеству изображения с сонограммами, выполненными на аппаратуре «видимой речи» лучших коммерческих фирм. Тем не менее принципы анализа, осуществленные в моделях слухового анализатора, по-
154
О 0.1 0.2 0.3 0.4 0.5 0.6 0.7 O.B 0.9 1.0 1.1 1.2 1.3 С
155
зволяют считать это направление в усовершенствовании метода динамической спектрографии перспективным. Он продолжает развиваться в направлении отображения при анализе других феноменов слуховой рецепции, таких как, например, двухтоновое подавление и др. [18, 19].
5.5. ПРАКТИЧЕСКИЕ ПРИМЕНЕНИЯ МЕТОДА ДИНАМИЧЕСКОЙ СПЕКТРОГРАФИИ РЕЧИ
Методы визуального изучения спектральной динамики речи позволили сформулировать и обосновать возможность решения двух важных задач, представляющих научный интерес и имеющих большое поле практического применения. Это задачи автоматического распознавания и синтеза речи. [5, 11, 15, 21, 25, 26, 31, 39, 41].
Нельзя представить себе прогресс в области автоматического распознавания речи вне связи с накоплением опыта в сфере «чтения» динамических спектрограмм. Невозможно приступать с научно обоснованных позиций к построению схем автоматического распознавания и понимания речи, не отдавая себе отчета в разнообразии звуковых реализаций фонем русского языка, в закономерностях нх взаимодействий, в противоречивости спектрально-временных характеристик осмысленных речевых высказываний. Слушая и воспринимая звуковое многообразие родной речи, аудитор, надо полагать, весьма близок в своем принципиальном аналитическом поведении к оператору, осуществляющему процесс визуального «чтения» динамических спектрограмм. Несомненно, в том и другом случае его поведение базируется на текущей классификации акустических явлений, в процессе которой используется информация об анатомо-физиологических особенностях образования звуков речи, о тех функциях, которые последние осуществляют в системе языка. Важнейшая из этих функций состоит в том, чтобы образовывать различаемые звуковые оболочки значимых языковых единиц, к которым относятся морфемы и слова. Механизмы такого рода классификации звуков речи вырабатываются у человека в практике языкового общения. В их основе лежит фонемный анализ сигналов речи. Несомненно, звуки реальной речи в динамическом речевом потоке постоянно подлежат фонемной категоризации, если только речь воспринимается как осмысленное явление, т. е. происходит ее понимание. Из этого не следует, однако, что языковая интерпретация речи требует, чтобы она реально воспринималась как последовательность всех минимальных смыслоразличительных единиц.
Для практического использования фонетических знаний в построении систем автоматического распознавания и понимания речи не менее важно подчеркнуть другое обстоятельство, а именно то, что смыслоразличительная функция единичных звуков речи осуществляется в естественной речи далеко не повсеместно, более того,— довольно редко. Роль отдельных звуков в разделении по
156
смыслу разных слов весьма различна и отнюдь не постоянна. Она определяется контекстом, структурой языка и правилами разговорной речи, прагматикой, определяющей тему разговора. Непрерывно меняется вместе с используемым словарным запасом, активно вовлекаемым в речевой процесс в данный момент времени, и смыслоразличительная функция отдельных звуков речевого потока. В силу этого классификация речевого потока на фонемные категории осуществляется в восприятии далеко не по формальным схемам таксономического отнесения к тому или иному фонемному классу. Этот процесс неотъемлемо связан с канвой языкового мышления, непрерывных предсказаний и их направленных проверок. Мы имели возможность убедиться в этом на материале динамических спектрограмм слитных фраз.
Огромная сложность естественного процесса восприятия звуковой речи человеком преодолевается и обеспечивается посредством работы мозгового аппарата, мощность которого не идет ни в какое сравнение с возможностями применяемых для распознавания речи современных электронно-вычислительных машин. Тем не менее опыт построения систем автоматического распознавания и понимания речи, накопленный за последние десятилетия, недвусмысленно показывает, что структура перспективной системы распознавания речи неизбежно должна отображать собой, в том или ином приближении, модель восприятия речи человеком. Первым этапом в построении такого рода модели так или иначе должно выступать накопление знаний о спектрально-временной динамике звуковой речи в реальном речевом потоке осмысленно артикулируемых высказываний.
Предыдущая << 1 .. 43 44 45 46 47 48 < 49 > 50 51 52 .. 53 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed