Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Деркач М.Ф. -> "Динамические спектры речевых сигналов" -> 44

Динамические спектры речевых сигналов - Деркач М.Ф.

Деркач М.Ф., Гумецкий Р.Я., Гура Б.М., Чабан М.Е. Динамические спектры речевых сигналов — Лв.: Высшая школа, 1983. — 168 c.
Скачать (прямая ссылка): dinamichspektrrechsignal1983.djvu
Предыдущая << 1 .. 38 39 40 41 42 43 < 44 > 45 46 47 48 49 50 .. 53 >> Следующая

(подчеркнуты ударные гласные). Размышляя над этой неоднозначно расшифрованной фразой, вы, наверное, догадаетесь, что здесь была произнесена фраза «Наша Шура мала».
Указанный метод предварительной сегментации, неоднозначной фонемной идентификации сегментов и пробного синтеза всевозможных слов и предложений из популярного словаря с использованием известных правил синтаксиса с успехом был испытан в виде программной модели распознавания простых речевых сообщений на ЭВМ [8, 9, 22, 37]. В случае, когда в составе слов встречаются достаточно контрастные акустические звуки и структура фразы достаточно проста, такой алгоритм работает вполне эффективно.
5.3. РОЛЬ АПРИОРНЫХ ЗНАНИЙ, КОНТЕКСТА И ЭВРИСТИЧЕСКИХ ПРЕДСКАЗАНИЙ В «ЧТЕНИИ» ДИНАМИЧЕСКИХ СПЕКТРОГРАММ РЕЧИ
Наряду с информацией, содержащейся в самом речевом сигнале в виде достоверно идентифицируемых участков его фонемного скелета, важнейшую роль для осмысленного восприятия динамических спектрограмм речевого сообщения имеет учет контекстуальной информации. Учет контекста в анализе речевого сигнала предполагает использование в процессе восприятия источников знаний (сведений и предположений) о структуре словаря определенного языка, о взаимодействиях и взаимосвязях между словами данного языка, придающих им соответствующие грамматические формы, изменяющие их акустическое звучание. В контекстуальной информации в явной или скрытой форме содержится потенциальный резерв сведений о языке — законах его лексики, грамматики, семантики и прагматики в форме, в которой используются несравненно более высокие уровни абстракции и символики чем те, которые выступают в закономерностях фонетической реализации
10 964-3
137
фонем в звукосочетаниях. Эти закономерности постоянно извлекаются из памяти человека, пользующегося данным языком в режиме речевого общения, составляя основу его речевого мышления и речевой коммуникации.
Мы не можем отрицать того очевидного факта, с которым читатель постоянно сталкивался, анализируя динамические спектрограммы слов и фраз, что в речи зачастую нет в наличии полного комплекта признаков — акустических коррелятов произношения отдельных фонем. Их нет не потому, что они не были выявлены сонографом в процессе анализа, а потому, что они объективно не были произнесены. После того как мы ознакомились на материале динамических спектрограмм с такими фонетическими явлениями, как коартикуляция звуков речи, их редукция во времени и в пространстве признаков, ассимиляция и извращение отдельных признаков, небрежное выговаривание некоторых звуков и т. п., мы не можем не призадуматься над тем, почему при столь большой вариабельности в произношении отдельных звуков речевые высказывания в целом устойчивы для восприятия и понятны слушателю, владеющему данным языком.
Совокупность накопленных в настоящее время разносторонних знаний о речи как коммуникативном процессе, свойственном исключительно человеку, позволяет высказать утверждение, что восприятие акустического речевого сообщения в его спектрально-временной динамике организовано по типу предсказания (стимулируемого наличием в сигнале надежно рецептируемых свойств отдельных звуков) некоторого конечного количества правдоподобных высказываний и их текущей проверки. Вероятнее всего, что сам процесс текущего предсказания высказываний формируется на словесной основе и что в структуре словесных гипотез используются свойства слов как фонемных последовательностей, характеризующихся соответствующей спектрально-временной динамикой в пространстве фонетических значимых признаков. Несомненно также, что формирование предсказываемых высказываний происходит с учетом грамматических и семантических закономерностей используемого языка. Предельным упрощением организации осмысленного воспрятия акустического речевого сообщения на основе анализа его спектрально-временной динамики является случай, когда аудитор заранее осведомлен о перечне возможных слов или предложений, которые могут быть реализованы в данной ситуации.
Мы попытаемся на отдельных примерах рассмотреть принципиальную структуру такого анализа динамических спектрограмм, который сводится к их осмысленному нелинейному «чтению», руководимому эвристическими догадками в условиях априорной осведомленности о возможных высказываниях. Такой процесс текущего анализа динамических спектрограмм можно организовать на пофонемной основе. Чтобы убедиться в том, насколько помогает в этом анализе факт догадки, ожидаемого предположения, текстовой подсказки, рассмотрим динамические спектрограммы
138
фраз, приведенные на рис. 5.3.1. В этих фразах выступают слова, в которых, наряду со щелевыми глухими согласными, встречаются и звонкие щелевые, тоже обладающие вполне значимыми идентификационными ключами. Играют свою роль и другие четко произнесенные звуки, такие как [н] с его носовыми резонансными полосами, стационарные участки гласных и их характерные и-образные переходы на стыках с мягкими согласными, глухие и звонкие смычки во взрывных согласных и т. п.
Однако, невзирая на полный стиль произношения этих фраз, для многих содержащихся в них звуков остается неразрешенной неоднозначность относительно их фонемной принадлежности. О многих сегментах трудно с определенностью судить — [в] это или [л], [л] или [д], [м] или [н], [р] или [к], [ц] или [ч] и т.п. Часто бывает затруднительно сказать, сколько звуков заключено в анализируемом сегменте. Попытайтесь «прочесть» динамические спектрограммы любой из приведенных фраз, не прибегая к чтению подписи, и вы убедитесь, до чего это трудное и полное неопределенности занятие. Достаточно нам, однако, прочесть буквенную подпись под анализируемым предложением, как все фонемные элементы динамической спектрограммы, в том числе и те, которые только что казались нам отсутствующими, или сомнительными, станут совершенно очевидными. Идентифицировать звуковые реализации фонем на динамической спектрограмме предложения после подсказки удается легко и просто.
Предыдущая << 1 .. 38 39 40 41 42 43 < 44 > 45 46 47 48 49 50 .. 53 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed