Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Ляпунова А.А. -> "Введение в формальный анализ естественных языков" -> 12

Введение в формальный анализ естественных языков - Ляпунова А.А.

Ляпунова А.А., Лупанова О.Б. Введение в формальный анализ естественных языков — М.: Мир, 1965. — 64 c.
Скачать (прямая ссылка): vedenievformalniyzakon1963.djvu
Предыдущая << 1 .. 6 7 8 9 10 11 < 12 > 13 14 15 16 17 18 .. 26 >> Следующая


Теперь определим условия, при которых процесс порождения каждом терминальной цепочки будет однозначно определять ее С-маркер. Для грамматик, рассматривавшихся до си\ пор, никакого естественного способа обеспечить выполнение этого требования не существует. Так, если имеется грамматика со следующими правилами:

S->AB\ AB->cde, (15)

то нет никакого способа определить, является ли в цепочке cde сегмент cd составляющей типа А (подчиненной в С-маркере символу А) и является ли сегмент de составляющей типа В (подчиненной в С-маркере элементу В). Наиболее естественный путь достижения желаемого результата это потребовать, чтобы в каждом правиле грамматики подстановка представляла собой замену (на символ или цепочку) ровно одного символа исходной последовательности. Таким образом, грамматики могут иметь правила либо вида (16а), либо вида (166):

А —> м (1 б а)

<рЛ»|)-»¦ qxm|) (или, иначе, А-*-а> в контексте <р — ф). (166)

Правила вида (166) называются контекстно-связанными, а правила вида (16а)—контекстно-свободными. Грамматика, содержащая только правила вида (16а), называется контекстно-свободной. (Заметим, между прочим, что связанными контекстом или свободными являются только правила, а не элементы в терминальной цепочке.) В любом случае, если <р есть некоторая
258

Н. Хомский, Дж. Миллер

строка вывода, а 1|з — строка, которая непосредственно следует за ф, то имеется единственный ¦) набор цепочек фЬ ф2, а, ш, таких, что ф^фіЗф;. и ;і|>“фіО)ф2; тогда мы говорим, что <о есть немочка типн а (т. t, подчинена у.члу, помеченному символом « в дерене, представляющем соответствующий С-маркер). В случае коитикстио-свободных грамматик верпы не только утверждения 1—4 из (14), Ho и соответствующие им обратные. Тем самым мы получаем определение различных видов рекур-снвности через отношение =ф. В дальнейшем мы будем рассматривать рекурсивные элементы только в контекстно-свободных грамматиках.

Назначение правил типа (166) состоит в том, чтобы иметь возможность выразить контекстные ограничения, наложенные на выбор элементов. Так, в число предложений типа «подле-жащее + сказуемое + дополнение» входят, в частности, такие предложения, как The fact that the case was dismissed doesn’t surprise me («Тот факт, что дело было прекращено, не удивил меня»), Congress enacted a new law («Конгресс ввел новый закон»), The men consider John a dictator («Люди считают Джона диктатором»), John felt remorse («Джон почувствовал угрызения совести»); однако не являются грамматически правильными предложения, которые получены из них переменой мест подлежащего и дополнения: I don’t surprise the fact that the case was dismissed («Я не удивляю тот факт, что дело было прекращено»), A new law enacted Congress («Новый закон ввел Конгресс»); John considers the men a dictator («Джон считает людей диктатором»); Remorse felt John («Угрызения совести почувствовали Джона»), Носители английского языка признают, что первые четыре предложения являются абсолютно естественными, тогда как вторые четыре, если они вообще могут быть понятны, требуют специальной интерпретации, которая может быть определена по аналогии с правильно построенными предложениями. В смысле определений из разд. 3, эти предложения имеют степень грамматичности более низкую, чем предыдущие, если вообще не равную нулю. Грамматика, которая не делает различия между этими двумя видами пред-

1) В действительности, для того чтобы гарантировать единственность этих цепочек, множество правил должно удовлетворять некоторым дополнительным условиям; в частности, должна быть исключена возможность появления такой последовательности строчек вывода: AB, ABC и т. д. В будущем допустим, без дальнейших комментариев, что такие условия выполнены. На самом деле они всегда могут быть выполнены без дальнейшего сужения класса порождаемых языков, хотя, конечно, они как-то влияют на вид класса порождаемых С-маркеров. В случае грамматики с контекстно-связанными правилами эти дополнительные условия вовсе ие являются лишними, как мы увидим в следующей главе, разд. 3.
Формальный анализ естественных языков

259

ложеннй, безусловно не является полноценной, а чтобы естественным и экономным образом выразить это различие, достаточно ввести контекстно-связанные правила, которые накладывают ограничения на выбор подлежащего, сказуемого и дополнения.

В идеальном случае теория грамматики должна содержать определение множества допустимых грамматик, множества допустимых предложений и множества допустимых структурных описаний. Кроме того, она должна включать общий метрд приписывания каждому предложению одного или нескольких структурных описаний в соответствии с грамматикой. Иначе говоря, грамматика должна быть выражена в столь явной форме, чтобы по ней можно было однозначно определить, что она утверждает относительно каждого из порожденных предложений (ср. Chomsky, 1961а). Чтобы построить теорию грамматик непосредственных составляющих, мы фиксируем словари K1Y и Vr как заданные не пересекающиеся друг с другом конечные множества символов, удовлетворяющие описанным выше условиям. В этом случае грамматика есть просто конечное отношение, заданное в множестве цепочек словаря V=VvUVt и удовлетворяющее этим условиям. Заметим, что проблема нахождения Vt в случае естественного языка сводится, по существу, к проблеме построения универсальной фонетической теории (включая, в частности, разработку универсального фонетического алфавита и правил, определяющих общие законы распределения фонетических сегментов). Более подробно об этом CM. разд. 6 и приведенные там ссылки. Кроме того, мы должны наложить ограничение на длину морфемы (чтобы словарь Vr был конечным) и установить множество «грамматических морфем» (т. е. морфем, выражающих грамматические признаки — такие, как время, вид и число). Эта последняя проблема, так же как проблема получения обоснованной интерпретации для элементов множества Vn, является классической проблемой «универсальной грамматики». Эта проблема состоит в получении независимого от языка определения множества грамматических категорий, которые могут использоваться или ие использоваться в данном языке. Такое определение должно, без сомнения, опираться как на формальный анализ грамматической структуры, так п на соображения чисто семантического характера. Эти вопросы не имели популярности в последние несколько десятилетии, хотя нет никаких оснований считать их недостойными серьезного рассмотрения. Напротив, они остаются важными и первостепенными для общей лингвистики.
Предыдущая << 1 .. 6 7 8 9 10 11 < 12 > 13 14 15 16 17 18 .. 26 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed