Введение в формальный анализ естественных языков - Ляпунова А.А.
Скачать (прямая ссылка):
Теперь мы можем определить понятие грамматической трансформации следующим образом. Пусть Q есть С-маркер терминальной цепочки t, причем t может разделяться на последовательные сегменты ti....tn таким образом, что всякий сегмент
ti можно возвести в Q к некоторому узлу, помеченному символом At. В таком случае мы говорим, что цепочка t может быть проанализирована относительно Q как (Ji......tn\ A1....An).
В простейшем случае трансформация T отчасти определяется последовательностью символов (Au ..., Лп), которая задает область ее применения по следующему правилу.
Цепочка t с С-маркером Q входит в область применения трансформации 7, если t может быть проанализирована относительно Q как (^i, .. ., г„; Ai, ..An)-
В этом случае (ti, ..t„) есть собственный анализ t относительно (О, Т), a (Au ..., An) —структурный индекс Т.
Формальный анализ естественных языков
267
Чтобы закончить определение трансформации T, необходимо описать те изменения, которые она производит в элементах собственного анализа цепочек, к которым применима. Например, трансформация может заключаться в перестановке или выбрасывании некоторых элементов, в замене их на некоторые другие, в постановке на заданное место некоторых постоянных цепочек и т. д. Предположим, что трансформации T сопоставлена лежащая в ее основе элементарная трансформация Tcl,
такая, что Tel (i; f,...<п)=<Л, где (U......t„) — собственный
анализ і относительно (Q, Г). В этом случае цепочка, получающаяся в результате применения трансформации T к цепочке t с С-маркером Q,такова:
T[t, QI = O1 ... о„
Ясно, что было бы нежелательно называть грамматической трансформацией любое соответствие того вида, который только что был описан. Нежелательно было бы, например, включать в грамматику трансформации, которые соотносят друг с другом такие пары, как John saw the boy («Джон увидел мальчика») —> I’ll leave tomorrow («Я уезжаю завтра»); John saw the man («Джон увидел человека») -»Why don’t you try again? («Почему бы тебе ие попытаться еще раз?»); John saw the girl («Джон увидел девочку») —> China is industrializing rapidly («Китай индустриализируется быстрыми темпами»), В грамматике должны допускаться только такие трансформации, которые выражают реальные структурные соотношения между предложениями: соотношения типа актив — пассив, утверждение— вопрос, утверждение — номинализация и т. д. Произвольного сопоставления предложений с помощью трансформаций можно избежать, если наложить дополнительное, вполне естественное ограничение на элементарную трансформацию. Эго ограничение таково *)•
Если TeI — элементарная трансформация, то для любых чисел і U п и для любых цепочек Xu . . ., Xn, Уі..уп волокно вы-
полняться следующее условие: Т,і (і; X1, ..., х„) должно быть получено из Tgi (<'; уи ..., уп) в результате замены у} на X1 для всех j •< п.
Иными словами, результат элементарной трансформации должен быть независим от того, к какой цепочке она применяется. Тем самым исключается возможность применения трансформаций к частным цепочкам слов (или морфем). При этом условии, однако, никакая еднная элементарная трансформация
При более точной формулировке необходимо было бы различить разные вхождения одной и той же цепочки (см. Chomsky, 1955),
10*
268
Н. Хомский, Дж. Миллер
ие может одновременно заменить John will try («Джон попытается») на Will John try? («Попытается ли Джон?») и John tried («Джон пытался») на Did John try? («Пытался ли Джон?»), хотя это, бмуслокио, одна и ти же простая трансформации «опроса. Элементарная трансформация, которая нужна в /ілшюм случае, должна прекратить XfX2Xx в X2X1X3. Это значит, что трансформация Ta должна быть определена для произвольных Jf1, х2, X3 следующим образом:
T.i(U X1, X2, х3) = X2,
T1I (2', X1, X2, x3)~xlt
Tei (3; X1, х2, я3) = х3.
Чтобы такое правило дало в результате фразу Did John try?, необходимо применять трансформацию вопроса не к Johntried,
а, скорее, к гипотетической цепочке John +past+try (терминальной цепочке, аналогичной по структуре предложению John will try), которая лежит в основе предложения John tried. Вообще мы не можем требовать, чтобы терминальные цепочки находились в каком-то простом соотношении с реальными предложениями. Здесь приходится вводить обязательные преобразования (трансформационные и фонологические), которые определяют физический облнк элементов н одновременно переставляют их, выбрасывают некоторые элементы и т. д.
Чтобы понятие трансформаций было эмпирически адекватным, его необходимо обобщить. Прежде всего нужно допустить применение трансформации к паре С-маркеров. (Трансформации, подобные рассмотренным выше, которые применялись к одному С-маркеру, мы будем теперь называть сингулярными трансформациями.) Так, терминальная цепочка, лежащая в основе предложения His owning property surprised me («То, что у него есть собственность, удивило меня»), получается из полученных ранее цепочек it surprised me («Это удивило меня») и he owns property («У него есть собственность»). Чтобы иметь возможность получать такие предложения, можно, в простейших случаях, допускать, чтобы в предшествующей грамматике непосредственных составляющих выводы предложений- начинались не только с tt.Stt>HOHC#SttftStt---. ..ttStt.B этом случае мы введем структурный индекс (Д, NP, V, NP, Д, Д, NP, V, NP, Д:), из которого с помощью трансформации можно получить предложение His owning property surprised ше. Более подробное и аккуратное изложение этого вопроса см. (Chomsky, 1955),