Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Ляпунова А.А. -> "Введение в формальный анализ естественных языков" -> 3

Введение в формальный анализ естественных языков - Ляпунова А.А.

Ляпунова А.А., Лупанова О.Б. Введение в формальный анализ естественных языков — М.: Мир, 1965. — 64 c.
Скачать (прямая ссылка): vedenievformalniyzakon1963.djvu
Предыдущая << 1 .. 2 < 3 > 4 5 6 7 8 9 .. 26 >> Следующая


В равной мере существенно, кроме того, определить свойства грамматики, которую наше обучающееся устройство должно в конце концов дать на выходе. Предполагается, что грамматика отражает некоторые способности владеющего языком взрослого человека. Поэтому грамматика должна, в частности, показать, каким образом человек оказывается в состоянии определить, что такое правильно построенное предложение; кроме того, она должна содержать информацию относительно объединения языковых единиц в более крупные структуры. Обучающееся устройство должно, например, понять разницу между примерами (Ia) и (16).

Описание грамматики, которая дала бы возможность перечислить в явном виде грамматически правильные предложения языка и их структурные описания, занимает центральное место в дальнейшем изложении. Наша цель состоит в том, чтобы построить формальную грамматику, которая порождает правильные структурные описания предложений, исходя из относи-
236

Н. Хомский, Дж. Миллер

тельно малого числа общих принципов устройсгва предложения; эта грамматика должна быть включена в состав общей теории языковой структуры, которая давала бы возможность обоснован) /феимушестиа одной грамматики перед другими. Од»а из ча/ійч лрофессиолалыюго лингвиста состоит и каком-то смисм: и том, чтобы сделан, ипимм тот процесс, который бессознательно осуществляет всякий нормальный ребенок.

Практически работающая модель обучения языку должна основываться на весьма сильных допущениях относительно класса потенциальных грамматик, которые может иметь естественный язык. По-видимому, обучающееся устройство должно иметь в своем распоряжении сведения об общей форме, которую может принимать грамматика, а также некоторую процедуру, позволяющую на основе заданного текста решить, является ли данная грамматика более адекватной, чем некоторая другая. Кроме того, это устройство должно располагать определенными фонетическими возможностями для распознавания и реального построения предложений; оно должно также обладать каким-то механизмом для определения, на основе заданной грамматики, грамматической структуры предложений. Все это должно быть заготовлено заранее, прежде чем начнется обучение. Думать, что адекватная грамматика может быть выбрана из бесконечного числа теоретически допустимых возможностей на основе чистой индукции по конечному числу исходных предложений, — значит совершенно недооценивать сложность проблемы.

Процесс обучения должен, таким образом, состоять в оценке различных возможных грамматик с целью найти ту, которая лучше всего согласуется с исходными данными. Обучающееся устройство должно найти такую грамматику, которая порождала бы все предложения, не захватывая ни одного непред-ложения, и приписывала бы порождаемым предложениям структурные описания таким образом, чтобы все предложения, которые не являются повторениями друг друга, имели описания, отличные друг от друга в соответствующих местах. Конечно, обучающееся устройство нужно будет снабдить определенными эвристическими принципами, которые позволили бы ему, при заданных входах и заданном перечне возможных грамматик, достаточно быстро выбирать несколько наиболее подходящих вариантов, которые затем могут быть подвергнуты более тщательному сравнению; эвристические процедуры нужны также для того, чтобы оценивать одни характеристики грамматик раньше, чем другие. Необходимые эвристические процедуры сильно упростятся, если заранее сделать класс потенциальных грамматик относительно узким. Практически
Формальный анализ естественных языков

237

правильное разделение труда между эвристическими методами и ограничениями на форму грамматики должно еще уточняться в дальнейшем. Ясно, однако, что не следует особенно надеяться на нозможностн обнаружения правильной грамматики с помощью индукции. В конце концов, даже глупые люди обучаются говорить, а самые умные обезьяны — нет.

2. НЕКОТОРЫЕ АЛГЕБРАИЧЕСКИЕ АСПЕКТЫ КОДИРОВАНИЯ

Отображение одной полугруппы на другую — это операция, весьма часто встречающаяся в системах связи. Ее можно называть в целом кодированием, понимая под этим все разнообразные процессы кодирования, перекодирования, декодирования и передачи сигналов. Для определенности будем считать, что одна полугруппа состоит из всех цепочек букв, которые могут быть построены при помощи конечного алфавита А, а другая — из цепочек слов, составляющих конечный словарь V. Таким образом, в этом разделе мы рассмотрим некоторые абстрактные свойства систем с операцией соединения — свойства, которыми характеризуются в равной мере и искусственные, и естественные коды.

Код С есть взаимнооднозначное отображение 0 цепочек в словаре V на цепочки в алфавите А, такое, что если и,-, V1 — цепочки в V, то =0(Уі)~0(и;). Где 0 — изоморфизм ме-

жду цепочками в V и некоторым подмножеством всех цепочек в Л; цепочки в А определяют записи цепочек из V. В дальнейшем там, где не возникает неоднозначности, мы будем упрощать обозначение, опуска-я символ ~, обозначающий соединение, и принимая, таким образом, соглашения, обычные для орофографических систем.
Предыдущая << 1 .. 2 < 3 > 4 5 6 7 8 9 .. 26 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed