Научная литература
booksshare.net -> Добавить материал -> Биология -> Розен Р. -> "Принцип оптимальности в биологии " -> 74

Принцип оптимальности в биологии - Розен Р.

Розен Р. Принцип оптимальности в биологии — М.: Мир, 1969. — 215 c.
Скачать (прямая ссылка): principoptimizaciivbiologii1969.djvu
Предыдущая << 1 .. 68 69 70 71 72 73 < 74 > 75 76 77 78 79 80 .. 87 >> Следующая

На примере перцептрона мы выяснили, что операционально изображение представляет собой не что иное, как определенный набор входных сигналов некоторой системы и что эта система может распознать его в том и только в том случае, если каждый входной сигнал из этого набора вызывает некоторую однозначно определенную реакцию, или выходной сигнал системы. Способность устройств, распознающих изображения, к адаптации определяется тем, что они могут так изменять зависимость между их входными и выходными сигналами, чтобы в результате их реакция на данное изображение совпала с требуемой.
Прежде чем покончить с обсуждением схемы перцептрона, отметим различие между этой схемой и теми системами управления или регулирования, с которыми мы имели дело раньше. В идейном отношении наиболее существенным является отсутствие в схеме перцептрона (фиг. 31) контура обратной связи и какого-либо управляющего блока, или регулятора. Наличие регулятора здесь лишь неявно подразумевается. Он представляется в виде совершенно отдельной системы, которая сравнивает выходной сигнал перцептрона с нужной формой выходного сигнала и затем в соответствии с некоторым фиксированным правилом или алгоритмом модифицирует коэффициенты Wi. Таким образом, действие регулятора сводится к изменению передаточной функции перцептрона, а не к изменению его входного сигнала. В отсутствие такого регулятора и той цепи обратной связи, которую он неявно осуществляет, перцептрон теряет свойства адаптивной системы.
Итак, в схеме перцептрона управляющее устройство, или регулятор, играет роль Deus ex Machina. Ему должна быть известна «правильная» реакция на каждое конкретное изображение, представленное перцептрону, и оно должно также обладать способностью применять алгоритм, с помощью которого изменяются коэффициенты Wi. После завершения процесса сходимости (т. е. после того, как весовые коэффициенты w{ примут
свои оптимальные значения) регулятор отключается от схемы действия перцептрона. Поскольку регулятору «неизвестны» значения щ (а известно лишь, ведут или не ведут они к правильной реакции), трудно представить себе, чтобы-алгоритм можно было воплотить в форме, в той или иной степени напоминающей передаточную функцию регулятора.
Отмеченное обстоятельство приводит к тому, что исследование зависимости между входными и выходными сигналами перцептрона по духу своему сильно отличается от методов изучения систем, которые мы рассматривали в гл. 8. В математическом отношении здесь основной упор делается на доказательство сходимости к оптимальному поведению при. заданном конкретном алгоритме (и, разумеется, на доказательство того, что такое оптимальное поведение существует). Для построения такого алгоритма можно применить математические методы вариационного исчисления и различные стохастические обобщения, описанные в гл. 10, но сама схема перцептрона, описанная выше, строится независимо от такого алгоритма.
11.3. Обучение
До сравнительно недавнего времени считалось, что способностью к обучению на основании опыта обладают только живые организмы. Обучение распознаванию изображений представляет собой один частный вид обучения, к которому способны живые организмы, но многие его черты типичны для процесса обучения вообще. Поэтому в данном разделе нам будет полезно еще раз вернуться к проблеме распознавания изображений.
Одна из характерных черт адаптивных устройств, способных распознавать изображение, заключается в том, что описание оценочной функции, минимизируемой при работе этих устройств, нигде явно не входит в их схему. Обучение происходит с помощью подкрепления (положительного или отрицательного) некоторых реакций системы на определенные входные сигналы. Если реакция системы совпадает с требуемой, то она получает положительное подкрепление; если же она оказывается неподходящей, то подкрепление будет отрицательным. Такой метод, грубо говоря, аналогичен методу поощрений и наказаний, применяемому при тренировке животных, воспитании маленьких детей и т. п. Таким образом, можно сказать, что адаптивная система стремится минимизировать получаемое ею отрицательное подкрепление.
Функция регулятора в перцептроне состоит как раз в создании такого подкрепления, т. е. регулятор играет роль инструк-
тора или тренера. Но в отличие от обучения человека или животных, при котором применяется как положительное, так и отрицательное подкрепление, в перцептроне регулятор создает только отрицательные подкрепления; это означает, что перцеп-трон не получает «поощрения» за правильный ответ, но «наказывается» за неправильный ответ.
Как нетрудно себе представить, существует обширная литература по вопросам математической теории обучения. В первых работах (см., например, [105]) делались в основном попытки установить характер поведения организмов при обучении, подвер-
гая количественному исследованию нейронные модели. Позже, однако, специалисты по теории обучения по большей части занимались постановкой и анализом специальных экспериментов по обучению, и основное внимание уделялось стохастическим аспектам этих процессов, а не нейронным механизмам. Эти стохастические теории во многих отношениях сходны с теорией, которой мы коснулись в разд. 11.2.
Предыдущая << 1 .. 68 69 70 71 72 73 < 74 > 75 76 77 78 79 80 .. 87 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed