Алгоритмы разума - страница 8
Результаты исследования РЭМа показали перспективность использования М-сетей как при построении моделей процессов мышления, так и при разработке систем типа «искусственный разум», способных к самостоятельному эффективному функционированию в сложных условиях. Выяснилась также целесообразность дальнейшего проведения работ по изучению возможностей аппарата при построении более мощных моделей, а также исследования весьма важного в практическом и теоретическом отношениях вопроса об адаптивных возможностях М-автоматов.
Затем была построена и исследована новая модель — МОД. При его создании сохранялись как общая схема постановки задачи, так и принципиальная структура выбранного ранее условного сюжета моделирования. МОД также был разработан в виде неполного М-автомата. При этом его алгоритмическая часть отображала процессы планирования, связанные с предварительной организацией движения, а структурная — процессы принятия решений в ходе непосредственного взаимодействия со средой. Обе части целесообразно рассматривать как независимые модели мыслительных процессов, между которыми может быть организовано постоянное взаимодействие. Эти модели названы соответственно МОД-1 и МОД-2.
МОД-1 вырабатывал план деятельности М-автомата в среде в виде совокупности подцелей движения, основной цели и ожидаемых (предвидимых) состояний автомата в ходе движения. Алгоритмы восприятия внешней информации в МОД-1 моделировали процессы зрительного восприятия человека, построения возможных вариантов плана, их оценки, синтеза окончательного варианта, его разбиения на отдельные этапы, выбора объектов-ориентиров для каждого из этапов, моделировали процессы принятия решения человеком в условиях отсутствия полной информации о среде.
МОД-1 являлся неполным М-автоматом, основной объем его функций реализовался алгоритмическими структурами. М-сеть здесь содержала 62 i-модели, около 1000 связей и использовалась в основном для представления мотивационной сферы модели. МОД-1 был реализован в виде комплекса программ для ЦВМ М-220. Программы включали до 15 000 команд, их просчет занимал 20—30 мин машинного времени. Среда модели могла содержать до 625 объектов (это максимальное число). Каждый из объектов задавался упорядоченным набором из 8—10 признаков (входных воздействий). Выходом модели являлся оптимальный план передвижений в среде. В среднем такой план мог состоять из 30 элементов (целей, подцелей и ожидаемых отклонений внутренних состояний).
М-автомат МОД-2 вырабатывал конкретные реализации планов, построенных МОД-1. Его основная особенность связана с реализацией на М-сети программ самообучения. Последнее осуществлялось путем изменения веса первоначально заданных связей, установления новых связей и порождения новых узлов М-сети. Протекание процессов изменения структуры сети определялось особенностями среды, в которой действовал автомат, соотнесенными с поставленными перед ним задачами. Задачи могли формулироваться, например, в следующем виде: действовать так, чтобы обеспечить максимальное значение оценки «собственного комфорта», максимальное соответствие внешних и внутренних реакций автомата реакциям моделируемого объекта или быстрейшее достижение цели. Возможны были и комбинированные задачи.
Автомат может рассматриваться как модель деятельности человека по принятию решений в задачах движения в лабиринте. Кроме того, МОД-2 может быть использован в качестве устройства, управляющего передвижением технических систем, предназначенных для сбора информации, транспортировки и т.п. В зависимости от цели использования автомата изменяется и критерий оценки эффективности его функционирования.
МОД-2 — полный М-автомат. Его М-сеть может содержать до 400 i-моделей и до 2000 связей. На М-сети задана двухуровневая СУТ. МОД-2 был реализован в виде программы для ЦВМ БЭСМ-6. Программа содержала около 6000 команд. Время просчета одного такта 30—50 сек. Экспериментально были исследованы реакции автомата на протяжении до 300 тактов. На входы автомата подавалась информация о плане движения и об объектах среды, каждый из которых относится к одному из шести возможных типов. Всего среда могла содержать до 400 расположенных произвольным образом объектов. Предварительная информация о некоторых характеристиках среды и структуре оценочных функций задавалась в процессе начальной организации М-сети автомата. Количество выполняемых МОД-2 действий (выходных параметров или решений) — 22. Из них 17 — различного рода действия — шаги, перемещающие автомат в среде, а 5 — «активные» действия, изменяющие состояние среды или автомата («есть», «спать», «нести объект», «бросить объект», «создать убежище»). Поведение автомата состояло в формировании последовательностей решений о выполнении тех или иных действий и соответственно их фактическим выполнением. Были разработаны оценки поведения и предложены процедуры оптимизации автомата. Оптимизация выполнялась варьированием значений шести параметров обучения.