Материалы || Новости || СИРИУС || Конференция || Голосование || Ресурсы || Блог

Ассоциативная машина. Представление знаний.
Целенаправленное поведение.

В данной статье описывается один из аспектов проекта "Ассоциативная машина" являющегося попыткой построить модель искусственного интеллекта способного эффективно обучаться и осуществлять поиск целенаправленного поведения в произвольных средах. Здесь рассматривается вторая из перечисленных задач в предположении, что первая решена.
При попытке построить модель полнофункционального искусственного интеллекта кажется вполне оправданным привлечение знаний о естественном интеллекте человека. Иногда такое разумное стремление доводят до абсурда, пытаясь построить точную модель естественного разума. К сожалению, используя текущие интеллектуальные возможности человека (хотя и большими, но все же ограниченными конструктивными природными решениями) этого нельзя достичь. Есть и другая тенденция, пытаться все изобрести снова, что никак нельзя признать правильным решением. По моему мнению, необходим разумный компромисс. В представленной работе изначально используются понятия, позаимствованные из человеческого мышления, но их интерпретация только приближенно соответствует прообразам. Целью публикации статьи является попытка выяснить насколько близко соответствие (хотелось бы услышать конструктивную критику). 

1 Представление знаний

Эффективное поведение должно быть адаптивным и основываться на знаниях о среде, в которой функционирует машина. Попробуем неформально определить какие самые важные понятия должны присутствовать в модели представления знаний человеком. Первое что придет на ум, по-видимому, и является тем, что мы ищем. На ум приходят понятия образ и ассоциация. Под образом понимается любые модели объектов, совокупностей и последовательностей действий и событий, воспринимаемых и четко выделяемых (распознаваемых) нашим сознанием. Понятие модель употреблено здесь не совсем корректно, оно лишь обозначает различие образа и объективной реальности, сам же образ не имеет внутренней структуры. Образ это, выражаясь формально терминальный символ из алфавита, с которым оперирует разум. Образы связаны ассоциациями. Ассоциативная связь обладает направлением, силой(-1 <= w <= +1) и временным сдвигом (t) и может быть формально представлена вектором <i, j, w, t>, где i – образ, из которого исходит стрелка ассоциации; j – к которому ведет ассоциация; w – сила ассоциации; t – временной сдвиг ассоциации. Отсутствие конкретной ассоциативной связи между двумя образами можно интерпретировать как наличие такой ассоциации, но с w = 0. Для внесения ясности приведу несколько примеров ассоциативных связей: 1) Если включить чайник с водой, то через пять минут он закипит <"Включил чайник с водой", "Чайник кипит", 0.99, 5 минут> (w = 0.99, а не 1 так как чайник может сломаться или свет отключат или еще чего ни будь случиться) 2) Если пот утру болит голова, значит вчера легли поздно спать <"Утром болит голова", "Лег спать рано", w= -0.8, -9 часов>. Как видно из примера ассоциативная связь может, как усиливать образы(w > 0), так и подавлять их(w < 0). Для выработки целенаправленного поведения необходим способ описания цели функционирования.

2 Представление целей

Традиционно цели кибернетических систем описываются в виде единственного функционала подлежащего минимизации (максимизации). Однако описание в таком виде целей естественных высокоразвитых живых систем затруднительно, так как обычно преследуются множество целей, приоритет которых меняется динамически и нет жесткого горизонта прогноза и планирования. В ассоциативной машине цели функционирования описываются на том же языке, что и остальные знания. Цель описывается образами, которые машина пытается восстановить или подавить в реальности (например, образы "насыщение", "размножение", "баланс микроэлементов в организме", "боль", "голод", "жажда" и т. д.). Целевые образы не формируются в ходе обучения и заданы априори (у естественных организмов они по видимому сформировались в ходе эволюции по Ч. Дарвину), меняются лишь ассоциации связывающие их с другими образами. У простых животных приоритеты целей и динамика (например, сезонные обострения и спады инстинкта размножения) их изменений задана генетически. У сложных животных и у Человека приоритеты целей так же могут меняться в зависимости от легкости их достижения и взаимной зависимости (отклонения от здоровой нормы не рассматриваются). Для упрощения описания, будем считать, что ассоциативная машина стремиться реализовать в реальности все целевые образы.

3 Представление поведения

        Для того, что бы осуществлять поведение, необходим язык описания операций над внешней средой. Как и при описании целей будем использовать язык образов. Пусть задан набор образов, которые машина может, безусловно, реализовать в реальности (те, кто склонен мыслить в терминах нейрофизиологии может воспринимать их как эффекторы или командные нейроны). Например (в терминах нейрофизиологии), возбудить мотонейрон №123 или подавить командный нейрон №934. На набор управляющих образов обучение машины не оказывает влияния, меняются лишь ассоциации, связывающие их с другими образами. Множество управляющих образов может меняться только при изменении конструкции каналов управления машины. В силу специфики управляющих образов стрелки ассоциаций в них не входят (нет необходимости прогнозировать вероятность их реализации).
 

4 Целенаправленное поведение

        Для понимания алгоритма поиска машиной целенаправленного поведения видится целесообразным изложить неформально его суть. Поиск поведения осуществляется машиной непрерывно с его применением и наблюдением за результатами. Процесс поиска заключается в непрерывной перестройке модели представляющей собой нагруженный орграф, вершинами которого являются образы, а дугами являются ассоциативными связями между образами. Образам приписываются моделируемые и целевые активности, а так же предполагаемый момент времени активизации на условной шкале времени моделирования. Машина постоянно пересчитывает как состояние вершин графа, так и саму конфигурацию графа стремясь включить в него образы, наиболее значимые для решения задачи. Среди всех образов выделяются такие, целевая активность которых непосредственно определяет текущее поведение машины (управляющие образы) и образы, моделируемая активность которых определяется фактом и уверенностью их распознания в окружающей среде (наблюдаемые образы). В ходе моделирования в параллельном режиме осуществляется прямой (посылка® следствие) и обратный (цель® подцель) вывод. Алгоритм вывода базируется на взвешивании моделируемой, фактической и целевой активности образов с учетом степени влияния друг на друга выраженной в наличие ассоциативных связей. При обратном выводе цели могут, как способствовать реализации друг друга, так и вступать в конфликт. "Побеждают" группы целей/подцелей, которые наиболее легко достижимы в текущей ситуации и способствуют достижению друг друга.
Метод определения целенаправленного поведения основывается на методе информационной доски впервые предложенной Ньюэллом в 1962 году, а позднее был использован Редди и Ерманом в проектах Hearsey и Hearsey II по распознаванию речи [1]. Эффективность метода подтвердилась, и он был использован в других областях, включая интерпретацию сигналов, трехмерное моделирование молекулярных структур, распознавание образов и планирование [2].

4.1 Пространство моделирования

Поиск целенаправленного поведения неразрывно связан с понятием моделирования влияний на среду обитания и процесса развития последствий этих влияний. Для проведения моделирования необходимы ресурсы. Моделирование проводиться в некотором ограниченном пространстве образов (далее ПМ) характеризуемое максимальным количеством N вмещаемых образов. Всем образам в ПМ приписываются три свойства: A – моделируемая активность (0 <= A <= 1), B – целевая (степень важности реализации образа) активность (0 <= B <= 1) и t – момент времени активности на шкале времени моделирования (не путать с временным сдвигом t ассоциативных связей). В ПМ могут находиться несколько экземпляров одного образа, но все они должны иметь различные значения свойства t. В ПМ всегда присутствуют образы, распознанные машиной в реальной окружающей среде в текущий момент времени (наблюдаемые образы). Для таких образов свойство A показывает степень уверенности в том, что распознан именно этот образ (в простейшем случае A = 1, то есть 100% уверенности в распознании образа) и t = 0. Будем обозначать такое множество образов как F, а все остальные образы объединим во множестве G. В ходе моделирования в ПМ помещаются новые образы. При переполнении ПМ из него исключается образ i П F, у которого max{Ai, |2*Bi - 1|} минимально среди образов из G (то есть, исключается образ, у которого моделируемая активность мала и он не входит в круг наиболее важных целей или подцелей).

4.2 Процесс моделирования

        Процесс моделирования состоит из множества параллельных, однородных процессов. Каждый i - й процесс связан с образом Qi О FИ G из ПМ по схеме один к одному.
Для дальнейшего понимания алгоритма функционирования процессов, необходимо ввести следующие обозначения:
W(X, Y, t) – функция возвращает значение w для ассоциативной связи с временным смещением t, стрелка которой направлена из образа X в образ Y;
Q – образ из ПМ связанный с процессом;
T - множество всех целевых образов;
P – множество всех управляющих образов, P
З T=Ж ;
D(X) – множество образов связанных ассоциативной связью с образом X и находящихся в ПМ (D(X)
Н FИ G);
А(X) – моделируемая активность образа X;
B(X )– целевая активность образа X;
T(X) – момент моделируемой активности образа X на шкале времени моделирования;
ReCalcA(X) – функция, вычисляющая пересчитанную моделируемую активность образа X;
ReCalcB(X) – функция, вычисляющая пересчитанную целевую активность образа X;
INCLUDE (X, AX, BX, TX) – операция внесения образа X в ПМ с назначенными ему свойствами: AX – моделируемая активность, AB – целевая активность, TX – момент моделируемой активности образа на шкале времени моделирования. При выполнении операции ведется проверка на максимальное количество образов в ПМ. В случае переполнения ПМ из него исключается самый малоинформативный образ не входящий в F. Операция не меняет состав ПМ в случае, если образ со значением свойства t равным TX уже присутствует в ПМ;
Процесс, связанный с образом Q активизируется при изменении состава множества D(Q) или при изменении свойств образов входящих в D(Q).
Активизированный процесс пересчитывает свойства образа Q по формулам (7) и (15), изменяет состав образов в ПМ по алгоритму (16) и завершается. Текущие действия ассоциативной машины определяются значениями целевой активности образов входящих во множество P, находящихся в ПМ и со значением свойства t равным 0.

4.2.1 Пересчет моделируемой активности

Рассмотрим схему пересчета прогнозируемой активности A=A(Q) образа Q с моделируемым моментом активизации T(Q) и не являющимся ни наблюдаемым, ни управляющим образом. При пересчете используются сведения только об ассоциативных связях, стрелки которых направлены из образов находящихся в ПМ в Q и образы, из которых исходят эти ассоциации. Пусть D(Q)={D1, D2, … , Dn} – множество образов из ПМ непосредственно связанных ассоциативной связью с Q (ассоциативная связь направлена в Q). Пусть Wi = W(Di, Q,T(Q) – T(Di)) – сила ассоциативной связи ведущей из Di к Q. В случае, если задача определения A сводиться к задаче (1).
(A(D
1) * ((W1 – (2 * A – 1))2 + A(D2) * (W2 - (2 * A – 1))2 +…+ A(Dn) * (Wn - (2 * A – 1))2) а min (1)
Решение задачи (1) приводит к формуле (2) пересчета моделируемой активности образа Q
ПFИP при D(Q)№Ж.

В случае, если D(Q)=
Ж или считается, что возможность активизации объекта Q невозможна. То есть, возможность спонтанной активизации не наблюдаемых непосредственно образов при моделировании исключается. Для активизации образа всегда необходимы предпосылки.
Видится целесообразным ввести функцию ReCalcA1(X) (формула (3)) для пересчета моделируемой активности, определенную на X
ПFИP.

Тогда, выражение (2) можно переписать.
A=ReCalcA1(Q), QПFИP        (4)
Для образа Q входящего во множество управляющих образов, моделируемая активность всегда равна целевой активности.
A=B(Q), QОP
(5) Для образа Q входящего во множество наблюдаемых образов, моделируемая активность зависит только от факта распознания образа во внешней среде.
A=A(Q), QОF         (6)
Можно ввести обобщенную функцию ReCalcA(X) для пересчета моделируемой активности.


4.2.2 Пересчет целевой активности

Рассмотрим схему пересчета целевой активности B=B(Q) образа Q с моделируемым моментом активизации T(Q) и не являющимся целевым образом. При пересчете используются сведения только об ассоциативных связях, стрелки которых направлены из образов находящихся в ПМ в Q и образы, из которых исходят эти ассоциации. Пусть D(Q)={D1, D2, … , Dn} – множество образов из ПМ непосредственно связанных ассоциативной связью с Q (ассоциативная связь направлена из Q). Пусть Wi = W(Q, Di, T(Di) - T(Q)) – сила ассоциативной связи ведущей из Q к Di.
Введем функцию приоритета цели:
P1(Di) =A(Di) * |2 * B(Di) - 1| * |Wi| (8)
Введем функцию обеспечения достижения цели:
P2(Di) = (9)
В случае, если задача определения B сводиться к задаче (9).
(P1(D
1) * ((P2(D1) – (2 * B – 1))2 + P1(D2) * (P2(D2) - (2 * B – 1))2 +…+ P1(Dn) * (P2(Dn) - (2 * B – 1))2) а min (10)
Решение задачи (10) приводит к формуле (11) пересчета моделируемой активности образа Q
ПFИP при D(Q)№Ж.

В случае, если D(Q)=
Ж или целевая активность принимает такое значение, чтобы P1(Q)=0, то есть B=1/2. Видится целесообразным ввести функцию ReCalcB1(X) (формула (12)) для пересчета целевой активности, определенную на XПT.

Тогда, выражение (11) можно переписать
B=ReCalcB1(Q), QПT        (13)
Для образа Q входящего во множество целевых образов, моделируемая активность всегда равна 1.
B=1, QОT (14)
Можно ввести обобщенную функцию ReCalcB(X) для пересчета целевой активности.



Алгоритм изменения состава образов в ПМ        (16)
  1. Для всех ассоциативных связей L1=<Q,X,TW1,TX>, где X - произвольный образ из базы знаний ассоциативной машины, выполнять:
  2. 1.Свойству t образа X присвоить значение равное T(Q) + TX (Функции ReCalcA и ReCalcB требую наличие свойства t у образа X)
  3. 2.INCLUDE (X, ReCalcA(X), ReCalcB(X), T(Q) + TX)
  4. Для всех ассоциативных связей L2=<X,Q,TW2,TX> где X - произвольный образ из базы знаний ассоциативной машины, выполнять:
  5. 1.Свойству t образа X присвоить значение равное T(Q) - TX (Функции ReCalcA и ReCalcB требую наличие свойства t у образа X)
  6. 2.INCLUDE (X, ReCalcA(X), ReCalcB(X), T(Q) - TX)
Литература:
  1. Nii, P. Summer 1986. Blackboard Systems: The Blackboard Model of Problem Solving and the Evaluation of Blackboard Architectures. AI Magazine vol. 7(2)
  2. Englemore, R. and Morgan, T. 1988. Blackboard Systems. Wokingham,England: Addison-Wesley

Хомич Андрей

 

SpyLOG


(c) redstar
Дата обновления:

The new Internet search project.
Сайт создан в системе uCoz