Ассоциативная машина. Представление знаний.
Целенаправленное поведение.
В данной статье описывается один из аспектов проекта "Ассоциативная машина" являющегося попыткой построить модель искусственного интеллекта способного эффективно обучаться и осуществлять поиск целенаправленного поведения в произвольных средах. Здесь рассматривается вторая из перечисленных задач в предположении, что первая решена.
При попытке построить модель полнофункционального искусственного интеллекта кажется вполне оправданным привлечение знаний о естественном интеллекте человека. Иногда такое разумное стремление доводят до абсурда, пытаясь построить точную модель естественного разума. К сожалению, используя текущие интеллектуальные возможности человека (хотя и большими, но все же ограниченными конструктивными природными решениями) этого нельзя достичь. Есть и другая тенденция, пытаться все изобрести снова, что никак нельзя признать правильным решением. По моему мнению, необходим разумный компромисс. В представленной работе изначально используются понятия, позаимствованные из человеческого мышления, но их интерпретация только приближенно соответствует прообразам. Целью публикации статьи является попытка выяснить насколько близко соответствие (хотелось бы услышать конструктивную критику).
1 Представление знаний
Эффективное поведение должно быть адаптивным и основываться на знаниях о среде, в которой функционирует машина. Попробуем неформально определить какие самые важные понятия должны присутствовать в модели представления знаний человеком. Первое что придет на ум, по-видимому, и является тем, что мы ищем. На ум приходят понятия образ и ассоциация. Под образом понимается любые модели объектов, совокупностей и последовательностей действий и событий, воспринимаемых и четко выделяемых (распознаваемых) нашим сознанием. Понятие модель употреблено здесь не совсем корректно, оно лишь обозначает различие образа и объективной реальности, сам же образ не имеет внутренней структуры. Образ это, выражаясь формально терминальный символ из алфавита, с которым оперирует разум. Образы связаны ассоциациями. Ассоциативная связь обладает направлением, силой(-1 <= w <= +1) и временным сдвигом (t) и может быть формально представлена вектором <i, j, w, t>, где i – образ, из которого исходит стрелка ассоциации; j – к которому ведет ассоциация; w – сила ассоциации; t – временной сдвиг ассоциации. Отсутствие конкретной ассоциативной связи между двумя образами можно интерпретировать как наличие такой ассоциации, но с w = 0. Для внесения ясности приведу несколько примеров ассоциативных связей: 1) Если включить чайник с водой, то через пять минут он закипит <"Включил чайник с водой", "Чайник кипит", 0.99, 5 минут> (w = 0.99, а не 1 так как чайник может сломаться или свет отключат или еще чего ни будь случиться) 2) Если пот утру болит голова, значит вчера легли поздно спать <"Утром болит голова", "Лег спать рано", w= -0.8, -9 часов>. Как видно из примера ассоциативная связь может, как усиливать образы(w > 0), так и подавлять их(w < 0). Для выработки целенаправленного поведения необходим способ описания цели функционирования.
2 Представление целей
Традиционно цели кибернетических систем описываются в виде единственного функционала подлежащего минимизации (максимизации). Однако описание в таком виде целей естественных высокоразвитых живых систем затруднительно, так как обычно преследуются множество целей, приоритет которых меняется динамически и нет жесткого горизонта прогноза и планирования. В ассоциативной машине цели функционирования описываются на том же языке, что и остальные знания. Цель описывается образами, которые машина пытается восстановить или подавить в реальности (например, образы "насыщение", "размножение", "баланс микроэлементов в организме", "боль", "голод", "жажда" и т. д.). Целевые образы не формируются в ходе обучения и заданы априори (у естественных организмов они по видимому сформировались в ходе эволюции по Ч. Дарвину), меняются лишь ассоциации связывающие их с другими образами. У простых животных приоритеты целей и динамика (например, сезонные обострения и спады инстинкта размножения) их изменений задана генетически. У сложных животных и у Человека приоритеты целей так же могут меняться в зависимости от легкости их достижения и взаимной зависимости (отклонения от здоровой нормы не рассматриваются). Для упрощения описания, будем считать, что ассоциативная машина стремиться реализовать в реальности все целевые образы.
3 Представление поведения
Для того, что бы осуществлять поведение, необходим язык описания операций над внешней средой. Как и при описании целей будем использовать язык образов. Пусть задан набор образов, которые машина может, безусловно, реализовать в реальности (те, кто склонен мыслить в терминах нейрофизиологии может воспринимать их как эффекторы или командные нейроны). Например (в терминах нейрофизиологии), возбудить мотонейрон №123 или подавить командный нейрон №934. На набор управляющих образов обучение машины не оказывает влияния, меняются лишь ассоциации, связывающие их с другими образами. Множество управляющих образов может меняться только при изменении конструкции каналов управления машины. В силу специфики управляющих образов стрелки ассоциаций в них не входят (нет необходимости прогнозировать вероятность их реализации).
4 Целенаправленное поведение
Для понимания алгоритма поиска машиной целенаправленного поведения видится целесообразным изложить неформально его суть. Поиск поведения осуществляется машиной непрерывно с его применением и наблюдением за результатами. Процесс поиска заключается в непрерывной перестройке модели представляющей собой нагруженный орграф, вершинами которого являются образы, а дугами являются ассоциативными связями между образами. Образам приписываются моделируемые и целевые активности, а так же предполагаемый момент времени активизации на условной шкале времени моделирования. Машина постоянно пересчитывает как состояние вершин графа, так и саму конфигурацию графа стремясь включить в него образы, наиболее значимые для решения задачи. Среди всех образов выделяются такие, целевая активность которых непосредственно определяет текущее поведение машины (управляющие образы) и образы, моделируемая активность которых определяется фактом и уверенностью их распознания в окружающей среде (наблюдаемые образы). В ходе моделирования в параллельном режиме осуществляется прямой (посылка® следствие) и обратный (цель® подцель) вывод. Алгоритм вывода базируется на взвешивании моделируемой, фактической и целевой активности образов с учетом степени влияния друг на друга выраженной в наличие ассоциативных связей. При обратном выводе цели могут, как способствовать реализации друг друга, так и вступать в конфликт. "Побеждают" группы целей/подцелей, которые наиболее легко достижимы в текущей ситуации и способствуют достижению друг друга.
Метод определения целенаправленного поведения основывается на методе информационной доски впервые предложенной Ньюэллом в 1962 году, а позднее был использован Редди и Ерманом в проектах Hearsey и Hearsey II по распознаванию речи [1]. Эффективность метода подтвердилась, и он был использован в других областях, включая интерпретацию сигналов, трехмерное моделирование молекулярных структур, распознавание образов и планирование [2].
4.1 Пространство моделирования
Поиск целенаправленного поведения неразрывно связан с понятием моделирования влияний на среду обитания и процесса развития последствий этих влияний. Для проведения моделирования необходимы ресурсы. Моделирование проводиться в некотором ограниченном пространстве образов (далее ПМ) характеризуемое максимальным количеством N вмещаемых образов. Всем образам в ПМ приписываются три свойства: A – моделируемая активность (0 <= A <= 1), B – целевая (степень важности реализации образа) активность (0 <= B <= 1) и t – момент времени активности на шкале времени моделирования (не путать с временным сдвигом t ассоциативных связей). В ПМ могут находиться несколько экземпляров одного образа, но все они должны иметь различные значения свойства t. В ПМ всегда присутствуют образы, распознанные машиной в реальной окружающей среде в текущий момент времени (наблюдаемые образы). Для таких образов свойство A показывает степень уверенности в том, что распознан именно этот образ (в простейшем случае A = 1, то есть 100% уверенности в распознании образа) и t = 0. Будем обозначать такое множество образов как F, а все остальные образы объединим во множестве G. В ходе моделирования в ПМ помещаются новые образы. При переполнении ПМ из него исключается образ i П F, у которого max{Ai, |2*Bi - 1|} минимально среди образов из G (то есть, исключается образ, у которого моделируемая активность мала и он не входит в круг наиболее важных целей или подцелей).
4.2 Процесс моделирования
Процесс моделирования состоит из множества параллельных, однородных процессов. Каждый i - й процесс связан с образом Qi О FИ G из ПМ по схеме один к одному.
Для дальнейшего понимания алгоритма функционирования процессов, необходимо ввести следующие обозначения:
W(X, Y, t) – функция возвращает значение w для ассоциативной связи с временным смещением t, стрелка которой направлена из образа X в образ Y;
Q – образ из ПМ связанный с процессом;
T - множество всех целевых образов;
P – множество всех управляющих образов, PЗ T=Ж ;
D(X) – множество образов связанных ассоциативной связью с образом X и находящихся в ПМ (D(X)Н FИ G);
А(X) – моделируемая активность образа X;
B(X )– целевая активность образа X;
T(X) – момент моделируемой активности образа X на шкале времени моделирования;
ReCalcA(X) – функция, вычисляющая пересчитанную моделируемую активность образа X;
ReCalcB(X) – функция, вычисляющая пересчитанную целевую активность образа X;
INCLUDE (X, AX, BX, TX) – операция внесения образа X в ПМ с назначенными ему свойствами: AX – моделируемая активность, AB – целевая активность, TX – момент моделируемой активности образа на шкале времени моделирования. При выполнении операции ведется проверка на максимальное количество образов в ПМ. В случае переполнения ПМ из него исключается самый малоинформативный образ не входящий в F. Операция не меняет состав ПМ в случае, если образ со значением свойства t равным TX уже присутствует в ПМ;
Процесс, связанный с образом Q активизируется при изменении состава множества D(Q) или при изменении свойств образов входящих в D(Q).
Активизированный процесс пересчитывает свойства образа Q по формулам (7) и (15), изменяет состав образов в ПМ по алгоритму (16) и завершается. Текущие действия ассоциативной машины определяются значениями целевой активности образов входящих во множество P, находящихся в ПМ и со значением свойства t равным 0.
4.2.1 Пересчет моделируемой активности
Рассмотрим схему пересчета прогнозируемой активности
A=A(Q) образа Q с моделируемым моментом активизации T(Q) и не являющимся ни наблюдаемым,
ни управляющим образом. При пересчете используются сведения только об ассоциативных
связях, стрелки которых направлены из образов находящихся в ПМ в Q и образы, из
которых исходят эти ассоциации. Пусть D(Q)={D1,
D2, … , Dn}
– множество образов из ПМ непосредственно связанных ассоциативной связью с Q (ассоциативная
связь направлена в Q). Пусть Wi
= W(Di, Q,T(Q)
– T(Di)) – сила
ассоциативной связи ведущей из Di
к Q. В случае, если задача
определения A сводиться к задаче (1).
(A(D1) * ((W1
– (2 * A – 1))2
+ A(D2) * (W2
- (2 * A – 1))2
+…+ A(Dn) *
(Wn - (2 * A
– 1))2) а
min (1)
Решение задачи (1) приводит к формуле (2) пересчета моделируемой активности образа QПFИP при D(Q)№Ж.
В случае, если D(Q)=Ж
или считается, что возможность
активизации объекта Q невозможна. То есть, возможность спонтанной активизации
не наблюдаемых непосредственно образов при моделировании исключается. Для активизации
образа всегда необходимы предпосылки.
Видится целесообразным ввести функцию ReCalcA1(X) (формула (3)) для пересчета
моделируемой активности, определенную на XПFИP.
Тогда, выражение (2) можно переписать.
A=ReCalcA1(Q), QПFИP (4)
Для образа Q входящего во множество управляющих образов, моделируемая активность всегда равна целевой активности.
A=B(Q), QОP
(5)
Для образа Q входящего во множество наблюдаемых образов, моделируемая активность зависит только от факта распознания образа во внешней среде.
A=A(Q), QОF (6)
Можно ввести обобщенную функцию ReCalcA(X) для пересчета моделируемой активности.
4.2.2 Пересчет целевой активности
Рассмотрим схему пересчета целевой активности B=B(Q)
образа Q с моделируемым моментом активизации T(Q) и не являющимся целевым образом.
При пересчете используются сведения только об ассоциативных связях, стрелки которых
направлены из образов находящихся в ПМ в Q и образы, из которых исходят эти ассоциации.
Пусть D(Q)={D1,
D2, … , Dn}
– множество образов из ПМ непосредственно связанных ассоциативной связью с Q (ассоциативная
связь направлена из Q). Пусть Wi
= W(Q, Di, T(Di)
- T(Q)) – сила ассоциативной связи ведущей из Q к Di.
Введем функцию приоритета цели:
P1(Di)
=A(Di) * |2
* B(Di) -
1| * |Wi|
(8)
Введем функцию обеспечения достижения цели:
P2(Di)
= (9)
В случае, если задача
определения B сводиться к задаче (9).
(P1(D1) * ((P2(D1)
– (2 * B – 1))2
+ P1(D2) * (P2(D2)- (2 * B – 1))2
+…+ P1(Dn) *
(P2(Dn)- (2 * B – 1))2)
а min (10)
Решение задачи (10) приводит к формуле (11) пересчета моделируемой активности
образа QПFИP
при D(Q)№Ж.
В случае, если D(Q)=Ж
или целевая активность принимает
такое значение, чтобы P1(Q)=0, то есть B=1/2. Видится целесообразным ввести функцию
ReCalcB1(X) (формула (12)) для пересчета целевой активности, определенную на XПT.
Тогда, выражение (11) можно переписать
B=ReCalcB1(Q), QПT (13)
Для образа Q входящего во множество целевых образов,
моделируемая активность всегда равна 1.
B=1, QОT
(14)
Можно ввести обобщенную функцию ReCalcB(X) для пересчета
целевой активности.
Алгоритм изменения состава образов в ПМ (16)
Для всех ассоциативных связей L1=<Q,X,TW1,TX>, где X - произвольный
образ из базы знаний ассоциативной машины, выполнять:
1.Свойству t образа X присвоить значение равное T(Q) + TX (Функции ReCalcA
и ReCalcB требую наличие свойства t у образа X)
2.INCLUDE (X, ReCalcA(X), ReCalcB(X), T(Q) + TX)
Для всех ассоциативных связей L2=<X,Q,TW2,TX> где X - произвольный
образ из базы знаний ассоциативной машины, выполнять:
1.Свойству t образа X присвоить значение равное T(Q) - TX (Функции ReCalcA
и ReCalcB требую наличие свойства t у образа X)
2.INCLUDE (X, ReCalcA(X), ReCalcB(X), T(Q) - TX)
Литература:
Nii, P. Summer 1986. Blackboard Systems: The Blackboard Model of Problem
Solving and the Evaluation of Blackboard Architectures. AI Magazine vol. 7(2)
Englemore, R. and Morgan, T. 1988. Blackboard Systems. Wokingham,England:
Addison-Wesley