爱玩科技网
您的当前位置:首页Agent理性模型研究综述

Agent理性模型研究综述

来源:爱玩科技网
http://www.paper.edu.cn

1

黄慎 胡军

1湖南大学 计算机与通信学院,长沙 (410082)

E-mail:hun_hs@163.com

摘要:本文分别从基于意识的模型、基于能力与知识的模型、基于和义务的模型和群体思维状态模型等四个类型介绍了Agent理论模型研究的现状,在详细介绍传统的Agent理性模型的基础上重点阐述了近年来出现的基于和义务的模型,指出该类模型代表了今后Agent理性模型研究的发展趋势;然后从逻辑全知和理论与实践脱离两个方面比较了各个模型的优势和不足;最后简要的介绍了我们目前的研究工作。 关键字:Agent模型,逻辑全知,,义务 中图分类号:TP391

1. 引言

在传统的Agent理性模型研究过程中,从意识的立场出发来研究Agent的思维属性,是一个主导的研究方向。其中BDI模型又最为著名,在BDI模型中,Agent的信念可以反应环境的变化,通过决策(愿望和意图的选择)调整其行为,进而完成系统的设计目标。然而传统的Agent模型也有如下一些不足之处:在信念修正方面,传统Agent的信念修正是Agent自身对当前知识进行修改并保持与信念一致,即Agent不能动态的选择知识与规则,不能接受外部动机来调整自身的动作选择;在协作机制方面,现有BDI逻辑并不支持Agent之间动态协作关系的显示表示和推理,未考虑引入新的规则后,如何对其行为进行选择调整,当然也就缺乏了动作冲突处理机制。 因此,近年来一些研究者把、规范、义务等概念引入到了BDI逻辑中,使Agent之间的协作关系得到显式表示,提高了Agent之间的协作性。

本文首先从基于意识的模型、基于能力与知识的模型、基于和义务的模型和群体思维状态模型等四个方面阐述了Agent理论模型的研究状况,然后从逻辑全知和理论与实践脱离两个方面比较了各模型的特点。

2. Agent理论模型

2.1 基于意识的模型

Daniel Dennett[1~2]从大众心理学的角度描述了人们立场和行为,引入了意愿系统,通过信念、愿望和合理的理性等属性来预测Agent的行为。McCarthy认为,如果Agent的信念、愿望、目的、意识、能力等特性表示计算机的信息和人的信息是一样的,那么把他们赋予给计算机是合理的;这有助于我们了解计算机的结构、它过去或将来的行为,我们可以为机器 1

本课题得到高等学校博士学科点专项科研基金(项目编号:20070532075)和国家自然科学基金(项目编号:60773208)的资助。

http://www.paper.edu.cn

[3]

。Bratman[4~5]从哲学的角度对

理性和意图进行了分析,刻画了意图的客观性和在理性平衡中的位置,并认为理性Agent的行为受制于意图,认为信念、愿望、意图是Agent基本的思维属性,并提出了BDI理论。在Bratman的基础上,学者们提出了一些著名的意图模型。 2.1.1 Cohen和Levesque的意图模型

Cohen和Levesque(C&L)在1990年提出了著名的意图模型[6],从“理性平衡”的角度分析了自治Agent,他们认为自治Agent的信念、目标、规划、意图、承诺和动作之间需要一种“理性平衡”。该模型基于正规逻辑的可能世界模型,定义了Agent的一些基本属性,并将意图定义为一种持续的目标,初步阐述了意图在Agent行为中的作用。C&L并且将意图归结为信念和意愿并从Agent基本的属性中推出了各种意图;采用了两个层次的方式来处理意图理论形式化的问题,创建了一个逻辑上的理性代理,处理了基本模态算子之间的关系。在该框架之上,他们引入了一系列的派生结构,构成了“理性的动作局部理论”,意图就是这些结构之一;其中两个核心内容是:持续目标和意图属性。

持续目标:(P-GOAL x p)= def(GOAL x (LATER p))∧(BEL x ¬p)∧[BEFORE((BEL x p)

∨BEL x □¬p))¬(GOAL x(LATER p))]。

一个Agent x 将P作为持续目标当且仅当它有一个最终要实现的目标p,并相信p现在还不成立。只有在Agent相信p已成立,或Agent x相信p已经无法实现时,它才放弃目标p。

意图属性:在持续目标的基础上,C&L又定义了两类意图。 (INTEND1 x a)= def(P-GOAL x[DONE x (BEL x(HAPPENS a))?;a]

(INTEND2 x a)= def(P-GOAL x∃e(DONE x[(BEL x∃e’(HAPPENS x e’;p?))∧¬(GOAL x

¬(HAPPENS x e;p?))]?;e;p?)).

C&L的意图模型是很早期的权威理论,成为了后期工作的一个基准。但是他们的整个推理过程相当的复杂,并且把意图归结为信念和目标的做法有一定的局限性。 2.1.2 Rao和Georgeff的BDI模型

在C&L的意图模型中,只用到了两个基本的属性:信念和目标。其他的属性,如意图都是从以上两个属性中派生出来的。Rao和Georgeff(R&G)在C&L的基础上,提出了基于三个模态算子的逻辑框架:信念、愿望和意图[7~8];其形式化基础是基于扩展的计算树逻辑CTL(Computational Tree Logic),即信念、愿望和意图的可达世界本身就是一个分支的时间树结构;每个世界就是一棵时间树,Agent拥有单一的过去和未来的分支,世界中的一个时间称为一个状态,这些状态与事件相对应,分支表示在每个时间点上Agent的选择。

R&G在处理Agent如何在时间树上进行选择时,定义了状态公式和路径公式;状态公式在时间点上取值,路径公式在路径上取值。R&G用模态连接词定义信念、目标和意图,给出了模型的一些约束和公理,阐述了思维属性之间的约束关系,特别提出现实性对于理性的作用,还用承诺策略描述了Agent的不同性格,R&G的模型相当有代表性,成为了许多

http://www.paper.edu.cn

在语法上,R&G从两个方面扩展了计算树逻辑CTL*,首先描述了该逻辑的一阶变量,然后引入信念、愿望和意图模态算子并扩展该逻辑到可能世界框架;与CTL*逻辑类似,该逻辑有两种类型的公式:状态公式和路径公式。

在可能世界语义上,解释器M是一个元组,M= ,其中T是时间点上的集合,≺是时间点上的一个二元关系,U是论域,Φ是对任何已知世界和时间点从一阶实体到U中元素的一个映射。在可能世界模型的基础上,R&G建立了一套公理系统并提出了Agent的三种承诺机制;这些承诺机制描述了Agent的不同性格。 2.1.3 其它关于意识的模型

Bell 的属性改变模型[9],建立了一套持续规则,来表征Agent将会保持它的思维属性直到它有改变的理由,扩展了HIntiKKA的可能世界语义并用模态连接词定义影响、信念、意图、义务和理性,且显式地加入了时间特性。其中时间采用了描述语言CA进行描述,动态的描述了思维状态的变迁。

Pollack的意图模型基于非正规模态逻辑[10],使用认知结构描述Agent的状态,引入了意图关系图的概念表示意图的结构,初步表达了means-end的结构。

Konolige的演绎模型[11]直接对AI系统中的“信念”建模,他认为基于知识的系统主要由表达“信念”的数据库和一些逻辑推到机制组成。作者用演绎结构对系统建模,演绎结构d=(△,ρ),其中△是逻辑语言的公式集,表示Agent的基本信念, ρ是推导规则集,用来描述Agent的推导机制。通过该演绎结构,作者给出了Agent信念系统的一个直接模型。

Gaspar和Coelho[12]指出了己有的意图模型的不足,提出了agent 的目标和意图模型以及修正框架,扩展了agent 思维状态中的信念模型。

文献[13]分析了用模态逻辑框架研究意图的局限性,提出了“意图的两维结构理论”,从相关性、时序关系两维上对意图进行刻画,提出了意图产生框架和基于BDI 结构的agent 框架。

2.2 基于能力与知识的模型

从思维状态的角度描述Agent模型,能够很清晰的表述出Agent自身的思维状态和决策过程。但是这些理论强调的是,感知动作的执行是如何影响Agent的状态,本质上来说是纯公理的,虽然在数学上有良好的语义,但是无法从计算上对这些语义给出解释。许多学者从知识和能力的角度入手提出了一些新的模型,其形式化体系是认知逻辑,能够被计算机处理和解释。其中较有影响的工作是基于VSK逻辑的Agent模型;Lomuscio和Ryan(L&R)提出了单Agent的VSK逻辑[14],它能表示环境中客观真实的、可访问的、可感知的以及知道的信息。VSK逻辑扩展了模态认知逻辑,该逻辑的主要优点是信息之间的关系能够用它们所对应的Agents结构特征在理论上进行描述,但是该逻辑失去了思维状态模型的特性,一些学者又提出了结合思维状态的VSK形式化模型,它们认为利用VSK-BDI逻辑,能够表示环境中客观真实的事物,在环境中可以访问的信息以及Agent借助感知器能感知到的信息,还能表示

http://www.paper.edu.cn

2.2.1 Lomuscio和Wooldridge的VSK逻辑

L&W提出的VSK逻辑[15]主要强调了环境因素对Agent的影响,它们认为VSK逻辑是对处在特定环境中的Agent的信息特征进行推理的一种多模态逻辑,该逻辑能够表示环境中的客观事物,在环境中可以访问的或知道的以及Agent能感知到的信息。在整个模型中引入了三个重要的模态算子:V(Visibility)访问环境算子、S(Perception)感知环境算子、K(Knowledge)知识算子,它们分别表示Agent可访问、感知、知道的信息特征,用这些算子来描述Agent和它所处的环境信息,下面主要从语义框架和逻辑系统两个方面来介绍该模型。

语义框架,该语义框架是一个组合形式的框架。该框架首先定义了环境,然后定义了Agent,最后把两者结合起来,给出了一个VSK系统的定义。

元组Env=元组Ag=代表一个Agent,其中Li={li1,li2,…}是Agent所有局部状态组成的集合;Act={α1,α2,…}是Agent可实施的动作组成的集合;See:2E→Perc是Agent的感知函数;DOi:L→Act是Agent的动作选择函数;τ:L×Perc→L是Agent状态转移函数;环境状态l0∈L0表示Agenti的初始局部状态。

上述两个元组构成了VSK逻辑系统S,S=(Env,Ag),如果g∈G当且仅当g在S的运行中出现,则G为由S生成的可达状态。其中G是VSK系统的全局状态集,G={g0,g1.g2,…}是E×L的子集。

在语义框架的基础上,L&W提出了VSK逻辑。假设P是一个原子命题集,VSK逻辑语言L采用如下的BNF语法定义:

::=true︱any element of P︱¬︱V(ag)|S(ag)︱K(ag)

框架F是元组F=,其中W是非空集(其中的元素代表世界),Rv,Rs,Rk⊆W×W是W上的二元关系,并用~v,~s,~k分别代表Rv,Rs,Rk。由S和框架F相结合生成了Kripke框架Fs,Fs=其中W=G,G是系统S的全局可达状态集合;~v定义为:(e,l)~v(e’,l’)当且仅当e’∈vis(e);~s定义为:(e,l)~s(e’,l’)当且仅当see(vis(e)=see(vis(e’);~k定义为:(e,l)~k(e’,l’)当且仅当l=l’。

L&W在框架F上给出了公理系统和VSK逻辑的公式集,并在最后证明了VSK逻辑的完备性。

2.2.2 基于VSK-BDI逻辑的 Agent系统形式化模型

云南师范大学的夏幼明教师和他的学生们,对L&w的VSK逻辑进行了改进,在L&w模型的基础上加入了思维状态并提出了VSK-BDI逻辑[16~19]。他们认为该逻辑能在VSK逻辑和BDI逻辑之间达到一个平衡,Agent既能感知到环境信息又能具有信念、愿望和意图等思维

http://www.paper.edu.cn

VSK-BDI逻辑与VSK逻辑相比较主要有如下几个方面的改进,引入了思维状态的BDI逻辑和可能世界模型。环境元组方面和VSK类似,Agent元组方面,加入了三个模态算子。Ag=,其中B={b0,b1,…},是Agent所有信念的集合;D={d0,d1,…},是Agent所有愿望的集合;I={i0,i1,…},是Agent所有意图的集合;Bgf:Perc×L×T→2B,是Agent的信念生成函数,它根据时间,Agent相信自己的感知,根据自己当时对环境的感知及自身的局部状态生产Agent的信念。Dgf:Perc×L×T→2D,是Agent的愿望生成函数,它根据时间,Agent所处的环境状态及自身的局部状态生成Agent的愿望,该函数的值域表示Agent对应时间具有的愿望。Igf:Perc×L×T→2I,是Agent的意图生成函数实际上可看为目标,它根据Agent当前所处的时间,具有的信念和愿望,生成Agent的意图,其它的和VSK逻辑类似。最后在整个VSK逻辑模型中,加入了模态算子B、D和I以及状态变迁时的推理。

2.3 基于义务与的模型

近些年,义务和的概念被引入到了Agent的体系结构中,这些概念的引入给现有的Agent理论提供了新的发展方向。众多学者认为,在设计多Agent系统时,为了支持丰富的协作行为,给个体Agent提供各种形式的社会意识是重要的。 2.3.1 基于BDIOCTL逻辑的Agent模型

Broersen和Dastani(B&D)在R&G的基础上扩展了BDI逻辑并提出了BDIOCTL逻辑[20],该逻辑引入了标准道义逻辑模态算子Oi(α):“Agent I 有义务使得公式α成立”,讨论了四个模态(B、D、I和O)之间可能具有的特性。B&R首先简要阐述了R&G的形式化属性(Bip→

Dip;Dip→¬Bi¬p;DiEFp→BiEFp)和承诺策略,随后,从单Agent的属性和多Agent义务

两个方面阐述了模态算子Oi在思维状态中起到的作用。

在单Agent属性方面,B&D从规范是否可违反的角度把规范分成了两类:强规范和弱规范;其语义形式化表示如下:强规范(Oip→Bip;Oip→Dip;Oip→Iip)弱规范(Oip→¬Bi¬p;Oip→¬Di¬p;Oip→¬Ii¬p)。以愿望为例,如果一个Agent是有义务工作,那么Agent是有工作愿望的或者至少没有愿望不工作;有工作愿望代表了强规范而没有愿望不工作代表了弱规范。持久性上,义务通常会持续一段时间,截止期限的义务用O(表示,其中O(ip,d)ip,d)=def A(OipU(p∨d))。

在多Agent义务方面,多Agnet系统环境下Agent之间的交互产生了义务,社会系统决定了哪种义务与其它Agent的思维状态有关,由此产生了一种主仆关系的特性:

Bi(Ij(α))→Oi(α),如果Agent i 相信Agent j 有意图使得α成立,那么Agent i 与义务使得α成立。

2.3.2 社会Agent的BDO模型

http://www.paper.edu.cn

[21]

来描述Agent的思维状态和社会属性。他们认为意图为中心的观点不适于描述社

会Agent,至今人们对意图从直观理解、推理规则、形式语义都还没有形成共识,意图实际上也是个体思维属性,在进一步研究Agent社会性、相互依赖、建立承诺、组织结构等问题中的地位也值得商讨。作者认为困扰Agent学术界的“理论与实践分离”也可能是由于“基于以意图为中心”造成的,因此他们不以意图为中心,取而代之以更能表达社会性和易于把握的思维属性—义务,并着眼于建立可以表达Agent社会性的逻辑系统。在该逻辑系统中,每个Agent的思维状态可以划分为社会意识层和个体意识层,模态词也相应的分为一元模态词和二元模态词。在个体意识层,Agent只在个体意义上对信念、愿望、意图等思维属性进行记忆和处理,在没上升到社会意识层之前与其它Agent没太大作用,因此一个Agent对另一个Agent的信念、愿望和意图都可以归结为相应的一元模态词。在社会意识层,这层的思维属性会与多个Agent的个体意识层相交互并且Agent会通过承诺和义务等社会性思维属性与其它Agent建立联系,因此可以把义务作为二元模态词处理。基于上述观点,作者认为社会Agent模型应该有三个基本思维属性,个体意识层中的一元模态—信念和愿望,社会意识层中的二元模态—义务;其中义务刻画了个体与群体或其它个体的约束关系并且道义逻辑对义务 、应该、允许、禁止等道义算子都有较成熟的逻辑系统和动态修正方法,更易于Agent自身的推理。下面从承诺、奖励和惩罚,群体现象等两个方面来描述BDO逻辑系统。

承诺、奖励和惩罚方面,MAS理论研究中存在逻辑理性和效用理性难以融合的问题,作者在语法上引入表示奖励和惩罚的复杂动作来解决这个问题。

公理1 成功的承诺会产生义务(Succeeded commit(x,y,ϕ)⇒A○(OBL x y 公理2 (OBL x y Fϕ)∧(BEL y

ϕ).

ϕ)⇒¬(OBL x y Fϕ)∧(OBL y x A◇(Achieved

y Reward(y,x)). 如果x对y有义务Fϕ,且y相信ϕ已实现,则义务取消,且y对x有义务进行奖励。

公理3 (OBL x y F ϕ)∧(BEL y A ¬ϕ)⇒¬(OBL x y Fϕ)∧(GOAL y A◇(Achieves y Punish(y,x). 如果x对y有义务Fϕ,且y相信ϕ不可能实现,则义务取消,且y有目标对x进行惩罚。

公理4 (OBL x y F

ϕ)∧(Succeeded Decommit(x,y,Fϕ))⇒¬(OBL x y Fϕ)

∧(DES y A◇(Achieves y Punish(y,x).如果x对y有义务Fϕ,且x成功提出毁约,则

义务取消,且y有愿望对x进行惩罚。

公理5 (OBL x y F

ϕ)∧(Succeeded Decommit(y,x,Fϕ))⇒¬(OBL x y Fϕ)

∧(DES x A◇(Achieves x Punish(y,x).如果x对y有义务Fϕ,且y成功提出毁约,则

义务取消,且x有愿望让y对x进行奖励。

群体现象方面,作者认为群体的形成都是为了实现某一长期目标,群体的形成是各种群体思维属性的基础,并且这些属性的产生与消亡和长期目标有关不会因为局部目标的实现而解体。作者给出了如下几个概念的定义:

http://www.paper.edu.cn

ϕ)= def ∧x∈g(BEL x ϕ∧(∀y∈g{x})(BEL y ϕ)).

特定义务和相互信念构成的队 (TEAM g ϕ)= def(∀x∈g)(∀y∈g)((OBL x y

ϕ)∧(MBEL g(OBL x y ϕ))).

组织 (ORG g

ϕ)= def(∃g1⊆g)(TEAM g1 ϕ)∧(∀x∈g)(∃y∈g1)(∃ψ)((OBL x

y ψ)∧(BEL y INSTR(ψ,ϕ) 。其中谓词INSTR(ψ,ϕ)表示实现ψ有助于实现ϕ。

ϕ)组织意图 (ORG_INT g ψ)= def(∃ϕ)((ORG gϕ)∧(MBEL team(g) INSTR(ψ,)

∧(∃x∈team(g))((INT x ψ)∧(Has_Plan x p ψ))∧(∀ψ1∈subgoals(p,

ψ))(∃x∈g)( ∃y∈team(g))((INT x ψ1) ∧(OBL x y ψ1)).其中subgoals(p,ψ)返回一

个规划中所有的子意图。

2.3.3 基于BGIPDC逻辑的PDC-Agent体系结构模型

浙江大学的廖备水博士认为,在面向服务的自治计算体系中,自治实体Agent需要具有动态反应上层商业目标、策略和用户偏好()的能力并且、合同所产生的义务可以和Agent内部愿望结合,协调地推荐自治计算系统的运作。作者扩展了BDI逻辑提出了一个新的Agent模型―PDC-Agent模型[22]。

在PDC-Agent模型中,Agent主要有三个方面的动机,Agent自身的愿望、的义务和合同的义务。因此,Agent目标的产生是三种动机共同作用的结果,三种行为动机的冲突处理是基于优先级的方法:当同类动机之间或不同类动机之间产生冲突时,选择优先级较高者。下面主要从型义务和合同型义务两个方面介绍BGIPDC逻辑。

在BGIPDC逻辑中,型义务和合同型义务的状态公式分别是PObl(i,j,φ)和COblN(i,j,φ),其中i和j分别表示受托方和委托方Agent,N表示仲裁Agent。另外,用模态公式CPmsN(i,j,φ)、CPrhN(i,j,φ)、PPms(i,j,φ)和PPrh(i,j,φ)分别表示合同型许可和禁止以及型许可和禁止。PObl(i,j,φ)和COblN(i,j,φ)的可达关系OP和OC分别产生世界w在时间点t的道义理想世界。OP和OC是按照义务的优先级排序形成的。

对于合同型义务COblN(i,j,φ)来说,它们产生与基于处罚的合同条款,它们的优先级排序与违约的处罚代价有关。对于每一个态势wt,合同义务的承担者Agent i在该世界有一个关于另一个Agent j和虚拟组织仲裁机构(N)的代价值,记为:CS(wt,i,j,N)。这个代价值可以看作是当Agent i 不能向Agent j履行规定的义务时所承担的处罚代价。该义务的语义如下:

定义1 合同型义务可达关系OC依据基于违约的处罚代价建立,即如果在时间点t,可能世界w’的基于违约的处罚代价不大于可能世界w的基于违约的处罚代价,则可能世界w’可以替代w,即 OCi,j(wt,wt’)当且仅当CS(wt’,i,j,N)≤CS(wt,i,j,N)

基于OCi,j(wt,wt’)的定义,状态公式COblN(i,j,φ)的语义定义如下: Mv,wt╞COblN(i,j,φ)当且仅当∀wt’,使得OCi,j(wt,wt’),Mv,wt╞φ

http://www.paper.edu.cn

型义务方面,它不是基于违约处罚,而是基于态势wt下系统效用优先级u(wt)。效用优先级依据领域相关的算法来确定,于是当由不同的型义务引起服务冲突时,Agent将选择具有较高优先级的型义务。该义务的语义如下:

定义2 型义务可达关系OP依据基于系统效用的优先级建立,即如果在时间点t,世界w’的基于系统效用的优先级大于等于世界w的基于系统效用的优先级,则可能世界w’可以替代w,即OPi,j(wt,wt’)当且仅当u(wt)≤u(wt’)

基于OPi,j(wt,wt’)的定义,状态公式PObl(i,j,φ)的语义定义如下: Mv,wt╞PObl(i,j,φ)当且仅当∀wt’,使得OPi,j(wt,wt’),Mv,wt╞φ

上式表明,在态势wt,Agent i 对j有义务φ当且仅当对于任意的型义务可达世界wt’,Agent i对j有型义务φ。 2.3.4 基于的多Agent协同理论模型

在面向自治计算的协同体系中,如何建立高效的协同和资源共享的协同求解方式,是当前研究的热点之一。属于抽象和宏观上的概念,浙江大学的胡军博士从出发提出了基于的多Agent协同理论模型[23~24],作者认为协同体系中的自治元素Agent需要遵从去管理自身的内部行为和与其它元素的关系,多Agent的协助过程由来宏观,通过的导向作用来实施协同体系的自主管理。

胡军博士指出无论对Agent个体还是群体来说,其信念意图的确立和修正都是内部思维状态和外部因素相互作用的结果,外部因素主要通过来影响Agent的行为动作,外部因素的主要部分,在Agent的行为决策过程不仅考虑Agent思维状态对Agent行为的影响,而且进一步考虑对Agent的行为动作的影响可以比较合理的决定Agent的行为动作。Agent的周围存在一个规定的世界,Agent在条件符号时遵循规定的行为动作,使Agent把规定的世界纳入Agent自身的思维状态中,从而使Agent的行为受的规范。Agent在状态的更替中,不断的把条件符合的转化为自身的思维状态当中,实现在指导下的Agent行为。该模型的创新点是,从内部因素和外部因素两个方面分析了影响Agent决策的一些条件,并引入来描述外部因素,是系统对在某种状态下所作行为选择的一种陈述性描述,即规定了Agent在什么状态或条件下,发生了什么事件时该做些什么动作以及这些处理的规划等。下面主要从语义的角度来说明下该模型:

该模型主要在BGI逻辑的基础上,加入了两个表示的模态算子OBEY和EXIST。在模型结构M中加入了规定的世界集合,M=。其中Wp是由规定的世界集合,其余的和BGI中的模型结构类似。

遵循的语义,╞OBEY(x, φ) iff ∀wp’∈existP(x,wr,wp), ∀wr’

∈obeyP(x,wr,wp’),╞φ;

该语义表示Agent在状态s时遵循φ,当且仅当在状态s时,在Agent可达的

http://www.paper.edu.cn

存在的语义,╞Exist(x, φ) iff ∀wp’∈existP(x,wr,wp), ╞OBEY(x, φ)∨OBEY(x,¬φ);

该语义表示Agent在状态s时存在φ,当且仅当在状态s时,Agent所有可达的世界里φ都为真。

2.4 群体思维状态模型

Agent是指在某一环境下能够持续自主运行,具有社会性、反应性等特征的计算实体。其中社会性反应了Agent的群体合作能力,Agent之间必须通过某种方式的合作来完成问题的求解过程。学者们从不同的角度提出了Agent的群体思维理论。

Cohen,Levesque(C&L)扩展了其原有理论模型中有关意图的部分[25],给出了Agent组/队的联合意图的形式化定义,联合意图定义为特殊的联合持续目标。该理论说明了多个Agent在实施联合的社会性行为过程中,它们的信念、愿望和意图之间的关系并提出了如下几个有实际意义的概念。

弱目标概念,该概念说明了Agent在什么条件下保持其目标以及目标已经实现或不可能实现时应采取的行为。WG(x,y,p)=(¬Bel(x,p)∧Goal(x,◇p))∨(Bel(x,p)∧Goal(x,◇MB(x,y,p)))∨(Bel(x,□¬p)∧Goal(x,◇MB(x,y,□¬p)))。

联合持续目标概念,该概念说明了Agent在什么条件下会拥有联合目标以及如何保持持续性。JPG(x,y,p,q)=MB(x,y,¬p)∧MG(x,y,p)∧Until(MB(x,y,p)∨MB(x,y,□¬p)∨MB(x,y,

¬p),MB(x,y,(MG(x,y,p)∧MG(y,x,p))))。

在上述两个概念的基础上,联合意图定义为:

JI(x,y,a,q)=JPG(x,y,DONE(x,y,Until(DONE(x,y,a),MB(x,y,DOING(x,y,a)))?;a),q)。

C&L的联合意图理论属于早期经典理论,成为了后续工作的基准但也有些不足。Catelfranchi认为联合意图在定义上不是充分必要的[26],Castelfranchi区分了MAS中存在的多种承诺形式,讨论了达成社会承诺的个体的权利和义务。在多Agent之间存在着客观的社会依赖关系,因而产生了Agent之间的各种行为关系.相互依赖产生合作行为,而交互依赖则产生交换行为。Jennings在C&L的基础上,提出了群体职责的概念[27],认为群体职责是群体意图的一个延伸,不仅是对目标,而且是对规划的一种承诺;Ioerger提出一种基于可委派的群体职责的形式化表示[28],认为职责不一定需要自己去完成,可以委派他人,而意图不是这样。Agent不但要对所完成的任务进行承诺,还要对委派给他任务的上级 agent 进行承诺;Tambe 结合了群体意图模型和共享规划模型[29],以群体意图为桥梁建立团队成员的思维状态,以确保将来能产生公共的解决方案。Haddadi则在R&G的BDI逻辑上扩展了联合承诺[30],他认为联合目标是被委派或采纳的目标,承诺要求双方同意合作并共同相信它们都希望合作,说明了承诺会在什么条件下被形成、修正和维持。

3.各类Agent模型的分析对比

http://www.paper.edu.cn

3.1 逻辑全知问题

在基于意识的Agent模型中,存在着严重的“逻辑全知”问题以及由此带来的副作用等问题,该类模型的特点是,从意识立场出发把意图作为模型中不可缺少的一个意识属性并且意图决定了整个模型的理性平衡。该问题的根源是可能世界语义中存在逻辑全知的问题,而现实系统是资源有限的;因此,提出一个可控、可信和可行的模型必须避免逻辑全知的出现。

C&L的意图模型和R&G的BDI模型,都是基于正规模态逻辑的可能世界模型;因此也就不可避免的存在逻辑全知的问题。但是,这些都是早期比较经典的理论模型,为以后的理论研究打下了坚实的基础。C&L的意图模型中的推理过于复杂,不能很清晰的反应信念、愿望和意图之间的关系;而且将意图归结为信念和愿望的做法不适合对Agent有限性的假设。R&G的BDI模型所面临的主要问题是不能很好的与实践相结合;R&G在文献[31]中从实践的角度出发将BDI逻辑融入到了应用系统中;但是,意图在整个模型中的地位也的确有待商榷, 从Agent的社会性而言,意图也只是自身的一个思维属性;在形成Agent承诺机制的时候,还不能很好解决社会性的问题。

Konolige在信念演绎模型中引入了逻辑学的方法,其指导思想是通过逻辑学的方法避免在系统中出现逻辑闭包,该逻辑从语法的角度来阻断导致逻辑闭包的道路。从某种意义上讲,该模型是避免了逻辑全知的问题,但是这个方法也存在一定的缺陷;它只考虑了有关信念的逻辑,而没有考虑到有关知识的逻辑,这对能体现人类认知的Agent来说还是不够完善的。况且该模型也只能作为Agent的信念系统的一个简单直接模型,核心部分主要是由基本信念集和一些推导规则构成,因此在完备性和可信性上还有些不足之处。

文献[32~34]中提出了一种含有正规模态算子信念和非正规模态算子意图的混合模态逻辑系统。作者给出了非正规模态算子基于标准(正规)可能世界的语释,不存在逻辑全知问题以及由此带来的副作用等问题。该逻辑的核心内容是,为非正规模态逻辑找到一种基于正规可能世界的语义表示;从正规逻辑扩展到非正规逻辑的一个基本出发点就是系统资源的有限性,这种混合逻辑如何融合到有限资源的系统中是关注的重点内容。

3.2 理论与实践分离的问题

传统的BDI模型缺乏机制来明确表达义务和规范对Agent目标和意图的影响。由于这个原因,传统的BDI理论和各种实际Agent结构存在差距。BDI逻辑通过采用可能世界语义来反映客观世界,并依据自主决策Agent完成特定目标。这些理论特别强调了意图在推理过程中的作用。

Wooldridge在研究现实可行性时指出,基于模态逻辑的可能世界模型只能对Agent模型进行抽象的描述;所使用的逻辑描述和实际系统之间缺乏清晰的关系并且这些逻辑描述对Agent的推理能力都作了不现实的假设[35]。在给MAS系统建模时,Wooldridge提出了一个相

http://www.paper.edu.cn

马光伟博士从Agent的社会属性出发,提出了社会Agent的BDO模型。相比意图逻辑系统,义务逻辑系统比较成熟且是典型的社会性思维状态;采用BDO逻辑描述Agent比BDI逻辑更能有效地对社会关系进行推理。该模型看重的是社会承诺、依赖、联合意图等的推理规则,原有的个体意图推理显得并不是很重要;义务算子和道义逻辑的引入并和Agent的其它思维属性相融合使义务成为了Agent群体思维活动的纽带。但是,如何建立较完善的语义模型和结合各个思维属性动态的修正语义是该模型需要进一步重点研究的内容。

廖备水博士提出了一种初步满足自治元素基本特征的扩展BDI Agent 模型。作者把基于的管理方法和基于合同的协作机制有机地与个体Agent的知识表征和推理决策机制结合起来,以便能够接受和处理来自IT管理者的管理目标和策略,以及与其他Agent因协作需要而签订的合同,并在此基础上依据环境信息,进行自主决策和运作。该模型的创新点是从和合同角度出发融合了Agent内部愿望,协调地推进了自治计算系统的运作;但作者没有阐明融入动态规则后如何有效解决各种规则之间的冲突问题,以及Agent推理过程的非单调性问题。

4. 结论

研究MAS系统的方法有意识逻辑、时态逻辑和进程代数,但没有一个能够解决所有问题;因此针对MAS系统的需求建立模型是研究的关键问题。早期的基于意识的模型大多数都是从意识的立场出发来诠释人类的思维规律,通过借鉴人的思维属性来解释Agent的行为;但是人的思维变数太大无法描述,Agent只能从某个具体的应用领域来模拟人的思维和行为并在一个合理范围给出问题的逻辑系统。

在动态异构的分布式网络计算环境中,如何建立高效的协同和资源共享的协同求解方式,是当前研究的热点之一。在该环境中,建立一个高效的、可控的和可信的模型框架是研究的基础;而传统的Agent理论模型没有把外部动机纳入到决策范畴之内,因此也无法处理由和义务对Agent产生的影响。我们的工作是对传统的Agent模型进行革新,使贯穿整个Agent行为决策过程,并以此为基础建立驱动的多主体协作模型,全面描述协作求解的过程。

参考文献

[1] Dennett, D. C. (1978). Brainstorms. The MIT Press: Cambridge, MA.

[2] Dennett, D. C. (1987). The Intentional Stance. The MIT Press: Cambridge, MA.

[3] J. McCarthy. Ascribing mental qualities to machines. Technical report, Stanford AI Lab., 1978.

[4] Bratman, M. E. (1987). Intentions, Plans, and Practical Reason. Harvard University Press:Cambridge, MA [5] Bratman, M. E. (1990). What is intention? In Cohen, P. R., Morgan, J. L., and Pollack, M. E.,editors,

http://www.paper.edu.cn

[6] Cohen P R, Levesque H J. Intention is choice with commitment. Artificial Intelligence, 1990,42(2~3):213~261.

[7] Rao, A. S. and Georgeff, M. P. (1991a). Asymmetry thesis and side-effect problems in linear time and branching time intention logics. In Proceedings of the Twelfth International Joint Conference on Artificial Intelligence (IJCAI-91), pages 498–504, Sydney, Australia.

[8] Rao A S, Georgeff M P. Modeling rational agents within a BDI-architecture. In: Allen J, Fikes R, Sandewall E eds. Principles of knowledge representation and reasoning: Proceedings of the 2nd International Conference (KR91). San Mateo, CA: Morgan Kaufmann Publishers, Inc., 1991. 473~484.

[9] Bell J. Changing attitudes. In: Wooldridge M J, Jennings N R eds. Intelligent Agents, Proceedings of the ECAI'94 Workshop on Agent Theories, Architectures, and Languages. Berlin: Springer-Verlag KG, 1995. 40~55. [10] Konolige K, Pollack M E. A representationalist theory of intention. In: Bajcsy R ed. Proceedings of the 13th International Joint Conference on Artificial Intelligence. San Mateo, CA: Morgan Kaufmann Publishers, Inc., 1993. 390~395.

[11]Konolige. A deduction model of belief. Pitman Publishing:London and Morgan Kaufmann:San Mateo,CA.1986.

[12] Gaspar G., Coelho. H. (1995). Where do intentions come from?: a framework for goals and intentions adoption,derivation and evolution. Proceedings of the 7th Portuguese Conference on Artificial Intelligence, Berlin: Springer-Verlag. Kq1995: 115-128.

[13]朱朝晖.意图的两维结构理论及非单调推理的研究[博士学位论文].南京航空航天大学,1998.

[14]A Lomuscio and M.Ryan. Ideal agents sharing knowledge. In Proceedings of the13th European Conference on Artificial Intelligence(ECAI-98),pp.557-561,Brighton,United Kingdom, August, 1998.

[15]M.Wooldridge. Intelligent Agents. In G.Weiss, editors: Multi-Agent System, The MIT Press, April, 1999. [16] 张春霞 基于动态逻辑的Agent的形式化模型[硕士学位论文]. 云南师范大学,2000.

[17] 孙瑜 基于VSK-AF逻辑的多Agent系统的形式化模型 [硕士学位论文]. 云南师范大学,2002. [18] 伍晓敏基于VSK-t逻辑的Agent形式化模型[硕士学位论文]. 云南师范大学,2004.

[19] 章江花. 基于BDI-VSK-T逻辑的Agent系统形式化模型的研究[硕士学位论文]. 云南师范大学,2006. [20] Broersen, Dastani, and van der Torre. BDIO-CTL: Obligations and Specification of Agent Behavior [A]. In: Proceedings of IJCAI2003,2003.13-1390.

[21] 马光伟,徐晋辉,石纯一. 社会Agent 的BDO 模型. 计算机学报,2001, 24(5): 521-528. [22] 廖备水.基于PDC-Agent的面向服务的自治计算研究[博士学位论文].杭州:浙江大学,2006. [23] 胡军. 面向自治计算的基于的多agent 协同体系研究[博士学位论文].杭州:浙江大学,2006. [24] 胡 军, 李长云. 基于的多主体协作维护机制[J], 计算机工程与应用, 2007, 43(6):27—30. [25] Levesque H J, Cohen P R, Nunes J H T. On acting together. In: Proceedings of the 8th National Conference on Artificial Intelligence. Menlo Park, CA: AAAI Press/MIT Press, 1990. 94~99.

[26] Castelfranchi C, Conte R. Distributed artificial intelligence and social science: critical issues. In: O'Hare G, Jennings N R eds. Foundations of Distributed Artificial Intelligence. New York: John Wiley & Sons, Inc., 1996.

http://www.paper.edu.cn

[27] Jennings N R. Specification and implementation of belief-desire-joint intention architecture for collaborative problem solving. [J] Journal of Intelligent and Cooerative Information Systems.1993, 2(3): 2~318.

[28] Ioerger, J. Colby Johnson. A Formal Modal of Responsibilities in Agent-Based Teamwork. [A] Proceedings of the Fifth International Conference on Autonomous Agents. 2001: 157-158.

[29] Tambe. Towards Flexible Teamwork. [J] Journal of Artificial Intelligence Research 7, 1997: 83-124. [30] Haddadi A S. Communication and Cooperation in Agent Systems. Berlin: Springer-Verlag KG, 1996. 1~134. [31] Anand S. Rao,Michael P. Georgeff M. BDI agents:From theory to practice. Proceedings of the First International Conference on Multi-agent Systems. San Francisco, USA. 312-319. June,1995. [32]胡立山,石纯一.Agent形式化研究的逻辑工具. 计算机科学,1999,Vol.26 No 12. [33]胡立山,石纯一. Agent-BDI逻辑. 软件学报, 2000, 11 (10) : 1353~ 1360. [34胡立山,石纯一.Agent的意图模型. 软件学报,2000,11(7):965~970.

[35] Wooldridge M. This is MYWORLD: the logic of an agent-oriented DAI testbed. In: Wooldridge M J, Jennings N R eds. Intelligent Agents, Proceedings of the ECAI'94 Workshop on Agent Theories, Architectures, and Languages. Berlin: Springer-Verlag KG, 1995. 160~178.

Overview of Agent model research

Shen huang and Jun Hu

1 College of Computer and Communication, Hunan University, Changsha, PRC,

(410082) Abstract

This paper introduced the current research of theoretical model for Agent, which we described it from four aspects: the model based on the consciousness, the model based on the policy and obligation, the model based on ability and knowledge, and the social mental state model; After introduced the traditional model for rational Agents; we especially detailed the model based on the policy and obligation, this kind of model will become the tendency of the future Agent’s model research. Then, we analyzed the advantages and disadvantages of each model from the two areas: logical omniscience and the theory and practice. Finally, some current works are introduced as well. Key words: Agent, policy, obligation, logical omniscience

作者简介:

黄慎,男,1983年生,硕士研究生,主要研究方向是分布式系统管理、人工智能、软件工程。

胡军,男,1971年生,博士,副教授,主要研究方向是多agent系统、自治计算和人工智能。

因篇幅问题不能全部显示,请点此查看更多更全内容