基于规划融合的多Agent系统协调机制研究

基于规划融合的多Agent系统协调机制研究

论文摘要

多Agent系统中,Agent之间的协调关系是影响多Agent智能的一个重要方面,协调的目的在于通过信息共享和通信交互,对任务目标、行为动作进行合理安排,以最大限度的发挥多Agent的整体性能。在众多解决多Agent系统协调问题的方法中,智能规划是解决多Agent系统协调问题中的一种有效方法,而马尔可夫决策过程是解决智能体规划问题的一种有效理论模型,它的基本思想是:通过Agent与周围环境的交互反馈来感知环境的状态并不断修正自己的行为,以寻求解决问题的最优或次优策略。本文以马尔可夫决策模型及多Agent系统下的部分可观察马尔可夫决策模型为理论基础,研究了多Agent系统的两类协调问题:任务协调和行为协调,这里的任务协调具体是指动态任务分配问题,主要的研究内容包括以下几个方面。首先,对集中式的动态任务分配问题,根据分配任务的不确定性,系统收益的最大化需求以及分配过程序贯决策特征,利用马尔可夫决策模型进行了分析建模,赋予抽象的模型要素以问题相关的形式化描述,并在一定的前提条件下证明了最优分配策略的存在性。对模型的求解过程综合了值迭代和策略迭代的方法,实验结果表明,该方法在保证得到最优或次优策略的同时减少了迭代的次数,提高了收敛速度。其次,对动态任务分配中的再分配问题,通过分析再分配任务产生的原因,对初始分配策略进行了一定的调整,使得因各种原因而剩余的任务能够继续参与到动态分配的任务队列中,直到所有的任务最终都能得到合理的解决,加强了模型的健壮性。此外,对多Agent系统中Agent之间的行为协调问题,针对环境部分可观察性、需记忆的历史信息量大、通信资源非常有限的特点、提出了一种基于规划融合的行为协调机制,在该机制中,通过等价性定义和历史的可合并定理限制了历史信息的规模,采用对可能的冲突检测和延迟通信的方法合理的利用有限资源来提高系统收益和协调效率。通过实验,表明了此机制能够有效的提高利用历史信息进行决策的系统收益,而且在一定冲突度下能够利用有限通信资源提高协调效率和能力。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题的研究背景及意义
  • 1.2 国内外研究现状
  • 1.3 本文的研究内容
  • 1.4 论文的结构安排
  • 第2章 MAS基本理论与协调方法
  • 2.1 MAS基本理论
  • 2.1.1 Agent的概念与结构
  • 2.1.2 MAS体系结构
  • 2.2 MAS协调分类
  • 2.3 MAS协调方法
  • 2.3.1 基于BDI的思维状态模型
  • 2.3.2 基于社会结构的规划
  • 2.3.3 基于马尔可夫决策的规划
  • 2.4 本章小结
  • 第3章 基于MDP与再分配策略的动态任务分配机制
  • 3.1 动态任务分配问题
  • 3.1.1 MAS动态任务分配
  • 3.1.2 Agent间的协调问题
  • 3.1.3 动态任务分配机制及算法
  • 3.2 基于MDP&RA的动态任务分配模型
  • 3.2.1 模型构建
  • 3.2.2 再分配策略
  • 3.2.3 最优策略存在性证明
  • 3.3 基于MDP&RA的动态任务分配求解算法
  • 3.3.1 算法描述
  • 3.3.2 算法流程图
  • 3.4 仿真实验
  • 3.4.1 问题描述
  • 3.4.2 实验分析
  • 3.5 本章小结
  • 第4章 基于规划融合的MAS行为协调机制
  • 4.1 MAS行为协调
  • 4.1.1 MAS行为协调的必要性
  • 4.1.2 行为协调的方法—强化学习
  • 4.1.3 强化学习相关算法及关键问题
  • 4.2 基于规划融合的改进Q学习机制
  • 4.2.1 规划框架
  • 4.2.2 历史的可控制性
  • 4.2.3 协调中的通信问题
  • 4.3 基于规划融合的改进Q学习算法
  • 4.3.1 算法描述
  • 4.3.2 Q值函数的求解
  • 4.4 仿真实验
  • 4.4.1 问题描述
  • 4.4.2 实验分析
  • 4.5 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表的论文和取得的科研成果
  • 致谢
  • 相关论文文献

    • [1].基于agent的建筑工人流动行为仿真及其对行业的影响[J]. 控制与决策 2020(01)
    • [2].基于可能回答集程序的多Agent信念协调[J]. 计算机科学 2020(02)
    • [3].基于空间Agent的舰载机群调度路径规划[J]. 兵器装备工程学报 2020(03)
    • [4].基于多Agent的海岛微电网分布式双层控制方法[J]. 电力系统及其自动化学报 2020(03)
    • [5].基于Agent建模的小群体疏散时间研究[J]. 消防科学与技术 2020(03)
    • [6].基于多Agent的地区电网智能调度系统研究与设计[J]. 科技经济导刊 2020(09)
    • [7].基于Agent人工智能技术的分布式入侵检测系统设计[J]. 计算机测量与控制 2020(07)
    • [8].基于Agent的数据链系统信息交互过程建模仿真[J]. 计算机仿真 2020(08)
    • [9].基于Agent的中压电力线载波通信组网技术[J]. 电力信息与通信技术 2017(01)
    • [10].装备保障指挥Agent框架建模[J]. 火力与指挥控制 2017(02)
    • [11].基于Agent的要地防空作战仿真研究[J]. 计算机与数字工程 2016(11)
    • [12].利用多Agent算法进行船舶电力系统网络重构模型研究及仿真[J]. 舰船科学技术 2017(04)
    • [13].基于移动Agent的网络安全管理模型的研究[J]. 网络安全技术与应用 2017(06)
    • [14].基于多Agent技术的资产管理系统[J]. 电脑知识与技术 2017(07)
    • [15].基于Agent的内部威胁实时检测框架[J]. 计算机系统应用 2017(06)
    • [16].基于Agent的麻将游戏机器人系统设计[J]. 信息系统工程 2017(05)
    • [17].基于多agent系统的大规模无人机集群对抗[J]. 控制理论与应用 2015(11)
    • [18].基于多Agent的船舶电力系统故障恢复方法[J]. 信息与控制 2015(06)
    • [19].基于Agent的信息化作战油料保障调运模型[J]. 兵器装备工程学报 2016(03)
    • [20].基于多Agent仿真的新产品推广策略研究[J]. 中国管理科学 2015(S1)
    • [21].基于Agent的羊群行为研究[J]. 中国管理科学 2015(S1)
    • [22].智能电网之中的Agent技术分析[J]. 中国新技术新产品 2016(18)
    • [23].组织中情绪氛围对隐性知识共享的影响——基于多agent的仿真研究[J]. 情报理论与实践 2016(09)
    • [24].基于多Agent的作战体系仿真模型构建[J]. 舰船电子工程 2016(10)
    • [25].基于多Agent的分布式能源并网策略[J]. 系统工程学报 2014(06)
    • [26].基于Agent的个性化元搜索引擎[J]. 河北大学学报(自然科学版) 2015(02)
    • [27].一种改进的移动Agent消息收发机制[J]. 电子商务 2015(06)
    • [28].基于信标的多Agent系统及其移动规则研究[J]. 长春理工大学学报(自然科学版) 2015(03)
    • [29].电力系统继电保护中多Agent技术的运用实践略述[J]. 科技与创新 2015(21)
    • [30].基于多Agent的微电网电压控制系统[J]. 电气开关 2015(05)

    标签:;  ;  ;  ;  ;  

    基于规划融合的多Agent系统协调机制研究
    下载Doc文档

    猜你喜欢