多智能体协作策略的研究及在RoboCup中的应用

多智能体协作策略的研究及在RoboCup中的应用

论文摘要

多智能体协作是多智能体系统MAS研究的核心问题。在复杂、动态、不确定的多智能体环境中,为了满足多智能体协作中对局部配合和通信受限的要求,本文对智能体策略寻优、行为协调和动作规划问题进行研究,来构建适用于不同情况下的多智能体协作策略,并在典型的MAS——RoboCup机器人足球仿真系统平台下进行检验。首先,为了实现智能体行为选择的优化和多智能体的局部协作,提出基于行为协同优化的多智能体协作策略。智能体通过模块化模糊Q学习对其他智能体的行为进行评估,考虑它们的行为对自身行为选择的约束,来优化自身的行为决策,再采用共享联合意图的协调方法解决智能体之间的行为冲突,得到其最优行为策略。其次,在通信受限的情况下,提出基于多智能体行为图的分层规划协作策略。根据智能体感知到的局部环境信息,利用行为图对其行为过程进行预测规划,再结合模块化模糊Q学习中获得的行为选择的先验知识,逐层调整其初始行动计划,获得智能体协调一致的动作规划序列,使其针对当前环境快速做出有效决策来实现与其他智能体的协作。论文提出的多智能体协作策略应用到中南大学CSU_YunLu机器人足球仿真球队中,在实际训练和对抗比赛中验证了其有效性。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 课题研究背景
  • 1.2 国内外研究现状
  • 1.3 研究目的及意义
  • 1.4 主要研究内容和构成
  • 第二章 RoboCup中多智能体协作策略的研究
  • 2.1 多智能体的协作
  • 2.1.1 协调与协作
  • 2.1.2 RoboCup仿真球队协作策略分析
  • 2.2 协作策略设计的关键技术
  • 2.2.1 行为协调
  • 2.2.2 行动策略的学习
  • 2.2.3 动作序列的规划
  • 2.3 RoboCup中协作策略设计的难点
  • 2.3.1 协作任务确定
  • 2.3.2 协作过程规划
  • 2.3.3 多智能体的行为决策
  • 2.4 小结
  • 第三章 基于行为协同优化的多智能体协作策略
  • 3.1 基于行为协同优化的双层多智能体协作模型
  • 3.2 模块化模糊 Q学习的个体行为优化
  • 3.2.1 智能体学习空间的模块化划分
  • 3.2.2 模块化模糊 Q学习算法(MFQL)
  • 3.2.3 基于MFQL的智能体行为决策过程
  • 3.3 协作智能体的冲突消解
  • 3.3.1 协调主体的确定
  • 3.3.2 利用联合意图实现智能体最优行为决策
  • 3.4 行为协同优化的协作策略在RoboCup防守协作中的应用
  • 3.4.1 后卫断球配合策略的离线学习
  • 3.4.2 协作防守性能分析
  • 3.5 小结
  • 第四章 基于多智能体行为图的分层规划协作
  • 4.1 多智能体行为图(MABG)
  • 4.1.1 行为图的形式化表示
  • 4.1.2 多智能体行为图的正规化
  • 4.2 MABG分层规划协作模型
  • 4.3 分层规划协作过程
  • 4.3.1 先验知识的层次概化
  • 4.3.2 规划协作策略的确定
  • 4.4 MABG分层规划协作策略在RoboCup进攻协作中的应用
  • 4.4.1 球员边路进攻协作策略的规划
  • 4.4.2 对抗比赛中规划性能的分析
  • 4.5 小结
  • 第五章 总结与展望
  • 5.1 本文主要工作
  • 5.2 后期研究展望
  • 参考文献
  • 附录1 图索引
  • 附录2 表索引
  • 致谢
  • 攻读学位期间的论文情况和科研情况
  • 相关论文文献

    • [1].基于蒙特卡洛Q值函数的多智能体决策方法[J]. 控制与决策 2020(03)
    • [2].多智能体深度强化学习研究综述[J]. 计算机工程与应用 2020(05)
    • [3].多智能体路径规划研究进展[J]. 计算机工程 2020(04)
    • [4].数据驱动的多智能体网络鲁棒包容控制[J]. 控制理论与应用 2020(09)
    • [5].基于雷达观测的多智能体编队协作式目标跟踪[J]. 指挥信息系统与技术 2020(04)
    • [6].多智能体聚集问题研究综述[J]. 计算机应用研究 2019(06)
    • [7].多智能体强化学习综述[J]. 计算机科学 2019(08)
    • [8].基于多智能体的编队控制一致性研究[J]. 科技创新与应用 2016(35)
    • [9].新时期物联网环境下多智能体决策信息技术[J]. 山西农经 2016(14)
    • [10].牵引控制间歇通讯多智能体网络的一致性[J]. 信息与控制 2017(02)
    • [11].基于多智能体的配电台区智能决策系统研究[J]. 信息技术 2020(10)
    • [12].多智能体集合的人机交互指控系统架构研究[J]. 中国管理信息化 2020(20)
    • [13].基于切换拓扑的多智能体协作控制研究综述[J]. 计算机应用研究 2019(04)
    • [14].基于事件触发机制的多智能体网络平均一致性研究[J]. 计算机应用研究 2017(03)
    • [15].多智能体协调控制的演化博弈方法[J]. 系统科学与数学 2016(03)
    • [16].多智能体模型用于土地利用演变模拟研究进展[J]. 江西科学 2015(01)
    • [17].具有多变时滞的多智能体复杂动态网络的平均一致性[J]. 郧阳师范高等专科学校学报 2013(06)
    • [18].分布式优化的多智能体方法[J]. 控制理论与应用 2019(11)
    • [19].一种基于多智能体强化学习的流量分配算法[J]. 北京邮电大学学报 2019(06)
    • [20].一种高效率的多智能体协作学习通信机制[J]. 信息安全研究 2020(04)
    • [21].基于时滞脉冲控制的二阶多智能体一致性分析[J]. 莆田学院学报 2020(02)
    • [22].正实特征值切换拓扑的一般线性多智能体动态系统稳定性[J]. Engineering 2020(06)
    • [23].支持强化学习多智能体的网电博弈仿真平台[J]. 指挥与控制学报 2019(01)
    • [24].鲁棒优化与多智能体协调的电梯群控调度[J]. 中国新通信 2017(12)
    • [25].基于多智能体遗传算法的配电网节能降耗综合管理系统[J]. 湖南大学学报(自然科学版) 2016(04)
    • [26].事件触发控制背景下的二阶多智能体一致性探究[J]. 数学学习与研究 2019(03)
    • [27].主从多智能体网络快速随机一致性[J]. 山东大学学报(理学版) 2014(01)
    • [28].大规模多智能体仿真平台设计方法的研究[J]. 中国科学技术大学学报 2012(08)
    • [29].离散时间混合多智能体的拟平均一致性控制[J]. 智能系统学报 2012(04)
    • [30].基于多智能体社会的僵尸网络协同防御模型[J]. 微电子学与计算机 2011(03)

    标签:;  ;  ;  ;  

    多智能体协作策略的研究及在RoboCup中的应用
    下载Doc文档

    猜你喜欢