多智能体系统协作模型及其在足球机器人仿真系统中的应用

论文题目: 多智能体系统协作模型及其在足球机器人仿真系统中的应用

论文类型: 博士论文

论文专业: 控制理论与控制工程

作者: 彭军

导师: 吴敏

关键词: 多智能体系统,机器人足球世界杯,协作模型,学习,规划

文献来源: 中南大学

发表年度: 2005

论文摘要: 多智能体系统(MAS)的协作是近年来分布式人工智能领域的研究热点。机器人足球世界杯(RoboCup)仿真比赛是检验各种MAS理论的标准平台,在这个极为复杂的多智能体环境中,多智能体必须通过协作才能完成它们的共同目标:多进球赢得比赛。本文在RoboCup仿真球队的设计中,应用规划、学习和预测技术建立了MAS的协作策略和模型,主要研究工作有: 针对RoboCup足球机器人仿真系统面临的主要协作问题,提出一种双层的MAS协作模型框架,它包含协作策略和动作决策两层,这种结构不仅可以增强整个系统的智能度,而且还有利于多智能体间的动态实时协作。采用基于状态的规划协作模型,实现了协作智能体对系统的快速实时反应,不仅提高了单个智能体的反应速度,而且还提高了整个MAS协作的效率。从RoboCup仿真比赛进攻的角度提出了一种基于合作意愿矩阵的传球规划协作策略,实现了一种不依赖于通信的显式多智能体协作。用阵形将多个智能体联接成一个拥有共同目标的团队,并引入角色实现事先给定的任务分配和站位配合,从防守的角度出发,实现了基于阵形变换的多智能体动态防守协作,将案例学习应用到阵形设计中,突破了单凭直接经验设置阵形的局限。可实现积极防守阵形和消极防守阵形两个阵形之间动态变换,满足了不同阶段的防守协作要求,显著提高了球队的整体防守性能。提出了一种基于亲密度模型进行动态防守协作的方法。在采用人盯人战术时,智能体通过亲密度的计算确定是否需要协助队友完成人盯人任务;在采用区域防守战术时,由阵形确定每个区域的主要责任人,由亲密度确定每个区域的次要责任人,来共同完成区域的防守任务。通过亲密度模型的应用,实现了智能体间更好的协作,解决了盯人失败导致漏人的问题和区域防守中边界无人盯防的问题,达到了分工和协作的统一。从提高仿真球队的整体协作能力出发,提出了一种基于行为的预测方法,使RoboCup的协作模型设计简单、反应速度快、适应性好和智能度较高。采用基于行为预测的协作模型在CSU_YunLu队中实现了球队的协作决策,如传球和下底传中等小局部配合。

论文目录:

第一章绪论

1．1 研究背景及目的意义

1．1．1 多智能体系统的协作

1．1．2 足球机器人仿真系统

1．1．3 研究的目的及意义

1．2 国内外研究现状

1．2．1 理性智能体的BDI模型

1．2．2 规划协作模型

1．2．3 基于学习的自协调模型

1．3 主要研究内容与基本思想

1．4 论文构成

第二章多智能体系统协作模型的总体框架

2．1 RoboCup仿真系统

2．1．1 仿真环境

2．1．2 设计难点

2．1．3 仿真球队的设计

2．2 RoboCup仿真系统的主要协作问题

2．3 实现多智能体协作的关键技术

2．4 多智能体系统协作模型的总体框架

2．5 小结

第三章基于状态和合作意愿的规划协作

3．1 基于状态的规划协作模型

3．1．1 状态规划

3．1．2 协作模型

3．1．3 SBPC的三要素

3．2 SBPC模型在Robocup中的应用

3．3 基于合作意愿矩阵的规划协作策略

3．3．1 几种传球方法的比较

3．3．2 基于合作意愿矩阵的规划协作策略

3．4 规划协作策略在RoboCup中的应用

3．5 小结

第四章基于阵形变换和亲密度的动态协作

4．1 角色和阵形

4．1．1 角色

4．1．2 阵形

4．2 基于阵形变换的动态防守协作模型

4．2．1 模型的结构

4．2．2 阵形变换模块

4．2．3 动态防守协作模型在RoboCup中的应用

4．3 亲密度模型的建立

4．3．1 足球比赛中防守战术分析

4．3．2 亲密度模型

4．4 亲密度模型在RoboCup动态防守协作中的应用

4．4．1 基于亲密度模型的人盯人动态防守协作策略

4．4．2 基于亲密度模型的区域动态防守协作策略

4．5 小结

第五章多智能体协作策略的统计Q学习

5．1 多智能体增强学习

5．1．1 增强学习

5．1．2 多智能体增强学习

5．2 多智能体O学习

5．2．1 增强Q学习

5．2．2 多智能体Q学习模型

5．3 基于统计的多智能体Q学习

5．3．1 统计多智能体Q学习

5．3．2 统计多智能体Q学习算法

5．3．3 算法收敛性证明

5．3．4 算法有效性分析

5．4 RoboCup中协作策略的学习

5．4．1 防守协作策略的离线学习

5．4．2 算法性能分析

5．5 小结

第六章基于预测的多智能体协作模型

6．1 基于行为预测的多智能体协作模型

6．1．1 智能体行为预测的方法

6．1．2 基于行为预测的协作模型

6．1．3 预测协作模型在RoboCup中的应用

6．2 基于预测的多智能体Q学习

6．2．1 预测Q学习的引入

6．2．2 多智能体预测Q学习模型

6．2．3 学习性能分析

6．3 高层协作策略的预测Q学习

6．3．1 前场对抗与协作策略的学习

6．3．2 算法性能分析

6．4 小结

第七章结论与展望

7．1 结论

7．2 展望

参考文献

图索引

表索引

致谢

攻读学位期间主要的研究成果目录

发布时间: 2006-03-28

参考文献

[1].几类多智能体系统量化学习一致性研究[D]. 张婷.西安电子科技大学2017
[2].多智能体系统的性能优化[D]. 马婧瑛.西安电子科技大学2017
[3].一类非匹配非线性多智能体系统的分布式一致性控制[D]. 游秀.燕山大学2017
[4].半马尔科夫切换拓扑下的多智能体系统一致性[D]. 戴江涛.大连理工大学2018
[5].APTL模型检测方法及多智能体系统验证的研究[D]. 王海洋.西安电子科技大学2018
[6].复杂条件下多智能体系统的鲁棒一致性控制研究[D]. 李平.电子科技大学2017
[7].多智能体系统一致性控制若干问题研究[D]. 陈凯锐.广东工业大学2017
[8].几类多智能体系统的一致性问题研究[D]. 徐云剑.广东工业大学2017
[9].多智能体系统的协同控制及输出调节问题研究[D]. 梁洪晶.东北大学2016
[10].高阶非线性不确定多智能体系统鲁棒协同控制[D]. 王晴.北京科技大学2018

多智能体系统协作模型及其在足球机器人仿真系统中的应用

猜你喜欢