论文摘要
AUV(Autonomous Underwater Vehicle,简称AUV)作为一种高技术手段,在海洋环境监测、海底资源调查、科学考察、危险环境作业和打捞救生等方面起到了至关重要的作用。随着执行任务的复杂性日益增加,单AUV在大范围内作业的时效性、鲁棒性和柔性等方面就表现出明显不足。需要多个AUV构成系统来共同完成任务,而多AUV的协调控制成为关键问题,本论文主要讨论了一种新的多AUV协调控制方法、系统设计及仿真。本文首先介绍了多AUV技术的发展动态以及课题研究的意义,然后根据多AUV协调控制系统的需要建立AUV运动模型、多智能体Q学习模型,在此基础上建立了面向任务的多AUV系统结构。对比分析了近几年的几种重要的多智能体强化算法,然后提出了一种新的多智能体Q学习算法,这种算法结构简单,能够大大简化状态空间,加快收敛速度。试验表明,本文提出的多智能体Q学习方法是有效的。然后对多智能体Q学习算法实现多AUV协调的系统进行了设计,用多个仿真实例说明了多智能体Q学习算法在多AUV系统中的应用,试验证明,此本文提出的多智能体Q学习协调算法在满足Nash均衡的同时,避免了研究多个均衡点同时存在的问题,收敛速度快并且非常有效。
论文目录
摘要ABSTRACT目录第1章 绪论1.1 引言1.2 多AUV技术研究现状1.3 多智能体技术1.4 多智能体Q学习理论基础1.5 研究内容及意义第2章 AUV模型与多AUV系统结构2.1 AUV建模2.2 面向任务的多AUV系统结构2.3 本章小结第3章 多智能体Q学习协调算法研究3.1 几种重要的多智能体Q学习算法3.2 改进的多智能体Q学习协调算法3.3 算法验证仿真试验与结果分析3.3.1 有障碍物方格仿真实验3.3.2 仿真实验结果3.4 本章小结第4章 基于多智能体Q学习的多AUV协调系统设计4.1 引言4.2 多AUV协调系统模块设计4.2.1 通讯模块4.2.2 栅格化地图模块4.3 多智能体Q学习模块4.3.1 输入状态空间压缩模块4.3.2 个体动作选择模块4.3.3 整体行为选择模块4.3.4 编队任务内外强化信号模块4.4 AUV运动模块4.5 本章小结第5章 多AUV协调控制仿真研究5.1 基于多智能体Q学习的多AUV仿真设计5.2 多智能体Q学习二维仿真试验与结果分析5.2.1 仿真案例一5.2.2 仿真案例二5.2.3 仿真结果分析5.3 多智能体Q学习的三维虚拟仿真5.3.1 多智能体Q学习的多AUV三维仿真开发流程5.3.2 多智能体Q学习的多AUV三维仿真框架5.3.3 六个AUV虚拟仿真案例5.4 本章小结结论参考文献攻读硕士学位期间发表的论文和取得的科研成果致谢
相关论文文献
标签:多智能体论文; 学习论文; 均衡论文; 仿真论文;