论文摘要
Robocup机器人足球系统是一个典型的多智能体系统,同时也是一个典型的多智能体协作与竞争系统,它为分布式人工智能的研究提供了一个标准的试验平台。多智能体学习与协作是当今人工智能领域研究的难点与热点,机器人足球系统涉及到多个机器人的协同工作,实时性很强,在这种环境下研究智能体的学习问题和多智能体的协作问题具有很大的挑战。本文以全自主的机器人足球为背景,主要针对智能体学习和多智能体协作两方面进行了深入的研究。 在智能体学习方面,考虑到强化学习算法需要离散化状态空间和行为空间,而机器人足球系统是一个连续的空间,如果对所有变量进行离散必然导致维数灾难,且无法在实际系统中实现。在此基础上设计了改进算法,选择只离散化输入状态,同时将强化学习和在线搜索相结合,该方法提高了搜索速度和踢球动作的成效。 在多智能体协作研究方面,针对机器人足球的动态、不确定环境因素对智能体行为、协作的影响,智能体如何在不确定环境下进行协作就成为一个关键的问题。本文详细论述了三种已经应用到机器人足球上的协作模型和框架,分别探讨了他们的优缺点和可行性。 实验与应用研究表明,本文在智能体学习方面所做的算法结合了强化学习和启发式搜索的优点,将其应用到Robocup仿真比赛中的踢球动作设计,得到了令人满意的效果。
论文目录
摘要Abstract第一章 绪论1.1 分布式人工智能1.2 智能体及其要素1.2.1 智能体的定义1.2.2 智能体的特性1.3 机器人足球1.3.1 机器人足球赛的长期目标与短期目的1.3.2 机器人足球世界杯的项目分类1.4 国内外研究现状及应用前景1.4.1 国内外研究现状1.4.2 应用前景和应用领域1.5 本文研究的主要内容及组织1.5.1 多智能体的学习1.5.2 多智能体的协作第二章 多智能体系统模型2.1 Agent的结构分类2.1.1 反应式Agent2.1.2 跟踪式Agent2.1.3 慎思式Agent2.1.4 复合式Agent2.2 多智能体系统2.2.1 多Agent的基本模型2.2.2 多Agent系统的体系结构2.3 机器人足球比赛中的智能体模型2.4 本章小结第三章 Robocup 3D仿真系统分析3.1 系统介绍3.1.1 SPADES3.1.2 Soccer Server3.1.3 Monitor3.2 仿真比赛的动作模型和感知模型3.2.1 动作模型3.2.2 感知模型3.3 策略系统3.3.1 整体策略3.3.1 阵型与角色3.4 本章小结第四章 分布式足球机器人系统学习算法与动作设计4.1 机器学习4.2 多Agent学习4.2.1 世界强队的多智能体学习技术4.3 强化学习算法4.3.1 强化学习的基本模型4.3.2 几种重要的强化学习算法4.4 基于强化学习的机器人足球动作设计4.4.1 Robocup中运动模型介绍4.4.2 强化学习与在线搜索相结合4.4.3 实验结果4.5 本章小结第五章 分布式足球机器人系统协作技术5.1 多智能体的协作、协商和协调5.1.1 多智能体的协作方法5.1.2 多智能体的协商技术5.1.3 多智能体的协调方法5.2 足球机器人的智能体协作方法5.2.1 面临的主要问题5.2.2 评价模式5.3 Robocup中的三种成功协作方法5.3.1 TSR足球机器人团队协作框架5.3.2 FCPortugal的SBSP算法5.3.3 清华防守体系中的协作5.5 本章小结第六章 结束语6.1 论文研究结果6.2 研究展望参考文献发表论文和参加科研情况说明致谢西北工业大学学位论文知识产权声明书西北工业大学学位论文原创性声明
相关论文文献
标签:机器人足球论文; 多智能体系统论文; 强化学习论文; 协作论文;