基于增强学习和ART2神经网络的移动机器人路径规划研究

基于增强学习和ART2神经网络的移动机器人路径规划研究

论文摘要

本文在增强学习和ART2神经网络的基础上,研究了移动机器人路径规划问题,并重点分析了路径规划中的避碰撞问题。本文主要的工作和创新点有以下三个方面:(1)首先针对增强学习中的策略问题,提出了一种渐进式Soft-Max行为选择策略;即在学习初始时,因为对行为掌握的经验知识不够,学习主要通过探索以得到行为的经验知识;在学习的后期则因积累了足够多的经验知识,可以更好地利用行为,同时也可以通过某种突变以达到加快或减慢学习速度的目的。其次针对连续性任务,提出了一种连续任务On-Policy增强学习方法S-Learning以及基于最先策略的增强学习方法FPRL(Foremost-Policy Reinforcement Learning),并在仿真实验中与传统的Q-Learning方法进行对比,以说明这两种增强学习方法的可行性。(2)为了解决增强学习中传统的策略查询表(lookup-table)不适合存储大量的状态值和行为值的问题,本文采用ART2神经网络存储大量的状态空间和分类模式。面对大量的分类模式,手工评估和选择分类模式是非常困难的,为此本文在ART2神经网络中引入增强学习评估和选择机制,结合成RL-ART2(Reinforcement Learning based ART2 Neural Network)神经网络,成功地解决了如何评估和选择已存储在ART2中的分类模式的问题。(3)提出了基于RL-ART2神经网络的移动机器人多障碍物避碰撞系统RLART2-CAS(RLART2-Collision Avoidance System)。为了解决多障碍物环境下,难于手工获取避碰撞规则的难题,本文采用增强学习的方法使系统可以自主获得避碰撞规则;采用RL-ART2神经网络,实现了增强学习和神经网络的集成,解决了规则存储需要占用大量内存空间的问题,并自动评估避碰效果,使系统能够通过学习获得理想的避碰行为,完成路径规划。

论文目录

  • 摘 要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 课题来源
  • 1.2 课题研究的目的和意义
  • 1.3 移动机器人国内外研究概况
  • 1.3.1 国外研究概况
  • 1.3.2 国内研究概况
  • 1.4 论文的主要研究内容
  • 第二章 增强学习研究
  • 2.1 增强学习简介
  • 2.1.1 增强学习原理和结构
  • 2.1.2 增强学习分类
  • 2.2 最优搜索型强化学习算法
  • 2.2.1 TD 算法
  • 2.2.2 Q-Learning
  • 2.2.3 Sarsa
  • 2.3 经验强化型增强学习算法
  • 2.4 部分感知
  • 2.5 函数估计
  • 2.6 符号学习和增强学习偏差
  • 2.6.1 Dyna-Q
  • 2.6.2 增强学习中的规划抽取
  • 2.6.3 增强学习偏差
  • 2.7 增强学习应用
  • 2.8 小结
  • 第三章 ART2 自适应谐振神经网络理论
  • 3.1 自适应谐振理论ART
  • 3.2 ART2 神经网络模型
  • 3.3 ART2 神经网络的基本工作原理
  • 3.3.1 F场运算过程
  • 3.3.2 F场运算过程
  • 3.3.3 调整子系统运算过程
  • 3.3.4 长期记忆权值的调整方式
  • 3.4 ART2 神经网络学习算法
  • 3.5 小结
  • 第四章 移动机器人路径规划方法研究
  • 4.1 传统路径规划方法
  • 4.1.1 自由空间法
  • 4.1.2 人工势场法
  • 4.1.3 栅格法
  • 4.2 智能路径规划方法
  • 4.2.1 基于模糊逻辑的移动机器人路径规划方法
  • 4.2.2 基于神经网络的移动机器人路径规划方法
  • 4.2.3 基于遗传算法的移动机器人路径规划方法
  • 4.2.4 基于混合方法的机器人路径规划方法
  • 4.3 小结
  • 第五章 连续任务增强学习方法 S-learning 及基于最先策略的增强学习方法FPRL
  • 5.1 增强学习行为选择策略
  • 5.2 渐进式Soft-Max 行为选择策略
  • 5.3 一种连续任务On-Policy 增强学习方法S-Learning
  • 5.4 基于最先策略的增强学习方法FPRL
  • 5.5 小结
  • 第六章 基于增强学习的ART2 神经网络RL-ART2
  • 6.1 基于增强学习的ART2 神经网络RL-ART2
  • 6.2 RL-ART2 的学习算法
  • 6.3 小结
  • 第七章 基于 RL-ART2 神经网络的移动机器人多障碍物避碰撞系统RLART2-CAS
  • 7.1 引言
  • 7.2 基于规则的移动机器人避碰撞方法
  • 7.2.1 障碍物运动状态的获取
  • 7.2.2 避碰撞规则的定义
  • 7.2.3 基于增强学习的避碰撞行为评估和选择
  • 7.3 基于RL-ART2 的避碰撞系统RLART2-CAS
  • 7.3.1 RLART2-CAS 避碰撞系统结构
  • 7.3.2 RLART2-CAS 避碰撞系统流程
  • 7.4 小结
  • 第八章 仿真实验分析
  • 8.1 仿真平台及环境设置
  • 8.1.1 仿真平台TeamBots
  • 8.1.2 仿真环境设置
  • 8.2 增强学习评价仿真实验
  • 8.3 RL-ART2 神经网络的避碰撞仿真实验
  • 8.4 RL-ART2 神经网络路径规划仿真实验
  • 8.5 小结
  • 第九章 总结与展望
  • 9.1 总结
  • 9.2 进一步工作
  • 参考文献
  • 作者在攻读博士学位期间公开发表的论文
  • 作者在攻读博士学位期间所作的项目
  • 作者在攻读博士学位期间所写的专著
  • 致谢
  • 发表意见书
  • 博硕士学位论文同意发表声明
  • 相关论文文献

    • [1].ART2网络的学习速率调整及其影响[J]. 微电子学与计算机 2008(09)
    • [2].基于ART2动态聚类的协同过滤推荐方法[J]. 福建电脑 2009(05)
    • [3].基于改进ART2神经网络的绝缘子故障在线诊断[J]. 湖南大学学报(自然科学版) 2008(10)
    • [4].二维空间聚类的树ART2模型[J]. 计算机应用 2011(05)
    • [5].基于ART2的Q学习算法研究[J]. 控制与决策 2011(02)
    • [6].基于ART2网络的三维模型聚类分析方法[J]. 计算机集成制造系统 2011(09)
    • [7].基于ART2网络的变压器故障分类方法[J]. 变压器 2009(12)
    • [8].基于管件编码和ART2神经网络聚类的船舶管件加工族构造[J]. 科学技术与工程 2012(15)
    • [9].基于粗糙集和ART2神经网络的多传感器信息融合[J]. 仪器仪表用户 2008(02)
    • [10].使用LSA降维的改进ART2神经网络文本聚类[J]. 计算机工程与应用 2014(24)
    • [11].基于改进ART2算法的模式识别[J]. 吉林建筑大学学报 2017(02)
    • [12].基于改进的ART2神经网络的滚动轴承故障诊断[J]. 济南大学学报(自然科学版) 2019(06)
    • [13].基于ART2技术的面向对象高分辨遥感影像分类[J]. 计算机应用与软件 2010(04)
    • [14].基于ART2网络的民航气象服务器业务维护系统的设计与实现[J]. 重庆电子工程职业学院学报 2011(01)
    • [15].一种基于ART2神经网络的算法改进[J]. 现代电子技术 2014(18)
    • [16].一种基于强化学习的ART2神经网络——RL-ART2[J]. 模式识别与人工智能 2008(03)
    • [17].基于ART2网络的运动目标检测[J]. 长沙理工大学学报(自然科学版) 2012(01)
    • [18].一种改进的基于ART2神经网络的文字识别算法[J]. 桂林电子科技大学学报 2012(03)
    • [19].基于ART2神经网络的汽车车架纵梁模式识别[J]. 机械制造与自动化 2009(03)
    • [20].改进的ART2型神经网络在故障诊断中的应用[J]. 计算机工程与应用 2010(09)
    • [21].基于ART2网络的彩色像素分析及其应用[J]. 中国图象图形学报 2008(04)
    • [22].基于ART2神经网络的手势动作肌电信号识别[J]. 中国科学技术大学学报 2010(08)
    • [23].基于改进ART2神经网络的汽轮机故障诊断[J]. 煤矿机械 2009(01)
    • [24].ART2神经网络的一种改进[J]. 计算机工程与应用 2014(18)
    • [25].基于ART2线性组合神经网络的军事物流需求预测方法研究[J]. 电子世界 2015(16)
    • [26].基于ART2神经网络的车辆感应波形识别的方法[J]. 计算机测量与控制 2009(05)
    • [27].基于瞬时转速和ART2神经网络的柴油机故障诊断[J]. 现代车用动力 2018(01)
    • [28].基于ART2神经网络的脱机手写吾美藏文基字识别[J]. 电子技术与软件工程 2013(15)
    • [29].一种抗漂移的改进ART2网络GSC-ART2研究[J]. 智能计算机与应用 2014(05)
    • [30].基于主成分分析和ART2网络的车辆波形分类[J]. 湖南文理学院学报(自然科学版) 2009(04)

    标签:;  ;  ;  ;  ;  

    基于增强学习和ART2神经网络的移动机器人路径规划研究
    下载Doc文档

    猜你喜欢