强化学习在机械手路径规划中的应用

强化学习在机械手路径规划中的应用

论文摘要

两手臂机械手作为一种特殊的机器人,由于它的两个手臂紧密连接,它们之间具有很强的关联性,在机械手从一点到另一点的移动过程中,各个手臂不能像一般的机器人一样视为一个点或圆,而只能简化为几条互连的线段,这样各个手臂的路径规划就成为一个有待尽快解决的问题。本文提出了一种基于强化学习理论的机械手路径规划方法,解决了具有两个手臂的机械手在二维平面系统中的路径规划问题,仿真实验证实了这一方法的有效性。 强化学习通过试错和与环境交互获得策略的改进,作为一种无监督学习方法,它直接从环境反馈中进行学习,这种特点使它能够适应变化的环境。其自学习和在线学习的特点使其成为机器学习研究的一个重要分支。不同于有导师学习,它不需要给出输入—输出对,只是利用环境的惩奖信号来改善自己的行为。 本文首先介绍了强化学习的原理和结构,引入了强化学习的理论模型—马尔可夫决策过程,给出了常用的强化学习算法的流程,然后在此基础上介绍了多智能体强化学习理论的数学模型—马尔可夫对策,对基本的多智能体强化学习算法做了改进,削减了学习单元的冗余状态信息,降低了学习空间的组合强度,加快了多智能体强化学习算法的学习速度,最后提出了一种按比例分配的结构信度分配方法,把多智能体强化学习算法成功应用到了机械手路径规划中。

论文目录

  • 第1章 绪论
  • 1.1 引言
  • 1.2 路径规划技术的研究现状
  • 1.2.1 全局路径规划方法
  • 1.2.2 局部路径规划方法
  • 1.3 强化学习技术的发展历史
  • 1.4 强化学习技术的研究现状
  • 1.5 本文各章节结构安排
  • 第2章 单智能体强化学习
  • 2.1 简介
  • 2.2 马尔可夫决策过程(MDP)
  • 2.3 动态规划方法
  • 2.3.1 值迭代
  • 2.3.2 策略迭代
  • 2.4 蒙特卡洛算法
  • 2.5 瞬时差分算法
  • 2.5.1 瞬时差分(Temporal Difference)
  • 2.5.2 探索和利用(Exploration versus Exploitation)
  • 2.5.3 Sarsa算法
  • 2.5.4 Q学习算法
  • 2.6 多步强化学习
  • 2.6.1 多步 TD算法
  • 2.6.2 多步 Sarsa算法
  • 2.6.3 多步 Q算法
  • 2.7 本章小结
  • 第3章 多智能体强化学习
  • 3.1 理论基础
  • 3.1.1 Markov对策
  • 3.1.2 Nash均衡
  • 3.1.3 概念介绍
  • 3.1.4 基本算法
  • 3.2 算法改进
  • 3.2.1 基本思想
  • 3.2.2 预测动作
  • 3.2.3 预测状态
  • 3.3 本章小结
  • 第4章 机械手路径规划
  • 4.1 机械手工作环境
  • 4.2 碰撞检测
  • 4.3 状态及动作分割
  • 4.3.1 状态分割
  • 4.3.2 动作分割
  • 4.4 强化学习回报函数设计
  • 4.5 结构信度分配
  • 4.6 动作选择机制
  • 4.6.1 单智能体强化学习动作选择
  • 4.6.2 机械手强化学习动作选择
  • 4.7 仿真程序算法
  • 4.8 机械手路径规划仿真
  • 4.9 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表的论文和取得的科研成果
  • 致谢
  • 相关论文文献

    • [1].双通道数控系统桁架式机械手防碰撞设计及应用[J]. 设备管理与维修 2019(22)
    • [2].多用途果蔬采摘机械手的研究[J]. 南方农机 2019(23)
    • [3].果园采摘机械手研究现状综述[J]. 农机化研究 2020(05)
    • [4].分拣机械手在果蔬储运集散行业的应用研究[J]. 自动化技术与应用 2020(01)
    • [5].一种新型消防牵引机械手的结构设计[J]. 现代机械 2019(06)
    • [6].二自由度并联机械手动力学控制方法[J]. 机械科学与技术 2020(01)
    • [7].双(多)工位双(多)植入式测试机械手[J]. 中国集成电路 2020(Z1)
    • [8].桁架机械手结构和设计分析[J]. 科技资讯 2020(03)
    • [9].桁架机械手在数控机床中的应用[J]. 轻工科技 2020(04)
    • [10].智慧药房上药机械手系统送药装置的设计与研究[J]. 现代制造工程 2020(02)
    • [11].具有可锁机构的3RPS机械手运动轨迹控制研究[J]. 中国工程机械学报 2020(01)
    • [12].一种六轴焊接机械手运动学分析[J]. 哈尔滨理工大学学报 2019(06)
    • [13].离心铸造取件机械手导轨的设计[J]. 内燃机与配件 2020(05)
    • [14].仿人机械手设计与硬度感知研究[J]. 东北大学学报(自然科学版) 2020(03)
    • [15].基于位置开关的钻杆机械手定位系统研究[J]. 煤矿机械 2020(05)
    • [16].化工企业生产线搬运机械手电气控制系统的设计——评《化工企业管理》[J]. 塑料工业 2020(04)
    • [17].一种组合式气动柔性机械手设计[J]. 液压与气动 2020(05)
    • [18].自动化生产线搬运机械手控制系统的设计研究[J]. 机械设计与制造 2020(04)
    • [19].桁架机械手在加工自动生产线上的应用[J]. 内燃机与配件 2020(06)
    • [20].穴盘苗单驱动四齿移植机械手的设计与试验[J]. 农机化研究 2020(12)
    • [21].四阶球面并联机械手指向轨迹最优动态规划[J]. 控制工程 2020(04)
    • [22].一种数控生产线上下料桁架机械手系统设计[J]. 江苏工程职业技术学院学报 2020(01)
    • [23].助力机械手在汽车总装仪表工位的应用[J]. 机电工程技术 2019(S1)
    • [24].探析焊接机械手在起重机制造上的应用[J]. 中国设备工程 2020(14)
    • [25].水下机械手电液伺服系统前馈补偿控制策略研究[J]. 控制与信息技术 2020(03)
    • [26].一种饮料包装并联机械手设计与分析[J]. 机械制造与自动化 2020(04)
    • [27].基于遗传算法的变掌机械手结构优化[J]. 机械设计 2020(07)
    • [28].两自由度柔性并联机械手结构振动主动抑制方法[J]. 设备管理与维修 2020(14)
    • [29].并联机械手在芒果智能化分拣中的应用[J]. 现代农机 2020(04)
    • [30].远程人机交互机械手[J]. 绿色科技 2020(12)

    标签:;  ;  ;  

    强化学习在机械手路径规划中的应用
    下载Doc文档

    猜你喜欢