基于强化学习和群集智能方法的多机器人协作协调研究

基于强化学习和群集智能方法的多机器人协作协调研究

论文题目: 基于强化学习和群集智能方法的多机器人协作协调研究

论文类型: 博士论文

论文专业: 计算机应用技术

作者: 王醒策

导师: 顾国昌

关键词: 体系结构,强化学习算法,群集智能算法,多机器人系统,编队

文献来源: 哈尔滨工程大学

发表年度: 2005

论文摘要: 随着多机器人系统的迅速发展,21世纪伊始就对其提出了分布、智能和协同化的要求。合理体系结构和高效协作协调算法的研究重要性日益突出,本文对这两方面进行了全面深入地研究,内容分为三部分:多机器人系统体系结构研究;多机器人系统强化学习算法研究和多机器人系统群集智能算法研究,以满足多机器人系统的低通讯量,变化性,分布性,分散性和动态性的要求。 体系结构是多机器人系统的研究基础,直接决定了机器人间的相互关系和功能的分配。本文面向多机器人系统强化学习算法,设计了多机器人分层体系结构。给出了势场栅格算法,研究了模糊控制算法和黑板式通讯。这种结构的并发性好,实时功能强,能够加强机器人对变化环境的应变能力。面向多机器人系统群集智能算法,提出了多机器人意图-行为结构,对这种结构,对各机器人的行为能力和群体交互方式进行了研究。探讨了基于对策论的无通讯协调,给出了愿望竞争算法、抑制疲劳算法,研究了机器人行为设定机制和基于信息素的通讯机制,得出该结构具有分布式控制和分散的数据量的特点的结论,这适合于相似的分布式控制系统。 强化学习理论由于其自学习性和自适应性的优点而得到了广泛地关注。但此理论在应用中还存在着状态空间压缩,结构信度分配等问题。本文面对状态空间压缩问题,提出自组织动态压缩空间算法;关于结构信度分配问题,提出兼顾系统整体利益和个体利益的内外强化信号算法,对传统强化学习算法进行了重大改进。这种状态空间压缩方法加快了算法对空间的遍历,提高了算法的学习速度;合理分配信

论文目录:

第1章 绪论

1.1 引言

1.2 智能移动机器人研究的问题

1.3 群体行为概述

1.4 多机器人系统的研究内容

1.5 多机器人的主要群体行为

1.6 本文研究的目的和意义

1.7 本文的研究内容

1.8 本文的组织结构

第2章 多机器人系统体系结构研究

2.1 多机器人各种体系结构及其优缺点

2.1.1 多机器人系统的传统体系结构

2.1.2 基于MAS的多机器人体系结构

2.1.3 基于群集智能的多机器人体系结构

2.2 多机器人系统分层体系结构研究

2.2.1 多机器人分层结构

2.2.2 面向编队任务的多机器人分层结构实现

2.2.3 协作任务层—基于势场栅格法的路径规划算法

2.2.4 动作控制层—基于模糊推理的动作规划

2.2.5 黑板式通讯

2.3 基于群集智能的多机器人意图—行为体系结构研究

2.3.1 基于对策论的无通讯协调

2.3.2 基于群体智能的低通讯量协调

2.4 本章小结

第3章 多机器人系统强化学习算法研究

3.1 强化学习

3.1.1 强化学习的基本原理

3.1.2 多智能体强化学习方法

3.1.3 多智能体强化学习存在的主要问题

3.2 强化学习协调行为层结构

3.3 多机器人系统强化学习算法的实现

3.3.1 应用自组织网络量化压缩状态空间

3.3.2 强化学习模块

3.3.3 个体行为选择模块

3.3.4 群体行为选择模块

3.3.5 强化信号的确定与信度分配问题

3.4 仿真实验及数据分析

3.4.1 仿真实验

3.4.2 实验结果分析

3.5 本章小结

第4章 多机器人系统群集智能算法研究

4.1 群集智能介绍

4.1.1 人工生命简介

4.1.2 人工生命中的群集智能

4.1.3 群集智能的基本原则

4.1.4 群集智能的主要研究方法

4.1.5 群集智能的优缺点

4.2 多机器人系统群集智能算法实现

4.2.1 机器人运动模型

4.2.2 避障行为的实现

4.2.3 聚集行为的实现

4.2.4 排列行为的实现

4.2.5 漫游行为的实现

4.3 群集智能算法稳定性的讨论

4.3.1 简化群集模型

4.3.2 内聚力分析

4.4 仿真实验及数据分析

4.4.1 仿真实验

4.4.2 实验数据分析

4.5 强化学习算法和群集智能算法的讨论

4.5.1 两算法性能讨论

4.5.2 信息素传播算法与Q学习算法相似性讨论

4.6 本章小结

结论

参考文献

攻读博士学位期间发表的论文和取得的科研成果

致谢

附录A

发布时间: 2005-10-21

参考文献

  • [1].四足机器人奔跑步态动态稳定性与控制方法研究[D]. 刘清宇.华中科技大学2017
  • [2].室内环境下多机器人协调探索算法研究[D]. 姚芝凤.哈尔滨工程大学2018
  • [3].下肢外骨骼机器人多模融合控制策略研究[D]. 刘笃信.中国科学院大学(中国科学院深圳先进技术研究院)2018
  • [4].移动侦测机器人的人机交互与局部自主关键技术研究[D]. 纪鹏.东南大学2017
  • [5].面向家庭服务机器人的中文指令处理研究[D]. 高胜男.燕山大学2017
  • [6].水下球形探测机器人自主运动控制研究[D]. 刘志民.北京邮电大学2018
  • [7].基于多特征融合的机器人目标跟踪算法研究[D]. 王丽佳.北京工业大学2017
  • [8].面向快速测试进化形态的模块化机器人研究[D]. 刘策越.中国矿业大学(北京)2018
  • [9].基于视窗平台的机器人控制技术研究及实现[D]. 何永义.上海大学2001
  • [10].拱泥机器人的控制系统及路径规划研究[D]. 王岚.哈尔滨工程大学2003

标签:;  ;  ;  ;  ;  

基于强化学习和群集智能方法的多机器人协作协调研究
下载Doc文档

猜你喜欢