论文摘要
多机器人系统作为一种人工系统,实际上是对自然界和人类社会中群体系统的一种模拟。多机器人协作与控制研究的基本思想就是将多机器人系统看作是一个群体或一个社会,从组织和系统的角度研究多个机器人之间的协作机制,从而充分发挥多个机器人系统各种内在的优势。导航是移动机器人重要研究内容之一,多移动机器人导航的研究不仅包括各机器人工作环境的建模、路径规划和机器人运动控制,还包括多机器人间的通信和信息融合等的研究。目前,全局已知环境下的单个机器人导航技术已经趋于成熟。但是,在复杂的全局未知的环境下有效地实施多机器人导航,仍是一个亟待解决的难题。本文针对此类要解决的机器人工作环境建模、路径规划和信息交流三个关键问题进行研究,因此具有较大的理论意义和应用价值。主要内容如下:1)本课题中多机器人系统采用基于优先级的主从式多机器人协同导航结构,即各机器人之间通过无线通信,在执行行为决策的同时判断自身周围环境情况,根据面临环境情况得出各机器人的优先级。具有最高优先级的机器人就是临时的主机器人,遇到冲突时有优先行动和指挥其他从机器人的权利。这样各机器人既具有独立决策的能力又不会使群体太分散,确保机器人高效、准确地完成任务。2)机器人导航行为决策中引入了情感感知的概念,用来描述机器人周围环境中障碍物对机器人行为的影响。基于情感感知的学习与决策模型是一个新的强化学习算法,该模型将来自情感的内在奖励和来自感知的外部奖励作为学习和决策的动机。将该模型引入到多机器人导航决策系统中,构造了一个新的移动机器人导航决策系统。通过基于在线的情感感知学习,形成多个机器人协作机制,以提高移动机器人在未知环境中导航的自适应性,从而使机器人更快速、更高效地完成自主导航任务。3)机器人导航行为决策中引入了意愿强度的概念,用来描述目标点对机器人的影响。若机器人是向着目标的方向运动,则此时的机器人在该方向上运动的意愿强度较大;反之,则较小。这样使机器人奔向目标行为明朗化、直接化。通过仿真实验表明,本课题所研究算法实现了多机器人自主导航,并且因为增加了情感感知和意愿强度的思想,使本课题系统显示出高效化、准确化、人性化的特点。论文最后进行了总结,给出了本文的创新点及主要研究成果,并指出要进一步研究的问题。