支持强偏序约束的智能规划与调度方法研究

支持强偏序约束的智能规划与调度方法研究

论文摘要

随着人工智能的快速发展,智能无人平台逐渐向小型化和智能化转变,多无人平台的高效协同将在未来的信息化战场、太空探索、抢险救援等领域有着广泛而深入的应用。在该问题背景下,当目标任务随机到达,目标之间存在强偏序约束,且目标任务的执行时间和执行的成功概率都具有时间相关不确定时,为了实现多无人平台之间的在线协同,满足在线计划过程中的时效性,需要设计高效的在线规划与调度方法,实时的生成执行计划,并优化调度相关的无人平台去执行。本文以此为研究目的,主要讨论:如何建立智能规划与优化调度相结合的在线计划系统;如何利用智能规划语言PDDL进行计划问题的描述与建模,描述无人平台之间的协同交互关系;如何在目标任务之间存在强偏序约束的情况下快速搜索执行目标任务的行动序列;以及如何在时间相关不确定环境下,针对规划过程生成的行动序列进行行动的起止时间推理和无人平台的在线优化调度,获得全局较优计划方案。主要工作如下:(1)建立了离线状态下基于运筹学方法的问题模型,并讨论了在线计划框架和基于PDDL的规划问题建模。文中通过基于运筹学方法的问题建模,对本文研究问题的特点和问题求解的复杂度进行了详细讨论;然后,根据智能规划和运筹学中优化调度的各自特点,设计了智能规划与优化调度相结合的在线计划系统框架。文中以单舰的不同武器平台自动协同防空为例,讨论了针对某一给定规划问题的PDDL描述与建模方法,为后续的智能规划搜索算法提供模型基础,并以该案例为背景,讨论了舰艇防空的在线计划系统的运行流程,设计开发了舰艇防空的在线计划仿真实验平台。(2)提出了规划过程中的死锁检测算法和多步前向搜索算法,用于解决初始状态下目标任务之间存在强偏序约束的规划问题。在该类问题中,目标任务的实现顺序必须满足初始状态下存在的偏序约束,搜索过程一旦违背任何偏序约束都会导致搜索过程进入死锁。现有的规划算法在规划解的搜索过程中,不能准确发现该类问题中目标任务之间的强偏序约束关系,从而无法快速获得规划解。本文针对这一问题,构建了基于目标实现图的死锁检测算法,该算法能快速预测搜索过程中因违背目标任务之间的强偏序约束而导致的显性和隐性死锁,从而引导多步前向搜索过程快速向目标状态逼近,并快速返回规划解。文中对算法的复杂度、充分性和适用领域进行了讨论,并通过三个不同领域的规划问题将本文算法和历年的冠军规划器进行了实验对比,验证了本文算法在解决该类问题时的充分性和有效性。(3)提出并解决了因相斥目标实现行动导致的强偏序约束规划问题。在该类规划问题的初始状态下,目标任务之间不存在任何强偏序约束。但是随着规划过程的进行,由于相斥目标实现行动的存在,对某一目标任务实现过程中的目标实现行动的选择不当,可能给后续的规划过程中引入目标实现顺序的强偏序约束。文中对该类问题的性质进行了分析,并从理论和实验上论证了该类问题的复杂性。通过对前面提出的死锁检测算法的进一步拓展,提出了以相斥目标实现行动集为启发式函数的多步前向搜索算法,并对算法的复杂度、算法求解该类问题的充分性和算法适合的问题特点进行了讨论。而且,文中构造了以编队舰艇防空为背景的相斥目标实现行动导致的强偏序约束规划问题,通过与历年的冠军自动规划器相比较,充分显示了现有规划算法在求解这一新的规划问题时存在的不足,以及本文算法在求解该类规划问题时的有效性。(4)研究了基于重计划的在线计划优化方法。在线过程中,由于目标任务的连续随机到达和计划执行结果的不确定性,当前的计划策略不可避免的存在“短视”现象。在对未来目标任务到达分布未知的情况下,为了能够获得全局较优解,文中设计了基于重计划的在线规划与调度策略,对当前已经生成但还未执行的目标任务的计划方案进行在线优化处理,以获得全局较优解。重计划过程具备实时性,充分考虑算法耗时对计划过程的影响、行动的时间推理、以及无人平台之间的最优化协同调度。文中以单舰的不同武器平台的协同防空为仿真案例,设计开发了仿真实验平台,验证了重计划的在线优化方法在获取全局较优解时的有效性,且用于重计划的时间越长,对全局解的优化程度越高。(5)研究了基于分散式马尔科夫决策过程的在线计划方法。该研究主要针对能准确估计未来目标任务到达的概率分布,目标任务的执行持续时间和计划执行的成功概率都具有时间相关不确定性,以及不允许进行重计划情况下的在线计划方法。针对每一个到达的目标任务,既要考虑调度无人平台以最大期望完成该目标任务,又要确保该决策造成的潜在机会损失最小,以获得计划过程的全局较优解。文中采用基于分散式马尔科夫决策过程的在线计划模型,模型的收益函数考虑了当前的决策收益和未来潜在的机会损失,并以编队的舰艇防空为案例,设计开发了仿真实验平台,通过仿真实验论证了考虑潜在机会损失的计划过程能返回全局较优计划方案。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景
  • 1.1.1 论文研究的背景与意义
  • 1.1.2 论文研究的基金项目支撑
  • 1.2 基本概念、问题特点及国内外相关研究现状
  • 1.2.1 预备知识及论文研究问题的特点
  • 1.2.2 国内外相关研究现状
  • 1.3 现有相关研究存在的问题和本文的主要研究工作
  • 1.3.1 现有相关研究存在的问题
  • 1.3.2 本文的研究思路
  • 1.3.3 本文的研究内容
  • 1.3.4 本文的主要创新点
  • 第二章 问题描述、建模与在线计划(规划与调度)系统的框架设计与分析
  • 2.1 基于运筹学方法的问题建模
  • 2.1.1 离线状态下的问题形式化描述
  • 2.1.2 离线运筹学优化模型
  • 2.1.3 离线优化模型的求解复杂度分析
  • 2.2 规划与调度相结合的在线计划系统框架与计划生成流程
  • 2.3 案例分析:基于舰艇防空案例的在线计划系统分析
  • 2.3.1 舰艇防空案例介绍
  • 2.3.2 基于智能规划与优化调度的舰艇防空计划系统
  • 2.3.3 案例讨论
  • 2.4 本章小结
  • 第三章 初始状态下目标任务之间存在强偏序顺序约束的规划方法研究
  • 3.1 强目标偏序约束规划问题介绍
  • 3.2 死锁检测算法及算法性质分析
  • 3.3 目标实现行动的有效性检测
  • 3.4 基于死锁检测的多步前向搜索算法
  • 3.5 实验分析
  • 3.5.1 实验数据介绍
  • 3.5.2 实验环境与对比算法
  • 3.5.3 实验结果
  • 3.5.4 实验总结与讨论
  • 3.6 本章小结
  • 第四章 相斥目标实现行动导致的目标任务之间强偏序约束的规划方法研究
  • 4.1 问题定义与介绍
  • 4.2 问题性质分析
  • 4.3 问题求解
  • 4.3.1 问题求解复杂度分析
  • Ms FS)'>4.3.2 基于相斥目标实现行动集的多步前向搜索(ExMs FS)
  • 4.4 案例分析:舰艇编队防空仿真实验
  • 4.4.1 基于舰艇防空规划的实验设计
  • 4.4.2 实验结果
  • 4.4.3 实验结果讨论
  • 4.5 本章小结
  • 第五章 时间相关不确定下基于重计划的在线规划与调度方法研究
  • 5.1 在线计划问题分析与建模
  • 5.1.1 问题描述
  • 5.1.2 问题建模与启发式求解
  • 5.2 可重复使用无人平台的时间窗口管理
  • 5.3 在线计划过程
  • 5.3.1 在线算法耗时处理
  • 5.3.2 实时重计划
  • 5.4 案例分析:舰艇单舰防空仿真实验
  • 5.4.1 基于舰艇单舰防空的仿真实验设计
  • 5.4.2 算法时间分析
  • 5.4.3 重计划的效果分析
  • 5.4.4 重计划的平均计算时间和全局效果优化的关系分析
  • 5.5 本章小结
  • 第六章 时间相关不确定下基于分散式马尔科夫决策过程的在线规划与调度方法研究
  • 6.1 问题描述与基本假设
  • 6.2 分散式马尔科夫决策过程(DEC-MDP)
  • 6.2.1 无人平台执行目标任务过程的状态空间描述
  • 6.2.2 基于分散式马尔科夫决策的在线过程模型
  • 6.3 考虑潜在机会损失的分散式马尔科夫决策过程(PCL-DEC-MDP)
  • 6.3.1 潜在机会成本
  • 6.3.2 考虑潜在机会损失的收益计算
  • 6.4 基于PCL-DEC-MDP的在线规划与调度方法
  • 6.4.1 基于PCL-DEC-MDP的多无人平台在线规划与调度
  • 6.4.2 算法性质及证明
  • 6.5 案例分析:舰艇编队防空仿真实验
  • 6.5.1 基于舰艇编队防空的仿真实验设计
  • 6.5.2 DEC-MDP与PCL-DEC-MDP的比较分析
  • 6.6 本章小结
  • 第七章 结论与展望
  • 7.1 本文工作总结
  • 7.2 未来研究展望
  • 致谢
  • 参考文献
  • 作者在学期间取得的学术成果
  • 附录A 初试状态下具有强目标偏序约束的舰艇编队防空规划问题PDDL模型
  • 附录B 相斥目标实现行动导致的强偏序约束舰艇防空规划问题PDDL模型
  • 附录C 单舰防空的在线规划与调度过程中的PDDL模型
  • 相关论文文献

    标签:;  ;  ;  

    支持强偏序约束的智能规划与调度方法研究
    下载Doc文档

    猜你喜欢