论文摘要
半马尔可夫决策过程(SMDP)可用来描述实际生活中很大一类离散事件动态系统,即半Markov系统。实际的系统不可避免地存在不确定性,而且对系统的优化往往涉及多极值优化问题,这使得对不确定SMDP鲁棒决策的研究更具现实意义。本文的主要工作是研究利用全局优化方法求解不确定SMDP的最优鲁棒控制策略。 SMDP一般是通过等价的马尔可夫决策过程(MDP)来分析研究的,同时对不确定SMDP的研究也是以确定性SMDP为基础的,故论文首先介绍了等价MDP的概念和确定性SMDP系统基于性能势的优化方法,再介绍不确定SMDP基于性能势的鲁棒决策求解的统一算法,它适用于平均和折扣准则两种情况。针对系统优化过程中可能涉及的多极值优化问题,本文重点介绍了用以解决这一问题的两种全局优化方法,即模拟退火算法和填充函数法。详细讨论了基于全局优化的系统优化方法在各种不确定SMDP鲁棒决策问题中的应用,包括在不相关不确定参数条件下求解系统最优鲁棒控制策略的策略迭代算法,和在相关不确定参数条件下求解系统最优鲁棒控制策略的一类极小极大优化算法。在每种参数条件下又分为两种情况,分别是仅等价无穷小生成子依赖系统参数,和性能函数与等价无穷小生成子都依赖系统参数。 本文以SMDP的数值实验方式,说明了有关算法在各种不确定情况下求解鲁棒决策问题的运用,验证了算法对折扣和平均两种准则是统一的:通过大量实验结果分析,讨论了各种算法在不同情况下的优化效果,以及针对不同情况选择和使用算法的建议;论文研究结果对建立实际半Markov系统的鲁棒决策机制具有一定理论和应用价值。
论文目录
相关论文文献
- [1].非线性整数规划的一个新的无参数填充函数算法[J]. 计算数学 2017(03)
- [2].全局优化的填充函数方法研究[J]. 兰州文理学院学报(自然科学版) 2016(04)
- [3].不等式约束全局优化的填充函数法[J]. 中国海洋大学学报(自然科学版) 2013(11)
- [4].填充函数的场线追踪[J]. 青岛大学学报(自然科学版) 2013(04)
- [5].基于填充函数的深度学习优化算法[J]. 工业控制计算机 2019(10)
- [6].求无约束连续全局优化问题的单参数填充函数法[J]. 宁夏大学学报(自然科学版) 2017(03)
- [7].一个新的连续可微的单参数填充函数[J]. 计算机科学 2016(08)
- [8].求无约束优化问题的无参数填充函数法[J]. 计算机工程与应用 2014(14)
- [9].解全局优化问题的一个单参数填充函数[J]. 青岛大学学报(自然科学版) 2014(03)
- [10].一类求解无约束全局最优解的新的填充函数[J]. 乐山师范学院学报 2012(12)
- [11].改进定义下的单参数填充函数及其性质分析[J]. 长江大学学报(自然科学版)理工卷 2010(01)
- [12].一类新的寻求全局最优解的填充函数[J]. 计算机技术与发展 2010(06)
- [13].含一个参数的填充函数算法[J]. 上海工程技术大学学报 2010(04)
- [14].一类单参数填充函数算法[J]. 上海工程技术大学学报 2009(02)
- [15].用于全局优化的一种新填充函数[J]. 计算机科学 2009(10)
- [16].全局优化问题的一个单参数填充函数方法(英文)[J]. 运筹学学报 2009(04)
- [17].用于全局优化的一类填充函数构造方法[J]. 河北大学学报(自然科学版) 2008(04)
- [18].一类多策略调参填充函数及其在全局优化问题中的应用[J]. 信阳师范学院学报(自然科学版) 2008(04)
- [19].一种新的带有缓和项的填充函数[J]. 青岛大学学报(自然科学版) 2008(03)
- [20].一个离散填充函数[J]. 计算机工程与应用 2008(28)
- [21].求解带箱子集约束的非光滑全局优化问题的填充函数方法[J]. 运筹学学报 2019(01)
- [22].整数规划问题的滤子填充函数算法[J]. 应用数学与计算数学学报 2018(02)
- [23].全局最优化的一种单参数填充函数法[J]. 重庆科技学院学报(自然科学版) 2012(04)
- [24].非线性无约束优化问题的滤子填充函数算法[J]. 运筹学学报 2017(01)
- [25].一个无约束全局最优化问题的单参数填充函数[J]. 数学教学研究 2011(11)
- [26].填充函数法在发动机加力最小油耗模式控制中的应用[J]. 航空学报 2010(01)
- [27].求解无约束全局优化的改进的单填充函数法[J]. 计算机技术与发展 2008(08)
- [28].基于梯度投影的广义滤子填充函数方法[J]. 数学杂志 2019(01)
- [29].基于变换函数与填充函数的模糊粒子群优化算法[J]. 自动化学报 2018(01)
- [30].全局优化问题的一个无参数填充函数算法[J]. 数学的实践与认识 2017(04)