多目标马氏决策过程摄动问题的研究

多目标马氏决策过程摄动问题的研究

论文摘要

多目标马氏决策过程是研究随机环境下多阶段决策过程优化问题的理论,其应用领域十分广泛,在近半个世纪的研究中,已经取得了丰富的成果,大多集中于最优方程及求解算法的问题。然而,我们在解决实际问题时,往往会由于运用观察、实验和测量等手段使所获得的数据不能完全准确,从而使得模型中的参数存在误差,这就将导致所建立的模型对实际问题存在一定的摄动,本文即分别针对离散时间折扣准则MOMDP模型、离散时间平均准则MOMDP以及连续时间折扣准则MOMDP模型的摄动问题给予讨论,并分为两步进行。 首先是MOMDP的最优理论。目前对MOMDP非劣策略的存在性问题主要集中于折扣准则MOMDP,因此本文依据文献[3]、[9]中对多目标问题的讨论方法,将文献[11]、[12]中平均准则MDP及连续时间折扣准则MDP的最优方程理论拓展到平均准则MOMDP及连续时间折扣准则MOMDP中,建立上述模型非劣策略所要满足的方程,从而建立MOMDP的最优理论。 其次,由于MOMDP的摄动问题的研究工作目前主要是从转移概率自身的性质出发,通过考察摄动对转移概率的稳态概率的影响,建立基于摄动的策略迭代法,以此来寻找决策者对MOMDP的满意策略。而就摄动对模型最优策略及最优准则函数的影响的研究目前还只是针对MDP的(见文献[2]、[4]、[8]),本文将文献[2]、[4]、[8]中对MDP摄动问题的理论向多目标情况进行拓展,即讨论转移概率的摄动后原模型的非劣策略是否依然非劣,以及保证非劣策略依然非劣的摄动限度的问题,并得到结论在一定条件下,摄动对非劣策略以及非劣目标向量的影响可以随摄动因子的变化而变化。 因此,如果控制转移概率或转移速率的摄动在很小的范围内,即决策者认为可以接收的范围,那么,我们运用上述的模型所得到的策略就可以更好地解决实际问题了。文中最后以一个多产品的库存管理为例给出了折扣准则MOMDP摄动理论的一个应用。

论文目录

  • 摘要
  • 英文摘要
  • 第一章 绪论
  • 1.1 多目标马氏决策过程的理论发展
  • 1.2 MDP摄动问题的研究发展
  • 1.3 本文结构与主要工作
  • 第二章 折扣准则MOMDP的摄动问题
  • 2.1 最优策略的存在性
  • 2.2 模型的摄动情形
  • 2.3 小结
  • 第三章 平均准则MOMDP的摄动问题
  • 3.1 非劣策略的存在性
  • 3.2 模型的摄动情形
  • 3.3 转换为折扣准则
  • 3.4 小结
  • 第四章 连续时间MOMDP的摄动问题
  • 4.1 折扣准则
  • 4.2 模型的非劣策略
  • 4.3 模型的摄动情形
  • 4.4 小结
  • 第五章 MOMDP摄动模型的应用
  • 5.1 建立模型
  • 5.2 模型的求解
  • 5.3 小结
  • 第六章 结束语
  • 致谢
  • 参考文献
  • 攻读硕士学位期间发表的论文
  • 相关论文文献

    • [1].具有边界摄动的抛物型方程的可解性(英文)[J]. 应用数学 2008(01)
    • [2].摄动-增量法解Duffing-Van der Pol方程极限环[J]. 湖北民族大学学报(自然科学版) 2020(03)
    • [3].配置、摄动配置以及龙格-库塔方法的一些新的讨论[J]. 安庆师范学院学报(自然科学版) 2008(02)
    • [4].摄动因素对火星环绕段轨道长期影响研究[J]. 深空探测学报 2017(01)
    • [5].摄动广义矩阵Lyapunov方程解的估计[J]. 通化师范学院学报 2008(02)
    • [6].用摄动配置方法求解含时薛定谔方程[J]. 系统科学与数学 2008(06)
    • [7].大范围转动弹性梁非线性动力学建模与摄动解耦[J]. 机械设计 2020(08)
    • [8].全球星摄动运动及摄动补偿运控策略研究[J]. 宇航学报 2010(07)
    • [9].三维随机渗流摄动有限元模拟研究[J]. 中国矿山工程 2016(05)
    • [10].一类非线性摄动问题解的渐近性态及其精度分析[J]. 湖州师范学院学报 2012(02)
    • [11].摄动Wadati-Segur-Ablowitz方程的精确行波解[J]. 成都信息工程学院学报 2010(05)
    • [12].广义(ω')性质的判定和摄动[J]. 数学的实践与认识 2019(15)
    • [13].一种空中发射弹道导弹摄动制导方法[J]. 火力与指挥控制 2013(03)
    • [14].Beurling-Ahlfors扩张伸张函数在非光滑摄动下的稳定性[J]. 华侨大学学报(自然科学版) 2011(02)
    • [15].一类非线性快慢系统非局部问题的摄动解[J]. 纯粹数学与应用数学 2012(01)
    • [16].摄动广义Lyapunov方程解的估计[J]. 黑龙江科技信息 2010(07)
    • [17].基于级联聚合算法下的布尔网络最优单点摄动(英文)[J]. Frontiers of Information Technology & Electronic Engineering 2020(02)
    • [18].一类超越方程的摄动解[J]. 湖州师范学院学报 2012(02)
    • [19].线弹性结构的高阶摄动随机有限元法[J]. 四川大学学报(工程科学版) 2014(03)
    • [20].考虑地球非球形引力摄动影响的自由段弹道解析解[J]. 国防科技大学学报 2018(04)
    • [21].基于多谐波微多普勒信号分析的目标摄动参数提取方法[J]. 电子与信息学报 2008(11)
    • [22].一类共形不变摄动积分方程正解的存在性[J]. 中国科学:数学 2012(04)
    • [23].高阶带谐摄动下卫星相对运动精确动力学模型[J]. 宇航学报 2012(09)
    • [24].Σ_e~n(n≥2)型Banach空间上的摄动类问题[J]. 数学研究 2011(04)
    • [25].受监督SOM学习模型定量输入-输出摄动分析(英文)[J]. 系统仿真学报 2010(05)
    • [26].一类超越方程的摄动解与解的精度估计[J]. 湖州师范学院学报 2009(02)
    • [27].高面质比航天器轨道运动受摄分析[J]. 飞行力学 2018(01)
    • [28].强拟凸域上连续函数Martinelli-Bochner公式边界摄动的稳定性[J]. 大学教育 2014(06)
    • [29].考虑J_2项摄动的空间共振轨道特性分析[J]. 西北工业大学学报 2016(01)
    • [30].单值延拓性质的摄动及其应用[J]. 华东师范大学学报(自然科学版) 2014(06)

    标签:;  ;  ;  ;  ;  ;  

    多目标马氏决策过程摄动问题的研究
    下载Doc文档

    猜你喜欢