性能势论文
控制系统的学习和优化:马尔可夫性能势理论与方法
论文摘要本文采用性能势理论和方法,研究了动态控制系统的学习和优化的问题。性能势理论是学习和优化领域相当重要的一套理论和方法。基于性能势这一核心概念,可以将学习和优化领域的各种研...不确定SMDP基于性能势的鲁棒控制研究
论文摘要半Markov决策过程(SMDP)是离散事件动态系统用于描述随机序贯决策问题的一类基本模型,其性能的分析和优化对许多现实系统具有重要的指导意义。在SMDP模型中,状态的...CSPS模型基于学习的Look-ahead控制研究
论文摘要在实际生产中,存在着这样一类重要的生产控制模型,即基于传送带服务的生产加工站(Conveyor-ServicedProductionStation,简称CSPS)问题,...大规模Markov决策过程基于性能势的并行算法研究与应用
论文摘要随着科技的发展,在当今社会中,广泛存在着一类复杂的随机动态系统,即离散事件动态系统(DEDS)。Markov决策过程(MDP)是DEDS建模常见的方法,其性能优化问题一...不确定半马尔可夫系统最优鲁棒决策研究
论文摘要半马尔可夫决策过程(SMDP)可用来描述实际生活中很大一类离散事件动态系统,即半Markov系统。实际的系统不可避免地存在不确定性,而且对系统的优化往往涉及多极值优化问...