策略梯度论文

基于直接策略搜索的强化学习方法研究
论文摘要强化学习是机器学习领域中主要的研究方向之一,研究的是如何使智能体通过和环境交互以改善自身的行为。随着监督学习和优化技术的发展,如何使用监督学习算法或优化方法在强化学习问...
策略梯度增强学习的理论、算法及应用研究
论文摘要增强学习（ReinforcementLearning）又称为强化学习或再励学习,是近年来机器学习和人工智能领域研究的热点之一。与监督学习不同,增强学习不需要给定输入状态...