资 源 简 介
对于动态系统的控制、决策、稳定性分析是控制学科长期以来的研究热点,基于Bellman提出的动态规划方法,为解决当状态空间和动作空间维数增加带来的维数灾问题,发展产生了自适应动态规划(Adaptive dynamic programming, ADP),这种方法也被称为自适应评价设计、启发式动态规划、 神经元动态规划和增强学习(张化光,张欣,罗艳红,等. 自适应动态规划综述[J]. 自动化学报, 2013, 39(4): 303-311.)。控制学科对强化学习的研究角度和计算机学科略有不同,这本书作者结合自己多年的研究教学经验,为两个学科的学者提供了更加系统的思路。感兴趣的朋友可以下载看看,