: 会议首页
: 组织机构
: 特邀专家
: 会议日程
: 论文交流
: 食宿安排
: 赞助支持
: 参会通知
: 会议地点
: 会议文集
: 以往会议
: 会议照片




技术问题,请联系网站管理员

© LAMDA 2005-2016

题目: 自适应动态规划最新进展
报告人: 刘德荣 教授 北京科技大学
摘要: 非线性系统的最优控制动态规划方法需要求解非线性Bellman方程,离散时间的问题由于需要求解非线性差分方程,其求解非常困难。长期以来,动态规划方法虽然理论上可以求解非线性系统的最优控制问题,但是由于时间反向计算而产生的“维数灾”问题,实际问题中无法完成其超大的计算量。自适应动态规划方法跟强化学习方法同属源于动态规划方法的自学习控制算法,所提的算法可以用来解决未知离散时间非线性系统的最优控制问题,在近期给出的该控制算法的收敛性证明基础上,提出了一系列新算法。算法的实现用到了三个神经网络,在递推的每一步分别用来近似性能指标函数、最优控制律和未知非线性系统。仿真结果证明了自学习控制算法的有效性。