强化学习基础四--Policy Gradient 理论推导
2017-11-23 13:28
621 查看
本文原文见我的知乎主页:https://www.zhihu.com/people/ikerpeng/
参考:
David Silver,Tutorial: Deep Reinforcement Learning,2016.
Pieter Abbeel,Policy Optimization,2017.
Hodo van Hasselt,Deep reinforcement Learning,2017.
R. Sutton, RL:An introduction 2nd,2017
参考:
David Silver,Tutorial: Deep Reinforcement Learning,2016.
Pieter Abbeel,Policy Optimization,2017.
Hodo van Hasselt,Deep reinforcement Learning,2017.
R. Sutton, RL:An introduction 2nd,2017
相关文章推荐
- 计算学习理论、统计学习基础理论
- >学习笔记 一,基础理论
- AJAX 基础理论学习笔记
- Gan(Generative Adversarial Net)学习笔记(1)--- Gan的基础理论
- 视频编解码学习之一:理论基础
- Java基础学习总结(53)——HTTPS 理论详解与实践
- 视频编解码学习之一:理论基础
- 视频编解码学习之一:理论基础
- 计算学习理论基础
- 视频编解码学习之一:理论基础
- 【svm学习笔记】svm_理论基础3
- JS学习笔记-基础理论+数组
- ICE中间件学习笔记 基础理论篇
- 深度学习笔记——理论与推导之概念,成本函数与梯度下降算法初识(一)
- 自定义View学习笔记01—基础理论
- Java基础学习总结(53)——HTTPS 理论详解与实践
- 模型汇总19 强化学习(Reinforcement Learning)算法基础及分类
- python学习1-理论基础
- 复习:支持向量机的理论基础—学习算法的实现方法
- 强化学习的基础知识