您的位置：首页 > 其它

深度强化学习的入门资源汇总-2016.8

2016-08-07 18:19 381 查看

深度强化学习导引：

http://mp.weixin.qq.com/s?__biz=MzI1NTE4NTUwOQ==&mid=2650324914&idx=1&sn=0baaf404b3d8132243d08b55310de210&scene=2&srcid=062732p5u33RRNIKUeDSlvXN&from=timeline&isappinstalled=0#wechat_redirect

详解深度强化学习，搭建DQN详细指南（基于Neon框架）：

https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650716425&idx=1&sn=bf52c653b7cd054ce721ce5be928c623

《Multiagent Cooperation and Competition with Deep Reinforcement Learning》Ardi Tampuu, Tambet Matiisen 15年11月份，是在deepMind Q-learning的基础上的一个扩展

http://arxiv.org/abs/1511.08779

深度强化学习导引：

https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650716246&idx=2&sn=2c328097a95839871c8c91c5c5af9de5

《Learning to Optimize》

强化学习的一个应用，把学习优化的过程加入了某些奖惩策略，利用强化学习的方式学习优化的方式，可参考

http://arxiv.org/abs/1606.01885

解读文章：

http://weibo.com/ttarticle/p/show?id=2309403985644224393104

Deep Reinforcement Learning 深度增强学习资源

https://zhuanlan.zhihu.com/p/20885568

《Dueling Network Architectures for Deep Reinforcement Learning》 Google DeepMind; University of Oxford; 15年11月，被引用10次以上

http://arxiv.org/abs/1511.06581

Yoshua Bengio 最新论文：用于序列预测的actor-critic算法 http://t.cn/RtV9tL6

原文：http://arxiv.org/abs/1607.07086

摘要提出了一种训练神经网络的方法以使用来自强化学习的 actor-critic 方法来生成序列。

另外：ICML16强化学习相关论文24篇

http://weibo.com/p/1001603975123651678749

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航

添加评论
分享网址
分享文章
返回顶部