您的位置：首页 > 其它

深度强化学习（资源篇）

2019-01-07 15:11 633 查看

理论
量化深度强化学习算法的泛化能力
 让机器帮你做决策！强化学习在智能交互搜索的应用分享
<深度强化学习从入门到大师：以刺猬索尼克游戏为例讲解PPO（第六部分）
<深度强化学习从入门到大师：简单介绍A3C （第五部分）
<深度强化学习从入门到大师：以 Cartpole 和 Doom 为例介绍策略梯度（第四部分）
<深度强化学习从入门到大师：进一步了解深度Q学习（第三部分 - 下）
<深度强化学习从入门到大师：以Doom为例一文带你读懂深度Q学习（第三部分 - 上）
<深度强化学习从入门到大师：通过Q学习进行强化学习（第二部分）
<深度强化学习从入门到大师：简介篇（第一部分）
学习何时做分类决策，深度好奇提出强化学习模型Jumper
深度强化学习中的好奇心
 NIPS 2018 | Spotlight论文：凭借幻想的目标进行视觉强化学习
 伯克利、OpenAI等提出基于模型的元策略优化强化学习
 BAIR讲述如何利用深度强化学习控制灵活手
 自学习 AI 智能体第二部分：深度 Q 学习
 自学习 AI 智能体第一部分：马尔科夫决策过程
 滴滴 KDD 2018 论文详解：基于强化学习技术的智能派单模型
 澳门大学讲座教授陈俊龙：从深度强化学习到宽度强化学习：结构，算法，机遇及挑战

项目
如何在TensorFlow 2.0中构建强化学习智能体
 开源啦：连DeepMind也捉急的游戏，OpenAI给你攻破第一关的高分算法
 如何保持运动小车上的旗杆屹立不倒？TensorFlow利用A3C算法训练智能体玩CartPole游戏
 基于TensorFlow的强化学习，在《毁灭战士》游戏里训练Agent
夺魁NeurIPS 2018强化学习大赛，百度正式发布RL模型库和算法框架PARL
DeepMind 开源TRFL，又一个强化学习复现、创新好帮手
 强化学习工具Horizon开源：Facebook曾用它优化在线视频和聊天软件
 Facebook开源首个适应大规模产品的强化学习平台Horizon，基于PyTorch 1.0
探索新的强化学习算法遇到困难？不怕不怕，谷歌为你带来「多巴胺」
「多巴胺」来袭！谷歌推出新型强化学习框架Dopamine
TensorFlow Agents日前开源，轻松在TF中构建并行强化学习算法

资讯
真的超越了波士顿动力！深度强化学习打造的 ANYmal 登上 Science 子刊
 用AI设计微波集成电路，清华大学等提出深度强化学习方法RINN
EMNLP 2018 | 用强化学习做神经机器翻译：中山大学&MSRA填补多项空白
 你需要新的好奇心方法克服强化学习中的拓展症
 超越DQN和A3C：深度强化学习领域近期新进展概览
 谷歌大脑用强化学习为移动设备量身定做最好最快的CNN模型

DeepMind推出深度学习与强化学习进阶课程（附视频）
MIT科学家Dimitri P. Bertsekas最新2019出版《强化学习与最优控制》(附书稿PDF&讲义)
伯克利CS294深度强化学习课程资料放出（PPT+录像）,
<重磅 | CS 294 2018 今日开课！双语字幕独家上线！
动态 | 从零开始快速入门深度强化学习，OpenAI 发布学习资源 Spinning Up
人人能上手：OpenAI发射初学者友好的强化学习教程 | 代码简约易懂
 MILA 2018夏季深度学习与强化学习课程资源大放送
 《深度强化学习》手稿开放了！
OpenAI开课了！深度强化学习最全课程包，教程、代码、习题、文档一网打尽
 从Zero到Hero，OpenAI重磅发布深度强化学习资源
 MIT 6.S094· 深度增强学习 | 学霸的课程笔记，我们都替你整理好了

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航

添加评论
分享网址
分享文章
返回顶部