您的位置:首页 > 其它

深度强化学习(资源篇)

2019-01-07 15:11 633 查看

理论
量化深度强化学习算法的泛化能力
让机器帮你做决策!强化学习在智能交互搜索的应用分享
<深度强化学习从入门到大师:以刺猬索尼克游戏为例讲解PPO(第六部分)
<深度强化学习从入门到大师:简单介绍A3C (第五部分)
<深度强化学习从入门到大师:以 Cartpole 和 Doom 为例介绍策略梯度 (第四部分)
<深度强化学习从入门到大师:进一步了解深度Q学习(第三部分 - 下)
<深度强化学习从入门到大师:以Doom为例一文带你读懂深度Q学习(第三部分 - 上)
<深度强化学习从入门到大师:通过Q学习进行强化学习(第二部分)
<深度强化学习从入门到大师:简介篇(第一部分)
学习何时做分类决策,深度好奇提出强化学习模型Jumper
深度强化学习中的好奇心
NIPS 2018 | Spotlight论文:凭借幻想的目标进行视觉强化学习
伯克利、OpenAI等提出基于模型的元策略优化强化学习
BAIR讲述如何利用深度强化学习控制灵活手
自学习 AI 智能体第二部分:深度 Q 学习
自学习 AI 智能体第一部分:马尔科夫决策过程
滴滴 KDD 2018 论文详解:基于强化学习技术的智能派单模型
澳门大学讲座教授陈俊龙:从深度强化学习到宽度强化学习:结构,算法,机遇及挑战

项目
如何在TensorFlow 2.0中构建强化学习智能体
开源啦:连DeepMind也捉急的游戏,OpenAI给你攻破第一关的高分算法
如何保持运动小车上的旗杆屹立不倒?TensorFlow利用A3C算法训练智能体玩CartPole游戏
基于TensorFlow的强化学习,在《毁灭战士》游戏里训练Agent
夺魁NeurIPS 2018强化学习大赛,百度正式发布RL模型库和算法框架PARL
DeepMind 开源TRFL,又一个强化学习复现、创新好帮手
强化学习工具Horizon开源:Facebook曾用它优化在线视频和聊天软件
Facebook开源首个适应大规模产品的强化学习平台Horizon,基于PyTorch 1.0
探索新的强化学习算法遇到困难?不怕不怕,谷歌为你带来「多巴胺」
「多巴胺」来袭!谷歌推出新型强化学习框架Dopamine
TensorFlow Agents日前开源,轻松在TF中构建并行强化学习算法

资讯
真的超越了波士顿动力!深度强化学习打造的 ANYmal 登上 Science 子刊
用AI设计微波集成电路,清华大学等提出深度强化学习方法RINN
EMNLP 2018 | 用强化学习做神经机器翻译:中山大学&MSRA填补多项空白
你需要新的好奇心方法克服强化学习中的拓展症
超越DQN和A3C:深度强化学习领域近期新进展概览
谷歌大脑用强化学习为移动设备量身定做最好最快的CNN模型

DeepMind推出深度学习与强化学习进阶课程(附视频)
MIT科学家Dimitri P. Bertsekas最新2019出版《强化学习与最优控制》(附书稿PDF&讲义)
伯克利CS294深度强化学习课程资料放出(PPT+录像),
<重磅 | CS 294 2018 今日开课!双语字幕独家上线!
动态 | 从零开始快速入门深度强化学习,OpenAI 发布学习资源 Spinning Up
人人能上手:OpenAI发射初学者友好的强化学习教程 | 代码简约易懂
MILA 2018夏季深度学习与强化学习课程资源大放送
《深度强化学习》手稿开放了!
OpenAI开课了!深度强化学习最全课程包,教程、代码、习题、文档一网打尽
从Zero到Hero,OpenAI重磅发布深度强化学习资源
MIT 6.S094· 深度增强学习 | 学霸的课程笔记,我们都替你整理好了

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: