[深度学习工具]·百度PaddlePaddle深度强化学习框架PARL
2019-01-19 00:09
736 查看
PARL快速入门示例
PaddlePaddle PARL 的名字来源于 PAddlepaddle Reinfocement Learning,是一款基于百度 PaddlePaddle 打造的深度强化学习框架。PaddlePaddle PARL 凝聚了百度多年来在强化学习领域的技术深耕和产品应用经验。与现有强化学习工具和平台相比,PaddlePaddle PARL 具有更高的可扩展性、可复现性和可复用性,强大的大规模并行化和稀疏特征的支持能力,以及工业级应用案例的验证
基于PARL,训练代理人在几分钟内使用策略梯度算法玩CartPole游戏。
如何使用
依赖关系:(在Ubuntu安装测试成功,Windows失败)
- python2.7或python3.5 +
- paddlepaddle > = 1.0.0
- PARL
- gym
开始培训:
[code]# Install dependencies pip install paddlepaddle # Or use Cuda: pip install paddlepaddle-gpu pip install gym git clone https://github.com/PaddlePaddle/PARL.git cd PARL pip install . # Train model cd examples/QuickStart/ python train.py # Or visualize when evaluating: python train.py --eval_vis[/code]
[code]。。。 [01-19 00:04:20 MainThread @train.py:71] Episode 995, Reward Sum 198.0. [01-19 00:04:20 MainThread @train.py:71] Episode 996, Reward Sum 200.0. [01-19 00:04:20 MainThread @train.py:71] Episode 997, Reward Sum 200.0. [01-19 00:04:20 MainThread @train.py:71] Episode 998, Reward Sum 150.0. [01-19 00:04:21 MainThread @train.py:71] Episode 999, Reward Sum 200.0. [01-19 00:04:21 MainThread @train.py:80] Test reward: 200.0
结果
训练结束后,您将看到代理获得最高分(200分)。
相关文章推荐
- 百度开源深度学习框架PaddlePaddle安装配置(单机CPU版)
- 深度学习框架PaddlePdddle学习( 二)
- 百度开源移动端深度学习框架 MDL
- 对于FacebookF8开发者大会开源深度学习框架Caffe2以及百度开放自动驾驶平台API的看法
- PaddlePaddle, TensorFlow, MXNet, Caffe2 , PyTorch五大深度学习框架2017-10评测
- 百度宣布将在Kubernetes上运行其深度学习平台PaddlePaddle
- 百度AI开发者实战营,百度AI开发平台,PaddlePaddle深度学习架构,资料汇总
- 大数据早报:百度开源移动端深度学习框架 中国联通成立大数据公司(9.26)
- 百度开源移动端深度学习框架mobile-deep-learning
- 百度深度学习平台PaddlePaddle的深度学习
- 百度深度学习平台PaddlePaddle的深度学习入门教程
- 百度深度学习平台PaddlePaddle的深度学习(转载自 m0_37903426的博客)
- 百度开源深度学习平台Paddle
- [置顶] 【深度学习 框架】PaddlePaddle的安装
- 利用深度强化学习框架解决金融投资组合管理问题(附 GitHub 实现)
- 百度开源移动端深度学习框架 MDL
- mobile-deep-learning(MDL)百度 移动端深度学习框架
- 深度学习框架PaddlePdddle学习( 一)
- TechDay实录 | 认识PaddlePaddle:更低使用成本、更高开发效率的深度学习框架
- [深度学习工具]基于PyTorch的NLP框架Flair