您的位置：首页 > 其它

百度强化学习7日打卡营心得体会

2020-07-12 17:03 162 查看

之所以想了解强化学习，主要是因为，在自己学校的深度学习课程展示中，看到其他小组用深度强化学习来玩游戏，觉得很有意思。但是这学期没有选修强化学习课程，自己感觉有点遗憾。也有想过找一个系统的强化学习课程学习一下，但是又觉得单纯为一时兴趣耗费太多时间不值(主要是研究方向和强化学习相关性很小。。。)，就作罢了。正巧在微信公众号里看到百度强化学习7日打卡营，授课教师来自NIPS竞赛世界冠军团队，而且正值各门课程期末大作业的间隙，犹豫再三后就报名了。

因为自己本身有模式识别和机器学习基础，听这门课感觉并不吃力，觉得科科老师讲课幽默诙谐、深入浅出，能够用很平易近人的语言将RL各个算法的本质讲解清楚，讲解代码的时候逻辑特别清晰，语言组织能力和表达能力都很强。我觉得自己的听课体验很好。

这门课不仅讲理论，而且也提供了实践的机会，基于PARL框架和PaddlePaddle，在gym和atari平台上玩游戏，让学员体会到训练模型和调参的乐趣。说到调参，我之前一直没有过多关注，调研重点还是在网络结构设计背后的理论上，比较注重motivation。这次打卡营，我发现自己调参的能力不够，有几个很简单的游戏也没有拿到很好的分数。还好，在作业讨论区，有很多同学热心地分享调参经验，如变化学习率，中途保存模型等等，让我学到很多。科科老师作为团队核心成员，工作应该也是很忙的，但是依然抽时间在作业讨论区回答学员的问题，非常认真负责。

在现如今Tensorflow和Pytorch已经被广泛接受的情况下，百度还开发自己的深度学习框架PaddlePaddle，实属难得。说到RL框架——PARL，使用体验很好，个人感觉上手不难。希望在以后的科研过程中，能更多地用上中国公司开发的工具。

总体来说，这次百度强化学习7日打卡营，是一次非常用心的公益课程，不仅免费，而且还准备了很多小礼物，我还幸运地抽奖得到一本书，哈哈。这次学习营，也算满足了我想了解RL的冲动吧。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航