您的位置:首页 > 编程语言 > Java开发

斯坦福大学2017年-Spring-最新强化学习(Reinforcement Learning)课程分享

2017-09-24 18:23 507 查看
课程说明

为了实现人工智能的梦想,我们需要学习出可以进行自主决策的系统。强化学习就是实现这一目标的强有力的例子,它与包括机器人、游戏、消费者画像和医疗保健在内的各种任务息息相关。本门课程将详细介绍强化学习领域的基础知识,学生们将会学习到强化学习核心方法和技术,包括如何进行泛化(Generalization)和探索(Exploration)。通过专家讲座、书面课程和线下编码任务相结合的方式,学生将会深入了解强化学习的关键思想和技巧。作业将包括强化学习的基础知识、以及深度强化学习相关知识-这是一个非常有前途的新领域,将深度学习技术与强化学习相结合。此外,通过线下的开放性项目,学生将提升他们对强化学习的理解。

学习目标

在课程结束后,学生应该能够

· 定义强化学习的关键特征,这也是区分AI和非交互式机器学习的关键特征

· 定义MDP,POMDP,bandit,batch offline 强化学习,online 强化学习

· 描述研究 VS 应用的挑战,并比较和对比至少两种方法来应对这一挑战

· 给定一个应用问题(例如,计算机视觉,机器人等)决定是否应该被定为一个强化学习问题,如果是,如何制定,应该采用什么算法来处理这个问题,并证明答案正确性。

· 实现包括深度强化学习算法在内的常见强化学习算法

· 学习分析强化学习算法和评估这些算法的多个标准:例如regret,样本复杂度(sample complexity),计算复杂度,收敛性等。

· 列出强化学习领域中至少两个开放的挑战或热门话题

课程大纲









课程ppt等资料下载地址:

链接: https://pan.baidu.com/s/1bpq7xO7

密码: 公众号回复“SRL”

往期精彩内容分享

神经机器翻译(NMT)的一些重要资源分享

《模型汇总-20》深度学习背后的秘密:初学者指南-深度学习激活函数大全

深度学习与NLP
深度学习|机器学习|人工智能 精品视频教程合集分享

纯干货-8
21套深度学习相关的视频教程分享

模型汇总-12
深度学习中的表示学习_Representation Learning

<纯干货-4>
加州伯克利大学2017年最新深度强化学习视频课程_part3

<深度学习优化策略-3>
深度学习网络加速器Weight Normalization_WN
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
相关文章推荐