您的位置：首页 > 编程语言 > Java开发

斯坦福大学2017年-Spring-最新强化学习（Reinforcement Learning）课程分享

2017-09-24 18:23 507 查看

课程说明

为了实现人工智能的梦想，我们需要学习出可以进行自主决策的系统。强化学习就是实现这一目标的强有力的例子，它与包括机器人、游戏、消费者画像和医疗保健在内的各种任务息息相关。本门课程将详细介绍强化学习领域的基础知识，学生们将会学习到强化学习核心方法和技术，包括如何进行泛化（Generalization）和探索（Exploration）。通过专家讲座、书面课程和线下编码任务相结合的方式，学生将会深入了解强化学习的关键思想和技巧。作业将包括强化学习的基础知识、以及深度强化学习相关知识-这是一个非常有前途的新领域，将深度学习技术与强化学习相结合。此外，通过线下的开放性项目，学生将提升他们对强化学习的理解。

学习目标

在课程结束后，学生应该能够

· 定义强化学习的关键特征，这也是区分AI和非交互式机器学习的关键特征

· 定义MDP，POMDP，bandit，batch offline 强化学习，online 强化学习

· 描述研究 VS 应用的挑战，并比较和对比至少两种方法来应对这一挑战

· 给定一个应用问题（例如，计算机视觉，机器人等）决定是否应该被定为一个强化学习问题，如果是，如何制定，应该采用什么算法来处理这个问题，并证明答案正确性。

· 实现包括深度强化学习算法在内的常见强化学习算法

· 学习分析强化学习算法和评估这些算法的多个标准：例如regret，样本复杂度（sample complexity），计算复杂度，收敛性等。

· 列出强化学习领域中至少两个开放的挑战或热门话题

课程大纲

课程ppt等资料下载地址：

链接: https://pan.baidu.com/s/1bpq7xO7

密码: 公众号回复“SRL”

往期精彩内容分享

神经机器翻译（NMT）的一些重要资源分享

《模型汇总-20》深度学习背后的秘密：初学者指南-深度学习激活函数大全

深度学习与NLP
深度学习|机器学习|人工智能精品视频教程合集分享

纯干货-8
21套深度学习相关的视频教程分享

模型汇总-12
深度学习中的表示学习_Representation Learning

<纯干货-4>
加州伯克利大学2017年最新深度强化学习视频课程_part3

<深度学习优化策略-3>
深度学习网络加速器Weight Normalization_WN

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 强化学习神经网络深度学习

相关文章推荐

新的分享

章节导航