斯坦福大学2017年-Spring-最新强化学习(Reinforcement Learning)课程分享
2017-09-24 18:23
507 查看
课程说明
为了实现人工智能的梦想,我们需要学习出可以进行自主决策的系统。强化学习就是实现这一目标的强有力的例子,它与包括机器人、游戏、消费者画像和医疗保健在内的各种任务息息相关。本门课程将详细介绍强化学习领域的基础知识,学生们将会学习到强化学习核心方法和技术,包括如何进行泛化(Generalization)和探索(Exploration)。通过专家讲座、书面课程和线下编码任务相结合的方式,学生将会深入了解强化学习的关键思想和技巧。作业将包括强化学习的基础知识、以及深度强化学习相关知识-这是一个非常有前途的新领域,将深度学习技术与强化学习相结合。此外,通过线下的开放性项目,学生将提升他们对强化学习的理解。
学习目标
在课程结束后,学生应该能够
· 定义强化学习的关键特征,这也是区分AI和非交互式机器学习的关键特征
· 定义MDP,POMDP,bandit,batch offline 强化学习,online 强化学习
· 描述研究 VS 应用的挑战,并比较和对比至少两种方法来应对这一挑战
· 给定一个应用问题(例如,计算机视觉,机器人等)决定是否应该被定为一个强化学习问题,如果是,如何制定,应该采用什么算法来处理这个问题,并证明答案正确性。
· 实现包括深度强化学习算法在内的常见强化学习算法
· 学习分析强化学习算法和评估这些算法的多个标准:例如regret,样本复杂度(sample complexity),计算复杂度,收敛性等。
· 列出强化学习领域中至少两个开放的挑战或热门话题
课程大纲
课程ppt等资料下载地址:
链接: https://pan.baidu.com/s/1bpq7xO7
密码: 公众号回复“SRL”
往期精彩内容分享
神经机器翻译(NMT)的一些重要资源分享
《模型汇总-20》深度学习背后的秘密:初学者指南-深度学习激活函数大全
深度学习与NLP
深度学习|机器学习|人工智能 精品视频教程合集分享
纯干货-8
21套深度学习相关的视频教程分享
模型汇总-12
深度学习中的表示学习_Representation Learning
<纯干货-4>
加州伯克利大学2017年最新深度强化学习视频课程_part3
<深度学习优化策略-3>
深度学习网络加速器Weight Normalization_WN
为了实现人工智能的梦想,我们需要学习出可以进行自主决策的系统。强化学习就是实现这一目标的强有力的例子,它与包括机器人、游戏、消费者画像和医疗保健在内的各种任务息息相关。本门课程将详细介绍强化学习领域的基础知识,学生们将会学习到强化学习核心方法和技术,包括如何进行泛化(Generalization)和探索(Exploration)。通过专家讲座、书面课程和线下编码任务相结合的方式,学生将会深入了解强化学习的关键思想和技巧。作业将包括强化学习的基础知识、以及深度强化学习相关知识-这是一个非常有前途的新领域,将深度学习技术与强化学习相结合。此外,通过线下的开放性项目,学生将提升他们对强化学习的理解。
学习目标
在课程结束后,学生应该能够
· 定义强化学习的关键特征,这也是区分AI和非交互式机器学习的关键特征
· 定义MDP,POMDP,bandit,batch offline 强化学习,online 强化学习
· 描述研究 VS 应用的挑战,并比较和对比至少两种方法来应对这一挑战
· 给定一个应用问题(例如,计算机视觉,机器人等)决定是否应该被定为一个强化学习问题,如果是,如何制定,应该采用什么算法来处理这个问题,并证明答案正确性。
· 实现包括深度强化学习算法在内的常见强化学习算法
· 学习分析强化学习算法和评估这些算法的多个标准:例如regret,样本复杂度(sample complexity),计算复杂度,收敛性等。
· 列出强化学习领域中至少两个开放的挑战或热门话题
课程大纲
课程ppt等资料下载地址:
链接: https://pan.baidu.com/s/1bpq7xO7
密码: 公众号回复“SRL”
往期精彩内容分享
神经机器翻译(NMT)的一些重要资源分享
《模型汇总-20》深度学习背后的秘密:初学者指南-深度学习激活函数大全
深度学习与NLP
深度学习|机器学习|人工智能 精品视频教程合集分享
纯干货-8
21套深度学习相关的视频教程分享
模型汇总-12
深度学习中的表示学习_Representation Learning
<纯干货-4>
加州伯克利大学2017年最新深度强化学习视频课程_part3
<深度学习优化策略-3>
深度学习网络加速器Weight Normalization_WN
相关文章推荐
- 斯坦福大学-2017年-秋-最新深度学习基本理论课程分享
- 《纯干货-6》Stanford University 2017年最新《Tensorflow与深度学习实战》视频课程分享
- 国立台湾大学-李宏毅-2017年(秋)最新深度学习与机器学习应用及其深入和结构化研究课程分享
- 斯坦福大学2017年春季_基于卷积神经网络的视觉识别课程视频教程及ppt分享
- 【备忘】2017年最新springboot开发校园商铺平台视频教程
- 2017年迄今最新人工智能资源盘点, 分享给你, 快来看看吧!
- 麻省理工学院-2017年-深度学习与自动驾驶视频课程分享
- 2010年春《斯坦福大学开放课程: 人机交互研讨 - 下学期》(Open Stanford Course: Human-Computer Interaction Seminar)Spring 2010共7课[MP4]
- 纯干货14 2017年-李宏毅-最新深度学习/机器学习中文视频教程分享_后篇
- 【课程分享】基于plusgantt的项目管理系统实战开发(Spring3+JDBC+RMI的架构、自己定义工作流)
- <纯干货-4> 加州伯克利大学2017年最新深度强化学习视频课程_part1
- Spring改版后最新下载地址分享
- 麻省理工学院-2017年-深度学习与自动驾驶视频课程分享
- 【备忘】2017年最新JAVA-ACE-架构师系列视频课程- RocketMQ(上下集)下载
- 纯干货13 2017年-李宏毅-最新深度学习/机器学习中文视频教程分享-前篇
- 【2018版】最新最全的SpringBoot 2.0入门视频课程——笔记
- 2018年最新自动化测试视频教程百度云分享全套不加密-麦子学院VIP报班课程
- 2018年最新Java视频课程免费分享(微软专家陆敏技主讲)
- 【备忘】2017年最新 项目实战 Spring Boot视频教程 微服务整合Mybatis
- 麻省理工学院-2018年最新深度学习算法及其应用入门课程资源分享