Reinforce learning: Lecture 1 Introduction to Reinforcement Learning 学习笔记
2018-03-07 20:58
597 查看
强化学习是什么?
首先我们先从一个简单的例子开始,大家都知道,当我们刚出生时,对地球的重力规则肯定是一无所知的,但经过摸爬滚打,我们慢慢地学会了走路,这一过程可以简化表示为:我们和
地面经过多次的
交互,
增强了我们的能力。
强化学习主要由以下及部分组成:
agent: 机器人
enviroment:环境
action:agent的行为
reward: environment 对 action的反馈
接下来看看他们一个时刻是如何交互的:
agent:
根据当前的状态StSt做出相应的动作,StSt是
可观测的状态量的
集合
根据reward更新网络参数
Enviroment:
根据agent的action,计算reward
更新StSt
agent 和 enviroment 的交互收敛 意味着 reward 达到了饱和状态。
强化学习特点
相比于其他深度网络,强化特性具有如下特性:属于无监督学习,没有label
模型参数更新仅依靠于reward
reward有延迟
基本概念
policy 策略,agent的行为即状态空间到动作空间的映射确定过程: ππ(s)
随机过程:ππ(a|s)=P[AtAt=a|StSt=s]
value,价值,衡量当前状态的好坏。
vπ(s)vπ(s) = Eπ[Rt+1+γRt+2+γ2Rt+3+...|St=s]Eπ[Rt+1+γRt+2+γ2Rt+3+...|St=s]
γγ 为折扣因子,取值为0~1,表示的是未来几个时刻的reward对当前的状态的影响,也就是网络具有前瞻的功能。
model,对环境规则的表示
预测状态转移概率 Pss′Pss′
预测下一时刻的立即反馈 Rass′Rss′a
exploition && exploration
exploition 利用学到的模型做出选择
exploration 尝试新的选择
prediction && control
prediction 给出一个策略
control 选出最优的策略
learning && plan
learning
环境规则未知
交互进行学习
提升策略
plan
环境已知
直接运用model计算
相关文章推荐
- silver课程笔记----Lecture 1: Introduction to Reinforcement Learning
- 【学习笔记】WEEK 1_Introduction to Deep Learning_Course Resources
- Machine Learning Foundation Lecture 02 Learning to Answer YesNo 学习笔记
- 【学习笔记】WEEK1_Practice Questions_QUIZ_Introduction to deep learning
- David Silver《Reinforcement Learning》课程解读—— Lecture 1: Introduction to Reinforcement Learning
- Coursera deeplearning.ai 深度学习笔记1-1-Introduction to deep learning
- 【学习笔记】WEEK 1_Introduction to Deep Learning_What is a neural network?
- 【学习笔记】WEEK 1_Introduction to Deep Learning_Why is Deep Learning taking off?
- 【学习笔记】WEEK 1_Introduction to Deep Learning_Supervised Learning with Neural Networks
- [翻译]斯坦福CS20SI:基于Tensorflow的深度学习研究课程笔记,Lecture note 1: Introduction to TensorFlow
- Andrew NG机器学习课程笔记系列之——Introduction to Machine Learning
- 【学习笔记】WEEK 1_Introduction to Deep Learning_About this Course
- 【学习笔记】WEEK 1_Welcome to the Deep Learning Specialization_Welcome
- Introduction to Algorithms 算法导论 第1章 基础知识 学习笔记及习题解答
- 台大李宏毅Machine Learning 2017Fall学习笔记 (7)Introduction of Deep Learning
- MIT6.00 1x Lecture 1 - Introduction to Computation 学习笔记
- 李菲菲课程笔记:Deep Learning for Computer Vision – Introduction to Convolution Neural Networks
- 机器学习基石笔记 Lecture 2: Learning to Answer Yes/No
- python nltk 学习笔记(5) Learning to Classify Text
- 【机器学习-斯坦福】学习笔记21——增强学习(Reinforcement Learning and Control)