统计学习方法 第1章 概论
2017-04-11 17:20
344 查看
1、统计学习三要素:模型、策略、算法。
1.1 模型就是所要学习的条件概率分布或决策函数。模型的假设空间、输入空间、输出空间、参数空间
决策函数模型
F={f|Y=f(X)}F={f|Y=fθ(X),θ∈Rn}
概率模型
F={P|P(Y|X)}条件概率的集合F={P|Pθ(Y|X),θ∈Rn}条件概率分布族
1.2 策略:按照什么样的准则学习选择最优的模型
损失函数(loss/cost function):度量模型一次预测的好坏;L(Y,f(X))
风险函数:度量平均意义下模型预测的好坏。
常用的损失函数:
(1)0-1损失函数:
L(Y,f(X))={1,0,Y≠f(X)Y=f(X)
(2)平方损失函数:
L(Y,f(X))=(Y−f(X))2
(3)绝对损失函数:
L(Y,f(X))=|Y−f(X)|
(4)对数损失函数(是用于最大似然估计的)
L(Y,f(X))=−log(P(Y|X))
期望风险、经验风险
经验风险最小化、结构风险(经验风险和模型复杂度)最小化
1.3算法:统计学习基于训练数据集,根据学习策略,从假设空间中选择最优模型,最后需要考虑用什么样的方法求解最优模型。
2 模型评估与模型选择
训练误差、测试误差(预测/泛化能力)模型空间含义不同复杂度的模型时
过拟合
常用的模型选择方法:正则化和交叉验证
2.1 正则化
结构风险最小化策略,在经验风险上加一个正则化项或罚项
2.2 交叉验证
随机地将训练集分为:训练集、验证集和测试集。
训练集:模型训练;
验证集:模型选择;
测试集:最终对学习方法的评估。
3 监督学习(生成方法/判别方法;生成模型/判别模型)
3.1 分类问题输出变量Y是有限个离散值
学习、分类两个过程
3.2 标注问题
3.3 回归问题
相关文章推荐
- 第1章 统计学习方法概论——第7节 生成模型与判决模型
- 统计学习方法(Machine Learning)------- 第1章 统计学习方法概论
- 第1章 统计学习方法概论——第8~10节 分类、标注、回归问题
- 统计学习方法 李航---第1章 统计学习方法概论
- 统计学习方法 第1章 统计学习方法概论
- 统计学习方法 李航---第1章 统计学习方法概论
- 第1章 统计学习方法概论——第4~6节 模型选择、正则化和交叉验证、泛化能力
- 一、概论--统计学习方法总结
- 统计学习方法第一章 统计学习方法概论 读书笔记
- <统计学习方法>1 概论
- 第一章 统计学习方法概论
- 统计学习笔记(1)——统计学习方法概论
- 学习笔记一:统计学习方法概论
- 统计学习笔记(1)——统计学习方法概论
- 统计学习方法概论总结(一)
- 统计学习方法学习笔记1:统计学习方法概论
- 统计学习方法概论
- 统计学习方法概论
- 统计学习方法概论
- 统计机器学习(1)-统计学习方法概论