学习大数据第二天:数据挖掘的基础方法——最小二乘法
2016-04-23 17:57
309 查看
1.原理
最常用的是普通最小二乘法( Ordinary Least Square,OLS):所选择的回归模型应该使所有观察值的残差平方和达到最小。(Q为残差平方和)- 即采用平方损失函数。
样本回归模型:
其中ei为样本(Xi, Yi)的误差
平方损失函数:
则通过Q最小确定这条直线,即确定
,以
为变量,把它们看作是Q的函数,就变成了一个求极值的问题,可以通过求导数得到。求Q对两个待估参数的偏导数:
根据数学知识我们知道,函数的极值点为偏导为0的点。
解得:
2.最小二乘法MATLAB实现
(1)
最常用的是普通最小二乘法( Ordinary Least Square,OLS):所选择的回归模型应该使所有观察值的残差平方和达到最小。(Q为残差平方和)- 即采用平方损失函数。
样本回归模型:
其中ei为样本(Xi, Yi)的误差
平方损失函数:
则通过Q最小确定这条直线,即确定
,以
为变量,把它们看作是Q的函数,就变成了一个求极值的问题,可以通过求导数得到。求Q对两个待估参数的偏导数:
根据数学知识我们知道,函数的极值点为偏导为0的点。
解得:
2.最小二乘法MATLAB实现
(1)
相关文章推荐
- disconnected no supported authentication methods available(server sent: publickey,keyboard interae)
- 60款顶级大数据开源工具
- 第一章 从开机加电到执行main函数之前的过程
- Spark机器学习(三) Labeled point-- Data Types
- hive启动出现权限错误 /tmp/hive on HDFS should be writable.
- 【BZOJ1260】[CQOI2007]涂色paint 【区间DP】
- 深入浅出解析大数据平台架构
- 172. Factorial Trailing Zeroes
- 两方面的学习——贵在坚持
- org.hibernate.HibernateException: Could not obtain transaction-synchronized Session for current thre
- 大数据 --> ProtoBuf的使用和原理
- 大数据量下高并发同步的讲解(不看,保证你后悔)
- HDU 1022 Train Problem I
- 第85课:基于HDFS的SparkStreaming案例实战和内幕源码解密
- async & await (转载)
- CodeVS 1416|USACO Train 5.5.3|Two Five|二五语言|搜索
- vagrant up and authentication failure
- Spark机器学习(二) 局部向量 Local-- Data Types - MLlib
- Error with command: gdb --version Cannot run program "gdb": Launching failed
- 全球人工智能技术大会有感