ML—线性回归系列(二)—基础统计
2015-11-25 21:12
183 查看
华电北风吹
天津大学认知计算与应用重点实验室
日期:2015/11/25
线性回归是统计学里面一个非常重要的部分,在本系列的第二部分主要总结一些线性回归的统计学指标。并且不定期更新。
一、统计学名词
样本与系列第一篇表示一样表示为(x(i),y(i)),模型对于x(i)的预测值为y^(i)=θ^Tx(i),所有样本的y(i)的均值表示为y¯=1m∑mi=1y(i).
下面来看三个度量指标
1、总离差平方和
SST=∑mi=1(y(i)−y¯)2
2、误差平方和(残差平方和)
SSE=∑mi=1(y(i)−y^(i))2
3、回归平方和
SSR=∑mi=1(y^(i)−y¯)2
并且对于这三个指标有
SST=SSE+SSR
二、线性回归显著性指标
1、复相关系数
R2=SSRSST=1−SSTSST
很显然R值范围为[0,1],并且R越接近与1,说明线性关系越强。
2、F检验
F=SSR/n−1SSE/m−n服从F(n−1,m−n)分布,因此可以使用F检验来判断回归显著性。
天津大学认知计算与应用重点实验室
日期:2015/11/25
线性回归是统计学里面一个非常重要的部分,在本系列的第二部分主要总结一些线性回归的统计学指标。并且不定期更新。
一、统计学名词
样本与系列第一篇表示一样表示为(x(i),y(i)),模型对于x(i)的预测值为y^(i)=θ^Tx(i),所有样本的y(i)的均值表示为y¯=1m∑mi=1y(i).
下面来看三个度量指标
1、总离差平方和
SST=∑mi=1(y(i)−y¯)2
2、误差平方和(残差平方和)
SSE=∑mi=1(y(i)−y^(i))2
3、回归平方和
SSR=∑mi=1(y^(i)−y¯)2
并且对于这三个指标有
SST=SSE+SSR
二、线性回归显著性指标
1、复相关系数
R2=SSRSST=1−SSTSST
很显然R值范围为[0,1],并且R越接近与1,说明线性关系越强。
2、F检验
F=SSR/n−1SSE/m−n服从F(n−1,m−n)分布,因此可以使用F检验来判断回归显著性。
相关文章推荐
- java 控制台scanner的中文输入问题
- 易用性-工业机器人控制器设计的重中之重:2015上海工博会有感
- USACO skidesign
- Scalaz(14)- Monad:函数组合-Kleisli to Reader
- Scalaz(14)- Monad:函数组合-Kleisli to Reader
- 鸟哥的LINUX私房菜基础篇第三版 阅读笔记 四 档案的文件系统的压缩和打包
- Java String类的常用方法
- Linux minicom命令
- 在 Django REST framework 善用 SerializerMethodField 来优化不必要的查询
- 集群-基础知识1
- 数据库三大范式简单理解
- C语言交换两个变量数值的几种方法
- Codeforces Round #333 (Div. 2) C. The Two Routes
- Qt停止线程的方法
- CSS3选择器,详细归纳一下,算是一个工作总结
- jquery(2)——操纵DOM
- 排序容器_TreeSet与TreeMapJAVA127
- 性能测试准备——计算pacing值
- 【.Net底层剖析】stfld指令-给对象的字段赋值
- 面试题