线性回归介绍之三——线性回归的使用条件
2014-03-28 14:56
627 查看
线性回归使用范围如此广泛,可惜真正正确使用的却为数不多。从国内的医学杂志情况来看,线性回归的使用都是信手拈来,丝毫不考虑自己的数据是否符合线性回归的使用条件。国内医学杂志80%以上的统计应用都是错误的,这一点已经有专门的有心人发现了。
线性回归使用之前,有几个前提是一定要考虑的:(1)自变量与因变量是否呈直线关系。(2)因变量是否符合正态分布。(3)因变量数值之间是否独立。(4)方差是否齐性。
其实如果正规地来说,应该是看残差(residual)是否正态、独立以及方差齐。所谓残差,就是因变量的真实值与估计值之间的差值。
如果你对这些条件觉得不知道怎么判断,那么有一个简单的方法一定是你乐意了解的。所有的这些条件都可以通过一种方式来判断,即绘制散点图。
是否呈直线关系,这个很简单,在上一篇文章中已经介绍过了。如下图所示,必须大致呈直线关系。
是否正态分布,可以用残差的正态概率图来看,目前用sas、spss等都可以轻松地做出来。如下图,如果正态概率呈一条直线,表明符合正态分布。当然,还可以通过各种正态性检验方法检验是否符合正态分布。
是否方差齐,可以用残差的分布来看,即以因变量的预测值为x轴,以残差为y轴作图,如果残差无明显的分布,表明方差齐性。如果有一定的趋势,可能存在方差不齐的情况,如下图随着x轴的增加残差的范围逐渐增大,明显的方差不齐的情形。
对于是否独立,也可以通过图形来看, 随着时间的变化,因变量应该没有任何趋势,否则可能表明因变量之间有一定的相关性。还可通过Durbin-Watson法检验是否独立。
正规地来说,应用线性回归分析之前,必须对这四个条件进行检验。如果条件不符合仍然使用线性回归,即使得出结果,也不准确。试想一下,前提都不对,怎么保证后面的结果正确呢?实际上,做任何事情,前提都是极为重要的,离开了前提,就相当于南辕北辙,大方向都错了,怎么达到正确的目的呢?
线性回归使用之前,有几个前提是一定要考虑的:(1)自变量与因变量是否呈直线关系。(2)因变量是否符合正态分布。(3)因变量数值之间是否独立。(4)方差是否齐性。
其实如果正规地来说,应该是看残差(residual)是否正态、独立以及方差齐。所谓残差,就是因变量的真实值与估计值之间的差值。
如果你对这些条件觉得不知道怎么判断,那么有一个简单的方法一定是你乐意了解的。所有的这些条件都可以通过一种方式来判断,即绘制散点图。
是否呈直线关系,这个很简单,在上一篇文章中已经介绍过了。如下图所示,必须大致呈直线关系。
是否正态分布,可以用残差的正态概率图来看,目前用sas、spss等都可以轻松地做出来。如下图,如果正态概率呈一条直线,表明符合正态分布。当然,还可以通过各种正态性检验方法检验是否符合正态分布。
是否方差齐,可以用残差的分布来看,即以因变量的预测值为x轴,以残差为y轴作图,如果残差无明显的分布,表明方差齐性。如果有一定的趋势,可能存在方差不齐的情况,如下图随着x轴的增加残差的范围逐渐增大,明显的方差不齐的情形。
对于是否独立,也可以通过图形来看, 随着时间的变化,因变量应该没有任何趋势,否则可能表明因变量之间有一定的相关性。还可通过Durbin-Watson法检验是否独立。
正规地来说,应用线性回归分析之前,必须对这四个条件进行检验。如果条件不符合仍然使用线性回归,即使得出结果,也不准确。试想一下,前提都不对,怎么保证后面的结果正确呢?实际上,做任何事情,前提都是极为重要的,离开了前提,就相当于南辕北辙,大方向都错了,怎么达到正确的目的呢?
相关文章推荐
- Python中条件选择和循环语句使用方法介绍
- 线性回归介绍之十——多因素分析策略
- 初学ML笔记N0.1——线性回归,分类与逻辑斯蒂回归,通用线性模型
- 【机器学习-西瓜书】三、线性回归;对数线性回归
- 线性回归介绍及分别使用最小二乘法和梯度下降法对线性回归C++实现
- 03_MyBatis基本查询,mapper文件的定义,测试代码的编写,resultMap配置返回值,sql片段配置,select标签标签中的内容介绍,配置使用二级缓存,使用别名的数据类型,条件查询ma
- 初学ML笔记N0.1——线性回归,分类与逻辑斯蒂回归,通用线性模型
- 很详细、很移动的Linux makefile教程:介绍,总述,书写规则,书写命令,使用变量,使用条件推断,使用函数,Make 的运行,隐含规则 使用make更新函数库文件 后序
- 回归分析之线性回归(N元线性回归)
- 线性回归介绍之二——“线性”的理解
- 03_MyBatis基本查询,mapper文件的定义,测试代码的编写,resultMap配置返回值,sql片段配置,select标签标签中的内容介绍,配置使用二级缓存,使用别名的数据类型,条件查询ma
- 初学ML笔记N0.1——线性回归,分类与逻辑斯蒂回归,通用线性模型
- 机器学习(1)------ 线性回归、加权线性回归及岭回归的原理和公式推导
- 很详细、很移动的Linux makefile教程:介绍,总述,书写规则,书写命令,使用变量,使用条件推断,使用函数,Make 的运行,隐含规则 使用make更新函数库文件 后序
- 初学ML笔记N0.1——线性回归,分类与逻辑斯蒂回归,通用线性模型
- 主题三 编译过程介绍----17.条件编译的使用分析
- 线性回归为毛使用梯度下降而不是导数等于0
- 线性回归—求解介绍及回归扩展
- 线性回归介绍之一
- 初学ML笔记N0.1——线性回归,分类与逻辑斯蒂回归,通用线性模型