您的位置:首页 > 其它

线性回归介绍之三——线性回归的使用条件

2014-03-28 14:56 627 查看
线性回归使用范围如此广泛,可惜真正正确使用的却为数不多。从国内的医学杂志情况来看,线性回归的使用都是信手拈来,丝毫不考虑自己的数据是否符合线性回归的使用条件。国内医学杂志80%以上的统计应用都是错误的,这一点已经有专门的有心人发现了。

线性回归使用之前,有几个前提是一定要考虑的:(1)自变量与因变量是否呈直线关系。(2)因变量是否符合正态分布。(3)因变量数值之间是否独立。(4)方差是否齐性。

其实如果正规地来说,应该是看残差(residual)是否正态、独立以及方差齐。所谓残差,就是因变量的真实值与估计值之间的差值。

如果你对这些条件觉得不知道怎么判断,那么有一个简单的方法一定是你乐意了解的。所有的这些条件都可以通过一种方式来判断,即绘制散点图。

是否呈直线关系,这个很简单,在上一篇文章中已经介绍过了。如下图所示,必须大致呈直线关系。




是否正态分布,可以用残差的正态概率图来看,目前用sas、spss等都可以轻松地做出来。如下图,如果正态概率呈一条直线,表明符合正态分布。当然,还可以通过各种正态性检验方法检验是否符合正态分布。




是否方差齐,可以用残差的分布来看,即以因变量的预测值为x轴,以残差为y轴作图,如果残差无明显的分布,表明方差齐性。如果有一定的趋势,可能存在方差不齐的情况,如下图随着x轴的增加残差的范围逐渐增大,明显的方差不齐的情形。




对于是否独立,也可以通过图形来看, 随着时间的变化,因变量应该没有任何趋势,否则可能表明因变量之间有一定的相关性。还可通过Durbin-Watson法检验是否独立。




正规地来说,应用线性回归分析之前,必须对这四个条件进行检验。如果条件不符合仍然使用线性回归,即使得出结果,也不准确。试想一下,前提都不对,怎么保证后面的结果正确呢?实际上,做任何事情,前提都是极为重要的,离开了前提,就相当于南辕北辙,大方向都错了,怎么达到正确的目的呢?
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
相关文章推荐