您的位置:首页 > 编程语言 > Python开发

用Python学习统计学基础-4

2015-09-26 12:27 519 查看

九、显著性的显著

显著水平(significance level)是不能100%确信实验中观察到的结果是否是由于处理因素或需要检验的因素引起的所需要承担的风险。

研究案例:参加 学前项目的孩子与没有参与的孩子在学习成绩上是否存在差异。

零假设:两个群体的学习成绩相等(没有差异)。

研究假设:参与学前项目的孩子的平均成绩高于没有参与项目的孩子的平均成绩。

研究的工作就是表明这两个群体学习成绩的差异仅仅是由于学前项目引起的。研究中始终是存在错误的可能性,风险的水平就是统计性显著水平。

统计显著性(statistical significance)是指零假设为真的情况下拒绝零假设所要承担的风险水平。

描述统计是用于描述样本的特征,而推论统计是基于样本特征推断总体的某些特征。

常用统计检验方法选择

两个变量之间的关系相关系数的显著性的t检验
多个变量之间的关系回归,因素分析或典型分析
两个群体一个或多变量之间的差异,相同参与者接受多次测试非独立样本的t检验
两个以上群体一个或多变量之间的差异,相同参与者接受多次测试配对测量方差分析
两个群体一个或多变量之间的差异,相同参与者不接受多次测试独立样本的t检验
两个以上群体一个或多变量之间的差异,相同参与者不接受多次测试简单方差分析
统计检验步骤

零假设的陈述

设置零假设的风险水平

选择适当的检验统计量

计算检验统计量

使用特定统计量的临界值表确定拒绝零假设需要的值

比较实际值和临界值

如果实际值大于临界值,不能接受零假设

如果实际值没有超过临界值,零假设是最有力的解释

十、两个群体的t检验,不同群体的均值检验

t检验的一个主要假设是两个群体中每个群体的变异性的量是相等的。t统计量的计算



使用特定的统计量的临界值分布表确定拒绝零假设需要的值。

用python的scipy.stats的ttest_ind函数可以直接计算t和p。

实例,a组是在家治疗的疗效值,b组诗家外治疗的疗效值,检验这两种方法的疗效是否存在明显差异。

from scipy.stats import ttest_ind
a = [3,4,1,1,1,3,3,6,5,1,4,5,4,4,3,6,7,7,7,8]
b = [7,6,7,8,7,6,5,6,4,2,5,4,3,6,7,5,4,3,8,7]
t,p=ttest_ind(a,b)
print t
print p
输出

-2.15195090047
0.0378183889695
计算得到的p值是0.0378,说明观察到的差异是由随机因数引起的概率小于0.04,说明家外治疗似乎更有效。

十一、两个群体的t检验,两个相关群体的均值检验

非独立均值检验表明是相同的群体在两种不同的条件下进行相同的研究,比如学生在接受课外辅导前后成绩的差异,a辅导前的测试成绩,b辅导后的测试成绩。



python代码

from scipy.stats import ttest_rel
a = [3,5,4,6,5,5,4,5,3,6,7,8,7,6,7,8,8,9,9,8,7,7,6,7,8]
b = [7,8,6,7,8,9,6,6,7,8,8,7,9,10,9,9,8,8,4,4,5,6,9,8,12]
t,p=ttest_rel(a,b)
print t
print p
输出

-2.44948974278
0.0219829970441
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: