Khan公开课 - 统计学学习笔记:(十)Chi-square分布
2012-10-16 11:22
375 查看
χ2分布
随机变量X是独立的标准正态分布变量,X~N(0,1),即E(X)=0, Var(X)=1。
Q1=X12,Q1是一个Chi-Square分布,记为
,degree of freedom is 1
Q2=X12+ X22,Q2是一个Chi-Square分布,记为
,degree of freedom is 2
以此类推。图为Chi-Square的分布图。有χ table可供查询,例如P(Q2>2.41) = 0.3
皮尔逊χ2分布检验:Pearson’s chi-squared test
实际观察次数O与某理论次数(E又称期望次数)之差的平方再除以理论次数乃是一个与抽样分布之一的χ2分布非常近似的次数分布。
而自由度则是不相干事件得数目。
如同n足够大是,二项分布和正态分布非常吻合一样,这里也不做理解证明,由法国数学家Pearson给出,就当给了个工具,我们相信工具有效,来使用工具,常用于检查出现频率。
例子1:一维χ2检验
已知从周一到周六,顾客的分布比例为10%、10%、15%、20%、30%、15%,而观察值顾客数为30、14、34、45、57、20,问在significance level α=5%下,这个比例是否正确。
H0:比例正确;H1:比例不正确
自由度是多少,有6个参数,但是自由度是n-1=5,因为只要知道5个,第6个参数是可以计算出来的。查χ表,自由度5的行,α=5%时,χc2=11.07,根据实际观察计算的值比所查值更为极端,所有拒绝给出分布比例H0
例子2:二维列联表χ2检验
检验可能是二维表的方式,例如顾客中又分了男女,由于最后一行和最后一列都可以由其他信息获得,不是独立变量,自由度为(m-1)(n-1)。列联表也成为contingency table。下面例子是某个发病季节检验草药在significance level α=10%是否有效。
根据上面的情况我们进行信息补充:
H0:Herb do nothing; H1: Herbs do something
2行3列,自由度为(2-1)(3-1)=2,查chi table,α=5%时χc2=4.5,所有我们不能拒绝H0,即不能认为草药有作用。
相关链接:我的四方书库
相关文章推荐
- Khan公开课 - 统计学学习笔记:(四)泊松分布、大数定理
- Khan公开课 - 统计学学习笔记:(六)中心极限定理
- Khan公开课 - 统计学学习笔记:(三)随机变量、概率密度、二项分布、期望值
- Khan公开课 - 统计学学习笔记:(七)伯努利分布、置信区间、t分布、p-value和第一型错误
- Khan公开课 - 统计学学习笔记:(九)线性回归公式,决定系数和协方差
- Khan公开课 - 统计学学习笔记:(二)总本、样本、集中趋势、离中趋势
- Khan公开课 - 统计学学习笔记:(八)样本均值之差
- Khan公开课 - 统计学学习笔记:(一)中间值和统计图表
- Khan公开课 - 统计学学习笔记:(十一)平方之和、F统计
- Khan公开课 - 统计学学习笔记:(五)正态分布
- Khan公开课 - 统计学学习笔记:(十二)逻辑
- 统计学学习笔记——(6)概率分布
- Khan公开课 - 概率学习笔记(一)独立事件、相依事件和排列组合
- 统计学 学习笔记 (五)—— 掌握数据的整体状态 数据的分布特性
- Khan公开课 - 概率学习笔记(二)无顺序独立事件、数学符号、Bayes's Law、非公平概率计算
- Andrew Ng公开课学习笔记——Coordinate ascent(坐标上升法)
- 【学习笔记】斯坦福大学公开课(机器学习) 之学习理论.a
- 应用统计学与R语言实现学习笔记(二)——数据收集
- Coursera公开课笔记: 斯坦福大学机器学习第十一课“机器学习系统设计(Machine learning system design)”
- 【分布计算环境学习笔记】4 Enterprise Java Bean