中心极限定理、置信区间
中心极限定理
中心极限定理是概率论中的一组定理。 中心极限定理说明,在适当的条件下,大量相互独立随机变量的均值经适当标准化后依分布收敛于正态分布 。 这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量之和近似服从正态分布的条件。
历史
中心极限定理的第一版被法国 数学家棣莫弗发现,他在1733年发表的卓越论文中使用正态分布去估计大量抛掷硬币出现正面次数的分布。 这个超越时代的成果险些被历史遗忘,所幸著名法国数学家拉普拉斯在1812年发表的巨著Théorie Analytique des Probabilités中拯救了这个默默无名的理论。
拉普拉斯扩展了棣莫弗的理论,指出二项分布可用正态分布逼近。 但同棣莫弗一样, 拉普拉斯的发现在当时并未引起很大反响。 直到十九世纪末中心极限定理的重要性才被世人所知。 1901年,俄国数学家里雅普诺夫用更普通的随机变量定义中心极限定理并在数学上进行了精确的证明。 如今,中心极限定理被认为是(非正式地) 概率论中的首席定理。
棣莫佛-拉普拉斯定理
用正态分布逼近二项分布
棣莫佛-拉普拉斯(de Moivre - Laplace)定理是中央极限定理的最初版本,讨论了服从二项分布的随机变量序列。 它指出,参数为n , p的二项分布以np为均值、 np(1-p)为方差的正态分布为极限。
置信区间
置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度,其给出的是被测量参数的测量值的可信程度,即前面所要求的“一个概率”。 点估计与区间估计: 以生活中的买双色球彩票为例:点估计就是买一张双色球中奖的概率;而区间估计就是买一砸彩票,这一砸里面有一个中奖的概率。 置信区间是指由样本统计量所构造的总体参数的估计区间,展现的是这个参数的真实值落在测量值(推测值)的周围的可信程度。我们可以使用[a, b]表示样本估计总体平均值的误差范围的区间,[a, b]就被称作置信区间。
同时,我们选择这个置信区间,目的是为了让“a和b之间包含总体平均值”这一结果具有特定的概率,就是置信水平。
上图中:样本均值以95%的概率落入区间[-2, 2]
参考:
维基百科
http://open.163.com/special/Khan/khstatistics.html
- 中心极限定理
- 中心极限定理与大数定律
- 大数定律&中心极限定理
- 伯努利分布、二项分布、多项分布、Beta分布、Dirichlet分布、连续分布(正态分布)、大数定理、中心极限定理、贝叶斯理论
- 大数定律和中心极限定理
- 第一张、大数定律与中心极限定理
- 中心极限定理的一个例子:大小医院的新生儿
- [傅里叶变换及其应用学习笔记] 十. 卷积与中心极限定理
- 从中心极限定理的模拟到正态分布
- 大数定律和中心极限定理的区别和联系
- [读书笔记]1.中心极限定理实例,用样本数据猜测样本来自的未知的总体
- 大数定律和中心极限定理的中文叙述
- 中心极限定理证明(独立同分布)
- 小数定律,大数定律,中心极限定理的理解和概括
- 中心极限定理的形象理解
- 大数定律和中心极限定理
- 统计学:中心极限&置信区间
- 数理统计(二)——切比雪夫不等式、大数定理、伯努利定理、中心极限定理
- 独立同分布的中心极限定理
- 中心极限定理与大数定律