您的位置:首页 > 其它

中心极限定理、置信区间

2019-04-05 18:21 1366 查看

中心极限定理
中心极限定理是概率论中的一组定理。 中心极限定理说明,在适当的条件下,大量相互独立随机变量的均值经适当标准化后依分布收敛于正态分布 。 这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量之和近似服从正态分布的条件。
历史

中心极限定理的第一版被法国 数学家棣莫弗发现,他在1733年发表的卓越论文中使用正态分布去估计大量抛掷硬币出现正面次数的分布。 这个超越时代的成果险些被历史遗忘,所幸著名法国数学家拉普拉斯在1812年发表的巨著Théorie Analytique des Probabilités中拯救了这个默默无名的理论。

拉普拉斯扩展了棣莫弗的理论,指出二项分布可用正态分布逼近。 但同棣莫弗一样, 拉普拉斯的发现在当时并未引起很大反响。 直到十九世纪末中心极限定理的重要性才被世人所知。 1901年,俄国数学家里雅普诺夫用更普通的随机变量定义中心极限定理并在数学上进行了精确的证明。 如今,中心极限定理被认为是(非正式地) 概率论中的首席定理。
棣莫佛-拉普拉斯定理

用正态分布逼近二项分布
棣莫佛-拉普拉斯(de Moivre - Laplace)定理是中央极限定理的最初版本,讨论了服从二项分布的随机变量序列。 它指出,参数为n , p的二项分布以np为均值、 np(1-p)为方差的正态分布为极限。

置信区间

置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度,其给出的是被测量参数的测量值的可信程度,即前面所要求的“一个概率”。 点估计与区间估计: 以生活中的买双色球彩票为例:点估计就是买一张双色球中奖的概率;而区间估计就是买一砸彩票,这一砸里面有一个中奖的概率。 置信区间是指由样本统计量所构造的总体参数的估计区间,展现的是这个参数的真实值落在测量值(推测值)的周围的可信程度。我们可以使用[a, b]表示样本估计总体平均值的误差范围的区间,[a, b]就被称作置信区间。
同时,我们选择这个置信区间,目的是为了让“a和b之间包含总体平均值”这一结果具有特定的概率,就是置信水平。

上图中:样本均值以95%的概率落入区间[-2, 2]
参考:
维基百科
http://open.163.com/special/Khan/khstatistics.html

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: