您的位置:首页 > 其它

【读书笔记】统计学:从数据到结论 第五章

2015-12-01 15:57 218 查看
第五章 简单统计推断:总体参数估计    
    从数据得到关于现实世界的结论的过程就叫做统计推断,估计是统计推断的重要内容之一,统计推断的另一个主要内容是假设检验。

    在利用样本中的信息来对总体参数进行推断之前,人们往往对代表总体的变量假定了分布族,比如假定人们的身高属于正态分布族,这些模型假定基本上是根据经验而得,仅仅是对现实世界的一个近似。模型假定之后,就要确定模型参数,估计出参数之后,总体的分布就知道了。
    样本的函数称为统计量,用于估计的统计量称为估计量,由于一个统计量对于不同的样本取值不同,所以估计量也是随机变量,并有其分布,带入样本数据之后,估计量的数值称为估计量的一个实现,也叫估计值
    最常用的估计量有样本均值、样本标准差,用来估计总体均值、总体标准差等。
    两种估计:点估计和区间估计。

1.点估计
    用估计量的实现值来近似相应的总体参数。例如要估计总体均值,估计量就是样本均值,利用一个样本均值的实现来近似总体均值,得到的是一个值。
    无偏估计量:估计量的期望等于欲估计的总体参数,则该估计量称为该参数的无偏估计量。随机样本产生的样本均值、样本标准差和伯努利实验的成功比例分别都是相应的总体均值、总体标准差和总体比例的无偏估计,因为这些估计量都只受随机因素的影响,他们的期望值是近似等于预估计的总体参数的。
2.区间估计
    包括估计量在内的一个区间,该区间被认为很可能包含总体参数。例如要估计总体均值,估计量是样本均值,估计样本均值的一个区间,很可能这个区间里面包含有总体均值,其结果是一个区间。
    区间估计有一个置信度的概念,解释就是“无穷次重复抽样所得到的所有区间中只有95%包含参数”,置信度又称置信水平或置信系数。

    一个例子:计算两个地区大学生身高的分布,均值差的点估计和95%置信区间。
    假设身高服从正态分布,求的是两个总体均值和标准差的点估计和区间估计,两个总体均值估计量的样本均值分别为170.56和165.60,样本标准差分别为6.97857和7.55659,这些直接在spss里面输入数据就可以得到。
    求两个均值差的点估计和95%置信区间,在spss里面的结果如下:



    表头两列是检验方差是否相等,如果Sig超过0.05,认为这两个总体方差不等,看第一行结果,反之看第二行结果。本例看第一行,两个样本的差点估计是4.96,95%置信区间为(2.073,7.84)。
    置信区间的计算方法在5.5.2节说明了。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  统计学