【读书笔记】统计学:从数据到结论 第五章
2015-12-01 15:57
218 查看
第五章 简单统计推断:总体参数估计
从数据得到关于现实世界的结论的过程就叫做统计推断,估计是统计推断的重要内容之一,统计推断的另一个主要内容是假设检验。
在利用样本中的信息来对总体参数进行推断之前,人们往往对代表总体的变量假定了分布族,比如假定人们的身高属于正态分布族,这些模型假定基本上是根据经验而得,仅仅是对现实世界的一个近似。模型假定之后,就要确定模型参数,估计出参数之后,总体的分布就知道了。
样本的函数称为统计量,用于估计的统计量称为估计量,由于一个统计量对于不同的样本取值不同,所以估计量也是随机变量,并有其分布,带入样本数据之后,估计量的数值称为估计量的一个实现,也叫估计值。
最常用的估计量有样本均值、样本标准差,用来估计总体均值、总体标准差等。
两种估计:点估计和区间估计。
1.点估计
用估计量的实现值来近似相应的总体参数。例如要估计总体均值,估计量就是样本均值,利用一个样本均值的实现来近似总体均值,得到的是一个值。
无偏估计量:估计量的期望等于欲估计的总体参数,则该估计量称为该参数的无偏估计量。随机样本产生的样本均值、样本标准差和伯努利实验的成功比例分别都是相应的总体均值、总体标准差和总体比例的无偏估计,因为这些估计量都只受随机因素的影响,他们的期望值是近似等于预估计的总体参数的。
2.区间估计
包括估计量在内的一个区间,该区间被认为很可能包含总体参数。例如要估计总体均值,估计量是样本均值,估计样本均值的一个区间,很可能这个区间里面包含有总体均值,其结果是一个区间。
区间估计有一个置信度的概念,解释就是“无穷次重复抽样所得到的所有区间中只有95%包含参数”,置信度又称置信水平或置信系数。
一个例子:计算两个地区大学生身高的分布,均值差的点估计和95%置信区间。
假设身高服从正态分布,求的是两个总体均值和标准差的点估计和区间估计,两个总体均值估计量的样本均值分别为170.56和165.60,样本标准差分别为6.97857和7.55659,这些直接在spss里面输入数据就可以得到。
求两个均值差的点估计和95%置信区间,在spss里面的结果如下:
表头两列是检验方差是否相等,如果Sig超过0.05,认为这两个总体方差不等,看第一行结果,反之看第二行结果。本例看第一行,两个样本的差点估计是4.96,95%置信区间为(2.073,7.84)。
置信区间的计算方法在5.5.2节说明了。
从数据得到关于现实世界的结论的过程就叫做统计推断,估计是统计推断的重要内容之一,统计推断的另一个主要内容是假设检验。
在利用样本中的信息来对总体参数进行推断之前,人们往往对代表总体的变量假定了分布族,比如假定人们的身高属于正态分布族,这些模型假定基本上是根据经验而得,仅仅是对现实世界的一个近似。模型假定之后,就要确定模型参数,估计出参数之后,总体的分布就知道了。
样本的函数称为统计量,用于估计的统计量称为估计量,由于一个统计量对于不同的样本取值不同,所以估计量也是随机变量,并有其分布,带入样本数据之后,估计量的数值称为估计量的一个实现,也叫估计值。
最常用的估计量有样本均值、样本标准差,用来估计总体均值、总体标准差等。
两种估计:点估计和区间估计。
1.点估计
用估计量的实现值来近似相应的总体参数。例如要估计总体均值,估计量就是样本均值,利用一个样本均值的实现来近似总体均值,得到的是一个值。
无偏估计量:估计量的期望等于欲估计的总体参数,则该估计量称为该参数的无偏估计量。随机样本产生的样本均值、样本标准差和伯努利实验的成功比例分别都是相应的总体均值、总体标准差和总体比例的无偏估计,因为这些估计量都只受随机因素的影响,他们的期望值是近似等于预估计的总体参数的。
2.区间估计
包括估计量在内的一个区间,该区间被认为很可能包含总体参数。例如要估计总体均值,估计量是样本均值,估计样本均值的一个区间,很可能这个区间里面包含有总体均值,其结果是一个区间。
区间估计有一个置信度的概念,解释就是“无穷次重复抽样所得到的所有区间中只有95%包含参数”,置信度又称置信水平或置信系数。
一个例子:计算两个地区大学生身高的分布,均值差的点估计和95%置信区间。
假设身高服从正态分布,求的是两个总体均值和标准差的点估计和区间估计,两个总体均值估计量的样本均值分别为170.56和165.60,样本标准差分别为6.97857和7.55659,这些直接在spss里面输入数据就可以得到。
求两个均值差的点估计和95%置信区间,在spss里面的结果如下:
表头两列是检验方差是否相等,如果Sig超过0.05,认为这两个总体方差不等,看第一行结果,反之看第二行结果。本例看第一行,两个样本的差点估计是4.96,95%置信区间为(2.073,7.84)。
置信区间的计算方法在5.5.2节说明了。
相关文章推荐
- 为什么统计学家应该关注数据挖掘
- 最小二乘法
- 统计学习(一)--统计学习的定义及常识
- 统计学原理----走出平均数理解上的误区
- SAS软件的使用和统计学分析的初步介绍
- 基于个人选择的一点想法
- 美国纽约留学的日子
- 读 统计学习方法 摘要
- mysql统计用户七日留存存储过程
- 生物&统计学词汇解释
- 统计学习-4
- 统计学习-3
- 统计学习-2
- 协方差矩阵
- R在开放数据的应用
- scikit-learn Generalized Linear Models 自主学习笔记(一)
- 协方差,方差,期望的意义
- 度量,看上去很美
- 重学Statistics, Cha2 Descriptive Statistics (Categorical and Quantitative Data)
- 重学statistics,Cha3 Descriptive Statistics: numerical measures