您的位置:首页 > 其它

漫步数理统计一——绪论

2017-03-03 00:05 253 查看
许多调查可以由部分进行表征,前提是基于以下事实:在基本相同的条件下,重复进行的试验或多或少是标准的程序。 例如,在医学研究中关注点集中于待使用药物的效果;或对经济学家而言,关注的可能是三种指定商品在不同时间的价格;或对农艺师而言,可能想研究化肥对谷物产量的影响。调查人员获得此类信息的唯一方法就是进行实验。每个实验都会产生一个结果,但这些试验的特点是在实验进行之前我们无法进行预测。

假设我们有这样一个试验,其结果不能确定的预测出来,但在执行之前,每个可能结果能被准确的描述出来,如果这种试验可以在相同条件下重复进行,我们就被它为随机试验,并且每个可能结果的集合称为试验空间或样本空间。

例1:现在投掷一枚硬币,背面朝上用T表示,正面朝上用H表示,假设在相同的条件下硬币可以重复投掷,那么这个硬币的投掷过程就是一个随机试验的例子,在这个试验中结果就是两个符号T,H中的一个;即样本空间是这两个符号的集合。

例2:现在红白两方每人掷一次骰子,结果用有序数对表示,假设在相同的条件下双方重复掷骰子,那么产生数对过程就是一个随机试验,样本空间有36个有序对组成:(1,1),…,(1,6),(2,1),…,(2,6),…,(6,6)。

令C表示样本空间,c表示C中的一个元素,C表示C中元素的一个集合,如果试验的结果在C中,我们就说事件C发生了。现在设想我们进行了N次随机试验,那么我们可以得出N个结果中C发生的次数(频数)f,比率f/N称为N次试验中事件C的相对频率,当N很小时相对频率通常不稳定,从掷硬币中就能感觉出来。但是随着N的增大,经验表明我们可以将事件C与一个数联系起来,假设为p,它等于或近似等于相对频率稳定的那个数。如果这么做的话,那么p可以看成未来试验中,事件C相对频率要么等于要么近似等于的值,因此,虽然我们不能预测随机试验的结果,但是当N非常大时,我们预测C发生的相对频率。与事件C关联的数p有许多名字,有时称为试验结果在C中的概率;有时称为事件C的概率;有时称为C的概率测度,通常会根据上下文选择合适的属于。

例3:令C表示例2的样本空间,C是C中满足和等于7的有序对组合的集合,那么C就是(1,6),(2,5),(3,4),(4,3),(5,2),(6,1)。假设骰子掷了N=400次,和等于7的频数f=60,那么结果在C中的相对频数是f/N=60400=0.15,因此我们可以将C与非常靠近0.15的数p联系起来,p称为事件C的概率。

注1:上面概率的解释有时看成相对频率法,它显然依赖这样的事实:试验在基本相同的条件下重复进行。然而,许多人将其看成合理的置信度量,据此将概率应用到其他情况。例如p=25意味着对于事件C而言,他们个人的或主观的概率等于25,因此,如果他们愿意赌博的话,这可以解释成他们对结果C下注的意愿,这样的话两种结果的比率为p/(1−p)=25/35=23,并且,如果他们确实相信p=25是正确的,那么他们更愿意下注到另一方:(a)如果C发生就赢3元,不发生的话输2 元,或者(b)如果C不发生赢2元,不发生的话输3元。然而,因为概率的数学性质与这两种解释都是一致的,所以数学的发展并不依赖于使用哪种方法。

掌握统计数学理论的主要目的是提供随机试验的数学模型,一旦提供了这种试验的模型并且详细阐述了理论,那么统计学家就可以在这个框架内对随机试验进行推断(即得出结论)。 这种模型的构建需要概率论,逻辑上满足概率的一个模型就是基于集合概念和集合函数的模型,下篇博文简单介绍一下集合论的相关知识。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  数理统计