您的位置：首页 > 其它

漫步数理统计一——绪论

2017-03-03 00:05 253 查看

许多调查可以由部分进行表征，前提是基于以下事实：在基本相同的条件下，重复进行的试验或多或少是标准的程序。例如，在医学研究中关注点集中于待使用药物的效果；或对经济学家而言，关注的可能是三种指定商品在不同时间的价格；或对农艺师而言，可能想研究化肥对谷物产量的影响。调查人员获得此类信息的唯一方法就是进行实验。每个实验都会产生一个结果，但这些试验的特点是在实验进行之前我们无法进行预测。

假设我们有这样一个试验，其结果不能确定的预测出来，但在执行之前，每个可能结果能被准确的描述出来，如果这种试验可以在相同条件下重复进行，我们就被它为随机试验，并且每个可能结果的集合称为试验空间或样本空间。

例1：现在投掷一枚硬币，背面朝上用T表示，正面朝上用H表示，假设在相同的条件下硬币可以重复投掷，那么这个硬币的投掷过程就是一个随机试验的例子，在这个试验中结果就是两个符号T,H中的一个；即样本空间是这两个符号的集合。

例2：现在红白两方每人掷一次骰子，结果用有序数对表示，假设在相同的条件下双方重复掷骰子，那么产生数对过程就是一个随机试验，样本空间有36个有序对组成：(1,1),…,(1,6),(2,1),…,(2,6),…,(6,6)。

令C表示样本空间，c表示C中的一个元素，C表示C中元素的一个集合，如果试验的结果在C中，我们就说事件C发生了。现在设想我们进行了N次随机试验，那么我们可以得出N个结果中C发生的次数(频数)f，比率f/N称为N次试验中事件C的相对频率，当N很小时相对频率通常不稳定，从掷硬币中就能感觉出来。但是随着N的增大，经验表明我们可以将事件C与一个数联系起来，假设为p，它等于或近似等于相对频率稳定的那个数。如果这么做的话，那么p可以看成未来试验中，事件C相对频率要么等于要么近似等于的值，因此，虽然我们不能预测随机试验的结果，但是当N非常大时，我们预测C发生的相对频率。与事件C关联的数p有许多名字，有时称为试验结果在C中的概率；有时称为事件C的概率；有时称为C的概率测度，通常会根据上下文选择合适的属于。

例3：令C表示例2的样本空间，C是C中满足和等于7的有序对组合的集合，那么C就是(1,6),(2,5),(3,4),(4,3),(5,2),(6,1)。假设骰子掷了N=400次，和等于7的频数f=60，那么结果在C中的相对频数是f/N=60400=0.15，因此我们可以将C与非常靠近0.15的数p联系起来，p称为事件C的概率。

注1：上面概率的解释有时看成相对频率法，它显然依赖这样的事实：试验在基本相同的条件下重复进行。然而，许多人将其看成合理的置信度量，据此将概率应用到其他情况。例如p=25意味着对于事件C而言，他们个人的或主观的概率等于25，因此，如果他们愿意赌博的话，这可以解释成他们对结果C下注的意愿，这样的话两种结果的比率为p/(1−p)=25/35=23，并且，如果他们确实相信p=25是正确的，那么他们更愿意下注到另一方：(a)如果C发生就赢3元，不发生的话输2 元，或者(b)如果C不发生赢2元，不发生的话输3元。然而，因为概率的数学性质与这两种解释都是一致的，所以数学的发展并不依赖于使用哪种方法。

掌握统计数学理论的主要目的是提供随机试验的数学模型，一旦提供了这种试验的模型并且详细阐述了理论，那么统计学家就可以在这个框架内对随机试验进行推断（即得出结论）。这种模型的构建需要概率论，逻辑上满足概率的一个模型就是基于集合概念和集合函数的模型，下篇博文简单介绍一下集合论的相关知识。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 数理统计

相关文章推荐

新的分享

章节导航