漫步数理统计九——离散随机变量
2017-03-16 20:21
281 查看
定义1:对于一个随机变量,如果它的空间要么有限,要么可数,那么我们称其是一个离散随机变量。
对于集合D,如果它的元素是可列的,那么我们称这个集合是可数的;例如在D与正整数之间存在一个一一对应的关系。
例1:考虑抛硬币产生的独立序列,每个结果要么是头(H)要么是尾(T)。进一步,在每次抛的过程中,我们假设H,T是等可能的,即P(H)=P(T)=12。样本空间C由像TTHTHHT⋯这样的序列组成,令随机变量X第一次抛出头时所抛的次数,那么对于给定的序列,X=3。显然X的空间是D={1,2,3,4,…},当开始是H 时X=1,因此P(X=1)=12,同样得当序列为TH 时X=2,根据独立性可知概率P(X=2)=(12)(12)=14。更一般得,如果X=x,其中x=1,2,3,4,…,那么前面有x−1次为尾,即TT⋯TH,所以根据独立性,我们有
P(X=x)=(12)x−1(12)=(12)x,x=1,2,3,…
这个空间是可数的。一个有趣的事件是第一处出现头的次数为奇数;例如X=∈{1,3,5,…},这个事件的概率为
P[X∈{1,3,5,…}]=∑x=1∞(12)2x−1=1/21−(1/4)=23
通过上面的例子表明,关于离散随机变量的概率可以用P(X=x)的概率求出来,这些概率确定了一个重要的函数,定义下:
定义2:令X是离散随机变量,空间为D,X的概率质量函数由
pX(x)=P[X=x],for x∈D
给出。
注意,pmf满足下面两条性质:
(i)0≤pX(x)≤1,x∈D;(ii)Σx∈DpX(x=1)
对于离散集合D,如果一个函数满足性质(i)(ii),那么这个函数唯一确定了随机变量的分布。
令X是离散随机变量,空间为D,FX(x)的不连续点定义了质量;即如果x是FX的一个不连续点,那么P(X=x)>0。现在我们将随机变量空间与概率为正的点区别开来,对那些空间X中概率为正的点我们定义其为随机变量X 的支撑,我们经常用S来表示X的支撑,注意S⊂D,当然也有可能S=D
例2:现在有100个保险丝,从中随机抽出5个进行检测;如果5个均合格,那么这100个接受。事实上,这100个中有20个不合格,那么该保险丝被接受的概率为
(805)(1005)=0.32
更一般得,令随机变量X是5个中不合格的个数,那么X的pmf为
pX(x)=⎧⎩⎨⎪⎪(20x)(805−x)(1005)0for x=0,1,2,3,4,5elsewhere
很明显,X的空间是D={0,1,2,3,4,5},这是满足超几何分布的随机变量的实例,基于这些讨论很容易画出Xcdf的图像。
在统计学中经常会遇到这样的问题,我们有一个随机变量X 并且知道它的分布,然而我们感兴趣的是随机变量Y,他它是X的某个变量,Y=g(X)。尤其是我们想确定Y的分布,假设X在空间DX中是离散的,那么Y的空间是DY={g(x):x∈DX}。现在考虑两种情况:
首先g是一对一的,那么Y的pmf为
pY(y)=P[Y=y]=P[g(X)=y]=P[X=g−1(y)]=pX(g−1(y))(1)
例3:考虑例1的几何随机变量X,X是第一次出现头时所抛硬币的次数,令Y是第一次出现头时前面所抛硬币的次数,即Y=X−1。这时函数g为g(x)=x−1,其逆为g−1(y)=y+1,Y的空间是DY={0,1,2,…},根据等式1的表达式可得Y的pmf是
pY(y)=pX(y+1)=(12)y+1,for y=0,1,2,…
例4:令X的pmf为
pX(x)={3!x!(3−x)!(23)x(13)3−x0x=0,1,2,3elsewhere
我们现在求随机变量Y=X2的pmfpY(y),变换y=g(x)=x2将DX={x:x=0,1,2,3}映射到DY={y:y=0,1,4,9},一般而言,y=x2不是一对一映射的;但是这里是满足条件的,因为DX={x:x=0,1,2,3}中的x不存在负值,即我们有单值的反函数x=g−1(y)=y√(不是−y√),并且
pY(y)=pX(y√)=3!(y√)!(3−y√)!(23)y√(13)3−y√, y=0,1,4,9
第二种情况中的变换g(x)不是一对一的。虽然不是绝对的,但是对大多数涉及离散随机变量的应用来说,Y的pmf通过直接的方法就能得到,为此我们给出两个例子。
考虑例3中的几何随机变量,我们玩一个游戏,如果第一次头出现的次数为偶数甲方赢一元,如果是奇数那么甲方输一元,令Y表示我们的净收益,那么Y的空间是{−1,1}。例1 中已经计算出X为奇的概率为23,因此Y的分布为pY(−1)=2/3,pY(1)=1/3。
考虑另一个例子,令Z=(X−2)2,其中X是例1的几何随机变量,那么Z的空间是DZ={0,1,4,9,16,…},注意当且仅当X=2时Z=0;当且仅当X=1或者X=3时Z=1;而其他情况存在一对一的关系:x=z√+2,z∈{4,9,16,…}。因此Z的pmf是:
pZ(x)=⎧⎩⎨⎪⎪⎪⎪pX(2)=14pX(1)+pX(3)=58pX(z√+2)=14(12)z√for z=0for z=1for z=4,9,16,…
为了验证其正确性,读者可以试着计算Z的pmf在其空间上求和等于1。
博文pdf版本下载地址:http://pan.baidu.com/s/1i5OaIUT
对于集合D,如果它的元素是可列的,那么我们称这个集合是可数的;例如在D与正整数之间存在一个一一对应的关系。
例1:考虑抛硬币产生的独立序列,每个结果要么是头(H)要么是尾(T)。进一步,在每次抛的过程中,我们假设H,T是等可能的,即P(H)=P(T)=12。样本空间C由像TTHTHHT⋯这样的序列组成,令随机变量X第一次抛出头时所抛的次数,那么对于给定的序列,X=3。显然X的空间是D={1,2,3,4,…},当开始是H 时X=1,因此P(X=1)=12,同样得当序列为TH 时X=2,根据独立性可知概率P(X=2)=(12)(12)=14。更一般得,如果X=x,其中x=1,2,3,4,…,那么前面有x−1次为尾,即TT⋯TH,所以根据独立性,我们有
P(X=x)=(12)x−1(12)=(12)x,x=1,2,3,…
这个空间是可数的。一个有趣的事件是第一处出现头的次数为奇数;例如X=∈{1,3,5,…},这个事件的概率为
P[X∈{1,3,5,…}]=∑x=1∞(12)2x−1=1/21−(1/4)=23
通过上面的例子表明,关于离散随机变量的概率可以用P(X=x)的概率求出来,这些概率确定了一个重要的函数,定义下:
定义2:令X是离散随机变量,空间为D,X的概率质量函数由
pX(x)=P[X=x],for x∈D
给出。
注意,pmf满足下面两条性质:
(i)0≤pX(x)≤1,x∈D;(ii)Σx∈DpX(x=1)
对于离散集合D,如果一个函数满足性质(i)(ii),那么这个函数唯一确定了随机变量的分布。
令X是离散随机变量,空间为D,FX(x)的不连续点定义了质量;即如果x是FX的一个不连续点,那么P(X=x)>0。现在我们将随机变量空间与概率为正的点区别开来,对那些空间X中概率为正的点我们定义其为随机变量X 的支撑,我们经常用S来表示X的支撑,注意S⊂D,当然也有可能S=D
例2:现在有100个保险丝,从中随机抽出5个进行检测;如果5个均合格,那么这100个接受。事实上,这100个中有20个不合格,那么该保险丝被接受的概率为
(805)(1005)=0.32
更一般得,令随机变量X是5个中不合格的个数,那么X的pmf为
pX(x)=⎧⎩⎨⎪⎪(20x)(805−x)(1005)0for x=0,1,2,3,4,5elsewhere
很明显,X的空间是D={0,1,2,3,4,5},这是满足超几何分布的随机变量的实例,基于这些讨论很容易画出Xcdf的图像。
在统计学中经常会遇到这样的问题,我们有一个随机变量X 并且知道它的分布,然而我们感兴趣的是随机变量Y,他它是X的某个变量,Y=g(X)。尤其是我们想确定Y的分布,假设X在空间DX中是离散的,那么Y的空间是DY={g(x):x∈DX}。现在考虑两种情况:
首先g是一对一的,那么Y的pmf为
pY(y)=P[Y=y]=P[g(X)=y]=P[X=g−1(y)]=pX(g−1(y))(1)
例3:考虑例1的几何随机变量X,X是第一次出现头时所抛硬币的次数,令Y是第一次出现头时前面所抛硬币的次数,即Y=X−1。这时函数g为g(x)=x−1,其逆为g−1(y)=y+1,Y的空间是DY={0,1,2,…},根据等式1的表达式可得Y的pmf是
pY(y)=pX(y+1)=(12)y+1,for y=0,1,2,…
例4:令X的pmf为
pX(x)={3!x!(3−x)!(23)x(13)3−x0x=0,1,2,3elsewhere
我们现在求随机变量Y=X2的pmfpY(y),变换y=g(x)=x2将DX={x:x=0,1,2,3}映射到DY={y:y=0,1,4,9},一般而言,y=x2不是一对一映射的;但是这里是满足条件的,因为DX={x:x=0,1,2,3}中的x不存在负值,即我们有单值的反函数x=g−1(y)=y√(不是−y√),并且
pY(y)=pX(y√)=3!(y√)!(3−y√)!(23)y√(13)3−y√, y=0,1,4,9
第二种情况中的变换g(x)不是一对一的。虽然不是绝对的,但是对大多数涉及离散随机变量的应用来说,Y的pmf通过直接的方法就能得到,为此我们给出两个例子。
考虑例3中的几何随机变量,我们玩一个游戏,如果第一次头出现的次数为偶数甲方赢一元,如果是奇数那么甲方输一元,令Y表示我们的净收益,那么Y的空间是{−1,1}。例1 中已经计算出X为奇的概率为23,因此Y的分布为pY(−1)=2/3,pY(1)=1/3。
考虑另一个例子,令Z=(X−2)2,其中X是例1的几何随机变量,那么Z的空间是DZ={0,1,4,9,16,…},注意当且仅当X=2时Z=0;当且仅当X=1或者X=3时Z=1;而其他情况存在一对一的关系:x=z√+2,z∈{4,9,16,…}。因此Z的pmf是:
pZ(x)=⎧⎩⎨⎪⎪⎪⎪pX(2)=14pX(1)+pX(3)=58pX(z√+2)=14(12)z√for z=0for z=1for z=4,9,16,…
为了验证其正确性,读者可以试着计算Z的pmf在其空间上求和等于1。
博文pdf版本下载地址:http://pan.baidu.com/s/1i5OaIUT
相关文章推荐
- 漫步数理统计十一——连续随机变量(下)
- 漫步数理统计十九——独立随机变量
- 漫步数理统计二十——多元随机变量
- 漫步数理统计十二——随机变量的期望
- 漫步数理统计七——随机变量(上)
- 漫步数理统计十——连续随机变量(上)
- 漫步数理统计八——随机变量(下)
- 漫步数理统计三十二——中心极限定理
- 漫步数理统计六——条件概率与独立(下)
- 概率与数理统计9--二元连续随机变量
- 漫步数理统计三十一——依分布收敛
- 漫步数理统计三十三——采样与统计量
- 漫步数理统计二十七——t与F分布
- 漫步数理统计一——绪论
- 漫步数理统计三——概率集合函数(上)
- 概率与数理统计8---二元随机变量
- 漫步数理统计二十六——多元正态分布
- 漫步数理统计二——集合论
- 漫步数理统计三十四——顺序统计量
- 漫步数理统计二十五——正态分布