您的位置:首页 > 其它

漫步数理统计二十七——t与F分布

2017-05-05 22:51 295 查看
本篇博文定义两个非常重要的分布,它们在一些统计推断问题中非常有用,也就是t分布与F分布。

令W表示满足N(0,1)分布的随机变量;V表示满足χ2(r)分布的随机变量;且W,V独立,那么W,V的联合pdf,表示为h(w,v),就是W的pdf与V的pdf乘积,或者

h(w,v)={12π√e−w2/21Γ(r/2)2r/2vr/2−1e−v/20∞<w<∞,0<v<∞elsewhere

定义新的随机变量T为

T=WV/r‾‾‾‾√

利用变量替换方法可以得到T的pdfg1(t)。方程

t=wv/r‾‾‾√u=v

定义了一个变换,将={(w,v):−∞<w<∞,0<v<∞}一一映射到={(t,u):−∞<t<∞,0<u<∞},因为w=tu‾‾√/r√,v=u,所以变换的雅可比绝对值为||=u‾‾√/r√,所以T,U=V的联合pdf为

g(t,u)=h(tu‾‾√r√,u)||={12π√Γ(r/2)2r/2ur/2−1exp[−u2(1+t2r)]u√r√0|t|<∞,0<u<∞elsewhere

T的边缘pdf为

g1(t)=∫∞−∞g(t,u)du=∫∞012πr‾‾‾‾√Γ(r/2)2r/2u(r+1)/2−1exp[−u2(1+t2r)]du

令z=u[1+(t2/r)]/2得到

g1(t)=∫∞012πr‾‾‾‾√Γ(r/2)2r/2(2z1+t2/r)(r+1)/2−1e−z(21+t2/r)dz=Γ[(r+1)/2]πr‾‾‾√Γ(r/2)1(1+t2/r)(r+1)/2,−∞<t<∞(1)

所以如果W满足N(0,1),V满足χ2(r)且W,V独立,那么

T=WV/r‾‾‾‾√(2)

就有如上所述的pdfg1(t)。随机变量T的分布通常称为t分布,通过观察可以发现t分布完全由参数r决定,也就是卡方分布的自由度。

例1:T满足自由度为r的t分布,那么根据(2),我们可以写成T=W(/r)−1/2,其中W满足N(0,1)分布,V满足χ2(r)分布,W,V是独立的随机变量。假设(r/2)−(k/2)>0,那么

E(Tk)=E[Wk(Vr)−k/2]=E(Wk)E[(Vr)−k/2]=E(Wk)2−k/2Γ(r2−k2)Γ(r2)r−k/2, k<r(3)

为了求T的均值,令k=1。因为E(W)=0,所以只要T的自由度超过1,T的均值就为0。为了求方差,令k=2,这时候需要r>2,因为E(W2)=1,所以T的方差为

var(T)=E(T2)=rr−2(4)

因此自由度r>2的t分布均值为0,方差为r/(r−2)。

接下来考虑两个独立且自由度分别为r1,r2的卡方随机变量U,V,U,V的联合pdfh(u,v)为

h(u,v)={1Γ(r1/2)Γ(r2/2)2r1+r2/2ur1/2−1vr2/2−1e−(u+v)/200<u,v<∞elsewhere

我们定义新的随机变量为

W=U/r1V/r2

接下里求W的pdfg1(w),方程

w=u/r1v/r2,z=v,

定义了一对一变换,将集合={(u,v):0<u<∞,0<v<∞}映射到集合={(w,z):0<w<∞,0<z<∞},因为u=(r1/r2)zw,v=z,变换的雅可比绝对值为||=(r1/r2)z,随机变量W,Z=V的联合pdfg(w,z)为

g(w,z)=1Γ(r1/2)Γ(r2/2)2(r1+r2)/2(r1zwr2)r1−22zr2−22exp[−z2(r1wr2+1)]r1zr2

假设(w,z)∈,其他地方为零。W的边缘pdfg1(w)为

g1(w)=∫∞−∞g(w,z)dz=∫∞0(r1/r2)r1/2(w)r1/2−1Γ(r1/2)Γ(r2/2)2(r1+r2)/2z(r1+r2)/2−1exp[−z2(r1wr2+1)]dz

变量代换

y=z2(r1wr2+1)

可得

g1(w)=∫∞0(r1/r2)r1/2(w)r1/2−1Γ(r1/2)Γ(r2/2)2(r1+r2)/2(2yr1w/r2+1)(r1+r2)/2−1e−y×(2r1w/r2+1)dy={Γ[(r1+r2)/2](r1/r2)r1/2Γ(r1/2)Γ(r2/2)(w)r1/2−1(1+r1w/r2)(r1+r2)/200<w<∞elsewhere

故,如果U,V是自由度分别为r1,r2的且独立的卡方变量,那么

W=U/r1V/r2

的pdf如上所示,该随机变量的分布通常称为F分布,可以看出F分布完全由参数r1,r2决定。

例2:F为自由服r1,r2的F分布,那么F=(r2/r1)(U/V),其中U,V是独立的χ2随机变量,自由度分别为r1,r2。因此F的k阶矩为

E(Fk)=(r2r1)kE(Uk)E(V−k)

当然假设右边的期望均存在。根据前面的定理可知k>−(r1/2)恒为真,所以第一个期望恒存在,如果r2>2k那么第二个期望存在。假设为真,那么F的均值为

E(F)=r2r1r12−1Γ(r22−1)Γ(r22)=r2r2−2

如果r2非常大,那么E(F)约为1。

最后介绍一个定理,它是由上面的t分布推导出来的。

定理1:令X1,…,Xn是独立同分布的随机变量,且每个都是均值为μ,方差为σ2的正态分布,定义新的随机变量为

X¯=1n∑i=1nXi,S2=1n−1∑i=1n(Xi−X¯)2

那么

X¯是N(μ,σ2n)分布;

X¯,S2是独立的;

(n−1)S2/σ2满足χ2(n−1)分布;

随机变量

T=X¯−μS/n‾‾√

满足自由度为n−1的t分布。

证明:令X=(X1,…,Xn)′,因为X1,…,Xn是独立同分布的N(μ,σ2)随机变量,所以X是多元正态分布N(μ1,σ2I),其中1表示元素均为1的向量。令v′=(1/n,…,1/n)′=(1/n)1′。注意X¯=v′X,定义随机向量Y为Y=(X1−X¯,…,Xn−X¯)′,考虑下面的变换:

W=[X¯Y]=[v′I−1v′]X

因为W是多元正态随机向量的线性变换,它的均值与方差为

E[W]=[v′I−1v′]μ1=[μ0n]

其中0n表示元素全为0的向量,协方差矩阵为

Σ=[v′I−1v′]σ2I[v′I−1v′]′=σ2⎡⎣⎢⎢1n0n0′nI−1v′⎤⎦⎥⎥

因为X¯是W的第一个元素,根据前面的定理可得结论1。接下来因为协方差为0,所以X¯与Y独立,但是S2=(n−1)−1Y′Y,因此Y¯也与S2独立,结论2的证。

考虑随机变量

V=∑i=1n(Xi−μσ)2

这个和的每项都是N(0,1)随机变换的平方,因此是χ2(1)分布。因为它们互相独立,所以V是χ2(n)随机变量。注意,

V=∑i=1n((Xi−X¯)+(X¯−μ)σ)2=∑i=1n(Xi−X¯σ)2+(X¯−muσ/n‾‾√)2=(n−1)S2σ2+(X¯−μσ/n‾‾√)2

右边两项是独立的,且第二项为标准正态分布的平方即χ2(1)分布。取两边的mgf可得

(1−2t)−n/2=E[exp{t(n−1)S2/σ2}](1−2t)−1/2

求出的(n−1)S2σ2就得到结论3。最后,利用前面三个结论即可得到结论4,

T=(X¯−μ)/(σ/n‾‾√)(n−1)S2/(σ2(n−1))‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾√
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  t分布 f分布 自由度