您的位置:首页 > 其它

漫步数理统计十四——重要的不等式

2017-04-12 19:49 274 查看
本篇博文给出涉及期望的三个不等式的证明,之后我们会经常遇到这些不等式,首先介绍一个有用的结论。

定理1:令X表示随机变量,m是一个正整数,假设E[Xm]存在,如果k是一个正数且k≤m,那么E[Xk]存在。

证明:我们证明连续情况;离散情况与之类似,只需要将积分符号换成求和符号即可,令f(x)是X的pdf,那么

∫∞−∞|x|kf(x)dx=∫|x|≤1|x|kf(x)dx+∫|x|>1|x|kf(x)dx≤∫|x|≤1f(x)dx+∫|x|>1|x|mf(x)dx≤∫∞−∞f(x)dx+∫∞−∞|x|mf(x)dx≤1+E[|X|m]<∞

得证。

定理2:(马尔科夫不等式)令u(X)是随机变量X的非负函数,如果E[u(X)]存在,那么对于每个正常数c,

P[u(X)≥c]≤E[u(X)]c

证明:这里给出连续情况的证明;对于离散情况,只需要将积分符号改成求和符号即可。令A={x:u(x)≥c},f(x)表示X的pdf,那么

E[u(X)]=∫∞−∞u(x)f(x)dx=∫Au(x)f(x)dx+∫Acu(x)f(x)dx

上式最右边的每个被积函数都是正的,所以左边大于或等于右边任何一项,特别地

E[u(X)]≥∫Au(x)f(x)dx

然而,如果x∈A,那么u(x)≥c,所以我们用c代替上式右边u(x)的话,不等式不会增加,即

E[u(X)]≥c∫Af(x)dx

因为

∫Af(x)dx=P(X∈A)=P[u(X)≥c]

从而得到

E[u(X)]≥cP[u(X)≥c]

得证。

前面这个不等式是切比雪夫不等式的推广,具体如下定理所述。

定理3:(切比雪夫不等式)X是一个随机变量且概率分布的方差sigma2是有限的(根据定理1,这意味着均值μ=E(X)存在),那么对于任意k>0,

P(|X−μ|≥kσ)≤1k2

或者等价的

P(|X−μ|<kσ)≥1−1k2

证明:利用定理2中取u(X)=(X−μ)2,c=k2σ2,那么我们有

P[(X−μ)2≥k2σ2]≤E[(X−μ)2]k2σ2

因为这个不等式右边的分子是σ2,所以可以写成

P(|X−μ|≥kσ)≤1k2

得证。当然这里的k是大于1的整数。

切比雪夫不等式有一个简洁的形式,可以取kσ=ϵ,其中ϵ>0,这是不等式就变成

P(|X−μ|≥ϵ)≤σ2ϵ2,for all ϵ>0

因此1/k2是概率P(|X−μ|≥kσ)的上界,接下来我们给出一些实例中的上界与概率的准确值。

例1:令X的pdf为

f(x)={123√0−3√<x<3√elsewhere

这里μ=0,σ2=1,如果k=32,我们有准确的概率值

P(|X−μ|≥kσ)=P(|X|≥32)=1−∫3/2−3/2123√dx=1−3√2

根据切比雪夫不等式,这个概率上界为1/k2=49,因为近似1−3√/2=0.134,这是准确值远小于上界4/9。如果取k=2,我们得到的准确值是P(|X−μ|≥2σ)=P(|X|≥2)=0,依然远小于上界1/k2=1/4。

在上面的例子中,概率P(|X−μ|≥kσ)与上界1/k2差别较大。然而,如果我们希望不等式对所有k>0成立且对所有有有限方差的随机变量成立,那么就不可能再提高了,如下所示。

例2:X是离散型随机变量,在点x=−1,0,1处概率分别为18,68,18。这里μ=0,σ2=14。如果k=2,那么1/k2=14,P(|X−μ|≥kσ)=P(|X|≥1),即P(|X−μ|≥kσ)等于上界1/k2=1/4,因此在没有给出X分布的进一步假设的情况下,不等式无法提高了。

定义1:定义在区间(a,b),−∞≤a<b≤∞上的函数ϕ,如果对于(a,b)上的所有x,y以及所有的0<γ<1,不等式

ϕ[γx+(1−γ)y]≤γϕ(x)+(1−γ)ϕ(y)

成立,那么函数ϕ(x)称为凸函数,如果上面的不等式是严格的,那么称ϕ是严格凸函数。

在一阶与二阶导存在的情况下,下面的不等式成立。

定理4:如果ϕ在(a,b)上可微,那么

对于所有的a<x<y<b,当且仅当ϕ′(x)≤ϕ′′(y)时,ϕ 是凸的。

对于所有的a<x<y<b,当且仅当ϕ′(x)<ϕ′′(y)时,ϕ是严格凸的。

如果ϕ在(a,b)上二阶可微,那么

对于所有的a<x<y<b,当且仅当ϕ′′(x)≥0时,ϕ 是凸的。

对于所有的a<x<y<b,当且仅当ϕ′′(y)>0时,ϕ是严格凸的。

当然这个定理的第二部分可以从第一部分直接导出,而第一部分直观上也比较好理解,具体证明可以参考一些分析的书。下面给出一个非常有用的关于凸的不等式。

定理5:(詹森不等式)如果ϕ在开集I上是凸的,X是随机变量,其支撑含于I中且有有限期望,那么

ϕ[E(X)]≤E[ϕ(X)]

如果ϕ严格凸,那么不等式是严格的,除非X是一个常随机变量。

证明:假设ϕ有二阶导,ϕ(x)在u=E[X]处进行泰勒级数展开:

ϕ(x)=ϕ(μ)+ϕ′(μ)(x−mu)+ϕ′′(zeta)(x−μ)22

其中ζ位于x,μ之间。因为上式的最后一项是正的,所以我们有

ϕ(x)≥ϕ(μ)+ϕ′(μ)(x−μ)

两边分别取期望即可得到所要的结论。假设X不是常量,那么如果对于所有的x∈(a,b),ϕ′′(x)>0,则不等式是严格凸的。

例3:X是非退化随机变量,均值为μ且有有限的二阶矩,那么μ<E(X2)。这个结论可以利用詹森不等式得到,需要用到严格凸函数ϕ(t)=t2。

例4:(调和与几何平均)令{a1,…,an} 是正数集合,对每个数a1,…,an分配权重1/n就得到一个随机变量X的分布,那么X的均值就是算数平均(AM),E(X)=n−1Σni=1ai,又因为−logx 是凸函数,所以利用詹森不等式可得

−log(1n∑i=1nai)≤E(−logX)=−1n∑i=1nlogai=−log(a1a2…an)1/n

或者等价的

log(1n∑i=1nai)≥log(a1a2…an)1/n

因此

(a1a2…an)1/n≤1n∑i=1nai

不等式左边称为几何平均(GM),所有上面的不等式等价于对任意有限正数集,GM≤AM。

现在用1/ai代替ai,(也是正值),那么我们就得到

1n∑i=1n1ai≥(1a11a2⋯1an)1/n

或者等价的

11nΣni=11ai≤(a1a2…an)1/n

不等式的左边称为调和级数(HM),从而我们得出对任意正数集合

HM≤GM≤AM
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息