您的位置:首页 > 其它

机器学习概率论基础

2016-03-13 17:27 113 查看


(补充:
(1)数学期望-----即所有样本的均值
(2)方差------------即样本与均值的差的平方的和
(3)标准差---------即对方差开2次根号)

0-1分布(伯努利分布、两点分布)-----离散概率分布

若随机变量X只取两个可能值0,1 ,且

P{X = 1} = p,P{X = 0} = q

其中0<p<1,q = 1 - p,则称X服从0-1分布

伯努利分布的数学期望与方差


二项分布-----其本质就是n重伯努利实验-----离散概率分布

若随机变量X可能取值0,1,2...,n,且X分布规律为


(n是实验次数,k是n次实验中成功的次数)

其中0<p<1, p+q = 1, 则称X服从参数为 n,p的二项分布。

二项分布的数学期望与方差


泊松分布(用以描述 “单位时间或单位空间内,某一事件发生的次数” 这样的问题)-----离散概率分布

若随机变量X的可能取值0,1,2,...,n,X的分布规律为



其中

,则称X服从参数为的泊松分布。记为



二项分布与泊松分布的关系


泊松分布的数学期望与方差


(补充:概率密度

如果对于随机变量X的分布函数F(X),存在非负函数f(x),使得对于任意实数x,有





则称X为连续性随机变量,其中函数f(x)称为X的概率密度函数。

在数学中,连续型随机变量的概率密度函数是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。

概率密度函数并没有实质的意义,只是对于连续性随机变量,我们关心他在某一点取值的问题没有太大的意义,而是关心它在某一区间上取值的问题,故引入了概率密度函数。)

正态分布(高斯分布---Gauss)----连续概率分布

若随机变量X的概率密度函数为


,则称X服从

的正态分布,记为



正态密度函数图形的性质:



(1)曲线关于直线

对称,这表明:对于任意的h>0,有


(2)当

时,f(x)取到最大值

,x离越远,f(x)的值就越小,这表明,对于同样长度的区间,当区间离

越远时,随机变量X落在该区间中的概率就越小。

(3)曲线y = f(x)在

处有拐点;曲线y = f(x)以OX轴为渐进线。

(4)若

固定,而改变

的值,则发f(x)的图形沿x轴平行移动,但不改变其形状。因此y
= f(x)图形的位置完全由参数

所确定。

(5)若

固定,而改变

的值,由于f(x)的最大值为

可知,当

越小时,y
= f(x)的图形越陡,因而X落在

附近的概率越大;反之,当

越大时,y
= f(x)的图形越平坦,这表明X的取值越分散。

标准正态分布

当参数

时,称随机变量X服从标准正态分布,记作

。其密度函数表示为:


标准正态分布的密度函数关于y轴对称:



标准正态分布的分布函数表示为:



正态分布的数学期望与方差


下面两个机器学习中不常用

均匀分布

设随机变量的概率密度为

则称X服从区间[a,b]上的均匀分布,
概率密度函数图:



服从均匀分布的随机变量X的分布函数为:





均匀分布的数学期望与方差


指数分布

设连续性随机变量X具有概率密度

,则称X服从参数为

的指数分布,记作


其分布函数为:


指数分布的数学期望和方差
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: