您的位置：首页 > 其它

机器学习中的距离/散度/熵

2020-02-03 04:52 330 查看

一、信息量

定义：用一个信息的编码长度。
性质：编码长度与出现的概率成负相关。（如：哈夫曼编码）
公式（0/1编码）
I=log⁡2(1p(x))=−log⁡2(p(x))I=\log_2(\frac{1}{p(x)})=-\log_2(p(x))I=log2(p(x)1)=−log2(p(x))

二、信息熵

定义：一个分布的信息量。（编码的平均长度/信息量的均值）
公式
H(p)=∑xp(x)log2(1p(x))=−∑xp(x)log⁡2(p(x))H(p)=\sum_x{p(x)log_2(\frac{1}{p(x)})}=-\sum_x{p(x)\log_2(p(x))}H(p)=x∑p(x)log2(p(x)1)=−x∑p(x)log2(p(x))

三、交叉熵 cross-entropy

定义：用猜测的分布(p)(p)(p)的编码方式编码真实的分布(q)(q)(q)，得到的平均编码长度/信息量均值。
因为参考的博客公式推导有冲突，有人认为p为真实分布，我暂且认为q为真实分布。\color{red}{因为参考的博客公式推导有冲突，有人认为p为真实分布，我暂且认为q为真实分布。}因为参考的博客公式推导有冲突，有人认为p为真实分布，我暂且认为q为真实分布。
公式
Hp(q)=∑xq(x)log⁡2(1p(x))H_p(q)=\sum_x{q(x)\log_2(\frac{1}{p(x)})}Hp(q)=x∑q(x)log2(p(x)1)
意义：不同分布之间的距离度量。
应用：最后的损失函数。（交叉熵本质上相当于衡量两个编码方式之间的差值，只有当猜测的分布约接近于真实分布，其值越小）
具体说明，详见信息量，信息熵，交叉熵，KL散度和互信息（信息增益），没太懂，以后遇到再细看\color{red}{没太懂，以后遇到再细看}没太懂，以后遇到再细看。

四、KL散度（相对熵）

别名：KL距离、相对熵。（D(q∣∣p)、Dq(p):q对p的相对熵D(q||p)、D_q(p):q对p的相对熵D(q∣∣p)、Dq(p):q对p的相对熵）
公式（相对熵=交叉熵-信息熵）
Dq(p)=Hq(p)−H(p)=∑xp(x)log⁡2(p(x)q(x))D_q(p)=H_q(p)-H(p)=\sum_x{p(x)\log_2(\frac{p(x)}{q(x)})}Dq(p)=Hq(p)−H(p)=x∑p(x)log2(q(x)p(x))
意义：同一随机事件+不同分布间的距离度量。
图示
性质（非负性）：Dq(p)≥0D_q(p)\geq0Dq(p)≥0。

四、联合信息熵和条件信息熵

公式
a. 联合信息熵
H(X,Y)=∑x,yp(x,y)log⁡2(1p(x,y))H(X,Y)=\sum_{x,y}p(x,y)\log_2(\frac{1}{p(x,y)})H(X,Y)=x,y∑p(x,y)log2(p(x,y)1)
b. 条件信息熵
H(Y∣X)=H(X,Y)−H(X)H(Y|X)=H(X,Y)-H(X)H(Y∣X)=H(X,Y)−H(X)
=∑xp(x)∑yp(y∣x)log⁡2(1p(y∣x))=\sum_xp(x)\sum_yp(y|x)\log_2(\frac{1}{p(y|x)})=x∑p(x)y∑p(y∣x)log2(p(y∣x)1)
=∑x,yp(x,y)log⁡2(1p(y∣x))=\sum_{x,y}p(x,y)\log_2(\frac{1}{p(y|x)})=x,y∑p(x,y)log2(p(y∣x)1)
意义：联合分布是同一个分布中两变量相互影响的关系。
图示

五、互信息（信息增益）

定义：一个联合分布中两个信息的纠缠程度/相互影响那部分的信息量
公式
I(X,Y)=H(X)+H(Y)−H(X,Y)I(X,Y)=H(X)+H(Y)-H(X,Y)I(X,Y)=H(X)+H(Y)−H(X,Y)
=H(Y)−H(Y∣X)=H(Y)-H(Y|X)=H(Y)−H(Y∣X)
性质（非负性）：I(X,Y)≥0I(X,Y)\geq0I(X,Y)≥0。
图示
应用：决策树。

六、variation of information

定义：联合分布（即同一个分布）两个变量相互影响的关系。
公式
V(X,Y)=H(X,Y)−I(X,Y)V(X,Y)=H(X,Y)-I(X,Y)V(X,Y)=H(X,Y)−I(X,Y)
意义：度量不同随机变量间的差别。
V(X,Y)=0V(X,Y)=0V(X,Y)=0：说明这两个变量完全一致。
V(X,Y)V(X,Y)V(X,Y)值越大说明两个变量越独立。

参考：

信息量，信息熵，交叉熵，KL散度和互信息（信息增益）
KL散度、JS散度、Wasserstein距离
 一文搞懂散度(KL，MMD距离、Wasserstein距离)

点赞
收藏
分享
文章举报

梁小娘子发布了36 篇原创文章 · 获赞 0 · 访问量 544 私信关注

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航

添加评论
分享网址
分享文章
返回顶部