邮件反垃圾技术之——汉明距离
2013-12-21 10:25
155 查看
在信息论中,两个等长字符串之间的汉明距离是两个字符串对应位置的字符不同的个数。
1介绍
2特性
3历史及应用
换句话说,它就是将 一个字符串变换成另外一个字符串所需要替换的字符个数。 例如:
* 1 与 0 之间的汉明距离是 1。
* 214 与 214 之间的汉明距离是 0。
* "abcd" 与 "aacd" 之间的汉明距离是 1。
汉明重量是字符串相对于同样长度的零字符串的汉明距离,也就是说,它是字符串中非零的元素个数:对于二进制字符串来说,就是 1 的个数,所以 11101 的汉明重量是 4。
对于固定的长度 n,汉明距离是该长度字符向量空间上的度量,很显然它满足非负、唯一及对称性,并且可以很容易地通过完全归纳法证明它满足三角不等式。
两个字 a 与 b 之间的汉明距离也可以看作是特定运算的 a−b 的汉明重量。
对于二进制字符串 a 与 b 来说,它等于 a异或b以后所得二进制字符串中“1”的个数。另外二进制字符串的汉明距离也等于 n维超正方体两个顶点之间的曼哈顿距离,其中 n 是两个字串的长度。[1]
汉明距离是以理查德·卫斯里·汉明的名字命名的,汉明在误差检测与校正码的基础性论文中首次引入这个概念。在通信中累计定长二进制字中发生翻转的错误数据位,所以它也被称为信号距离。汉明重量分析在包括信息论、编码理论、密码学等领域都有应用。但是,如果要比较两个不同长度的字符串,不仅要进行替换,而且要进行插入与删除的运算,在这种场合下,通常使用更加复杂的编辑距离等算法。
转自百度百科:http://baike.baidu.com/link?url=LzNdyVge7ZKHscAZ1_mxHPbrcuYybXe-bEI5icucFRo0KHts0o8QsgUFCRwG-k36
目录
1介绍2特性
3历史及应用
1介绍
换句话说,它就是将 一个字符串变换成另外一个字符串所需要替换的字符个数。 例如:* 1 与 0 之间的汉明距离是 1。
* 214 与 214 之间的汉明距离是 0。
* "abcd" 与 "aacd" 之间的汉明距离是 1。
汉明重量是字符串相对于同样长度的零字符串的汉明距离,也就是说,它是字符串中非零的元素个数:对于二进制字符串来说,就是 1 的个数,所以 11101 的汉明重量是 4。
2特性
对于固定的长度 n,汉明距离是该长度字符向量空间上的度量,很显然它满足非负、唯一及对称性,并且可以很容易地通过完全归纳法证明它满足三角不等式。两个字 a 与 b 之间的汉明距离也可以看作是特定运算的 a−b 的汉明重量。
对于二进制字符串 a 与 b 来说,它等于 a异或b以后所得二进制字符串中“1”的个数。另外二进制字符串的汉明距离也等于 n维超正方体两个顶点之间的曼哈顿距离,其中 n 是两个字串的长度。[1]
3历史及应用
汉明距离是以理查德·卫斯里·汉明的名字命名的,汉明在误差检测与校正码的基础性论文中首次引入这个概念。在通信中累计定长二进制字中发生翻转的错误数据位,所以它也被称为信号距离。汉明重量分析在包括信息论、编码理论、密码学等领域都有应用。但是,如果要比较两个不同长度的字符串,不仅要进行替换,而且要进行插入与删除的运算,在这种场合下,通常使用更加复杂的编辑距离等算法。转自百度百科:http://baike.baidu.com/link?url=LzNdyVge7ZKHscAZ1_mxHPbrcuYybXe-bEI5icucFRo0KHts0o8QsgUFCRwG-k36
相关文章推荐
- 邮件服务器(邮件系统)最新反垃圾技术分享
- 邮件服务器(邮件系统)最新反垃圾技术分享
- 邮件服务器(邮件系统)最新反垃圾技术分享
- 邮件服务器(邮件系统)最新反垃圾技术分享
- 邮件服务器(邮件系统)最新反垃圾技术分享
- 百度邮件曝光:高级技术总监接管CTO工作
- 解析邮件归档技术 保护企业邮件安全(一)
- 反lj邮件技术解析-2
- [as hack技术]垃圾回收机强制执行
- 垃圾回收技术的发展(转)
- 解析邮件归档技术 保护企业邮件安全(三)
- 邮件加密技术的发展
- C#技术漫谈之垃圾回收机制(GC)
- 信息安全技术实验三 邮件服务安全实验
- 就从Magic Winmail 着手,专研邮件技术
- php 用sock技术发送邮件的函数
- 引领邮件系统技术发展―TurboMail荣获2010年度电子邮件产品行业贡献奖
- 邮件营销中邮件被过滤到垃圾邮箱怎么办
- 邮件技术资讯网致各邮件相关厂商的一封信
- 收到csdn的一个技术峰会的邮件,主题全是乱码。