模式识别相似性测度距离计算---夹角余弦和特征二值得夹角余弦
2016-03-01 14:58
260 查看
向量空间余弦相似度(Cosine Similarity)
余弦相似度用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小。余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,这就叫"余弦相似性"。
向量空间余弦相似度理论就是基于上述来计算个体相似度的一种方法。下面做详细的推理过程分析。
如果向量a和b不是二维而是n维,上述余弦的计算法仍然正确。假定a和b是两个n维向量,a是 ,b是 ,则a与b的夹角 的余弦等于:
cosA=[(x1)*(x2)+(y1)*(y2)]/{根号下[(x1)^2+(y1)^2]*根号下[(x2)^2+(y2)^2]}
余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,夹角等于0,即两个向量相等,这就叫"余弦相似性"。
对于二值得只是其中向量每个分量的取值只能为0或者1和一般的情况计算过程一样。
余弦相似度用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小。余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,这就叫"余弦相似性"。
向量空间余弦相似度理论就是基于上述来计算个体相似度的一种方法。下面做详细的推理过程分析。
如果向量a和b不是二维而是n维,上述余弦的计算法仍然正确。假定a和b是两个n维向量,a是 ,b是 ,则a与b的夹角 的余弦等于:
cosA=[(x1)*(x2)+(y1)*(y2)]/{根号下[(x1)^2+(y1)^2]*根号下[(x2)^2+(y2)^2]}
余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,夹角等于0,即两个向量相等,这就叫"余弦相似性"。
对于二值得只是其中向量每个分量的取值只能为0或者1和一般的情况计算过程一样。
相关文章推荐
- match_parent和fill_parent的区别
- electron之Windows下使用 html js css 开发桌面应用程序
- 快速掌握 Android Studio 中 Gradle 的使用方法
- 商业智能在公安交通管理领域的应用
- AngularJS 表达式 与 JavaScript 表达式
- 自我介绍
- Hibernate的HQL中in参数设置
- Libreoffice打开文档读取错误恢复
- Spring实战-雇员薪资管理系统
- 移动通信网络
- 【数据结构】复杂链表的复制
- Python中文编码问题
- pig0.15+hadoop2.x安装 (注意版本匹配)
- Xcode 升级后,常常遇到的遇到的警告、错误,解决方法
- 使用overridePendingTransition()方法,打开、关闭activity有动画
- JEPF 软件快速开发平台
- 基于spring和mybatis项目的JUnit测试用例的实现
- android自定义主题样式
- Maven环境配置
- Exercise #5