GMM、fisher vector、SIFT与HOG特征资料
2015-12-13 19:50
253 查看
原文地址:http://yongyuan.name/blog/sometihing-about-GMM-fisher-vector-SIFT-and-HOG.html
查阅fisher vector资料时看到的几篇介绍fisher vector很不错的博文,要了解fisher vector你需要先了解GMM高斯混合模型,这两篇文章对GMM高斯混合模型讲解得很不错GMM,高斯混合模型。fisher
vector讲解的博文比较多,查阅的时候,我觉得下面几篇博文对fv讲得还比较深入:Fisher Vector、Fisher
Vecotr(1)、Fisher Vector(2)和Fisher
Vector 通俗学习。
此外,查阅FV资料的时候还发现原来微信图像技术组也用到的FV:
在图像检索领域,比较常用的技术是提取局部特征(如SIFT,SURF等),量化,建倒排表的架构,微信扫一扫中的封面识别就是采用这种技术。然而在图像云平台服务中,基于局部特征的的图像检索技术存在种种弊端。首先,在图像云平台服务中,每个开发者的图片数据都是相互独立的,若对所有开发者只建一个倒排表,每次开发者修改数据库时都会影响到所有开发者。若为每个开发者建立独享的倒排表,则会对资源造成巨大的浪费。其次,采用倒排结构时,开发者修改图像数据时(如增、删图片),都需要对整个倒排表进行重建。
在图像识别云平台中,微信图像技术组采用了基于全局特征的图像检索方法,通过SIFT+Fisher Vector得到一幅图像的全局描述子,然后通过量化,将全局描述子量化为低比特的码流,每幅图像对应一个图像识别指纹,在微信图像云平台服务中,已无需构建倒排表,开发者增、删图像时,后台只需在数据库对应的增加、删除指纹即可。对开发者的增删操作可以做出实时的响应。识别过程时,只需比对开发者数据库中的指纹即可。
在识别效果上,通过对多个数据集测试,检索效果上均与基于倒排表结构的图像检索技术相当,甚至某些数据集上优于基于倒排表结构的技术。
原文链接:微信图像开放平台:让你的应用看懂世界。
FV的Python实现代码pyfishervector与其对应的博文Image
Fisher Vector In Python,C++版本的可以参阅这里bLDFV。
此外,还发觉了几篇对SIFT、HOG讲解得比较好的博文:SIFT算法,这篇文章讲SIFT讲得不是一般的好;HOG特征(1)、HOG特征(3)和HOG特征(3),博文3对HOG的生成过程配合着图解说明讲得很赞。
最后,翻看的几篇很简短的总结,都是关于检索的,留着供以后查阅:Spectral Hashing、Product
quantization for nearest neighbor search、Efficient
visual search of videos cast as text retrieval、热点技术探索:大规模相似检索。
端午节下午所看的,以上。
GMM与fisher vector理解
查阅fisher vector资料时看到的几篇介绍fisher vector很不错的博文,要了解fisher vector你需要先了解GMM高斯混合模型,这两篇文章对GMM高斯混合模型讲解得很不错GMM,高斯混合模型。fishervector讲解的博文比较多,查阅的时候,我觉得下面几篇博文对fv讲得还比较深入:Fisher Vector、Fisher
Vecotr(1)、Fisher Vector(2)和Fisher
Vector 通俗学习。
此外,查阅FV资料的时候还发现原来微信图像技术组也用到的FV:
在图像检索领域,比较常用的技术是提取局部特征(如SIFT,SURF等),量化,建倒排表的架构,微信扫一扫中的封面识别就是采用这种技术。然而在图像云平台服务中,基于局部特征的的图像检索技术存在种种弊端。首先,在图像云平台服务中,每个开发者的图片数据都是相互独立的,若对所有开发者只建一个倒排表,每次开发者修改数据库时都会影响到所有开发者。若为每个开发者建立独享的倒排表,则会对资源造成巨大的浪费。其次,采用倒排结构时,开发者修改图像数据时(如增、删图片),都需要对整个倒排表进行重建。
在图像识别云平台中,微信图像技术组采用了基于全局特征的图像检索方法,通过SIFT+Fisher Vector得到一幅图像的全局描述子,然后通过量化,将全局描述子量化为低比特的码流,每幅图像对应一个图像识别指纹,在微信图像云平台服务中,已无需构建倒排表,开发者增、删图像时,后台只需在数据库对应的增加、删除指纹即可。对开发者的增删操作可以做出实时的响应。识别过程时,只需比对开发者数据库中的指纹即可。
在识别效果上,通过对多个数据集测试,检索效果上均与基于倒排表结构的图像检索技术相当,甚至某些数据集上优于基于倒排表结构的技术。
原文链接:微信图像开放平台:让你的应用看懂世界。
FV的Python实现代码pyfishervector与其对应的博文Image
Fisher Vector In Python,C++版本的可以参阅这里bLDFV。
SIFT、HOG
此外,还发觉了几篇对SIFT、HOG讲解得比较好的博文:SIFT算法,这篇文章讲SIFT讲得不是一般的好;HOG特征(1)、HOG特征(3)和HOG特征(3),博文3对HOG的生成过程配合着图解说明讲得很赞。最后,翻看的几篇很简短的总结,都是关于检索的,留着供以后查阅:Spectral Hashing、Product
quantization for nearest neighbor search、Efficient
visual search of videos cast as text retrieval、热点技术探索:大规模相似检索。
端午节下午所看的,以上。
相关文章推荐
- 【JS】浅谈匿名函数与闭包
- Install postfix on Ubuntu 14.04.txt
- python--回调函数
- EF简介
- C语言中数据输出宽度是什么?
- Now--Feature--Thinking
- JVM监控使用
- 10个免费的响应式布局HTML5+CSS3模板
- #学习笔记#(16)ul li 二级下拉菜单-jQuery
- Python学习之路(前言)
- 从prototype.js中学习到的js封装
- 【mysql】关于悲观锁
- Git 项目推荐 | Android 键盘弹出显示 Emoji 按钮
- 理解C语言——从小菜到大神的晋级之路(3)——C源程序的基本结构与调试方法
- 《Node.js In Action》笔记之流程控制
- struts2 后台验证之XML验证
- 看到就震惊了的代码
- 信息安全系统设计基础第十三周学习总结
- lightoj--1155-- Power Transmission (最大流拆点)
- 《挑战程序设计竞赛》2.1.3 穷竭搜索 POJ2718 POJ3187 POJ3050 AOJ0525