【深度学习】图像分类问题笔记
2017-09-29 18:46
330 查看
困难和挑战
视角变化(Viewpoint variation):同一个物体,摄像机可以从多个角度来展现。大小变化(Scale variation):物体可视的大小通常是会变化的(不仅是在图片中,在真实世界中大小也是变化的)。
形变(Deformation):很多东西的形状并非一成不变,会有很大变化。
遮挡(Occlusion):目标物体可能被挡住。有时候只有物体的一小部分(可以小到几个像素)是可见的。
光照条件(Illumination conditions):在像素层面上,光照的影响非常大。
背景干扰(Background clutter):物体可能混入背景之中,使之难以被辨认。
类内差异(Intra-class variation):一类物体的个体之间的外形差异很大,比如椅子。这一类物体有许多不同的对象,每个都有自己的外形。
实现步骤
低维度特征提取常用的局部特征提取的方法有:SIFT HOG LBP
特征编码
常用的特征编码的方法有:vector quantization, sparse coding, locality-constrained linear coding, Fisher vector encoding
Spatial constraint
注: spatial constraint 不会翻译,其解释如下:Spatial constraint or feature clustering is usually adopted after feature encoding for extracting the maximum or average of each dimension in the spatial domain. Pyramid feature matching–a popular feature clustering method–divides an image uniformly into patches and performs feature clustering in each patch.
图像分类
常见的分类器有:支持向量机、随机森林
常用模型
图像分类算法常用CNN,具体的几个模型有:VGG, GoogleNet 和 ResNets引用
http://book.paddlepaddle.org/index.htmlhttps://zhuanlan.zhihu.com/p/20894041?refer=intelligentunit
相关文章推荐
- <学习html>第二天笔记-标签分类、关系;开发工具;文档类型;标签语义化;HTML标签;问题“图像标签代码语法无误,但是图像显示不出来”
- 深度学习与计算机视觉[CS231N]学习笔记(2.1):图像分类
- 不用写代码就能实现深度学习?手把手教你用英伟达 DIGITS 解决图像分类问题
- Ng深度学习笔记2 -逻辑回归、分类问题、牛顿迭代
- [深度学习论文笔记][Image Classification] 图像分类部分论文导读
- 深度学习Java类库deeplearning4j 学习笔记-MNIST手写数字分类问题
- 深度学习入门笔记--图像线性分类
- 深度学习在图像识别中的应用--学习笔记1
- html5学习笔记三:canvas中平移,缩放,旋转等图像变换问题
- 深度学习在图像识别中的应用--学习笔记5
- [caffe]深度学习之图像分类模型AlexNet解读
- Kienct与Arduino学习笔记(2) 深度图像和真实世界坐标系中的深度图
- Kienct与Arduino学习笔记(2) 深度图像与现实世界的深度图的坐标
- 深度学习与计算机视觉系列(2)_图像分类与KNN
- 深度学习与计算机视觉系列(2)_图像分类与KNN
- 深度学习在图像识别中的应用--学习笔记6
- 深度学习在图像识别中的应用--学习笔记2
- [caffe]深度学习之图像分类模型AlexNet解读
- UFLDL教程笔记及练习答案四(建立分类用深度学习---栈式自编码神经网络)
- 深度学习在图像识别中的应用--学习笔记3