您的位置:首页 > 理论基础

关于computer view(CV)的几点认识-数字图像处理

2017-07-25 11:08 197 查看
当今科技越来越追求智能科技,CV大约从十年前就逐渐开始迅速发展,直至今日的火爆。就我本人的视角来看,CV从原始的基于数字图像处理渐渐发展为了采用机器学习、深度学习等综合性的学科。下面逐步分析我对此的几点认识。

我认为计算机视觉是从数字图像处理发展来的,而数字图像处理的基础又是数字信号处理。翻看Gonzalez的Digital Image Processing,可以发现里面许多章节是DSP的内容,如第四章-频域滤波和第五章-图像复原与重建(DFT/FFT和fiber的知识)、第七章-小波和多分辨率处理(小波变换的知识)、第八章-图像压缩(压缩编码的知识)。这些对与我们来说基本都是“先验知识”了,所以接受起来相对较快。

再简单说一下其他章节。前两章是介绍性内容略过。第三章-灰度变换与空间滤波,前半部分讲如何将彩色图变为灰度图,即如何把一个三维的图像矩阵变为一个一维的图像矩阵,其element的范围是(0-255)。(彩色图像一般采用24位实现法,即R/G/B分别取0-255)。后半部分主要是卷积,又是之前学过的内容了。

彩色图像在第六章-彩色图像处理中进一步进行了描述。详细来说,除了最常用的RGB模型,还有CMY和CMYK模型、HSI模型。我认为这一章的内容只是把前面对于灰度图处理的知识扩展到了彩色图像上面而已。

第九章-形态学图像处理,主要讲了开闭运算、膨胀腐蚀。以我个人的语言来说,膨胀是将图像的一部分扩大变模糊,腐蚀是将图像的一部分缩小变清晰。(感觉是很字面的意思)。应用的话,比如我们要处理的图像中有一条线应该是连起来的,但是转为灰度图或者其他操作之后线断了,我们就可以考虑通过膨胀将它重新连起来。再比如ORC字符识别中,有一些字很粗很不清晰,我们可以通过腐蚀操作将它缩瘦一点。

进一步的,开运算是先腐蚀后膨胀,作用是“平滑物体的轮廓、断开较窄的狭颈并消除细的突出物”。闭运算是先膨胀后腐蚀,作用是“弥合较窄的间断和细长 沟壑,消除小的孔洞,填补轮廓线中的断裂”。

第十章-图像分割是讲了边缘检测、角点检测、霍夫变换和各种算子。关于这部分内容我在之前整理过一个文档,回去找一下再传上来。

而图像分割这部分就我而言是用模式识别、机器学习的方法较多。关于这部分内容会在下一篇中写到。

第十一章-表示和描述中讲了边界追踪、骨架提取等,还有各种边界、区域描绘子。老实说我在这一章上的知识储备很不成体系,因此不多讲。里面的内容只是用过骨架提取,也可以说是细化。这一方法可以应用在手写字体识别和生成上(我便是在这一项目中用到了骨架提取的)。

Gonzalez在第十二章中提到了模式识别,有模板匹配、神经网络、分类器等方法。有关模式识别的内容在下一篇中会详细说明。

PS:写了这么多真的有点累了,过程中很多地方需要重新翻书,也发现自己记忆中很多的错误。是一个很有意义的整理。

记录于2017-07-25,11:08
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息