用 Python 和 OpenCV 检测图片上的条形码
2015-05-29 14:57
573 查看
Python 和 OpenCV 检测图片上的的条形码
这篇博文的目的是应用计算机视觉和图像处理技术,展示一个条形码检测的基本实现。我所实现的算法本质上基于StackOverflow
上的这个问题,浏览代码之后,我提供了一些对原始算法的更新和改进。
首先需要留意的是,这个算法并不是对所有条形码有效,但会给你基本的关于应用什么类型的技术的直觉。
假设我们要检测下图中的条形码:
![](http://ww4.sinaimg.cn/mw690/6941baebjw1emqlnopc64j20go0cijsa.jpg)
图1:包含条形码的示例图片
现在让我们开始写点代码,新建一个文件,命名为detect_barcode.py,打开并编码:
我们首先做的是导入所需的软件包,我们将使用NumPy做数值计算,argparse用来解析命令行参数,cv2是OpenCV的绑定。
然后我们设置命令行参数,我们这里需要一个简单的选择,–image是指包含条形码的待检测图像文件的路径。
现在开始真正的图像处理:
12~13行:从磁盘载入图像并转换为灰度图。
17~18行:使用Scharr操作(指定使用ksize = -1)构造灰度图在水平和竖直方向上的梯度幅值表示。
21~22行:Scharr操作之后,我们从x-gradient中减去y-gradient,通过这一步减法操作,最终得到包含高水平梯度和低竖直梯度的图像区域。
上面的gradient表示的原始图像看起来是这样的:
![](http://ww4.sinaimg.cn/mw690/6941baebjw1emqlnozlekj20rs0mtq8o.jpg)
图:2:条形码图像的梯度表示
注意条形码区域是怎样通过梯度操作检测出来的。下一步将通过去噪仅关注条形码区域。
25行:我们要做的第一件事是使用9*9的内核对梯度图进行平均模糊,这将有助于平滑梯度表征的图形中的高频噪声。
26行:然后我们将模糊化后的图形进行二值化,梯度图中任何小于等于255的像素设为0(黑色),其余设为255(白色)。
模糊并二值化后的输出看起来是这个样子:
![](http://ww1.sinaimg.cn/mw690/6941baebjw1emqlnpaw8nj20rs0mtwft.jpg)
图3:二值化梯度图以此获得长方形条形码区域的粗略近似
然而,如你所见,在上面的二值化图像中,条形码的竖杠之间存在缝隙,为了消除这些缝隙,并使我们的算法更容易检测到条形码中的“斑点”状区域,我们需要进行一些基本的形态学操作:
29行:我们首先使用cv2.getStructuringElement构造一个长方形内核。这个内核的宽度大于长度,因此我们可以消除条形码中垂直条之间的缝隙。
30行:这里进行形态学操作,将上一步得到的内核应用到我们的二值图中,以此来消除竖杠间的缝隙。
现在,你可以看到这些缝隙相比上面的二值化图像基本已经消除:
![](http://ww1.sinaimg.cn/mw690/6941baebjw1emqlnpo5vjj20rs0mtab1.jpg)
图4:使用形态学中的闭运算消除条形码竖条之间的缝隙
当然,现在图像中还有一些小斑点,不属于真正条形码的一部分,但是可能影响我们的轮廓检测。
让我们来消除这些小斑点:
我们这里所做的是首先进行4次腐蚀(erosion),然后进行4次膨胀(dilation)。腐蚀操作将会腐蚀图像中白色像素,以此来消除小斑点,而膨胀操作将使剩余的白色像素扩张并重新增长回去。
如果小斑点在腐蚀操作中被移除,那么在膨胀操作中就不会再出现。
经过我们这一系列的腐蚀和膨胀操作,可以看到我们已经成功地移除小斑点并得到条形码区域。
![](http://ww1.sinaimg.cn/mw690/6941baebjw1emqlnq03e0j213o0wk0uj.jpg)
图5:应用一系列的腐蚀和膨胀来移除不相关的小斑点
最后,让我们找到图像中条形码的轮廓:
38~40行:幸运的是这一部分比较容易,我们简单地找到图像中的最大轮廓,如果我们正确完成了图像处理步骤,这里应该对应于条形码区域。
43~44行:然后我们为最大轮廓确定最小边框
48~50行:最后显示检测到的条形码
正如你在下面的图片中所见,我们已经成功检测到了条形码:
![](http://ww4.sinaimg.cn/mw690/6941baebjw1emqlnqenukj20rs0mtgo9.jpg)
图6:成功检测到示例图像中的条形码
下一部分,我们将尝试更多图像。
成功的条形码检测
要跟随这些结果,请使用文章下面的表单去下载本文的源码以及随带的图片。
一旦有了代码和图像,打开一个终端来执行下面的命令:
![](http://ww4.sinaimg.cn/mw690/6941baebjw1emqlnqvkk3j20rs109aeb.jpg)
图7:使用OpenCV检测图像中的一个条形码
检测椰油瓶子上的条形码没有问题。
让我们试下另外一张图片:
![](http://ww4.sinaimg.cn/mw690/6941baebjw1emqlnrdehkj20rs109tdj.jpg)
图8:使用计算机视觉检测图像中的一个条形码
我们同样能够在上面的图片中找到条形码。
关于食品的条形码检测已经足够了,书本上的条形码怎么样呢:
![](http://ww4.sinaimg.cn/mw690/6941baebjw1emqlnrq62bj20rs1090x7.jpg)
图9:使用Python和OpenCV检测书本上的条形码
没问题,再次通过。
那包裹上的跟踪码呢?
![](http://ww2.sinaimg.cn/mw690/6941baebjw1emqlns6pvvj20rs10978h.jpg)
图10:使用计算机视觉和图像处理检测包裹上的条形码
我们的算法再次成功检测到条形码。
最后,我们再尝试一张图片,这个是我最爱的意大利面酱—饶氏自制伏特加酱(Rao’s Homemade Vodka Sauce):
![](http://ww4.sinaimg.cn/mw690/6941baebjw1emqlnspabmj20rs109gq5.jpg)
图11:使用Python和Opencv很容易检测条形码
我们的算法又一次检测到条形码!
总结
这篇博文中,我们回顾了使用计算机视觉技术检测图像中条形码的必要步骤,使用Python编程语言和OpenCV库实现了我们的算法。
算法概要如下:
计算x方向和y方向上的Scharr梯度幅值表示
将x-gradient减去y-gradient来显示条形码区域
模糊并二值化图像
对二值化图像应用闭运算内核
进行系列的腐蚀、膨胀
找到图像中的最大轮廓,大概便是条形码
需要注意的是,该方法做了关于图像梯度表示的假设,因此只对水平条形码有效。
如果你想实现一个更加鲁棒的条形码检测算法,你需要考虑图像的方向,或者更好的,应用机器学习技术如Haar级联或者HOG + Linear SVM去扫描图像条形码区域。
源码下载:http://pan.baidu.com/s/1jGMfcBs
这篇博文的目的是应用计算机视觉和图像处理技术,展示一个条形码检测的基本实现。我所实现的算法本质上基于StackOverflow
上的这个问题,浏览代码之后,我提供了一些对原始算法的更新和改进。
首先需要留意的是,这个算法并不是对所有条形码有效,但会给你基本的关于应用什么类型的技术的直觉。
假设我们要检测下图中的条形码:
![](http://ww4.sinaimg.cn/mw690/6941baebjw1emqlnopc64j20go0cijsa.jpg)
图1:包含条形码的示例图片
现在让我们开始写点代码,新建一个文件,命名为detect_barcode.py,打开并编码:
然后我们设置命令行参数,我们这里需要一个简单的选择,–image是指包含条形码的待检测图像文件的路径。
现在开始真正的图像处理:
17~18行:使用Scharr操作(指定使用ksize = -1)构造灰度图在水平和竖直方向上的梯度幅值表示。
21~22行:Scharr操作之后,我们从x-gradient中减去y-gradient,通过这一步减法操作,最终得到包含高水平梯度和低竖直梯度的图像区域。
上面的gradient表示的原始图像看起来是这样的:
![](http://ww4.sinaimg.cn/mw690/6941baebjw1emqlnozlekj20rs0mtq8o.jpg)
图:2:条形码图像的梯度表示
注意条形码区域是怎样通过梯度操作检测出来的。下一步将通过去噪仅关注条形码区域。
26行:然后我们将模糊化后的图形进行二值化,梯度图中任何小于等于255的像素设为0(黑色),其余设为255(白色)。
模糊并二值化后的输出看起来是这个样子:
![](http://ww1.sinaimg.cn/mw690/6941baebjw1emqlnpaw8nj20rs0mtwft.jpg)
图3:二值化梯度图以此获得长方形条形码区域的粗略近似
然而,如你所见,在上面的二值化图像中,条形码的竖杠之间存在缝隙,为了消除这些缝隙,并使我们的算法更容易检测到条形码中的“斑点”状区域,我们需要进行一些基本的形态学操作:
30行:这里进行形态学操作,将上一步得到的内核应用到我们的二值图中,以此来消除竖杠间的缝隙。
现在,你可以看到这些缝隙相比上面的二值化图像基本已经消除:
![](http://ww1.sinaimg.cn/mw690/6941baebjw1emqlnpo5vjj20rs0mtab1.jpg)
图4:使用形态学中的闭运算消除条形码竖条之间的缝隙
当然,现在图像中还有一些小斑点,不属于真正条形码的一部分,但是可能影响我们的轮廓检测。
让我们来消除这些小斑点:
如果小斑点在腐蚀操作中被移除,那么在膨胀操作中就不会再出现。
经过我们这一系列的腐蚀和膨胀操作,可以看到我们已经成功地移除小斑点并得到条形码区域。
![](http://ww1.sinaimg.cn/mw690/6941baebjw1emqlnq03e0j213o0wk0uj.jpg)
图5:应用一系列的腐蚀和膨胀来移除不相关的小斑点
最后,让我们找到图像中条形码的轮廓:
43~44行:然后我们为最大轮廓确定最小边框
48~50行:最后显示检测到的条形码
正如你在下面的图片中所见,我们已经成功检测到了条形码:
![](http://ww4.sinaimg.cn/mw690/6941baebjw1emqlnqenukj20rs0mtgo9.jpg)
图6:成功检测到示例图像中的条形码
下一部分,我们将尝试更多图像。
成功的条形码检测
要跟随这些结果,请使用文章下面的表单去下载本文的源码以及随带的图片。
一旦有了代码和图像,打开一个终端来执行下面的命令:
![](http://ww4.sinaimg.cn/mw690/6941baebjw1emqlnqvkk3j20rs109aeb.jpg)
图7:使用OpenCV检测图像中的一个条形码
检测椰油瓶子上的条形码没有问题。
让我们试下另外一张图片:
![](http://ww4.sinaimg.cn/mw690/6941baebjw1emqlnrdehkj20rs109tdj.jpg)
图8:使用计算机视觉检测图像中的一个条形码
我们同样能够在上面的图片中找到条形码。
关于食品的条形码检测已经足够了,书本上的条形码怎么样呢:
![](http://ww4.sinaimg.cn/mw690/6941baebjw1emqlnrq62bj20rs1090x7.jpg)
图9:使用Python和OpenCV检测书本上的条形码
没问题,再次通过。
那包裹上的跟踪码呢?
![](http://ww2.sinaimg.cn/mw690/6941baebjw1emqlns6pvvj20rs10978h.jpg)
图10:使用计算机视觉和图像处理检测包裹上的条形码
我们的算法再次成功检测到条形码。
最后,我们再尝试一张图片,这个是我最爱的意大利面酱—饶氏自制伏特加酱(Rao’s Homemade Vodka Sauce):
![](http://ww4.sinaimg.cn/mw690/6941baebjw1emqlnspabmj20rs109gq5.jpg)
图11:使用Python和Opencv很容易检测条形码
我们的算法又一次检测到条形码!
总结
这篇博文中,我们回顾了使用计算机视觉技术检测图像中条形码的必要步骤,使用Python编程语言和OpenCV库实现了我们的算法。
算法概要如下:
计算x方向和y方向上的Scharr梯度幅值表示
将x-gradient减去y-gradient来显示条形码区域
模糊并二值化图像
对二值化图像应用闭运算内核
进行系列的腐蚀、膨胀
找到图像中的最大轮廓,大概便是条形码
需要注意的是,该方法做了关于图像梯度表示的假设,因此只对水平条形码有效。
如果你想实现一个更加鲁棒的条形码检测算法,你需要考虑图像的方向,或者更好的,应用机器学习技术如Haar级联或者HOG + Linear SVM去扫描图像条形码区域。
源码下载:http://pan.baidu.com/s/1jGMfcBs
相关文章推荐
- 【新产品】.NET条形码控件 Spire.Barcode for .NET发布
- 条码控件Dynamsoft Barcode Reader教程:从PDF417驾驶执照中提取数据
- 条形d码扫描之rectOfInterest
- OSError: [Errno 2] No such file or directory
- python类库26[读写Excel]
- Python安装scikit-learn包
- python数据类型详解
- Unable to locate package python-pip
- Scikit Source Code Reading(2015.05.29)
- Gleanings of Python
- numpy库:常用基本
- Python Version 2.7 required which was not found in the registry
- python之类
- 编写Python脚本把sqlAlchemy对象转换成dict的教程
- Windows boost 下编译 python 库 boost_python-vc120-mt-1_58.lib
- Python学习——程序入口
- python (1):使用python 进行api 接口测试
- 学习资源整理
- Python 类的定义
- Python函数式编程——map()、reduce()