基于人工神经网络的数字字符识别系统demo(一):字符去噪、分割
2016-03-29 11:42
513 查看
最近尝试利用神经网络做数字字符识别,大概做了一下。整体很简陋,就是先对测试图片做下预处理,然后通过重采样提取特征,最后通过神经网络进行训练和识别。感兴趣的可以点击这里 了解一下,欢迎多多指教。
这里我大概介绍一下怎样将一副包含多个字符的图片进行去噪处理进而分割出单个字符,关于opencv中怎样使用ANN详见Opencv中ANN神经网络使用示例。
原始图:
效果图:
下面介绍一下处理步骤,
1.载入图像并作灰度化
2.二值化并作反色处理
3.提取外轮廓
4.根据轮廓大小去除噪声
5.再次查找轮廓并根据轮廓找出其boundingRect
6.将boundingRect分别保存为图像即可。
好,这样就基本结束了。直接上源码:
如果想了解整个project,欢迎访问https://github.com/NodYoung/ANNDigitRec。
这里我大概介绍一下怎样将一副包含多个字符的图片进行去噪处理进而分割出单个字符,关于opencv中怎样使用ANN详见Opencv中ANN神经网络使用示例。
原始图:
效果图:
下面介绍一下处理步骤,
1.载入图像并作灰度化
2.二值化并作反色处理
3.提取外轮廓
4.根据轮廓大小去除噪声
5.再次查找轮廓并根据轮廓找出其boundingRect
6.将boundingRect分别保存为图像即可。
好,这样就基本结束了。直接上源码:
//--------------------------------------【程序说明】------------------------------------------- // 程序说明:基于ANN的数字字符识别系统 // 程序描述: // 开发测试所用操作系统: Windows 7 64bit // 开发测试所用IDE版本:Visual Studio 2010 // 开发测试所用OpenCV版本: 2.4.8 //------------------------------------------------------------------------------------------------ #include <opencv2/opencv.hpp> //头文件 using namespace cv; //包含cv命名空间 //#include <fstream> //using namespace std; void main( ) { //载入图像 Mat srcImage = imread("scanDigit.bmp"); imshow("【原始图】",srcImage);//显示载入的图片 //灰度化 Mat grayImage; cvtColor(srcImage, grayImage, CV_RGB2GRAY);//RGB图像的灰度化 imshow("【灰度图】",grayImage); // imwrite("grayImage.jpg",grayImage);//保存图片 //二值化 Mat biImage; threshold(grayImage, biImage, 200, 255, CV_THRESH_BINARY_INV ); //对灰度图进行二值化处理,前景变为白色后findContours()寻找外轮廓才好用 imshow("【二值化图】",biImage); // imwrite("biImage.jpg",biImage); /* //查看图片数据 ofstream outImage("imagedata.txt", ios::out | ios::binary); for( unsigned int nrow = 0; nrow < srcImage.rows; nrow++) { for(unsigned int ncol = 0; ncol < srcImage.cols; ncol++) { uchar val = srcImage.at<unsigned char>(nrow,ncol); outImage << (int(val) > 200 ? 1 :0) ; //File3<<int(val)<< endl ; } outImage << endl ; } outImage.close(); */ //去除噪声 Mat contourImage(biImage.rows, biImage.cols, CV_8UC1, Scalar(0, 0, 0)); Mat noiseRemoveImage = biImage.clone(); vector<vector<Point> > contours; vector<Vec4i> hierarchy; findContours( biImage, contours, hierarchy, CV_RETR_EXTERNAL, CV_CHAIN_APPROX_SIMPLE ); for(int i = 0; i< contours.size(); i++ ) { Scalar color( 255, 255, 255 ); drawContours( contourImage, contours, i, color, 1, 8, hierarchy, 1);//绘制轮廓 // printf("轮廓[%d]的面积: %.2f\n", i, contourArea(contours[i])); if (contourArea(contours[i]) < 20) //此处面积20为经验值 { drawContours( noiseRemoveImage, contours, i, Scalar(0, 0, 0), -1, 8, hierarchy, 0); } } imshow( "外轮廓图", contourImage ); imshow( "去除噪声图", noiseRemoveImage ); /* //先做反色处理 Mat dstImage; bitwise_not(srcImage, dstImage); imshow( "反色图", dstImage ); */ /* //整体倾斜度调整 Mat rotMat(2, 3, CV_32FC1); Mat rotateImage(noiseRemoveImage.rows, noiseRemoveImage.cols, noiseRemoveImage.type(), Scalar(0, 0, 0)); Point center = Point(noiseRemoveImage.cols/2, noiseRemoveImage.rows/2); double angle = 2.1;//此处指定旋转角度 // double angle = slopeImage(noiseImage); double scale = 1; rotMat = getRotationMatrix2D(center, angle, scale); warpAffine(noiseRemoveImage, rotateImage, rotMat, rotateImage.size(),INTER_LINEAR, BORDER_CONSTANT, Scalar(0, 0, 0)); imshow( "旋转图", rotateImage ); */ /* //对图像进行膨胀操作 Mat element = getStructuringElement(MORPH_RECT, Size(3, 3));//定义核 Mat dilateImage = srcImage.clone(); morphologyEx(srcImage, dilateImage, MORPH_DILATE, element); imshow( "膨胀图", dilateImage); */ //字符分割并作尺寸归一化处理 Mat SegmentationImage = noiseRemoveImage.clone(); vector<vector<Point> > segcontours; vector<Vec4i> seghierarchy; findContours( noiseRemoveImage, segcontours, seghierarchy, CV_RETR_EXTERNAL, CV_CHAIN_APPROX_SIMPLE); Mat characterImage; Mat dstImage; char name[50]; for (int i = 0; i < segcontours.size(); i++) { Rect rect = boundingRect(Mat(segcontours[i])); // rectangle(SegmentationImage, rect.tl(), rect.br(), Scalar(255, 0, 0)); //将每个方框显示 //将每个字符的尺寸归一化并保存为图片 Mat roi = SegmentationImage(rect); resize(roi,characterImage,Size(32, 64 ),(0,0),(0,0),INTER_NEAREST); //再反色处理 bitwise_not(characterImage, dstImage); sprintf(name, "TestData\\%d.jpg", i); imwrite(name,dstImage); } imshow( "分割图", SegmentationImage); //等待任意按键按下 waitKey(0); }
如果想了解整个project,欢迎访问https://github.com/NodYoung/ANNDigitRec。
相关文章推荐
- 八.网络操作命令
- 关于HTTP详解
- HTTP/2 对 Web 性能的影响(下)
- HTTP/2 对 Web 性能的影响(下)
- Windows下C语言的Socket编程例子(TCP和UDP)
- 嵌入式Linux开发第一弹 之 网络配置
- Android中的几种网络请求方式详解
- 移植thttpd嵌入式web服务器
- Linux使用问题杂记--解决Ubuntu网络服务图标不显示
- thttpd web服务器在ARM上的移植
- windows下监控本机网络状况
- win7各种无法上网的解决办法
- HTTP请求原理介绍
- java中http请求的get与post的区别(笔记)
- Linux程序设计-套接字编程-网络信息服务
- TCP/IP协议学习(七) 基于C# Socket的Web服务器---动态通讯实现
- socket、tcp、udp、http 的认识及区别
- HTTP、TCP、UDP、Socket
- 网络编程(二)
- HTTPS那些事 用java实现HTTPS工作原理