MNIST手写数字数据库保存为*.bmp图像之MATLAB源程序
2015-10-10 16:02
537 查看
MNIST手写数字数据库保存为*.bmp图像之MATLAB源程序
手写数字库很容易建立,但是总会很浪费时间。Google实验室的Corinna Cortes和纽约大学柯朗研究所的Yann LeCun建有一个手写数字数据库,训练库有60,000张手写数字图像,测试库有10,000张。源图像数据可访问原站 http://yann.lecun.com/exdb/mnist/进行下载,或到 http://download.csdn.net/detail/destiny0321/9167873进行下载,该数据库的一个文件中包含了所有的图像,使用起来很不方便。笔者在MATLAB平台上将该数据包保存为一张一张的带有标识的.bmp图片文件,以供今后研究使用。首先讲解一下train-images.idx3-ubyte这个数据库个存储格式:
训练集图像格式(train-images.idx3-ubyte)
offset——–type————–value———- description
0000 —32 bit integer——0x00000803—–magic number
0004—32 bit integer——–60000——number of images
0008—32 bit integer———-28———–number of rows
0012—32 bit integer———-28——–number of columns
0016—unsigned byte ——–??——————pixel
0017—unsigned byte ——–??——————pixel
……..
xxxx—unsigned byte———??——————pixel
可见,前32bit*4对数据库进行了整体描述,之后是大小为8bit的像素值,也就是我们所需要的数据。
其次讲解一下train-labels.idx1-ubyte这个数据库个存储格式:
训练集标签格式(train-labels.idx1-ubyte)
offset——–type—————-value———- description
0000 —32 bit integer——0x00000803—–magic number
0004—32 bit integer——–60000——number of images
0008—unsigned byte ———??——————number
0009—unsigned byte ———??——————number
……..
xxxx—unsigned byte———-??——————number
可见,前32bit*2对数据库进行了整体描述,之后是大小为8bit的范围从0到9的数字标签,依次对应于train-images.idx3-ubyte中每幅图像所表示的数字。
对这两个文件有了清楚的认识之后,就很容易对其进行操作,获取我们想得到的*.bmp图像数据了。这是程序运行后的截图:
源程序如下:
fid_image=fopen('train-images.idx3-ubyte','r'); fid_label=fopen('train-labels.idx1-ubyte','r'); % Read the first 16 Bytes magicnumber=fread(fid_image,4); size=fread(fid_image,4); row=fread(fid_image,4); col=fread(fid_image,4); % Read the first 8 Bytes extra=fread(fid_label,8); % Read labels related to images imageIndex=fread(fid_label); Num=length(imageIndex); % Count repeat times of 0 to 9 cnt=zeros(1,10); for k=1:Num image=fread(fid_image,[max(row),max(col)]); % Get image data val=imageIndex(k); % Get value of image for i=0:9 if val==i cnt(val+1)=cnt(val+1)+1; end end if cnt(val+1)<10 str=[num2str(val),'_000',num2str(cnt(val+1)),'.bmp']; elseif cnt(val+1)<100 str=[num2str(val),'_00',num2str(cnt(val+1)),'.bmp']; elseif cnt(val+1)<1000 str=[num2str(val),'_0',num2str(cnt(val+1)),'.bmp']; else str=[num2str(val),'_',num2str(cnt(val+1)),'.bmp']; end imwrite(image',str); end fclose(fid_image); fclose(fid_label);
相关文章推荐
- matlab自带的分类器对人脸、鼻子、嘴进行检测
- Ubuntu 15.04 x64 安装 MATLAB2014a
- 我的Matlab 实用函数
- MATLAB中的分类器
- Matlab_Marr小波尺度变换图
- C/C++中调用matlab引擎计算
- C/C++中调用matlab引擎计算
- Matlab小程序-正弦波线性组合频谱图
- Matlab中diag函数注意事项
- Matlab验证公式取值范围
- MATLAB之flipdim函数
- matlab 分数阶0<m=p/q<1累加序列生成方法
- matlab 子函数的使用
- matlab中的repmat函数
- matlab中的convn函数
- matlab中的randperm函数
- matlab中rem与mod函数的区别
- matlab中的文件读写操作
- matlab 画框(三) 画框并保存图像
- matlab图形句柄属性总结