您的位置:首页 > 编程语言 > Python开发

深度学习的图像预处理中每个图片减去均值的原因(附python代码)

2019-06-03 15:08 2571 查看

为什么每张图片都要减去mean值呢?
在计算机视觉领域中,一定免不了的就是图像预处理中的 逐个样本减去mean值的过程,那么为什么一定要做这一步呢?

其主要的原因就是,对于我们的自然图像其实是一种平稳的数据分布【即图像的每一维都服从相同的分布】。所以通过减去数据对应维度的统计平均值,来消除公共的部分,以凸显个体之间的特征和差异。下面就用一个图来直观的表示一下:


可以看到减去均值后的图b,天空的纹理被消除了,凸显出了图片中的车和高楼等主要特征

需要注意的是:用来计算均值的,一定要用训练集,否则违背了深度学习的原则(即模型训练仅能从训练数据中获取信息)。对于得到的mean值,训练集、验证集和测试集都要分别减去均值。

附上代码

# 首先,你需要安装numpy和opencv模块。
# opencv 可以通过下面的命令来直接安装。
pip install opencv-python

该代码,只需修改文件路径即可。

import os
import numpy as np
import cv2
# 这个是你图片的根目录,注意不要带中文路径,楼主就因为这个调试了很久。
image_path = '/train/image'

file_names = os.listdir(image_path)

count = 0
mean = np.zeros(3, np.int64)

for i in file_names[1:]:
print(i)

img = cv2.imread(image_path + '/' + i)
#print(img)
count += 1
mean += np.sum(img, axis=(0, 1)).astype(int)
h, w = img.shape[0:-1]
print(h, w, count)
means = mean / (1.0 * h * w * count)
print('b, g, r = ', means)
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐