您的位置：首页 > 编程语言 > Python开发

深度学习的图像预处理中每个图片减去均值的原因（附python代码）

2019-06-03 15:08 2571 查看

为什么每张图片都要减去mean值呢？
在计算机视觉领域中，一定免不了的就是图像预处理中的逐个样本减去mean值的过程，那么为什么一定要做这一步呢？

其主要的原因就是，对于我们的自然图像其实是一种平稳的数据分布【即图像的每一维都服从相同的分布】。所以通过减去数据对应维度的统计平均值，来消除公共的部分，以凸显个体之间的特征和差异。下面就用一个图来直观的表示一下：

可以看到减去均值后的图b，天空的纹理被消除了，凸显出了图片中的车和高楼等主要特征

需要注意的是：用来计算均值的，一定要用训练集，否则违背了深度学习的原则（即模型训练仅能从训练数据中获取信息）。对于得到的mean值，训练集、验证集和测试集都要分别减去均值。

附上代码

# 首先，你需要安装numpy和opencv模块。
# opencv 可以通过下面的命令来直接安装。
pip install opencv-python

该代码，只需修改文件路径即可。

import os
import numpy as np
import cv2
# 这个是你图片的根目录，注意不要带中文路径，楼主就因为这个调试了很久。
image_path = '/train/image'

file_names = os.listdir(image_path)

count = 0
mean = np.zeros(3, np.int64)

for i in file_names[1:]:
print(i)

img = cv2.imread(image_path + '/' + i)
#print(img)
count += 1
mean += np.sum(img, axis=(0, 1)).astype(int)
h, w = img.shape[0:-1]
print(h, w, count)
means = mean / (1.0 * h * w * count)
print('b, g, r = ', means)

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航