机器学习中的归一化
2017-01-19 18:09
176 查看
归一化化定义:我是这样认为的,归一化化就是要把你需要处理的数据经过处理后(通过某种算法)限制在你需要的一定范围内。首先归一化是为了后面数据处理的方便,其次是保正程序运行时收敛加快。
数据归一化的目的是为了把不同来源的数据统一到一个参考系下,这样比较起来才有意义。
数据归一化,很重要。比如在用SVM分类时,数据尺度不统一对分类准确率影响很大。归一化一般将数据规整到一个小范围之间,如[0,1]或[-1,1],具体的方法一范求和或二范求模归一化等。
数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。以下是两种常用的归一化方法:
其中max为样本数据的最大值,min为样本数据的最小值。这种方法有个缺陷就是当有新数据加入时,可能导致max和min的变化,需要重新定义。
其中
为所有样本数据的均值,
为所有样本数据的标准差。
数据归一化的目的是为了把不同来源的数据统一到一个参考系下,这样比较起来才有意义。
数据归一化,很重要。比如在用SVM分类时,数据尺度不统一对分类准确率影响很大。归一化一般将数据规整到一个小范围之间,如[0,1]或[-1,1],具体的方法一范求和或二范求模归一化等。
数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。以下是两种常用的归一化方法:
一、min-max标准化(Min-Max Normalization)
也称为离差标准化,是对原始数据的线性变换,使结果值映射到[0 - 1]之间。转换函数如下:其中max为样本数据的最大值,min为样本数据的最小值。这种方法有个缺陷就是当有新数据加入时,可能导致max和min的变化,需要重新定义。
二、Z-score标准化方法
这种方法给予原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。经过处理的数据符合标准正态分布,即均值为0,标准差为1,转化函数为:其中
为所有样本数据的均值,
为所有样本数据的标准差。
相关文章推荐
- 机器学习之归一化
- 机器学习--python归一化特征值
- 机器学习-数据归一化方法
- 为什么一些机器学习模型需要对数据进行归一化?
- 机器学习中数据归一化和两种常用的归一化方法
- 【机器学习】归一化特征值的处理
- 机器学习--特征缩放/均值归一化
- 机器学习中训练集和测试集归一化-matlab
- 为什么一些机器学习模型需要对数据进行归一化?
- 为什么一些机器学习模型需要对数据进行归一化?
- 机器学习-数据归一化方法
- 机器学习中的标准化/归一化
- 机器学习--归一化
- 【机器学习笔记】数据归一化
- 为什么一些机器学习模型需要对数据进行归一化?
- 机器学习之——归一化
- 机器学习之——归一化线性回归与归一化逻辑回归
- 机器学习——标准化/归一化的目的和作用
- 机器学习中特征归一化的方法
- 机器学习_标准化和归一化