您的位置：首页 > 其它

数据归一化

2016-05-31 00:39 323 查看

数据归一化，又叫数据规范化或数据标准化，即把属性数据按比例缩放，使之落入一个特定的小区间，如[-1.0, 1.0]或[0.0, 1.0]。

规范化数据试图赋予所有属性相等的权重。对于涉及神经网络的分类算法或基于距离度量的分类（如最近邻分类）和聚类，规范化特别有用。如果使用神经网络后向传播算法进行分类挖掘，对训练元组中每个属性的输入值规范化有助于加快学习速度。对于基于距离的方法，规范化可以帮助防止具有较大初始值域的属性（如income）与具有较小初始值域的属性（如二元属性）相比权重过大。在没有数据的先验知识时，规范化也是有用的。

常用的数据规范化方法有以下几种：

1. 最小-最大值归一化