数据规范化常用方法
2015-05-19 08:46
155 查看
数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。这样去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。其中最典型的就是0-1标准化和Z标准化。下面介绍常见的几种方法:
1.最小-最大规范化
其中max_A为样本数据的最大值,min_A为样本数据的最小值。这种方法有一个缺陷就是当有新数据加入时,可能导致max和min的变化,需要重新定义。
2.z-score规范化
mean_A 为所有样本数据的均值, stand_dev_A为所有样本数据的标准差。
3.小数定标规范化
其中j是使得Max(| |)<1的最下整数。
1.最小-最大规范化
其中max_A为样本数据的最大值,min_A为样本数据的最小值。这种方法有一个缺陷就是当有新数据加入时,可能导致max和min的变化,需要重新定义。
2.z-score规范化
mean_A 为所有样本数据的均值, stand_dev_A为所有样本数据的标准差。
3.小数定标规范化
其中j是使得Max(| |)<1的最下整数。
相关文章推荐
- 数据归一化和两种常用的归一化方法
- 数据归一化和两种常用的归一化方法
- Java中几种常用数据类型之间转换的方法
- 大量数据优化常用方法
- 16种常用的数据分析方法汇总
- 数据挖掘常用方法
- 空间数据挖掘常用方法及举例
- iOS上常用四种数据存取方法
- Python pandas数据分析中常用方法
- 引用 常用的前台数据绑定方法
- Symfony2 数据调用常用方法
- 数据开发常用的几种数据预处理和数据整理方法
- 常用的前台数据绑定方法---------【个人收集】
- 数据归一化和两种常用的归一化方法
- 日常处理double数据常用的方法
- Java——基本数据类型常用的一些方法
- 大量数据优化常用方法
- 多数据之间的连接操作-集中几个.NET常用的方法(不完整)
- 数据归一化和两种常用的归一化方法
- 常用测试设计方法--数据组合覆盖测试设计