您的位置:首页 > 其它

数据规范化常用方法

2015-05-19 08:46 155 查看
   数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。这样去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。其中最典型的就是0-1标准化和Z标准化。下面介绍常见的几种方法:

  

1.最小-最大规范化
  其中max_A为样本数据的最大值,min_A为样本数据的最小值。这种方法有一个缺陷就是当有新数据加入时,可能导致max和min的变化,需要重新定义。

 


2.z-score规范化

 



   mean_A 为所有样本数据的均值, stand_dev_A为所有样本数据的标准差。

3.小数定标规范化
           


  其中j是使得Max(|  |)<1的最下整数。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息