您的位置:首页 > 其它

数据归一化与z-score标准化

2016-07-06 16:07 691 查看
现实应用中,归一化和标准化都快被叫烂了,很多时候我们都认为二者有相同的意思。粗略上是可以这样认为的,功能是一样的,目的都是消除量纲的影响,以解决指标之间的可比性问题。细细品味,背后还是有些意思的。从几种方法出发。

一.min-max标准化

min-max标准化,也称为极差法,这是对原始数据的一种线性变换,使原始数据映射到[0-1]之间。



所以说,这种标准化我们称之为归一化的时候,本质上是指将原始数据的最大值映射成1,是最大值归一化。

二.z-score标准化

z-score标准化,也称为标准化分数,这种方法根据原始数据的均值和标准差进行标准化,经过处理后的数据符合标准正态分布,即均值为0,标准差为1(根据下面的转化函数很容易证明),转化函数为:



所以说,这种标准化我们称之为归一化的时候,本质上是指将原始数据的标准差映射成1,是标准差归一化。标准差分数可以回答这样一个问题:“给定数据距离其均值多少个标准差”的问题,在均值之上的数据会得到一个正的标准化分数,反之会得到一个负的标准化分数。

reference to: http://www.09dsj.com/index.php/archives/1568 http://blog.csdn.net/dkcgx/article/details/46634471 http://www.cnblogs.com/chaosimple/archive/2013/07/31/3227271.html
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: