数据归一化与z-score标准化
2016-07-06 16:07
691 查看
现实应用中,归一化和标准化都快被叫烂了,很多时候我们都认为二者有相同的意思。粗略上是可以这样认为的,功能是一样的,目的都是消除量纲的影响,以解决指标之间的可比性问题。细细品味,背后还是有些意思的。从几种方法出发。
所以说,这种标准化我们称之为归一化的时候,本质上是指将原始数据的最大值映射成1,是最大值归一化。
所以说,这种标准化我们称之为归一化的时候,本质上是指将原始数据的标准差映射成1,是标准差归一化。标准差分数可以回答这样一个问题:“给定数据距离其均值多少个标准差”的问题,在均值之上的数据会得到一个正的标准化分数,反之会得到一个负的标准化分数。
reference to: http://www.09dsj.com/index.php/archives/1568 http://blog.csdn.net/dkcgx/article/details/46634471 http://www.cnblogs.com/chaosimple/archive/2013/07/31/3227271.html
一.min-max标准化
min-max标准化,也称为极差法,这是对原始数据的一种线性变换,使原始数据映射到[0-1]之间。所以说,这种标准化我们称之为归一化的时候,本质上是指将原始数据的最大值映射成1,是最大值归一化。
二.z-score标准化
z-score标准化,也称为标准化分数,这种方法根据原始数据的均值和标准差进行标准化,经过处理后的数据符合标准正态分布,即均值为0,标准差为1(根据下面的转化函数很容易证明),转化函数为:所以说,这种标准化我们称之为归一化的时候,本质上是指将原始数据的标准差映射成1,是标准差归一化。标准差分数可以回答这样一个问题:“给定数据距离其均值多少个标准差”的问题,在均值之上的数据会得到一个正的标准化分数,反之会得到一个负的标准化分数。
reference to: http://www.09dsj.com/index.php/archives/1568 http://blog.csdn.net/dkcgx/article/details/46634471 http://www.cnblogs.com/chaosimple/archive/2013/07/31/3227271.html
相关文章推荐
- 信息系统开发与利用 领域分析部分@wangshushu
- SQL的Join语法
- 学习笔记:树状数组
- OleView.exe:查看机器上的COM 组件。
- 找东西
- PSR 规范 (精简版)
- 【spring】BeanFactoryPostProcessor简介
- 为什么不能往Android的Application对象里存储数据
- Ffmpeg视音频编解码零基础学习
- hibernate 4.x org.hibernate.LazyInitializationException异常解决
- Android 动画
- JAVA反射系列之Field,java.lang.reflect.Field使用获取方法。
- mongodb入门学习小记
- Unity3D shader描边效果源码
- CSS Overflow属性详解
- 二叉树二叉链表存储结构《头文件:#include "BiTreeHead.h"》
- 证件识别接口PHP调用示例
- JavaScript 字符串方法大全
- Oracle中*和其他字段组合查询的说明
- 实习杂记(28):SurfaceView+ListView+MediaPlayer滑动时候灰色覆盖等问题