您的位置:首页 > 其它

1. 数据预处理-数据归一化和数据规范化

2017-09-11 19:43 537 查看

1. 数据归一化

1.1. 作用

把数据映射到[0,1]的区间中

把有量纲形式变成无量纲形式

1.2. 算法

1.2.1. 最小-最大归一化

Y=X−XminXmax−Xmin

把X的值映射到[0, 1] 的区域中,因为必有X < Xmax,所以分子(X - Xmin) < 分母(Xmax - Xmin),所以Y在[0,1]之间

1.2.2. 对数函数归一化

Y=log10(X)

1.2.3. 反余切函数归一化

Y=arctan(x∗2π)

2. 数据规范化

1.1. 作用

使数据按照一定的比例进行缩放,通过缩放,使得数据映射到特定的空间里面。

1.2. 算法

1.2.1. 最小-最大规范化

Y=X−XminXmax−Xmin∗(Xnewmax−Xnewmin)+Xnewmin

把X的值映射到[Xnewmin, Xnewmax] 的区域中。

1.2.2. Z分数(z-score)规范化(零均值规范化)

Y=X−μσ

这种方法最大的优势在于,不需要知道数据集的最大值,最小值。离群点对结果影响较低。

1.2.3. Sigmoid函数

Y=11+e−x

Sigmoid函数是一个具有S形曲线的函数,当数据趋向于正无穷和负无穷的时候,映射出来的值就会无限趋向于1和0,

1.2.4. 小数定标规范化

Y=X10n(n为使得Ymax<1的最小整数)

通过移动小数点的位置,进行规范化

1.2.5. 模糊量化规范化

Y=12+12∗sin[πXmax−Xmin∗(X−Xmax−Xmin2)]
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息