数据挖掘算法学习(四)PCA算法
2016-06-15 00:00
330 查看
转载请附上链接http://blog.csdn.net/iemyxie/article/details/38236647
算法简介
主成分分析(PrincipalComponentAnalysis,简称PCA)是一种常用的基于变量协方差矩阵对信息进行处理、压缩和抽提的有效方法。主要用于对特征进行降维。
算法假设
数据的概率分布满足高斯分布或是指数型的概率分布。方差高的向量视为主元。
算法输入
包含n条记录的数据集
算法输出
降维或压缩后的数据集
算法思想
•
1.
计算所有样本的均值
m
和
协方差
矩阵
S
;
•
2.
计算
S
的特征值
,
并
由
大到小排序;
•
3.
选择前
n'
个特征值对应的特征矢量作成一个变换矩阵
E=[e1,e2, …, en’]
;
•
4.
最后,对于之前每一个
n
维的特征矢量
x
可以转换为
n’
维的新特征
矢量
y=transpose(E)(x-m)
weka运行结果
以weather.nominal.arff为例运行结果部分截图如下:
算法应用
人脸识别
图像压缩
信号去噪
转载请附上链接
http://blog.csdn.net/iemyxie/article/details/38236647
算法简介
主成分分析(PrincipalComponentAnalysis,简称PCA)是一种常用的基于变量协方差矩阵对信息进行处理、压缩和抽提的有效方法。主要用于对特征进行降维。
算法假设
数据的概率分布满足高斯分布或是指数型的概率分布。方差高的向量视为主元。
算法输入
包含n条记录的数据集
算法输出
降维或压缩后的数据集
算法思想
•
1.
计算所有样本的均值
m
和
协方差
矩阵
S
;
•
2.
计算
S
的特征值
,
并
由
大到小排序;
•
3.
选择前
n'
个特征值对应的特征矢量作成一个变换矩阵
E=[e1,e2, …, en’]
;
•
4.
最后,对于之前每一个
n
维的特征矢量
x
可以转换为
n’
维的新特征
矢量
y=transpose(E)(x-m)
weka运行结果
以weather.nominal.arff为例运行结果部分截图如下:
算法应用
人脸识别
图像压缩
信号去噪
转载请附上链接
http://blog.csdn.net/iemyxie/article/details/38236647
相关文章推荐
- apt-get常用命令备份
- Shell脚本之awk篇(基础)
- 使用xmlDB实例
- [Deep Learning]学习记录1-Python实现神经网络BP算法
- Hbase自己理解
- 教授机器视物和理解——Facebook人工智能研究进展
- Eclipse下编写C++程序——CDT环境搭建
- 文本自动分类
- 利用word分词来计算文本相似度
- 什么是词干化处理
- 卷积神经网络在自然语言处理的应用
- word2vec实践(一):预备知识
- 词向量和语言模型
- Java内存泄露与溢出的区别
- [EN] TensorFlow Examples
- MapReduce:详解Shuffle过程
- 自然语言处理中的Attention Model:是什么及为什么
- myeclipse+maven实现多模块项目struts+spring+mybatis
- 短文本聚类方法
- 聚类算法-canopy