降维
2020-02-03 04:51
323 查看
之前只听过降维,搜索了一篇博客,感觉后面自己用的时候再细查会好一些。
总结:
- 缺失值比率:如果数据集的缺失值太多,我们可以用这种方法减少变量数。
- 低方差滤波:这个方法可以从数据集中识别和删除常量变量,方差小的变量对目标变量影响不大,所以可以放心删去。
- 高相关滤波:具有高相关性的一对变量会增加数据集中的多重共线性,所以用这种方法删去其中一个是有必要的。
- 随机森林:这是最常用的降维方法之一,它会明确算出数据集中每个特征的重要性。
- 前向特征选择和反向特征消除:这两种方法耗时较久,计算成本也都很高,所以只适用于输入变量较少的数据集。
- 因子分析:这种方法适合数据集中存在高度相关的变量集的情况。
- PCA:这是处理线性数据最广泛使用的技术之一。
- ICA:我们可以用ICA将数据转换为独立的分量,使用更少的分量来描述数据。
- ISOMAP:适合非线性数据处理。
- t-SNE:也适合非线性数据处理,相较上一种方法,这种方法的可视化更直接。
- UMAP:适用于高维数据,与t-SNE相比,这种方法速度更快。
参考
- 点赞
- 收藏
- 分享
- 文章举报
相关文章推荐
- 线性降维-笔记(2)
- 机器学习(周志华)_第十章 降维与度量学习
- 算法马拉松25 二分答案(组合数新高度!!!无敌的降维)
- Python机器学习应用 | 降维——NMF方法及实例
- 机器学习-学习笔记 降维与度量学习
- 特征降维 理论
- ML: 降维算法-LLE
- 降维-线性判别分析(LDA)
- 特征选择的几种方式(降维)
- 机器学习--PCA降维和Lasso算法
- 关于机器学习中数据降维的相关方法
- C语言的二维数组、及多维数组的降维
- 机器学习-python编写主成分分析(PCA)数据降维
- 机器学习之降维
- 降维——局部线性嵌入(LLE)
- 文本挖掘之降维技术之特征选择
- 维度规约(降维)算法在WEKA中应用
- 这款分布式配置中心,会是微服务的降维打击利器吗?
- PCA主成分分析进行数据降维
- PCA:利用PCA(四个主成分的贡献率就才达100%)降维提高测试集辛烷值含量预测准确度并《测试集辛烷值含量预测结果对比》—Jason niu