您的位置:首页 > 其它

降维

2020-02-03 04:51 323 查看

之前只听过降维,搜索了一篇博客,感觉后面自己用的时候再细查会好一些。

总结:
  1. 缺失值比率:如果数据集的缺失值太多,我们可以用这种方法减少变量数。
  2. 低方差滤波:这个方法可以从数据集中识别和删除常量变量,方差小的变量对目标变量影响不大,所以可以放心删去。
  3. 高相关滤波:具有高相关性的一对变量会增加数据集中的多重共线性,所以用这种方法删去其中一个是有必要的。
  4. 随机森林:这是最常用的降维方法之一,它会明确算出数据集中每个特征的重要性。
  5. 前向特征选择和反向特征消除:这两种方法耗时较久,计算成本也都很高,所以只适用于输入变量较少的数据集。
  6. 因子分析:这种方法适合数据集中存在高度相关的变量集的情况。
  7. PCA:这是处理线性数据最广泛使用的技术之一。
  8. ICA:我们可以用ICA将数据转换为独立的分量,使用更少的分量来描述数据。
  9. ISOMAP:适合非线性数据处理。
  10. t-SNE:也适合非线性数据处理,相较上一种方法,这种方法的可视化更直接。
  11. UMAP:适用于高维数据,与t-SNE相比,这种方法速度更快。
参考

降维

  • 点赞
  • 收藏
  • 分享
  • 文章举报
梁小娘子 发布了36 篇原创文章 · 获赞 0 · 访问量 532 私信 关注
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: