你知道吗?常用的数据挖掘分析工具Mahout和MLlib
2017-07-20 10:38
465 查看
传统的数据挖掘软件
专用挖掘工具、通用挖掘工具
–QUEST
–MineSet
–DBMiner
–Intelligent Miner
–SAS Enterprise Miner
–SPSS Modeler
大数据挖掘工具Mahout
Mahout 是Apache Software Foundation (ASF) 开发的一个开源项目
–目标是创建一些可伸缩的数据挖掘算法,供开发人员在Apache 在许可下免费使用。
–Mahout 包含许多实现,包括集群、分类、CF 和进化程序。
–此外,通过使用Apache Hadoop库,Mahout 可以有效地扩展到云中。
Mahout的意思是大象的饲养者及驱赶者。
–Mahout 这个名称来源于Hadoop徽标上的大象
–Mahout利用Hadoop来实现可伸缩性和容错性。
Mahout与Hadoop家族其他主要成员关系
大数据挖掘工具MLlib
MLlib是构建在Spark上的分布式数据挖掘工具,利用Spark的内存计算,和适合迭代型计算的优势,使性能大幅度提升。
•同时Spark算子丰富的表现力,让大规模数据挖掘的算法开发不再复杂
•MLlib作为Spark其中一部分,目前已经完全包含入Spark中。
数据挖掘框架(Spark MLlib)
•MLlib是Spark对常用的数据挖掘算法的实现库,同时包括相关的测试和数据生成器:
•MLlib目前支持多种常见的数据挖掘问题:
–二元分类、回归、聚类以及协同过滤,同时也包括一个底层的梯度下降优化基础算法。
专用挖掘工具、通用挖掘工具
–QUEST
–MineSet
–DBMiner
–Intelligent Miner
–SAS Enterprise Miner
–SPSS Modeler
大数据挖掘工具Mahout
Mahout 是Apache Software Foundation (ASF) 开发的一个开源项目
–目标是创建一些可伸缩的数据挖掘算法,供开发人员在Apache 在许可下免费使用。
–Mahout 包含许多实现,包括集群、分类、CF 和进化程序。
–此外,通过使用Apache Hadoop库,Mahout 可以有效地扩展到云中。
Mahout的意思是大象的饲养者及驱赶者。
–Mahout 这个名称来源于Hadoop徽标上的大象
–Mahout利用Hadoop来实现可伸缩性和容错性。
Mahout与Hadoop家族其他主要成员关系
大数据挖掘工具MLlib
MLlib是构建在Spark上的分布式数据挖掘工具,利用Spark的内存计算,和适合迭代型计算的优势,使性能大幅度提升。
•同时Spark算子丰富的表现力,让大规模数据挖掘的算法开发不再复杂
•MLlib作为Spark其中一部分,目前已经完全包含入Spark中。
数据挖掘框架(Spark MLlib)
•MLlib是Spark对常用的数据挖掘算法的实现库,同时包括相关的测试和数据生成器:
•MLlib目前支持多种常见的数据挖掘问题:
–二元分类、回归、聚类以及协同过滤,同时也包括一个底层的梯度下降优化基础算法。
相关文章推荐
- 你知道吗?常用的数据挖掘分析工具Mahout和MLlib
- 常用数据分析,数据挖掘工具函数
- 数据分析和挖掘工具
- 数据挖掘的分析软件和展示工具
- Python 和 R 数据分析/挖掘工具互查
- Python 和 R 数据分析/挖掘工具互查
- Python常用的数据分析工具入门: numpy和pandas入门
- 数据挖掘工具R软件与Weka的比较分析
- [app运营]App运营者必须知道的30款数据分析工具
- 常用数据分析方法及分析工具,比如:EXCEL、SAS、SPSS
- web商业智能BI,深入分析访问数据,从访问数据中挖掘财富(常用指标)
- 数据挖掘RapidMiner工具使用----决策树案例分析
- Python 和 R 数据分析/挖掘工具互查
- mahout运行测试与数据挖掘算法之聚类分析(一)kmeans算法解析
- 大数据分析- 基于Hadoop/Mahout的大数据挖掘
- 常用网站数据分析工具解析
- 数据挖掘工具分析北京房价 (一) 数据爬取采集(转)
- mahout运行测试与数据挖掘算法之聚类分析(一)kmeans算法解析
- 数据挖掘常用工具
- 大数据分析挖掘-基于Hadoop/Mahout/MLlib的大数据挖掘