机器学习实战学习笔记10——Apriori算法
2017-01-13 17:28
316 查看
1.Apriori概述
1.1 Apriori介绍
Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。该算法已经被广泛的应用到消费市场价格分析,入侵检测、电商购物推荐等领域。1.2 Apriori原理
关联分析是一种在大规模数据集中寻找频繁项集和关联规则的任务。该算法的基本思想是:(1)首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。
(2)然后由频繁项集产生强关联规则,这些规则必须满足最小支持度和最小可信度。
(3)使用步骤(1)中找到的频繁项集产生期望的规则,产生只包含集合的项的所有规则。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。
1.3 Apriori优缺点
(1)优点:简单、易理解、数据要求低(2)缺点:I/O负载较大、候选项集过多
(3)应用领域:消费市场价格分析,入侵检测、电商购物推荐
2.使用Apriori算法发现频繁项集
3.从频繁项集中挖掘关联规则
4.Apriori案例:发现国会投票中的模式
相关文章推荐
- 机器学习实战笔记9(Apriori算法)
- 机器学习实战--笔记9(Apriori算法)
- 机器学习实战笔记7(Adaboost)
- iOS学习笔记10(6)—GCD实战2:资源竞争
- 机器学习实战笔记——KNN算法
- Python 学习笔记(Machine Learning In Action)K-近邻算法(KNN)机器学习实战
- 机器学习实战笔记之非均衡分类问题
- 机器学习实战笔记(1)机器学习基础
- 机器学习实战笔记 k-近邻算法
- 机器学习实战-学习笔记-第十三章
- 机器学习实战学习笔记2——决策树算法
- 机器学习实战笔记5(logistic回归)
- 机器学习实战——第十一/十二章:关联规则挖掘Apriori算法和FP-growth算法
- 机器学习实战笔记之二(k-近邻算法)
- 机器学习实战笔记1
- 机器学习实战学习笔记 一 k-近邻算法
- 机器学习实战笔记二 决策树
- 机器学习实战笔记之三(决策树)
- 机器学习实战笔记(四):Logist线性回归算法的Python实现
- 机器学习实战笔记(三):决策树算法的Python实现