数据挖掘十大经典算法(4) The Apriori algorithm
2011-09-27 14:48
369 查看
Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里,所有支持度大于最小支持度的项集称为频繁项集,简称频集。
Apriori演算法所使用的前置统计量包括了:
最大规则物件数:规则中物件组所包含的最大物件数量
最小支援:规则中物件或是物件组必顸符合的最低案例数
最小信心水准:计算规则所必须符合的最低信心水准门槛
该算法的基本思想是:首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一 样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则,产生只包含集合的项的所有规则,其中 每一条规则的右部只有一项,这里采用的是中规则的定义。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集, 使用了递推的方法。
可能产生大量的候选集,以及可能需要重复扫描数据库,是Apriori算法的两大缺点。
Apriori演算法所使用的前置统计量包括了:
最大规则物件数:规则中物件组所包含的最大物件数量
最小支援:规则中物件或是物件组必顸符合的最低案例数
最小信心水准:计算规则所必须符合的最低信心水准门槛
该算法的基本思想是:首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一 样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则,产生只包含集合的项的所有规则,其中 每一条规则的右部只有一项,这里采用的是中规则的定义。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集, 使用了递推的方法。
可能产生大量的候选集,以及可能需要重复扫描数据库,是Apriori算法的两大缺点。
相关文章推荐
- 转载 数据挖掘十大经典算法(4) The Apriori algorithm
- 数据挖掘十大经典算法(4) The Apriori algorithm .
- 数据挖掘十大经典算法(4) The Apriori algorithm
- 数据挖掘十大经典算法(4) The Apriori algorithm
- 数据挖掘十大经典算法(4) The Apriori algorithm
- 数据挖掘十大经典算法(四) The Apriori algorithm
- 数据挖掘十大经典算法(4) The Apriori algorithm
- 数据挖掘十大经典算法(4) The Apriori algorithm
- 数据挖掘十大经典算法(4)Apriori
- 数据挖掘十大经典算法(7) AdaBoost
- 数据挖掘十大经典算法(9) 朴素贝叶斯分类器 Naive Bayes
- 数据挖掘十大经典算法(1) C4.5
- 数据挖掘十大经典算法(3) Support vector machines
- 数据挖掘十大经典算法(7) AdaBoost
- 数据挖掘十大经典算法
- 数据挖掘十大经典算法 <一> :Adaboost算法
- 转载 数据挖掘十大经典算法(2) The k-means algorithm
- 十大经典数据挖掘算法之C4.5算法
- 初探数据挖掘中的十大经典算法
- 数据挖掘十大经典算法