您的位置：首页 > 其它

数据挖掘回顾十二：关联规则挖掘之 FP-Growth 算法

2015-04-13 17:39 471 查看

1，鉴于Apriori算法需要反复地扫描事务数据库，产生频繁项集候选的数量巨大，并且在计算支持度计数时工作量巨大。

2，为了避免在产生候选时巨大的工作量，J.Han(韩家炜),
J.Pei(裴健),and
Y.Yin 提出了频繁模式增长算法，即本文中要说的FP-Growth 算法。此算法最主要的有点就是避免了产生候选频繁集。

3，FP-Growth
算法利用了如下的性质：局部频繁项由短模式生长出长模式，即先求短的频繁项，然后由短的频繁项衍生出长的频繁项。

4，FP-Growth 算法主要的步骤就是构造一棵 FP 树。如下图：

5，FP 树的优点如下：

6，条件模式基和条件FP 树：

7，FP-Growth 算法的思想和方法：

8，FP-Growth 算法 PK Apriori 算法：

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航