机器学习之-使用FP-growth算法来高效发现频繁项集-具体怎么实现及应用
2017-06-23 17:17
417 查看
1、FP-growth算法可以高效地发现频繁项集,但不能用于发现关联规则。
2、FP-growth发现频繁项集的基本过程:
1)构建FP树
2)从FP树种挖掘频繁项集。
3、FP树有其数据结构,一般用该数据结构对数据集进行编码。
4、一棵FP树看上去与计算机科学中的其他树结构相似,但是它通过链接(link)来连接相似元素,被连起来的元素项可以看成一个链表:
一个元素项可以在一棵FP树种出现多次,FP树会存储项集的出现频率,而每个项集会以路径的方式存储在树中。存在相似元素的集合会共享树的一部分,只有当集合之间完全不同时,树才会分叉。树节点上给出集合中的单个元素及其在序列中的出现次数,路径会给出该序列的出现次数。
2、FP-growth发现频繁项集的基本过程:
1)构建FP树
2)从FP树种挖掘频繁项集。
3、FP树有其数据结构,一般用该数据结构对数据集进行编码。
4、一棵FP树看上去与计算机科学中的其他树结构相似,但是它通过链接(link)来连接相似元素,被连起来的元素项可以看成一个链表:
一个元素项可以在一棵FP树种出现多次,FP树会存储项集的出现频率,而每个项集会以路径的方式存储在树中。存在相似元素的集合会共享树的一部分,只有当集合之间完全不同时,树才会分叉。树节点上给出集合中的单个元素及其在序列中的出现次数,路径会给出该序列的出现次数。
相关文章推荐
- 机器学习之使用FP-growth算法来高效发现频繁项集
- 机器学习之使用FP-growth算法来高效发现频繁项集
- 【机器学习实战-python3】使用FP-growth算法来高效 发现频繁项集
- 【机器学习实战】第12章 使用FP-growth算法来高效发现频繁项集
- 机器学习实战 - 读书笔记(12) - 使用FP-growth算法来高效发现频繁项集
- 《机器学习实战》笔记之十二——使用FP-Growth算法来高效发现频繁项集
- 使用FP-growth算法来高效发现频繁项集
- 机器学习之-使用Apriori算法进行关联并分析-具体怎么实现及应用
- 代码注释:机器学习实战第12章 使用FP-growth算法来高效发现频繁项集
- [完]机器学习实战 第十二章 使用FP-growth算法来高效发现频繁项集
- 使用FP-growth算法来高效发现频繁项集
- 使用FP-growth算法来高效发现频繁项集
- 【机器学习实战】第12章 使用FP-growth算法来高效发现频繁项集
- 春节期间小明使用微信收到很多个红包,非常开心。在查看领取红包记录时发现,某个红包金额出现的次数超过了红包总数的一半。请帮小明找到该红包金额。写出具体算法思路和代码实现,要求算法尽可能高效。
- 机器学习实战代码详解(12)使用FP-growth算法来高效发现频繁集
- 机器学习之-支持向量机-具体怎么实现及应用
- py2.7《机器学习实战》使用FP-growth算法高效发现频繁项集
- 春节期间小明使用微信收到很多个红包,非常开心。在查看领取红包记录时发现,某个红包金额出现的次数超过了红包总数的一半。请帮小明找到该红包金额。写出具体算法思路和代码实现,要求算法尽可能高效。
- FP-growth算法,高效发现频繁项集,找出最短时序路径
- 【机器学习实战】第12章 使用 FP-growth 算法来高效发现频繁项集