数据挖掘进阶之关联规则挖掘FP-Growth算法
2015-11-16 15:23
232 查看
数据挖掘进阶之关联规则挖掘FP-Growth算法
绪
近期在写论文方面涉及到了数据挖掘,需要通过数据挖掘方法实现软件与用户间交互模式的获取、分析与分类研究。主要涉及到关联规则与序列模式挖掘两块。关联规则挖掘使用基于有趣性度量标准的FP-Growth算法,序列模式挖掘使用基于有趣性度量标准的GSP算法。若想实现以上优化算法,首先必须了解其基本算法,并编程实现。关键点还是在于理解算法思想,只有懂得了算法思想,对其进行优化操作易如反掌。源代码方面,其实是自己从网络中查找并进行阅读,在理解的基础上进行优化。下面首先介绍一下基本的FP-Growth算法的实现过程:原理介绍
基本思路:不断地迭代FP-tree的构造和投影过程。对于每个频繁项,构造它的条件投影数据库和投影FP-tree。对每个新构建的FP-tree重复这个过程,直到构造的新FP-tree为空,或者只包含一条路径。当构造的FP-tree为空时,其前缀即为频繁模式;当只包含一条路径时,通过枚举所有可能组合并与此树的前缀连接即可得到频繁模式。
算法实现
本算法采用Java实现,主要根据序列模式的情况,算法共有2个类:MyFptree类:算法核心类。FP-Growth算法的核心操作:建树和挖掘频繁项操作都在这里实现。在使用该算法时,也是需要通过使用该类的方法来实现GSP算法。
TreeNode2类:元素类。在本算法实现中,元素类中含有元素属性集,在使用时也是使用该属性。另外,在该类中还封装了对元素的操作以及一些其他操作。
有关源码请点击下载。
有关序列模式挖掘的GSP算法,详见鄙人博客中“数据挖掘进阶之序列模式挖掘GSP算法”一文。相关文章推荐
- Cannot add header view to list setAdapter has already been called
- Git SSH Key 生成步骤
- 多线程学习--通过单例模式来实现多个线程中的数据共享
- 数据挖掘进阶之关联规则挖掘FP-Growth算法
- 使用监听的方法实时检测textView输入内容
- JavaScript基础——函数表达式
- 【CUBE】Oracle分组函数之CUBE魅力
- BAT解密:互联网技术发展之路(3)- 牛逼公司的技术架构都是这个范
- CGAffineTransformMakeRotation 实现旋转
- PHP、JS、Python,数据库 获取今天是星期几了?[开发篇]
- java中的快捷键
- Alpha版本测试文档
- oracle查看权限
- __asm__ __volatile__内嵌汇编用法
- 资源文件信息工具类--ResourceInfoCalculator
- iOS 设置Button的 初始选中状态
- win7、8、10(64)操作系统安装oracle11g(64)后,在登录时,database显示为空。
- css3太极图效果+自动旋转
- TreeSet中自定义Comparator实现降序
- maven(6)各个生命周期阶段以及与配置文件关系