您的位置:首页 > 编程语言 > Python开发

Apriori算法及python实现

2015-01-18 21:47 218 查看

1 Apriori介绍

Apriori算法使用频繁项集的先验知识,使用一种称作逐层搜索的迭代方法,k项集用于探索(k+1)项集。首先,通过扫描事务(交易)记录,找出所有的频繁1项集,该集合记做L1,然后利用L1找频繁2项集的集合L2,L2找L3,如此下去,直到不能再找到任何频繁k项集。最后再在所有的频繁集中找出强规则,即产生用户感兴趣的关联规则。

2.算法模拟





3.伪代码





4.python实现

# -*- coding:gb2312 -*-
import sys
import copy

def init_pass(T):
C = {}  #C为字典
for t in T:
for i in t:

if i in C.keys():
C[i] += 1
else:
C[i] = 1
return C

def generate(F):
C = []
k = len(F[0]) + 1
for f1 in F:
for f2 in F:
if f1[k-2] < f2[k-2]:
c = copy.copy(f1)
c.append(f2[k-2])
flag = True
for i in range(0,k-1):
s = copy.copy(c)
s.pop(i)
if s not in F:
flag = False
break
if flag and c not in C:
C.append(c)
return C

def compareList(A,B):
if len(A) <= len(B):
for a in A:
if a not in B:
return False
else:
for b in B:
if b not in A:
return False
return True

def apriori(T,minSupport):
D=[]
C=init_pass(T)
keys=C.keys();#.keys()方法,求出字典中的索引
keys.sort()
D.append(keys)#加入D集中
F=[[]]
for f in D[0]:
if C[f]>=minSupport:
F[0].append([f])
k=1

while F[k-1]!=[]:
D.append(generate(F[k-1]))
F.append([])
for c in D[k]:
count = 0;
for t in T:
if compareList(c,t):
count += 1
if count>= minSupport:
F[k].append(c)
k += 1

U = []
for f in F:
for x in f:
U.append(x)
return U

T = [['A','C','D'],['B','C','E'],['A','B','C','E'],['B','E']]

Z= apriori(T,2)
print Z


4.输出结果



内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: