您的位置:首页 > 编程语言 > Python开发

机器学习实战学习笔记10——Apriori算法

2017-01-13 17:28 316 查看

1.Apriori概述

1.1 Apriori介绍

Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。该算法已经被广泛的应用到消费市场价格分析,入侵检测、电商购物推荐等领域。

1.2 Apriori原理

关联分析是一种在大规模数据集中寻找频繁项集和关联规则的任务。该算法的基本思想是:

(1)首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。

(2)然后由频繁项集产生强关联规则,这些规则必须满足最小支持度和最小可信度。

(3)使用步骤(1)中找到的频繁项集产生期望的规则,产生只包含集合的项的所有规则。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。

1.3 Apriori优缺点

(1)优点:简单、易理解、数据要求低

(2)缺点:I/O负载较大、候选项集过多

(3)应用领域:消费市场价格分析,入侵检测、电商购物推荐

2.使用Apriori算法发现频繁项集

3.从频繁项集中挖掘关联规则

4.Apriori案例:发现国会投票中的模式

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息