数据挖掘学习笔记(一)
2010-12-16 10:04
323 查看
最近通过网上的、书上的资料,初步了解了数据挖掘的一些概念,现在整理一下以便日后学习。
一、定义(Data Mining)
1、数据挖掘:一种通过数理模式来分析企业内存储的大量资料,以找出不同客户和市场划分,分析出消费者喜好和行为的方法。也就是从存放在数据库、数据仓库和其他信息库中的数据中获取有效的、有潜在价值的、最终可被理解的模式的非平凡过程。
如:像我在当当网买书时,当当网的系统会根据我近期所购买的书的记录进行分析,然后在我下次登录当当网时,该系统会自行向我推荐其他类似的书籍。这个过程我想应该是用到数据挖掘的理论和方法。
2、数据挖掘在人工智能领域(AI)习惯上被称为数据中的知识发现,因此有人把数据挖掘视为数据库中知识发现过程的一个基本步骤。
知识发现过程分为3个阶段:1】数据准备;2】数据挖掘;3】结果表达和解释。
3、数据挖掘的起源
数据挖掘来自这些领域的思想:1】来自统计学的抽样、估计和假设检验;2】人工智能、模式识别、机器学习的搜索算法、建模理论和学习理论;3】其他领域的思想:最优化、进化计算、信号处理、可视化和信息检索。
4、数据挖掘的用途:
1】分类
2】估值
3】预言
4】相关性分组或关联规则
5】聚集
6】描述和可视化
7】复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等)
5、数据挖掘的第一步是描述数据、计算统计变量(如均值、方差等),再用图表或图片的形式直观地演示出来,就可以看出一些变量之间的相关性。因此为了挖掘工作提供足够的证据,必须为历史数据建立一个预言模型,然后用另外一些数据对这个模型进行测试,最后验证这个模型。
一、定义(Data Mining)
1、数据挖掘:一种通过数理模式来分析企业内存储的大量资料,以找出不同客户和市场划分,分析出消费者喜好和行为的方法。也就是从存放在数据库、数据仓库和其他信息库中的数据中获取有效的、有潜在价值的、最终可被理解的模式的非平凡过程。
如:像我在当当网买书时,当当网的系统会根据我近期所购买的书的记录进行分析,然后在我下次登录当当网时,该系统会自行向我推荐其他类似的书籍。这个过程我想应该是用到数据挖掘的理论和方法。
2、数据挖掘在人工智能领域(AI)习惯上被称为数据中的知识发现,因此有人把数据挖掘视为数据库中知识发现过程的一个基本步骤。
知识发现过程分为3个阶段:1】数据准备;2】数据挖掘;3】结果表达和解释。
3、数据挖掘的起源
数据挖掘来自这些领域的思想:1】来自统计学的抽样、估计和假设检验;2】人工智能、模式识别、机器学习的搜索算法、建模理论和学习理论;3】其他领域的思想:最优化、进化计算、信号处理、可视化和信息检索。
4、数据挖掘的用途:
1】分类
2】估值
3】预言
4】相关性分组或关联规则
5】聚集
6】描述和可视化
7】复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等)
5、数据挖掘的第一步是描述数据、计算统计变量(如均值、方差等),再用图表或图片的形式直观地演示出来,就可以看出一些变量之间的相关性。因此为了挖掘工作提供足够的证据,必须为历史数据建立一个预言模型,然后用另外一些数据对这个模型进行测试,最后验证这个模型。
相关文章推荐
- R语言与数据挖掘学习笔记(常用的包)
- Python数据挖掘学习笔记】九.回归模型LinearRegression简单分析氧化物数据
- 数据挖掘学习笔记之人工神经网络(二)
- SQL SERVER 2005 数据挖掘与商业智能完全解决方案---学习笔记(五)
- SQL SERVER 2005 数据挖掘与商业智能完全解决方案---学习笔记(四)
- 大数据学习笔记之三十八 数据挖掘算法之聚类分析
- 数据挖掘学习笔记(4)
- R语言与数据挖掘学习笔记(常用的包)
- 数据挖掘学习笔记--系统聚类法和K均值聚类法
- 数据挖掘学习笔记之人工神经网络(二)
- 数据挖掘学习笔记一:绪论
- 数据挖掘学习笔记三
- 数据挖掘学习笔记四
- 数据挖掘学习笔记-决策树算法浅析(含Java实现)
- 【数据挖掘学习笔记】——拉格朗日法填充缺失值
- python数据分析与挖掘学习笔记(1)-基础及准备
- 数据挖掘学习笔记:挖掘频繁模式、关联和相关[ZZ]
- 数据挖掘学习笔记(一)
- web数据挖掘(学习笔记)-观点挖掘
- 数据挖掘学习笔记1——系统聚类与K-均值聚类