数据挖掘入门 资料和步骤
2014-06-05 10:14
169 查看
最近不少朋友问到数据挖掘怎么入门,要看什么资料,
就想写一篇文章介绍一下入门步骤和资料,基本上下面的步骤是按顺序的,时间方面个人感觉至少需要小几个月
基础知识:
线性代数
统计学
计算机技术
基本上这些东西不说熟悉,至少也要有点概念,或者是大学有上过对应的课程,不需要特别准备。
推荐书籍和资料:
视频:
Coursera Machine Learning by Andrew Ng 作为入门还是不错的,而且对于初学者而言,视频比较容易理解
中文:
《数据挖掘概念与技术》 这本书我自己也挺喜欢的,适合初学者,涉及的面比较多,不过不够深入 (备选:《数据挖掘导论》)
《数学之美》 介绍了一些挺有意思的东西
英文:
PPT by Tan, Steinbach, Kumar 我这边上传了PDF版本
Pattern Recognition And Machine Learning 很多人推荐的一本书了,就是没有中文,而且难度有点大 (可以慢慢看)
实践:
了解了数据挖掘是怎么回事以后,最好的学习办法就是开始实战,如果公司里面没有类似的项目,那么可以考虑去以下网站参加比赛,重在参与和学习
http://www.kaggle.com/
其他常用资料和网站:
数据 如果你想要下载一些数据,这个网站可能会帮你
cos.name 这边有一些业界案例的ppt下载(年会那些),还有一些基本资料
数据挖掘工作中可能涉及到的技能和工具:
业务知识
数据清理和准备 (例如说sql server)
建模和分析工具 (例如说R, Weka)
算法和方案
Demo (PPT)
大数据处理 (Hadoop/Mahout)
Coding (不管是自己做一点处理还是最终把产品带上线,都需要一些coding的能力)
就想写一篇文章介绍一下入门步骤和资料,基本上下面的步骤是按顺序的,时间方面个人感觉至少需要小几个月
基础知识:
线性代数
统计学
计算机技术
基本上这些东西不说熟悉,至少也要有点概念,或者是大学有上过对应的课程,不需要特别准备。
推荐书籍和资料:
视频:
Coursera Machine Learning by Andrew Ng 作为入门还是不错的,而且对于初学者而言,视频比较容易理解
中文:
《数据挖掘概念与技术》 这本书我自己也挺喜欢的,适合初学者,涉及的面比较多,不过不够深入 (备选:《数据挖掘导论》)
《数学之美》 介绍了一些挺有意思的东西
英文:
PPT by Tan, Steinbach, Kumar 我这边上传了PDF版本
Pattern Recognition And Machine Learning 很多人推荐的一本书了,就是没有中文,而且难度有点大 (可以慢慢看)
实践:
了解了数据挖掘是怎么回事以后,最好的学习办法就是开始实战,如果公司里面没有类似的项目,那么可以考虑去以下网站参加比赛,重在参与和学习
http://www.kaggle.com/
其他常用资料和网站:
数据 如果你想要下载一些数据,这个网站可能会帮你
cos.name 这边有一些业界案例的ppt下载(年会那些),还有一些基本资料
数据挖掘工作中可能涉及到的技能和工具:
业务知识
数据清理和准备 (例如说sql server)
建模和分析工具 (例如说R, Weka)
算法和方案
Demo (PPT)
大数据处理 (Hadoop/Mahout)
Coding (不管是自己做一点处理还是最终把产品带上线,都需要一些coding的能力)
相关文章推荐
- 一名数据挖掘工程师给新人整理的入门资料
- 数据挖掘工程师入门资料
- 数据挖掘技术简介(入门资料再弱弱的提几个问题)
- 【数据挖掘】SQL Server 2008 Analysis Services 入门教程
- SPSS Clementine 数据挖掘入门2(转载)
- SQL Server 2005数据挖掘步骤
- Silverlight入门教程(五): 使用ListBox and DataBinding 组件显示列表数据-教程资料网 www.zhiweinet.com
- SPSS Clementine 数据挖掘入门 (1)
- 写个数据挖掘入门指导
- RapidMiner数据挖掘入门
- SPSS Clementine 数据挖掘入门1(转载)
- 数据挖掘资料汇编
- 数据挖掘资料汇编
- 转载某博主整理的资料:程序员面试、算法研究、编程艺术、红黑树、数据挖掘5大经典原创系列集锦与总结
- 机器学习 & 数据挖掘 —— 资料收集
- 【转载】SPSS Clementine 数据挖掘入门3
- 数据挖掘资料搜集
- 数据挖掘入门书:Roiger&Geatz《数据挖掘教程》清华版2003——从我那Windows Live Spaces转过来,表示决裂
- 关于数据挖掘(协同过滤、关联推荐、聚类分类)一些资料
- 数据挖掘十大经典算法 SVM入门