数据分析学习笔记(教材篇)
2016-08-06 22:46
375 查看
最近在学习数据科学方面的内容,因为是自学,身边也没有靠谱的老司机带着,工作又不相关,所以只能一点点的摸索。
这篇笔记主要用于罗列一些自学过程中使用的教材和在线课程,并会简要的说明一下对应教材的学习心得。
相对来说,在读这本书的时候,如果顺着作者的思路,边读边思考,那么对于数据分析来说,至少会有一个较为直观的印象。不过,要想靠着这本书,达到什么样的程度,很显然是不现实的。
此书主要分为以下几个部分:
分解数据:介绍了基本的数据分析的流程,「确定目标」「分解目标/数据」「评估并形成结论」「形成决策性建议」。
实验:介绍了在目标明确的时候,如何使用「随机选择」「关键因素」两个概念来设立合理的实验组以及控制组,从而达到分析选择不同的「实验参数」对实验结果的影响。
最优化:介绍了如何结合「目标函数」以及多组「制约因素」来得出最优化的结论。
数据图形化:介绍了对于数据分析来说,为什么「简洁」「直接」「可读」的数据图形是数据分析和决策支持的关键。
假设检验:介绍了使用「证伪法」来对「备选答案」进行「排除/筛选」。
贝叶斯统计:介绍了「贝叶斯统计」在数据分析的作用/应用,以及简单使用。
主观概率:介绍了在没有数据形成概率的时候,如何使用「关键干系人主观概率判断」来进行数据分析,以及如何使用「贝叶斯统计」来修正主观概率的结果。
启发法:介绍了如何应用多方的「主观推理逻辑/决策树」的「合理交叉点」,来找到合理的「分析点」,从而展开关键数据的收集和分析/挖掘。
直方图:介绍了直方图的应用场景,以及对于数据的「分布」「差异」「集中」三种趋势如何应用「标准差」进行分析。
回归:介绍了什么是「回归线」,以及如何从「散点图」中如何利用「均值」来生成「回归线」,并说明「回归线」对于「预测」的重要作用。
误差:介绍了为什么使用「回归线预测」的结果「不够准确」,以及如何应用「均方根误差」和「合理分区」来优化「回归线预测」。
关系数据库:介绍了如何将几张有关联关系的数据表格抽取及合并成我们所需要的数据表格,以及为什么使用关系型数据库。
整理数据:介绍了如何从非格式化数据整理到格式化数据的过程(主要是合理分列)。
这篇笔记主要用于罗列一些自学过程中使用的教材和在线课程,并会简要的说明一下对应教材的学习心得。
深入浅出数据分析
Head First系列教程可以说,一直是作为“白板”入门某一领域的首选教材。我在工作之余,用了一周的时间把这本书读完了。相对来说,在读这本书的时候,如果顺着作者的思路,边读边思考,那么对于数据分析来说,至少会有一个较为直观的印象。不过,要想靠着这本书,达到什么样的程度,很显然是不现实的。
此书主要分为以下几个部分:
分解数据:介绍了基本的数据分析的流程,「确定目标」「分解目标/数据」「评估并形成结论」「形成决策性建议」。
实验:介绍了在目标明确的时候,如何使用「随机选择」「关键因素」两个概念来设立合理的实验组以及控制组,从而达到分析选择不同的「实验参数」对实验结果的影响。
最优化:介绍了如何结合「目标函数」以及多组「制约因素」来得出最优化的结论。
数据图形化:介绍了对于数据分析来说,为什么「简洁」「直接」「可读」的数据图形是数据分析和决策支持的关键。
假设检验:介绍了使用「证伪法」来对「备选答案」进行「排除/筛选」。
贝叶斯统计:介绍了「贝叶斯统计」在数据分析的作用/应用,以及简单使用。
主观概率:介绍了在没有数据形成概率的时候,如何使用「关键干系人主观概率判断」来进行数据分析,以及如何使用「贝叶斯统计」来修正主观概率的结果。
启发法:介绍了如何应用多方的「主观推理逻辑/决策树」的「合理交叉点」,来找到合理的「分析点」,从而展开关键数据的收集和分析/挖掘。
直方图:介绍了直方图的应用场景,以及对于数据的「分布」「差异」「集中」三种趋势如何应用「标准差」进行分析。
回归:介绍了什么是「回归线」,以及如何从「散点图」中如何利用「均值」来生成「回归线」,并说明「回归线」对于「预测」的重要作用。
误差:介绍了为什么使用「回归线预测」的结果「不够准确」,以及如何应用「均方根误差」和「合理分区」来优化「回归线预测」。
关系数据库:介绍了如何将几张有关联关系的数据表格抽取及合并成我们所需要的数据表格,以及为什么使用关系型数据库。
整理数据:介绍了如何从非格式化数据整理到格式化数据的过程(主要是合理分列)。
相关文章推荐
- Python & 数据分析学习笔记[第2篇]
- 大数据学习笔记2--hdfs工作原理及源码分析
- 统计学方法与数据分析学习笔记1
- Hadoop学习笔记—20.网站日志分析项目案例(二)数据清洗
- Hadoop数据分析平台学习笔记1
- Excel学习笔记一Excel图表和数据分析
- 【数据分析 R语言实战】学习笔记 第六章 参数估计与R实现(下)
- 【数据分析 R语言实战】学习笔记 第八章 方差分析与R实现
- 【数据分析 R语言实战】学习笔记 第八章 方差分析与R实现
- 深入浅出数据分析 学习笔记
- PHP 开发 APP 接口 学习笔记与总结 - APP 接口实例 [5] 版本设计分析及数据表设计
- 【数据分析 R语言实战】学习笔记 第五章 数据的描述性分析(下)
- 【数据分析 R语言实战】学习笔记 第一章 数据分析导引
- Hadoop学习笔记—20.网站日志分析项目案例(二)数据清洗
- 数据分析,展现与R语言学习笔记(1)
- 数据分析与R语言学习笔记(1)
- 【数据分析 R语言实战】学习笔记 第四章 数据的图形描述
- 【数据分析 R语言实战】学习笔记 第五章 数据的描述性分析(上)
- 【数据结构与算法学习笔记】PART1:算法分析(计算,计算模型,大O记号,算法分析,迭代与递归,动态控制)
- 网络编程学习笔记-网络中数据传输过程的分析