Python & 数据分析学习笔记[第2篇]
2014-07-17 11:24
633 查看
资料:Python for Data Analysis.pdf [英文版]
Chapter1 Preliminaries 热身章节
使用Python 做数据分析需要的软件包:NumPy, IPython, matplotlib, and pandas (其中,IPython 是开发工具,NumPy, pandas 是数据结构和算法部分,matplotlib 顾名思义是可视化工具)。
[darkni] 这一套软件,包括Python 语言,IPython开发工具,以及NumPy 等各种支持库构成了 Python Ecosystem, 可以用于解决数据分析领域各种问题。
这一章介绍了这些软件包,还有安装方法。
Chapter2 Introductory Examples 热身章节
介绍了三个例子:1.usa.gov data, MovieLens 1M Data Set , 和 US Baby Names 1880-2010 ,通过实例的方式分享如何使用Python Ecosystem 解决现实的数据分析问题。
[darkni] 学习方法:随着例子,一个一个地练习。
思路:
第一步:理解现实世界中的数据
—— 获取数据,理解数据格式、涵义。也可能需要和数据库打交道。
第二步:准备数据
—— ETL 的过程,工作量大、繁、碎
第三步:转换数据
—— 通过统计、分组等方法,将原始数据转换为用于数据分析的新的数据集。依旧是 ETL 的过程。
第四步:建模和计算
—— 开始真正的数据分析之旅。
第五步:可视化
—— 以图表、结论等形式展示数据分析的结果。
[darkni] 全部练习后,再补充一个介绍博客。
Chapter3 IPython: An Interactive Computing and Development Environment
—— 鸡肋章节,介绍 IPython 的一些用法。内容通用,与数据分析的本质没什么关联。
Chapter4 NumPy Basics: Arrays and Vectorized Computation
—— 介绍 NumPy 软件包的用法,继续鸡肋。
NumPy 最关键的是 ndarray 即多维数组。数据分析的基础是数据,那么数据在Python 里从计算机的视角(数据结构)以 ndarray 进行操作。
这一章就是介绍如何操作 ndarray 和普通的数组(list)。
对 Matlab 熟悉的童鞋,ndarray 和矩阵概念上是一致的,操作上需要注意的 ndarray 从 0 开始索引,还有范围访问是: [ ) 的方式,左闭区间,右开区间。
[待续...]
Chapter1 Preliminaries 热身章节
使用Python 做数据分析需要的软件包:NumPy, IPython, matplotlib, and pandas (其中,IPython 是开发工具,NumPy, pandas 是数据结构和算法部分,matplotlib 顾名思义是可视化工具)。
[darkni] 这一套软件,包括Python 语言,IPython开发工具,以及NumPy 等各种支持库构成了 Python Ecosystem, 可以用于解决数据分析领域各种问题。
这一章介绍了这些软件包,还有安装方法。
Chapter2 Introductory Examples 热身章节
介绍了三个例子:1.usa.gov data, MovieLens 1M Data Set , 和 US Baby Names 1880-2010 ,通过实例的方式分享如何使用Python Ecosystem 解决现实的数据分析问题。
[darkni] 学习方法:随着例子,一个一个地练习。
思路:
第一步:理解现实世界中的数据
—— 获取数据,理解数据格式、涵义。也可能需要和数据库打交道。
第二步:准备数据
—— ETL 的过程,工作量大、繁、碎
第三步:转换数据
—— 通过统计、分组等方法,将原始数据转换为用于数据分析的新的数据集。依旧是 ETL 的过程。
第四步:建模和计算
—— 开始真正的数据分析之旅。
第五步:可视化
—— 以图表、结论等形式展示数据分析的结果。
[darkni] 全部练习后,再补充一个介绍博客。
Chapter3 IPython: An Interactive Computing and Development Environment
—— 鸡肋章节,介绍 IPython 的一些用法。内容通用,与数据分析的本质没什么关联。
Chapter4 NumPy Basics: Arrays and Vectorized Computation
—— 介绍 NumPy 软件包的用法,继续鸡肋。
NumPy 最关键的是 ndarray 即多维数组。数据分析的基础是数据,那么数据在Python 里从计算机的视角(数据结构)以 ndarray 进行操作。
这一章就是介绍如何操作 ndarray 和普通的数组(list)。
对 Matlab 熟悉的童鞋,ndarray 和矩阵概念上是一致的,操作上需要注意的 ndarray 从 0 开始索引,还有范围访问是: [ ) 的方式,左闭区间,右开区间。
[待续...]
相关文章推荐
- Python & 数据分析学习笔记[第1篇]
- python数据分析与挖掘学习笔记(3)_小说文本数据挖掘part1
- python数据分析与挖掘学习笔记(6)-电商网站数据分析及商品自动推荐实战与关联规则算法
- Python玩转数据分析学习笔记-03数据获取
- Python玩转数据分析学习笔记-01基础
- 资源&教程 | Python数据分析,详细的学习路径
- python数据分析与挖掘学习笔记(4)-垃圾邮件自动识别
- Python学习笔记(0)——编程0基础数据分析进阶之路
- Python 爬虫学习笔记三:多页内容爬取&内容分析及格式化
- 利用Pythonj进行数据分析学习笔记——第五章 pandas入门
- python数据分析与挖掘学习笔记(6)-电商网站数据分析及商品自动推荐实战与关联规则算法
- 利用python进行数据分析(学习笔记)
- python数据分析入门学习笔记
- python数据分析与挖掘学习笔记(7)-交通路标自动识别实战与神经网络算法
- 转载]利用Python进行数据分析——绘图和可视化 xticks-学习笔记
- python数据分析与挖掘学习笔记(1)-基础及准备
- python数据分析学习笔记三
- python 数据分析学习笔记 (第三章)
- python数据分析与挖掘学习笔记(5)-公司客户价值判断分析与聚类算法
- 2. Python脚本学习实战笔记二 分析提取数据成图