Data Analysis学习笔记 --- Python数据分析入门知识
2016-12-29 15:45
941 查看
首先上两张主线图:
前言:各种和数据分析相关python库的介绍(前言1~4摘抄自《利用python进行数据分析》) 1.Numpy: Numpy是python科学计算的基础包,它提供以下功能(不限于此): (1)快速高效的多维数组对象naarray (2)用于对数组执行元素级计算以及直接对数组执行数学运算的函数 (3)用于读写硬盘上基于数组的数据集的工具 (4)线性代数运算、傅里叶变换,以及随机数生成 (5)用于将C、C++、Fortran代码集成到python的工具 2.pandas pandas提供了使我们能够快速便捷地处理结构化数据的大量数据结构和函数。pandas兼具Numpy高性能的数组计算功能以及电子表格和关系型数据(如SQL)灵活的数据处理能力。它提供了复杂精细的索引功能,以便更为便捷地完成重塑、切片和切块、聚合以及选取数据子集等操作。 对于金融行业的用户,pandas提供了大量适用于金融数据的高性能时间序列功能和工具。 DataFrame是pandas的一个对象,它是一个面向列的二维表结构,且含有行标和列标。 ps.引用一段网上的话说明DataFrame的强大之处: Excel 2007及其以后的版本的最大行数是1048576,最大列数是16384,超过这个规模的数据Excel就会弹出个框框“此文本包含多行文本,无法放置在一个工作表中”。Pandas处理上千万的数据是易如反掌的事情,同时随后我们也将看到它比SQL有更强的表达能力,可以做很多复杂的操作,要写的code也更少。 说了一大堆它的好处,要实际感触还得动手码代码。 3.matplotlib matplotlib是最流行的用于绘制数据图表的python库。 4.Scipy Scipy是一组专门解决科学计算中各种标准问题域的包的集合。
5.statsmodels: 各种模型
6.scikit-learn: machine learning模块
相关文章推荐
- 利用Pythonj进行数据分析学习笔记——第五章 pandas入门
- python数据分析入门学习笔记
- 【零基础入门学习Python笔记005】闲聊之Python的数据类型
- Python 数据分析(一) 本实验将学习 pandas 基础,数据加载、存储与文件格式,数据规整化,绘图和可视化的知识
- pickle存储数据-读取数据-入门---python学习笔记25
- python学习笔记--Django入门三 Django 与数据库的交互:数据建模
- python数据分析与挖掘学习笔记(7)-交通路标自动识别实战与神经网络算法
- 《利用Python进行数据分析: Python for Data Analysis 》学习随笔
- python数据分析入门学习笔记儿
- python数据分析与挖掘学习笔记(2)-淘宝商品数据清洗及预处理
- python数据分析pandas包入门学习(三)汇总和统计描述
- python数据分析与挖掘学习笔记(3)_小说文本数据挖掘part1
- Python & 数据分析学习笔记[第1篇]
- Android入门学习笔记(一)|基础知识|文件数据存储读取|解析XML
- 利用python进行数据分析(学习笔记)
- Python学习笔记(二):语句、数据类型(快速入门篇)
- Python 数据分析(一) 本实验将学习 pandas 基础,数据加载、存储与文件格式,数据规整化,绘图和可视化的知识
- Python学习笔记(一)--Python基础知识:变量、数据类型、模块与字符串
- Python 数据分析(二 本实验将学习利用 Python 数据聚合与分组运算,时间序列,金融与经济数据应用等相关知识
- python数据分析与挖掘学习笔记(4)-垃圾邮件自动识别