您的位置:首页 > 编程语言 > Python开发

Python数据分析扩展库

2015-11-25 13:11 435 查看
Anaconda和Python(x,y)都自带了下面的这些库。

1. NumPy

强大的ndarray和ufunc函数。

import numpy as np
xArray = np.ones((3, 4))
xArray
Out[3]:
array([[ 1.,  1.,  1.,  1.],
[ 1.,  1.,  1.,  1.],
[ 1.,  1.,  1.,  1.]])

2. SciPy

科学计算(插值、积分、优化和图像处理)

from scipy import linalg
arr = np.array([[1,2], [3, 4]])
linalg.det(arr) #计算行列式
Out[6]: -2.0

3. Matplotlib

基于NumPy,二维绘图库,简单快速地生成曲线图、直方图和散点图等形式的图。

常用的pyplot是一个简单提供类似Matlab接口的模块。

4. Pandas

基于SciPy和NumPy,拥有高效的Series和DataFrame数据结构,数据操作和分析能力非常强,拥有能够高效处理大数据集的切片等功能,提供优化库功能读写多种文件格式,如CSV, HDF5等

df.head(3) #头3行
df.tail(4) #最后4行
df.sort(columns='score') #按照score列排序

作者:liulixiang1988#gmail.com (#换成@)

参考链接:https://www.coursera.org/learn/hipython/home/welcome
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: