numpy基本入门操作汇总二
2017-04-13 21:28
197 查看
本文是学习《利用python进行数据分析》的部分笔记,在这里感谢作者。
九:数学和统计方法:
sum,mean,std等函数,既可以作为数组的事例方法调用,也可以当做顶级Numpy函数调用:
var 方差
min/max 最小值、最大值
argmin/argmax 最大和最小元素的索引
cumsum 所有元素的累计和
cumprod 所有元素的累计积
十:用于布尔型数组的方法
在上面的方法中,布尔值会被强制转换成0或1,因此,sum常用于对布尔型数组中的True计数
arr = np.random.randn(100)
>>> (arr>0).sum()
49
any用于测试数组中是否存在一个或者多个true
all用于测试数组中是否都是True
十一:排序
用sort函数
十二:唯一化
np.unique,用于找出数组中的唯一值并返回已排序的结果。
十三:用于数组的文件输入输出
1,将数组以二进制格式保存到磁盘
np.save和np.load时读写磁盘数组数据的两个主要函数,默认情况下,数组是以未压缩的原始二进制格式保存在扩展名为.npy的文件中的。
加载npz文件时,会得到一个类似字典的对象,该对象会对各个数组进行延迟加载
>>> arr=np.loadtxt('ex1data1.txt',delimiter=',')
np.savetxt执行的是相反的操作,将数组写到以某种分隔符隔开的文本文件中。
十四:线性代数:
1,矩阵乘法:
numpy.linalg中有一组标准的矩阵分解运算以及诸如求逆和行列式之类的东西。
from numpy.linalg import inv,qr
>>> X=randn(5,5)
>>> mat=X.T.dot(X)
>>> inv(mat)
array([[ 0.75420692, -0.25274918, -0.29049394, -0.26562136, 0.09284846],
[-0.25274918, 3.03250359, 1.0858041 , 0.75130694, 2.76777681],
[-0.29049394, 1.0858041 , 0.68926702, 0.33203335, 0.94595721],
[-0.26562136, 0.75130694, 0.33203335, 0.37381694, 0.55013175],
[ 0.09284846, 2.76777681, 0.94595721, 0.55013175, 3.20477824]])>> >
mat.dot(inv(mat))
array([[ 1.00000000e+00, -4.44089210e-16, 1.11022302e-16,
-5.55111512e-17, 0.00000000e+00],
[ 5.55111512e-17, 1.00000000e+00, -2.22044605e-16,
2.22044605e-16, -8.88178420e-16],
[ 6.93889390e-17, -4.44089210e-16, 1.00000000e+00,
-2.77555756e-17, -2.22044605e-16],
[ -1.38777878e-16, -1.33226763e-15, -2.22044605e-16,
1.00000000e+00, 4.44089210e-16],
[ 2.77555756e-17, 8.88178420e-16, 2.22044605e-16,
0.00000000e+00, 1.00000000e+00]])
十五:随机数生成
部分numpy.random函数
seed 确定随机数生成的种子
rand 产生均匀分布的样本值
randint 从给定的上下限范围内随机选取整数
randn 产生标准正态分布的样本值
binomial 产生二项分布的样本值
normal 产生正态分布的样本值
beta 产生beta分布的样本值
九:数学和统计方法:
sum,mean,std等函数,既可以作为数组的事例方法调用,也可以当做顶级Numpy函数调用:
arr=np.random.randn(5,4) >>> arr.mean() 0.30723226701582096 >>> np.mean(arr) 0.30723226701582096mean和sum这类函数可以接受一个axis参数,指定取行或列的数据
>>> arr.mean(axis=1) array([-0.27960398, -0.14470685, 0.77773957, 0.26493607, 0.91779653]) >>> arr.sum(0) array([-0.51563296, 4.58151412, 0.80550744, 1.27325674]) >>> arr array([[-1.75497273, 0.50527593, -0.02333152, 0.15461239], [-0.06705213, -0.01714475, -0.60111944, 0.10648892], [ 0.71210024, 2.29201725, -1.04229547, 1.14913626], [-0.45675796, 0.80788751, 1.97804801, -1.26943327], [ 1.05104962, 0.99347819, 0.49420587, 1.13245243]])基本的数组统计方法还有以下一些:
var 方差
min/max 最小值、最大值
argmin/argmax 最大和最小元素的索引
cumsum 所有元素的累计和
cumprod 所有元素的累计积
十:用于布尔型数组的方法
在上面的方法中,布尔值会被强制转换成0或1,因此,sum常用于对布尔型数组中的True计数
arr = np.random.randn(100)
>>> (arr>0).sum()
49
any用于测试数组中是否存在一个或者多个true
all用于测试数组中是否都是True
>>> bools=np.array([False,False,False,True,True]) >>> bools.any() True >>> bools.all() False这两个方法也可以用于非布尔型数组,所有非0元素将会被当做True。
十一:排序
用sort函数
>>> arr=randn(8) >>> arr array([-0.05716577, 0.39176583, -0.16355803, -0.75749158, -0.05858426, 0.27394639, 2.15453362, 0.03001597])>> > arr.sort() >>> arr array([-0.75749158, -0.16355803, -0.05858426, -0.05716577, 0.03001597, 0.27394639, 0.39176583, 2.15453362])多维数组可以在任何一个轴向上进行排序,只需要将轴序号传给sort即可
>>> >>> arr=randn(5,3) >>> arr array([[ -2.23973954e+00, -4.51064672e-01, 1.22831533e-01], [ -5.20488365e-01, -6.04060242e-01, 4.17827196e-01], [ 1.31605261e+00, 4.49926583e-01, -5.02536669e-01], [ 5.51459340e-01, 3.02275944e-01, 5.01922045e-04], [ -5.81123339e-01, 1.38517518e+00, 3.73132478e-01]])>> > arr.sort(1) >>> arr array([[ -2.23973954e+00, -4.51064672e-01, 1.22831533e-01], [ -6.04060242e-01, -5.20488365e-01, 4.17827196e-01], [ -5.02536669e-01, 4.49926583e-01, 1.31605261e+00], [ 5.01922045e-04, 3.02275944e-01, 5.51459340e-01], [ -5.81123339e-01, 3.73132478e-01, 1.38517518e+00]])顶级方法np.sort返回的是数组的已排序副本,而就地排序则会修改数组本身。
十二:唯一化
np.unique,用于找出数组中的唯一值并返回已排序的结果。
>>> names=np.array(['Bob','Joe','Will','Bob','Will','Joe','Joe']) >>> np.unique(names) array(['Bob', 'Joe', 'Will'],
十三:用于数组的文件输入输出
1,将数组以二进制格式保存到磁盘
np.save和np.load时读写磁盘数组数据的两个主要函数,默认情况下,数组是以未压缩的原始二进制格式保存在扩展名为.npy的文件中的。
>>> arr=np.arange(10) >>> np.save('some_array',arr)如果文件路径末尾没有扩展名.npy,则该扩展名会被自动加上,然后就可以通过np.load读取磁盘上的文件。
>>> np.load('some_array.npy') array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])通过np.savez可以将多个数组保存在一个压缩文件中,将数组以关键字参数的形式传入即可:
np.savez('array_archive.npz',a=arr,b=arr)
加载npz文件时,会得到一个类似字典的对象,该对象会对各个数组进行延迟加载
>>> arch=np.load('array_archive.npz') >>> arch <numpy.lib.npyio.NpzFile object at 0x00000000059C8F98> >>> arch['b'] array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])2.存取文本文件
>>> arr=np.loadtxt('ex1data1.txt',delimiter=',')
np.savetxt执行的是相反的操作,将数组写到以某种分隔符隔开的文本文件中。
十四:线性代数:
1,矩阵乘法:
>>> x=np.array([[1.,2.,3.],[4.,5.,6.]]) >>> y=np.array([[6.,23.],[-1,7],[8,9]]) >>> x array([[ 1., 2., 3.], [ 4., 5., 6.]])>> > y array([[ 6., 23.], [ -1., 7.], [ 8., 9.]])>> > x.dot(y) array([[ 28., 64.], [ 67., 181.]])
numpy.linalg中有一组标准的矩阵分解运算以及诸如求逆和行列式之类的东西。
from numpy.linalg import inv,qr
>>> X=randn(5,5)
>>> mat=X.T.dot(X)
>>> inv(mat)
array([[ 0.75420692, -0.25274918, -0.29049394, -0.26562136, 0.09284846],
[-0.25274918, 3.03250359, 1.0858041 , 0.75130694, 2.76777681],
[-0.29049394, 1.0858041 , 0.68926702, 0.33203335, 0.94595721],
[-0.26562136, 0.75130694, 0.33203335, 0.37381694, 0.55013175],
[ 0.09284846, 2.76777681, 0.94595721, 0.55013175, 3.20477824]])>> >
mat.dot(inv(mat))
array([[ 1.00000000e+00, -4.44089210e-16, 1.11022302e-16,
-5.55111512e-17, 0.00000000e+00],
[ 5.55111512e-17, 1.00000000e+00, -2.22044605e-16,
2.22044605e-16, -8.88178420e-16],
[ 6.93889390e-17, -4.44089210e-16, 1.00000000e+00,
-2.77555756e-17, -2.22044605e-16],
[ -1.38777878e-16, -1.33226763e-15, -2.22044605e-16,
1.00000000e+00, 4.44089210e-16],
[ 2.77555756e-17, 8.88178420e-16, 2.22044605e-16,
0.00000000e+00, 1.00000000e+00]])
十五:随机数生成
部分numpy.random函数
seed 确定随机数生成的种子
rand 产生均匀分布的样本值
randint 从给定的上下限范围内随机选取整数
randn 产生标准正态分布的样本值
binomial 产生二项分布的样本值
normal 产生正态分布的样本值
beta 产生beta分布的样本值
相关文章推荐
- numpy基本入门操作汇总一
- 【numpy 入门】-- 基本操作(2)
- Numpy入门学习之(三) 数组、矩阵基本操作
- linux学习入门1——bash命令基本操作(linuxcast.net)(bash部分快捷键、uname、history、通配符、切换用户、作业管理(前台、后台运行,暂停等操作))
- php入门学习知识点五 关于php数组的几个基本操作
- XML数据的基本操作汇总C#
- Windows调试工具入门3—基本调试操作
- osworkflow基础入门部分汇总(基本概念,包用途分析及代码片断,表结构分析,主要优势,核心概念)
- RHEL6入门系列之六,桌面环境下的基本操作 推荐
- SQL字符串基本操作汇总
- CVS基本操作以及小窍门汇总
- vc入门宝典八(基本操作)
- jdom入门(基本的操作都可以)
- emacs入门基本操作
- Windows 调试工具入门-2-基本调试操作
- 二叉树递归的基本操作(求叶子数目、深度、路径汇总)
- 数据结构类型定义及基本操作汇总(三)--图的表示
- 数据结构类型定义及基本操作汇总(二)-- 二叉树及其遍历
- 网络入门(五)数据库及其基本操作
- 使用SVN入门基本操作