数据分析基础——Numpy的使用(一)
2018-01-16 09:51
357 查看
Numpy:提供了一个在Python中做科学计算的基础库,重在数值计算,主要用于多维数组(矩阵)处理的库。用来存储和处理大型矩阵,比Python自身的嵌套列表结构要高效的多。本身是由C语言开发,是个很基础的扩展,Python其余的科学计算扩展大部分都是以此为基础。
ndarray多维数组(N Dimension
Array)
NumPy数组是一个多维的数组对象(矩阵),称为ndarray,具有高效的算术运算能力和复杂的广播能力,并具有执行速度快和节省空间的特点。
注意:ndarray的下标从0开始,且数组里的所有元素必须是相同类型,每一个ndarray都拥有以下属性
ndim属性:维度个数
shape属性:维度大小
dtype属性:数据类型
示例代码:
1. np.random.rand()
生成指定维度的随机多维浮点型数组,数据固定区间 0.0 ~ 1.0
import numpy
as np
# 生成指定维度大小(3行4列)的随机多维浮点型数组(二维),rand固定区间0.0 ~ 1.0
arr =np.random.rand(3,
4)
print(arr)
print(type(arr))
[[ 0.09371338 0.06273976 0.22748452 0.49557778]
[ 0.30840042 0.35659161 0.54995724 0.018144 ]
[ 0.94551493 0.70916088 0.58877255 0.90435672]]
<class 'numpy.ndarray'>
print('维度个数: ',arr.ndim)
print('维度大小: ',arr.shape)
print('数据类型: ',arr.dtype)
维度个数: 2
维度大小: (3, 4)
数据类型: float64
2. np.random.uniform()
生成指定维度大小的随机多维浮点型数组,可以指定数字区间(均匀分布)
# 生成指定维度大小(3行4列)的随机多维浮点型数组(二维),uniform()可以指定区间(-1, 5)
arr =np.random.uniform(-1,
5, size = (3,
4))
# 'size='可省略
print(arr)
print(type(arr))
[[ 2.25275308 1.67484038 -0.03161878 -0.44635706]
[ 1.35459097 1.66294159 2.47419548-0.51144655]
[ 1.43987571 4.71505054 4.33634358 2.48202309]]
<class 'numpy.ndarray'>
print('维度个数: ',arr.ndim)
print('维度大小: ',arr.shape)
print('数据类型: ',arr.dtype)
维度个数: 2
维度大小: (3, 4)
数据类型: float64
3. np.random.randint()
生成指定维度大小的随机多维整型数组,可以指定数字区间
# 生成指定维度大小(3行4列)的随机多维整型数据(二维),randint()可以指定区间(-1, 5)
arr =np.random.randint(-1,
5, size = (3,
4))
# 'size='可省略
print(arr)
print(type(arr))
[[ 1 3 0 1]
[ 1 4 4 3]
[ 2 0-1 -1]]
<class 'numpy.ndarray'>
print('维度个数: ',arr.ndim)
print('维度大小: ',arr.shape)
print('数据类型: ',arr.dtype)
维度个数: 2
维度大小: (3, 4)
数据类型: float64
list 为 序列型对象(list)、嵌套序列对象(list of list),dtype表示数据类型 (int、float、str)。
示例代码:
# list 序列转换为 ndarray
arr =np.array(range(10))
print(arr) # ndarray数据
print(arr.ndim) #
维度个数
print(arr.shape) #
维度大小
运行结果:
[0123456789]
1
(10,)
# list oflist 嵌套序列转换为ndarray
lis_lis =[range(10), range(10)]
arr_2d =np.array(lis_lis)
print(arr_2d) # ndarray数据
print(arr_2d.ndim) #
维度个数
print(arr_2d.shape) #
维度大小
运行结果:
[[0123456789]
[0123456789]]
2
(2,
10)
2. np.zeros()
指定大小的全0数组。注意:第一个参数是元组,用来指定大小,如(3, 4),第二个参数可以指定类型,如int,默认为float。
zeros_arr= np.zeros((3,
4))
[[ 0.
0.
0. 0.]
[ 0.
0.
0. 0.]
[ 0.
0.
0. 0.]]
3. np.ones()
指定大小的全1数组。注意:第一个参数是元组,用来指定大小,如(3, 4),第二个参数可以指定类型,如int,默认为float。
ones_arr =np.ones((2,
3))
[[ 1.
1.
1.]
[ 1.
1.
1.]]
4. np.arange()
arange() 类似python
的 range() ,用来创建一个一维ndarray 数组,结果等同于 np.array(range())。
arr =np.arange(15)
# 0 ~ 14、共15个元素的 一维数组
print(arr)
[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14]
arr =np.arange(10,
20,
2) # 10 ~ 19、步长为2、共5个元素的一维数组
print(arr)
[10 12 14 16 18]
5. reshape()
reshape() 将 重新调整数组的维度。
arr =np.arange(15)
print(arr.reshape(3,
5))
# 3x5个元素的 二维数组
[[ 0 1 2 3 4]
[ 5 6 7 8 9]
[10 11 12 13 14]]
print(arr.reshape(1,
3, 5))
# 1x3x5个元素的 三维数组
[[[ 0 1 2 3 4]
[ 5 6 7 8 9]
[10 11 12 13 14]]]
6. random.shuffle()
random.shuffle() 将打乱数组序列(随机重新排列)。
arr =np.arange(15)
print(arr)
[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14]
打乱原数组的元素序列
np.random.shuffle(arr)
print(arr)
[ 5 8 1 7 4 0 12 9 11 213 14 10 3 6]
再配合reshape()使用
print(arr.reshape(3,5))
[[ 5 8 1 7 4]
[ 0 12 9 11 2]
[13 14 10 3 6]]
ndarray多维数组(N Dimension
Array)
NumPy数组是一个多维的数组对象(矩阵),称为ndarray,具有高效的算术运算能力和复杂的广播能力,并具有执行速度快和节省空间的特点。
注意:ndarray的下标从0开始,且数组里的所有元素必须是相同类型,每一个ndarray都拥有以下属性
ndim属性:维度个数
shape属性:维度大小
dtype属性:数据类型
一、ndarray的随机抽样创建
通过随机抽样(numpy.random) 生成随机数据。示例代码:
1. np.random.rand()
生成指定维度的随机多维浮点型数组,数据固定区间 0.0 ~ 1.0
import numpy
as np
# 生成指定维度大小(3行4列)的随机多维浮点型数组(二维),rand固定区间0.0 ~ 1.0
arr =np.random.rand(3,
4)
print(arr)
print(type(arr))
[[ 0.09371338 0.06273976 0.22748452 0.49557778]
[ 0.30840042 0.35659161 0.54995724 0.018144 ]
[ 0.94551493 0.70916088 0.58877255 0.90435672]]
<class 'numpy.ndarray'>
print('维度个数: ',arr.ndim)
print('维度大小: ',arr.shape)
print('数据类型: ',arr.dtype)
维度个数: 2
维度大小: (3, 4)
数据类型: float64
2. np.random.uniform()
生成指定维度大小的随机多维浮点型数组,可以指定数字区间(均匀分布)
# 生成指定维度大小(3行4列)的随机多维浮点型数组(二维),uniform()可以指定区间(-1, 5)
arr =np.random.uniform(-1,
5, size = (3,
4))
# 'size='可省略
print(arr)
print(type(arr))
[[ 2.25275308 1.67484038 -0.03161878 -0.44635706]
[ 1.35459097 1.66294159 2.47419548-0.51144655]
[ 1.43987571 4.71505054 4.33634358 2.48202309]]
<class 'numpy.ndarray'>
print('维度个数: ',arr.ndim)
print('维度大小: ',arr.shape)
print('数据类型: ',arr.dtype)
维度个数: 2
维度大小: (3, 4)
数据类型: float64
3. np.random.randint()
生成指定维度大小的随机多维整型数组,可以指定数字区间
# 生成指定维度大小(3行4列)的随机多维整型数据(二维),randint()可以指定区间(-1, 5)
arr =np.random.randint(-1,
5, size = (3,
4))
# 'size='可省略
print(arr)
print(type(arr))
[[ 1 3 0 1]
[ 1 4 4 3]
[ 2 0-1 -1]]
<class 'numpy.ndarray'>
print('维度个数: ',arr.ndim)
print('维度大小: ',arr.shape)
print('数据类型: ',arr.dtype)
维度个数: 2
维度大小: (3, 4)
数据类型: float64
二、ndarray的序列创建
1. np.array(list,dtype)list 为 序列型对象(list)、嵌套序列对象(list of list),dtype表示数据类型 (int、float、str)。
示例代码:
# list 序列转换为 ndarray
arr =np.array(range(10))
print(arr) # ndarray数据
print(arr.ndim) #
维度个数
print(arr.shape) #
维度大小
运行结果:
[0123456789]
1
(10,)
# list oflist 嵌套序列转换为ndarray
lis_lis =[range(10), range(10)]
arr_2d =np.array(lis_lis)
print(arr_2d) # ndarray数据
print(arr_2d.ndim) #
维度个数
print(arr_2d.shape) #
维度大小
运行结果:
[[0123456789]
[0123456789]]
2
(2,
10)
2. np.zeros()
指定大小的全0数组。注意:第一个参数是元组,用来指定大小,如(3, 4),第二个参数可以指定类型,如int,默认为float。
zeros_arr= np.zeros((3,
4))
[[ 0.
0.
0. 0.]
[ 0.
0.
0. 0.]
[ 0.
0.
0. 0.]]
3. np.ones()
指定大小的全1数组。注意:第一个参数是元组,用来指定大小,如(3, 4),第二个参数可以指定类型,如int,默认为float。
ones_arr =np.ones((2,
3))
[[ 1.
1.
1.]
[ 1.
1.
1.]]
4. np.arange()
arange() 类似python
的 range() ,用来创建一个一维ndarray 数组,结果等同于 np.array(range())。
arr =np.arange(15)
# 0 ~ 14、共15个元素的 一维数组
print(arr)
[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14]
arr =np.arange(10,
20,
2) # 10 ~ 19、步长为2、共5个元素的一维数组
print(arr)
[10 12 14 16 18]
5. reshape()
reshape() 将 重新调整数组的维度。
arr =np.arange(15)
print(arr.reshape(3,
5))
# 3x5个元素的 二维数组
[[ 0 1 2 3 4]
[ 5 6 7 8 9]
[10 11 12 13 14]]
print(arr.reshape(1,
3, 5))
# 1x3x5个元素的 三维数组
[[[ 0 1 2 3 4]
[ 5 6 7 8 9]
[10 11 12 13 14]]]
6. random.shuffle()
random.shuffle() 将打乱数组序列(随机重新排列)。
arr =np.arange(15)
print(arr)
[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14]
打乱原数组的元素序列
np.random.shuffle(arr)
print(arr)
[ 5 8 1 7 4 0 12 9 11 213 14 10 3 6]
再配合reshape()使用
print(arr.reshape(3,5))
[[ 5 8 1 7 4]
[ 0 12 9 11 2]
[13 14 10 3 6]]
相关文章推荐
- 利用Python进行数据分析(6) NumPy基础: 矢量计算
- 利用python进行数据分析-NumPy基础
- 利用python进行数据分析——Numpy基础(一)
- 利用Python数据分析:Numpy基础(六)
- 数据分析与展示(3)-- Matplotlib库基础使用
- 利用Python数据分析:Numpy基础(二)
- 利用Python进行数据分析(5) NumPy基础: ndarray索引和切片
- numpy&pandas 数据分析基础一
- 利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍 一、pandas 是什么 pandas 是基于 NumPy 的一个 Python 数据分析包,主
- 数据分析最常用的matplot基础使用笔记
- Python数据分析基础模块:Anaconda的安装以及简单使用
- 高维数据的应对手段: 主成分分析(PCA)简介+numpy实现+weka使用说明
- python 数据分析 numpy基础
- 阿里云clouder认证—使用Quick BI 制作企业数据分析报表(基础理论篇)
- 利用Python数据分析:Numpy基础(五)
- 数据分析基础之Linalg的使用
- 利用Python数据分析:Numpy基础(一)
- 利用Python做数据分析——numpy基础
- Python数据分析|第4章 NumPy基础:数组和矢量计算
- 利用Python数据分析:Numpy基础(七)