您的位置:首页 > 编程语言 > Python开发

数据分析基础——Numpy的使用(一)

2018-01-16 09:51 357 查看
Numpy:提供了一个在Python中做科学计算的基础库,重在数值计算,主要用于多维数组(矩阵)处理的库。用来存储和处理大型矩阵,比Python自身的嵌套列表结构要高效的多。本身是由C语言开发,是个很基础的扩展,Python其余的科学计算扩展大部分都是以此为基础。

ndarray多维数组(N Dimension
Array)

NumPy数组是一个多维的数组对象(矩阵),称为ndarray,具有高效的算术运算能力和复杂的广播能力,并具有执行速度快和节省空间的特点。

注意:ndarray的下标从0开始,且数组里的所有元素必须是相同类型,每一个ndarray都拥有以下属性

 ndim属性:维度个数
 shape属性:维度大小
 dtype属性:数据类型

一、ndarray的随机抽样创建

通过随机抽样(numpy.random) 生成随机数据。

示例代码:

1. np.random.rand()

生成指定维度的随机多维浮点型数组,数据固定区间 0.0 ~ 1.0

import numpy
as np

# 生成指定维度大小(3行4列)的随机多维浮点型数组(二维),rand固定区间0.0 ~ 1.0

arr =np.random.rand(3,
4)

print(arr)

print(type(arr))

 [[ 0.09371338 0.06273976  0.22748452  0.49557778]

  [ 0.30840042 0.35659161  0.54995724  0.018144 ]

  [ 0.94551493 0.70916088  0.58877255  0.90435672]]

 <class 'numpy.ndarray'>

print('维度个数: ',arr.ndim)

print('维度大小: ',arr.shape)

print('数据类型: ',arr.dtype)

 维度个数:  2

 维度大小:  (3, 4)

 数据类型:  float64

2. np.random.uniform()

生成指定维度大小的随机多维浮点型数组,可以指定数字区间(均匀分布)

# 生成指定维度大小(3行4列)的随机多维浮点型数组(二维),uniform()可以指定区间(-1, 5)

arr =np.random.uniform(-1,
5, size = (3,
4))
# 'size='可省略

print(arr)

print(type(arr))

 [[ 2.25275308 1.67484038 -0.03161878 -0.44635706]

  [ 1.35459097 1.66294159  2.47419548-0.51144655]

  [ 1.43987571 4.71505054  4.33634358  2.48202309]]

 <class 'numpy.ndarray'>

print('维度个数: ',arr.ndim)

print('维度大小: ',arr.shape)

print('数据类型: ',arr.dtype)

 维度个数:  2

 维度大小:  (3, 4)

 数据类型:  float64

3. np.random.randint()

生成指定维度大小的随机多维整型数组,可以指定数字区间

# 生成指定维度大小(3行4列)的随机多维整型数据(二维),randint()可以指定区间(-1, 5)

arr =np.random.randint(-1,
5, size = (3,
4))
# 'size='可省略

print(arr)

print(type(arr))

 [[ 1 3  0  1]

  [ 1 4  4  3]

  [ 2  0-1 -1]]

 <class 'numpy.ndarray'>

print('维度个数: ',arr.ndim)

print('维度大小: ',arr.shape)

print('数据类型: ',arr.dtype)

 维度个数:  2

 维度大小:  (3, 4)

 数据类型:  float64

二、ndarray的序列创建

1. np.array(list,dtype)

list 为 序列型对象(list)、嵌套序列对象(list of list),dtype表示数据类型 (int、float、str)。

示例代码:

# list 序列转换为 ndarray

arr =np.array(range(10))

print(arr)            # ndarray数据

print(arr.ndim)        #
维度个数

print(arr.shape)    #
维度大小

运行结果:

[0123456789]

1

(10,)

# list oflist 嵌套序列转换为ndarray

lis_lis =[range(10), range(10)]

arr_2d =np.array(lis_lis)

print(arr_2d)            # ndarray数据

print(arr_2d.ndim)        #
维度个数

print(arr_2d.shape)        #
维度大小

运行结果:

[[0123456789]

 [0123456789]]

2

(2,
10)

2. np.zeros()

指定大小的全0数组。注意:第一个参数是元组,用来指定大小,如(3, 4),第二个参数可以指定类型,如int,默认为float。

zeros_arr= np.zeros((3,
4))

[[ 0. 
0. 
0.  0.]

 [ 0. 
0. 
0.  0.]

 [ 0. 
0. 
0.  0.]]

 

3. np.ones()

指定大小的全1数组。注意:第一个参数是元组,用来指定大小,如(3, 4),第二个参数可以指定类型,如int,默认为float。

ones_arr =np.ones((2,
3))

 [[ 1. 
1. 
1.]

 [ 1. 
1. 
1.]]

 

4. np.arange()

arange() 类似python
的 range() ,用来创建一个一维ndarray 数组,结果等同于 np.array(range())。

arr =np.arange(15)
# 0 ~ 14、共15个元素的 一维数组

print(arr)

 [ 0 1  2  3 4  5  6 7  8  9 10 11 12 13 14]

 

arr =np.arange(10,
20,
2) # 10 ~ 19、步长为2、共5个元素的一维数组

print(arr)

 [10 12 14 16 18]

 

5. reshape()

reshape() 将 重新调整数组的维度。

arr =np.arange(15)

print(arr.reshape(3,
5))
# 3x5个元素的 二维数组

 [[ 0 1  2  3  4]

  [ 5 6  7  8  9]

  [10 11 12 13 14]]

 

print(arr.reshape(1,
3, 5))
# 1x3x5个元素的 三维数组

 [[[ 0 1  2  3  4]

   [ 5 6  7  8  9]

   [10 11 12 13 14]]]

 

6. random.shuffle()

random.shuffle() 将打乱数组序列(随机重新排列)。

arr =np.arange(15)

print(arr)

 [ 0 1  2  3 4  5  6 7  8  9 10 11 12 13 14]

 

 打乱原数组的元素序列

np.random.shuffle(arr)

print(arr)

 [ 5 8  1  7 4  0 12  9 11  213 14 10  3  6]

 

 再配合reshape()使用

print(arr.reshape(3,5))

 [[ 5 8  1  7  4]

  [ 0 12 9 11  2]

  [13 14 10 3  6]]
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: