您的位置:首页 > 其它

终极指南!创建Pandas Series的2种简单方法

2020-08-12 14:21 369 查看

熊猫系列是数据结构中最重要的部分。熊猫系列可以定义为Excel工作表中的一列。我们可以使用SQL数据库,CSV文件和已存储的数据来创建系列。在Pandas中创建系列的方法有很多,但是,我们将以这两种方式进行练习:

——使用ndarray或numpy数组 ——使用Python字典 在本熊猫系列教程结束时,我确定您可以在系列上创建并执行任何任务。配套课程请点击这里:

#1.什么是Pandas Series?

Pandas Series可以认为是数据结构的基础。它基本上只不过是一维类似数组的结构,可用于处理和操作数据。令它与众不同的是它的索引属性,该属性具有令人难以置信的功能并且易变。配套课程请点击这里:

熊猫系列的参数: data:这是您希望系列拥有的值。 index:这是与您用于系列的值相关的索引。 dtype:这指定系列中值的类型。 copy:复制输入的数据。

首先,我们导入pandas库。

>>> import pandas as pd

#2.如何创建熊猫系列? 导入库后,在第二个代码框中,继续输入以下代码-

>>> dataflair_arr= pd.Series([2,3,-4,6])

这将创建您的系列。

要访问该系列,请对以下代码进行编码-

>>> dataflair_arr

输出- 0 2 1 3 2 -4 3 6 d类型:int64

恭喜你! 您已经在熊猫中创建了自己的第一个系列。

2.1使用ndarray或numpy数组创建系列 我们还可以使用ndarray或numpy array创建一个序列: 首先,我们将导入numpy库:

>>> import numpy as np

这使我们将库称为np。初始化之后,我们创建一个numpy数组,然后将其变成一系列。

>>> npa = np.array(['d','a','t','a'])
>>> dataflair_ar= pd.Series(npa)
>>> dataflair_ar

第一行创建numpy数组,第二行将其转换为pandas系列。

输出- 0 d 1 a 2 t 3 a dtype:对象

2.2从python字典创建系列 我们可以从python 字典创建系列。 为此,我们首先需要创建一个字典:

>>> dataflair_dict = { 'Delhi': 12.9, 'Mumbai': 8.4, 'Kolkata': 9.7 }

要将这本词典变成熊猫系列,我们要做的就是:

>>> dataflair_arr3= pd.Series(dataflair_dict)
>>> dataflair_arr3

输出- Delhi 12.9 Mumbai 8.4 Kolkata 9.7 dtype: float64 dtype:float64

#3.如何更改熊猫系列的索引? 为了首先在熊猫系列中建立索引,我们将创建一个列表。配套课程请点击这里:

>>> num=[‘n1’,’n2’,’n3’,’n4’]

这是我们的列表,我们希望它成为值的索引(我们已提供)。因此,我们编写以下代码并运行它:

>>> dataflair_arr2= pd.Series([4,5,-2,2], index=num
>>> dataflair_arr2

输出-

#4.如何对系列进行数学运算? 如果要将值检查为相应的索引,只需使用以下命令

>>> dataflair_arr2 [ 'n2' ]

这将返回值5。 我们可以使用参数来过滤一系列值。为此,我们来看下面的示例:

>>> dataflair_arr2 [ dataflair_arr2> 2 ]

这是什么意思?这基本上是告诉该系列您想要一个大于2的所有值的列表。配套课程请点击这里: 运行上面给出的代码,我们得到: n1 4 n2 5 dtype:int64

因为4和5是pandas系列中唯一的值,所以大于2。如果系列中是否存在某个索引,请使用python本机代码中的'in'参数。

>>> ‘n3’ in dataflair_arr2

这将返回“ True”。

>>> dataflair_arr2*5

输出- n1 20 n2 25 n3 -10 n4 10 d类型:int64

#5.证明缺失值 让我们创建一个城市列表,并将其实现为一系列作为索引:

>>> cities=['Delhi', 'Kolkata', 'Mumbai', 'Chennai']
>>> dataflair_arr4=pd.Series(dict,index=cities)
>>> dataflair_arr4

你有注意到吗?钦奈(Chennai)是新添加的,在原始系列中没有任何价值。在此,金奈的值表示为NaN。 Delhi 12.9 Kolkata 9.7 Mumbai 8.4 Chennai NaN dtype: float64 NaN是熊猫表示缺失值的方式。

#6.如何在熊猫中添加两个系列? 是的,可以在熊猫中添加两个系列。

>>> dataflair_arr4 + dataflair_arr3

输出- Chennai NaN Delhi 25.8 Kolkata 19.4 Mumbai 16.8 dtype: float64

#7.如何访问熊猫系列中的一系列元素? 假设我们要访问arr4的前2个元素。我们所要做的就是在pandas中使用range函数,我们可以借助':'来使用它。 访问前两个元素的代码为:

>>> dataflair_arr4 [ :2 ]

输出- Delhi 12.9 Kolkata 9.7 dtype: float64

最后两个的代码是:

>>> dataflair_arr4 [ 2 :]

输出- Mumbai 8.4 Chennai NaN dtype: float64

因此,该函数基本上以series [x:y]的方式工作,其中x是范围的第一行的数字,y是范围的最后一行的数字。我们试试吧 :

>>> dataflair_arr4 [ 1 :3 ]

输出- Kolkata 9.7 Mumbai 8.4 dtype: float64

摘要 现在,您可以在熊猫系列上创建并执行任何任务。学习系列概念成为大熊猫的主人是非常重要的。借助熊猫系列,您可以在其他两个数据结构中获得专业知识;数据框和面板。配套课程请点击这里:

更多文章和资料|点击下方文字直达 ↓↓↓ 阿里云K8s实战手册 [阿里云CDN排坑指南]CDN ECS运维指南 DevOps实践手册 Hadoop大数据实战手册 Knative云原生应用开发指南 OSS 运维实战手册

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: