您的位置：首页 > 其它

终极指南！创建Pandas Series的2种简单方法

2020-08-12 14:21 369 查看

熊猫系列是数据结构中最重要的部分。熊猫系列可以定义为Excel工作表中的一列。我们可以使用SQL数据库，CSV文件和已存储的数据来创建系列。在Pandas中创建系列的方法有很多，但是，我们将以这两种方式进行练习：

——使用ndarray或numpy数组 ——使用Python字典在本熊猫系列教程结束时，我确定您可以在系列上创建并执行任何任务。配套课程请点击这里：

#1.什么是Pandas Series？

Pandas Series可以认为是数据结构的基础。它基本上只不过是一维类似数组的结构，可用于处理和操作数据。令它与众不同的是它的索引属性，该属性具有令人难以置信的功能并且易变。配套课程请点击这里：

熊猫系列的参数： data：这是您希望系列拥有的值。 index：这是与您用于系列的值相关的索引。 dtype：这指定系列中值的类型。 copy：复制输入的数据。

首先，我们导入pandas库。

>>> import pandas as pd

#2.如何创建熊猫系列？导入库后，在第二个代码框中，继续输入以下代码-

>>> dataflair_arr= pd.Series([2,3,-4,6])

这将创建您的系列。

要访问该系列，请对以下代码进行编码-

>>> dataflair_arr

输出- 0 2 1 3 2 -4 3 6 d类型：int64

恭喜你！您已经在熊猫中创建了自己的第一个系列。

2.1使用ndarray或numpy数组创建系列我们还可以使用ndarray或numpy array创建一个序列：首先，我们将导入numpy库：

>>> import numpy as np

这使我们将库称为np。初始化之后，我们创建一个numpy数组，然后将其变成一系列。

>>> npa = np.array(['d','a','t','a'])
>>> dataflair_ar= pd.Series(npa)
>>> dataflair_ar

第一行创建numpy数组，第二行将其转换为pandas系列。

输出- 0 d 1 a 2 t 3 a dtype：对象

2.2从python字典创建系列我们可以从python 字典创建系列。为此，我们首先需要创建一个字典：

>>> dataflair_dict = { 'Delhi': 12.9, 'Mumbai': 8.4, 'Kolkata': 9.7 }

要将这本词典变成熊猫系列，我们要做的就是：

>>> dataflair_arr3= pd.Series(dataflair_dict)
>>> dataflair_arr3

输出- Delhi 12.9 Mumbai 8.4 Kolkata 9.7 dtype: float64 dtype：float64

#3.如何更改熊猫系列的索引？为了首先在熊猫系列中建立索引，我们将创建一个列表。配套课程请点击这里：

>>> num=[‘n1’,’n2’,’n3’,’n4’]

这是我们的列表，我们希望它成为值的索引（我们已提供）。因此，我们编写以下代码并运行它：

>>> dataflair_arr2= pd.Series([4,5,-2,2], index=num
>>> dataflair_arr2

输出-

#4.如何对系列进行数学运算？如果要将值检查为相应的索引，只需使用以下命令

>>> dataflair_arr2 [ 'n2' ]

这将返回值5。我们可以使用参数来过滤一系列值。为此，我们来看下面的示例：

>>> dataflair_arr2 [ dataflair_arr2> 2 ]

这是什么意思？这基本上是告诉该系列您想要一个大于2的所有值的列表。配套课程请点击这里：运行上面给出的代码，我们得到： n1 4 n2 5 dtype：int64

因为4和5是pandas系列中唯一的值，所以大于2。如果系列中是否存在某个索引，请使用python本机代码中的'in'参数。

>>> ‘n3’ in dataflair_arr2

这将返回“ True”。

>>> dataflair_arr2*5

输出- n1 20 n2 25 n3 -10 n4 10 d类型：int64

#5.证明缺失值让我们创建一个城市列表，并将其实现为一系列作为索引：

>>> cities=['Delhi', 'Kolkata', 'Mumbai', 'Chennai']
>>> dataflair_arr4=pd.Series(dict,index=cities)
>>> dataflair_arr4

你有注意到吗？钦奈（Chennai）是新添加的，在原始系列中没有任何价值。在此，金奈的值表示为NaN。 Delhi 12.9 Kolkata 9.7 Mumbai 8.4 Chennai NaN dtype: float64 NaN是熊猫表示缺失值的方式。

>>> dataflair_arr4 + dataflair_arr3

输出- Chennai NaN Delhi 25.8 Kolkata 19.4 Mumbai 16.8 dtype: float64

>>> dataflair_arr4 [ ：2 ]

输出- Delhi 12.9 Kolkata 9.7 dtype: float64

最后两个的代码是：

>>> dataflair_arr4 [ 2 ：]

输出- Mumbai 8.4 Chennai NaN dtype: float64

因此，该函数基本上以series [x：y]的方式工作，其中x是范围的第一行的数字，y是范围的最后一行的数字。我们试试吧：

>>> dataflair_arr4 [ 1 ：3 ]

输出- Kolkata 9.7 Mumbai 8.4 dtype: float64

摘要现在，您可以在熊猫系列上创建并执行任何任务。学习系列概念成为大熊猫的主人是非常重要的。借助熊猫系列，您可以在其他两个数据结构中获得专业知识；数据框和面板。配套课程请点击这里：

更多文章和资料|点击下方文字直达 ↓↓↓ 阿里云K8s实战手册 [阿里云CDN排坑指南]CDN ECS运维指南 DevOps实践手册 Hadoop大数据实战手册 Knative云原生应用开发指南 OSS 运维实战手册

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航