利用 Python 进行数据分析(七)pandas 简单介绍(Series 和 DataFrame)
2016-08-05 16:25
1626 查看
一、pandas 是什么
pandas 是基于 NumPy 的一个 Python 数据分析包,主要目的是为了数据分析。它提供了大量高级的数据结构和对数据处理的方法。
pandas 有两个主要的数据结构:Series
和
DataFrame。
二、Series
Series 是一个一维数组对象
,类似于 NumPy 的一维 array。它除了包含一组数据还包含一组索引,所以可以把它理解为一组带索引的数组。
将 Python 数组转换成 Series 对象:
将 Python 字典转换成 Series 对象:
当没有显示指定索引的时候,Series 自动以 0 开始,步长为 1 为数据创建索引。
你也可以通过 index 参数显示指定索引:
对于 Series 对象里的单个数据来说,和普通数组一样,根据索引获取对应的数据或重新赋值;
不过你还可以传入一个索引的数组来获取数据或未数据重新赋值:
想要单独获取 Series 对象的索引或者数组内容的时候,可以使用
index
和
values
属性,例如:
对 Series 对象的运算(索引不变):
三、DataFrame
DataFrame 是一个表格型的数据结构。它提供有序的列和不同类型的列值。
例如将一个由 NumPy 数组组成的字典转换成 DataFrame 对象:
DataFrame 默认根据列名首字母顺序进行排序,想要指定列的顺序?传入一个列名的字典即可:
如果传入的列名找不到,它不会报错,而是产生一列 NA 值:
DataFrame 不仅可以以字典索引的方式获取数据,还可以以属性的方法获取,例如:
修改列的值:
删除某一列:
安装步骤已经在首篇随笔里写过了,这里不在赘述。利用 Python 进行数据分析(一)简单介绍
接下来一篇随笔内容是:利用 Python 进行数据分析(八)pandas 基本操作(Series 和 DataFrame),有兴趣的朋友欢迎关注本博客,也欢迎大家添加评论进行讨论。
相关文章推荐
- Python进程、线程、协程详解
- python中list、tuple和set的基础知识(一)
- 基于python的堡垒机
- Python3 - 时间处理与定时任务
- DSL与自动化测试 – 用Python实现简单的DSL
- day08_Python3的普通方法和静态方法
- 【转载】参数self详解
- 原因:安装MySQL-python-1.2.3.win-amd64-py2.7.exe,时提示:Python version 2.7 required, which was not found in
- python 正则表达式
- Python [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed 解决方法
- Python Logging 模块研究
- PYTHON-正则match
- windows下flask初探
- Python-ORM-SQLALchemy
- 练手python_随机生成200个获奖码
- 基于时间延迟的Python验证脚本
- 练手python_将条形码保存在mysql数据库中
- 练手python_在图像上增加数字
- Python-被调用函数中获取调用函数信息(转)
- 《Python基础教程 第2版·修订版》 字典:当索引不好用时(一)