利用 Python 进行数据分析(八)pandas 基本操作(Series 和 DataFrame)
2016-08-07 11:49
1056 查看
一、reindex() 方法:重新索引
针对 Series
重新索引指的是根据index参数重新进行排序。
如果传入的索引值在数据里不存在,则不会报错,而是添加缺失值的新行。
不想用缺失值,可以用 fill_value 参数指定填充值。
例如:
fill_value 会让所有的缺失值都填充为同一个值,如果不想这样而是用相邻的元素(左或者右)的值填充,则可以用 method 参数,可选的参数值为 ffill 和 bfill,分别为用前值填充和用后值填充:
针对 DataFrame
重新索引操作:
二、drop() 方法:丢弃数据
针对 Series
针对 DataFrame
不仅可以删除行,还可以删除列:
三、索引、选取和过滤
针对 Series
需要注意一点的是,利用索引的切片运算与普通的 Python 切片运算不同,其末端是包含的,既包含最后一个的项。比较:
赋值操作:
针对 DataFrame
DataFrame 中的 ix 操作:
四、算术运算和数据对齐
针对 Series
将2个对象相加时,具有重叠索引的索引值会相加处理;不重叠的索引则取并集,值为 NA:
针对 DataFrame
对齐操作会同时发生在行和列上,把2个对象相加会得到一个新的对象,其索引为原来2个对象的索引的并集:
和Series 对象一样,不重叠的索引会取并集,值为 NA;如果不想这样,试试使用 add() 方法进行数据填充:
五、函数应用和映射
将一个 lambda 表达式应用到每列数据里:
除了lambda 表达式还可以定义一个函数:
六、排序
针对 Series
针对 DataFrame
七、排名
八、带有重复值的轴索引
索引不强制唯一,例如一个重复索引的 Series:
安装步骤已经在首篇随笔里写过了,这里不在赘述。利用 Python 进行数据分析(一)简单介绍
接下来一篇随笔内容是:利用 Python 进行数据分析(九)pandas - 汇总统计和计算,有兴趣的朋友欢迎关注本博客,也欢迎大家添加评论进行讨论。
相关文章推荐
- 利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作
- 利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍
- 利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍
- 利用 Python 进行数据分析(七)pandas 简单介绍(Series 和 DataFrame)
- 利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍 一、pandas 是什么 pandas 是基于 NumPy 的一个 Python 数据分析包,主
- 【利用Python进行数据分析——经验篇3】如何操作DataFrame中的列的数据格式(转为百分数、保留4位小数)
- 利用Python进行数据分析(15) pandas基础: 字符串操作
- 利用Python进行数据分析(六)之pandas基本功能续
- 数据分析之Pandas(一):Series、DataFrame基本操作及索引对象
- 利用Pandas进行数据分析(2)——pandas数据基本操作
- 利用Python进行数据分析(15) pandas基础: 字符串操作
- 利用Python进行数据分析(六)之pandas基本功能
- 利用Python Pandas进行数据预处理-Pandas基本的数据结构
- 用python做数据分析4|pandas库介绍之DataFrame基本操作
- 利用python进行数据分析之pandas库的应用(二)
- 利用python进行数据分析之pandas库的应用(一)
- 利用python进行数据分析——pandas
- #######用python做数据分析4|pandas库介绍之DataFrame基本操作#######
- 利用 Python 进行数据分析(十二)pandas:数据合并
- 利用Python进行数据分析(13) pandas基础: 数据重塑/轴向旋转