Python使用pandas对数据进行差分运算
2017-10-25 00:00
716 查看
>>> import pandas
as pd
>>> import numpy
as np
# 生成模拟数据
>>> df = pd.DataFrame({'a':np.random.randint(1, 100, 10),\
'b':np.random.randint(1, 100, 10)},\
index=map(str,
range(10)))
>>> df
a b
0 21 54
1 53 28
2 18 87
3 56 40
4 62 34
5 74 10
6 7 78
7 58 79
8 66 80
9 30 21
# 纵向一阶差分,当前行减去上一行
>>> df.diff()
a b
0 NaN NaN
1 32.0 -26.0
2 -35.0 59.0
3 38.0 -47.0
4 6.0 -6.0
5 12.0 -24.0
6 -67.0 68.0
7 51.0 1.0
8 8.0 1.0
9 -36.0 -59.0
# 横向一阶差分,当前列减去左边的列
>>> df.diff(axis=1)
a b
0 NaN 33.0
1 NaN -25.0
2 NaN 69.0
3 NaN -16.0
4 NaN -28.0
5 NaN -64.0
6 NaN 71.0
7 NaN 21.0
8 NaN 14.0
9 NaN -9.0
# 纵向二阶差分
>>> df.diff(periods=2)
a b
0 NaN NaN
1 NaN NaN
2 -3.0 33.0
3 3.0 12.0
4 44.0 -53.0
5 18.0 -30.0
6 -55.0 44.0
7 -16.0 69.0
8 59.0 2.0
9 -28.0 -58.0
# 纵向二阶差分,丢弃空值
>>> df.diff(periods=2).dropna()
a b
2 -3.0 33.0
3 3.0 12.0
4 44.0 -53.0
5 18.0 -30.0
6 -55.0 44.0
7 -16.0 69.0
8 59.0 2.0
9 -28.0 -58.0
----------相关阅读----------
Python使用pandas扩展库DataFrame对象的pivot方法对数据进行透视转换
Python使用pandas读取Excel文件数据和预处理小案例
使用Python内置集合对象和内置函数filter()过滤无效书评
Python数据分析扩展库pandas的DataFrame排序方法小结
Pandas创建DataFrame对象的几种常用方法
Python基于用户协同过滤算法的电影推荐代码demo
Python+pandas读取Excel文件并统计演员参演电影数量
祝所有程序员1024节日快乐
学会提问,你就成功了一大半!
盘点那些让人上火的提问方式(论如何让交流更高效)
----------喜大普奔----------
1、继《Python程序设计基础》(2017年9月第5次印刷)、《Python程序设计(第2版)》(2017年9月第4次印刷)、《Python可以这样学》(2017年7月第3次印刷)系列图书之后,董付国老师新书《Python程序设计开发宝典》已于2017年8月1日在清华大学出版社出版,并于2017年9月进行了第2次印刷。为庆祝新书《Python程序设计开发宝典》全面上架,清华大学出版社联合“赣江图书专营”淘宝店推出特价优惠活动,《Python程序设计开发宝典》原价69元,新书上架期间超低价39.8元,可以复制下面的链接使用浏览器打开查看图书详情和购买:
https://detail.tmall.com/item.htm?spm=a1z10.3-b-s.w4011-14464369246.84.46f16db0roWfX4&id=557107249812&rn=339cbc9df2bac424664103917dedfbd2&abbucket=8&tbpm=3
2、董付国老师新作《中学生可以这样学Python》已正式出版,很快就会在各大书城全面上架。
3、董付国老师6本Python系列图书阅读指南
as pd
>>> import numpy
as np
# 生成模拟数据
>>> df = pd.DataFrame({'a':np.random.randint(1, 100, 10),\
'b':np.random.randint(1, 100, 10)},\
index=map(str,
range(10)))
>>> df
a b
0 21 54
1 53 28
2 18 87
3 56 40
4 62 34
5 74 10
6 7 78
7 58 79
8 66 80
9 30 21
# 纵向一阶差分,当前行减去上一行
>>> df.diff()
a b
0 NaN NaN
1 32.0 -26.0
2 -35.0 59.0
3 38.0 -47.0
4 6.0 -6.0
5 12.0 -24.0
6 -67.0 68.0
7 51.0 1.0
8 8.0 1.0
9 -36.0 -59.0
# 横向一阶差分,当前列减去左边的列
>>> df.diff(axis=1)
a b
0 NaN 33.0
1 NaN -25.0
2 NaN 69.0
3 NaN -16.0
4 NaN -28.0
5 NaN -64.0
6 NaN 71.0
7 NaN 21.0
8 NaN 14.0
9 NaN -9.0
# 纵向二阶差分
>>> df.diff(periods=2)
a b
0 NaN NaN
1 NaN NaN
2 -3.0 33.0
3 3.0 12.0
4 44.0 -53.0
5 18.0 -30.0
6 -55.0 44.0
7 -16.0 69.0
8 59.0 2.0
9 -28.0 -58.0
# 纵向二阶差分,丢弃空值
>>> df.diff(periods=2).dropna()
a b
2 -3.0 33.0
3 3.0 12.0
4 44.0 -53.0
5 18.0 -30.0
6 -55.0 44.0
7 -16.0 69.0
8 59.0 2.0
9 -28.0 -58.0
----------相关阅读----------
Python使用pandas扩展库DataFrame对象的pivot方法对数据进行透视转换
Python使用pandas读取Excel文件数据和预处理小案例
使用Python内置集合对象和内置函数filter()过滤无效书评
Python数据分析扩展库pandas的DataFrame排序方法小结
Pandas创建DataFrame对象的几种常用方法
Python基于用户协同过滤算法的电影推荐代码demo
Python+pandas读取Excel文件并统计演员参演电影数量
祝所有程序员1024节日快乐
学会提问,你就成功了一大半!
盘点那些让人上火的提问方式(论如何让交流更高效)
----------喜大普奔----------
1、继《Python程序设计基础》(2017年9月第5次印刷)、《Python程序设计(第2版)》(2017年9月第4次印刷)、《Python可以这样学》(2017年7月第3次印刷)系列图书之后,董付国老师新书《Python程序设计开发宝典》已于2017年8月1日在清华大学出版社出版,并于2017年9月进行了第2次印刷。为庆祝新书《Python程序设计开发宝典》全面上架,清华大学出版社联合“赣江图书专营”淘宝店推出特价优惠活动,《Python程序设计开发宝典》原价69元,新书上架期间超低价39.8元,可以复制下面的链接使用浏览器打开查看图书详情和购买:
https://detail.tmall.com/item.htm?spm=a1z10.3-b-s.w4011-14464369246.84.46f16db0roWfX4&id=557107249812&rn=339cbc9df2bac424664103917dedfbd2&abbucket=8&tbpm=3
2、董付国老师新作《中学生可以这样学Python》已正式出版,很快就会在各大书城全面上架。
3、董付国老师6本Python系列图书阅读指南
相关文章推荐
- Python 使用 pandas 进行数据分析
- 【量化小讲堂-Python&Pandas系列01】如何快速上手使用Python进行金融数据分析
- 使用Python pandas对不同列名的数据进行合并
- Python使用pandas扩展库DataFrame对象的pivot方法对数据进行透视转换
- python使用json格式进行数据封装
- 使用异或运算对数据及文件进行加密处理,附软件及源码
- 在Python中使用zlib模块进行数据压缩的教程
- matplotlib -- 使用python中的matplotlib进行绘图分析数据
- Python 使用nltk对数据进行自然语言处理(nlp)
- 使用python进行数据分析
- 在Python3中使用asyncio库进行快速数据抓取的教程
- 使用Python进行Elasticsearch数据索引
- 利用python中的pandas,sklearn进行数据挖掘 basic_of_datamining
- 【Python】Python的数据分析(二)——pandas安装及使用
- 使用Python Pandas处理亿级数据
- 在Python中使用zlib模块进行数据压缩的教程
- python使用pygal进行绘制数据图表和监控图表
- python使用pygal进行绘制数据图表和监控图表
- 使用Python与openpyxl进行表格处理(一)——读取数据
- 利用Python进行数据分析--数据聚合与分组运算1