您的位置:首页 > 其它

pandas学习笔记

2018-04-07 11:13 204 查看
# 对于pandas部分的学习,简单记录部分常用源代码如下,待更新... ...

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# dates = pd.date_range('20180406', periods=6)
# DataFrame 构建了一个纵横的列表。
# df = pd.DataFrame(np.random.rand(6, 4), index=dates, columns=list('abcd'))

# print(df)
# print(df[0:3])
# print(df[['a', 'c']])
# print(df.loc['20180406':'20180408', ['b', 'c']])   # 选取块只能这么操作,行不能写成2:5这种形式

# s = pd.Series([1, 3, 5, 8, 120])
# print(s)

# 新建的一列Sumab,并将其加入到原有的单元格中
# df['Sumab'] = pd.Series(df['a'] + df['b'], index=df.index)
# print(df)

# 在方括号中加入判断条件来过滤行,条件必需返回 True 或者 False
# print(df[df['a'] > 0.5])
# 打印出头两行,查看表末5行 df.tail(5),查看列的名字 df.columns
# 查看表格当前的值 df.values
# 查看所有列的统计描述,包括平均值,标准差,最大最小值,以及25%,50%,75%的 percentile 值 df.describe()
# 对表按照A列升序排序 df.sort_values(by=’A’)
# print(df.head(2))

#  %matplotlib inline
ts = pd.Series(np.random.randn(1000), index=pd.date_range('1/1/2018', periods=1000))
ts = ts.cumsum()
ts.plot()
df = pd.DataFrame(np.random.randn(1000, 4), index=ts.index,columns=['A', 'B', 'C', 'D'])
df = df.cumsum()
plt.figure()
df.plot()
plt.legend(loc='best')
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: