您的位置：首页 > 其它

pandas学习笔记

2018-04-07 11:13 204 查看

# 对于pandas部分的学习，简单记录部分常用源代码如下，待更新... ...

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# dates = pd.date_range('20180406', periods=6)
# DataFrame 构建了一个纵横的列表。
# df = pd.DataFrame(np.random.rand(6, 4), index=dates, columns=list('abcd'))

# print(df)
# print(df[0:3])
# print(df[['a', 'c']])
# print(df.loc['20180406':'20180408', ['b', 'c']])   # 选取块只能这么操作，行不能写成2：5这种形式

# s = pd.Series([1, 3, 5, 8, 120])
# print(s)

# 新建的一列Sumab，并将其加入到原有的单元格中
# df['Sumab'] = pd.Series(df['a'] + df['b'], index=df.index)
# print(df)

# 在方括号中加入判断条件来过滤行，条件必需返回 True 或者 False
# print(df[df['a'] > 0.5])
# 打印出头两行，查看表末5行 df.tail(5)，查看列的名字 df.columns
# 查看表格当前的值 df.values
# 查看所有列的统计描述，包括平均值，标准差，最大最小值，以及25%，50%，75%的 percentile 值 df.describe()
# 对表按照A列升序排序 df.sort_values(by=’A’)
# print(df.head(2))

#  %matplotlib inline
ts = pd.Series(np.random.randn(1000), index=pd.date_range('1/1/2018', periods=1000))
ts = ts.cumsum()
ts.plot()
df = pd.DataFrame(np.random.randn(1000, 4), index=ts.index,columns=['A', 'B', 'C', 'D'])
df = df.cumsum()
plt.figure()
df.plot()
plt.legend(loc='best')

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航