您的位置:首页 > 编程语言 > Python开发

Python数据分析基础(八)——时间序列

2017-06-25 22:24 656 查看
时间序列数据是一种重要的结构化数据形式。

datetime模块中的数据类型

类型说明
date以公历形式存储日历日期(年、月、日)
time将时间存储为时、分、秒、毫秒
datetime存储日期和时间
timedelta表示两个datetime值之间的差(日、秒、毫秒)
datettime格式定义

代码说明
%Y4位数的年
%y2位数的年
%m2位数的月[01, 12]
%d2位数的日[01, 31]
%H时(24小时制)[00, 23]
%I时(12小时制)[01, 12]
%M2位数的分[00, 59]
%S秒00, 61
%w用整数表示的星期几[0(星期天), 6]
%U每年的第几周[00, 53],星期天被认为是每周的第一天
%W每年的第几周[00, 53],星期一被认为是每周的第一天
%z以+HHMM或-HHMM表示的UTC时区偏移量
%F%Y-%m-%d简写形式
%D%m/%d/%y简写形式
特定于当前环境的日期格式

代码说明
%a星期几的简写
%A星期几的全称
%b月份的简写
%B月份的全称
%c完整的日期和时间
%p不同环境中的AM或PM
%x适合于当前环境的日期格式
%X适合于当前环境的时间格式
时间序列的基础频率

别名偏移量类型说明
DDay每日日历
BBusinessDay每工作日
HHour每小时
T或minMinute每分
SSecond每秒
L或msMilli每毫秒
UMicro每微秒
MMonthEnd每月最后一个日历日
BMBusinessMonthEnd每月最后一个工作日
MSMonthBegin每月第一个日历日
BMSBusinessMonthBegin每月第一个工作日
W-MON、W-TUEWeek从指定的星期几(MON、TUE、WED、THU、FRI、SAT、SUN)开始算起,每周
WOM-1MON、WOM-2MONWeekOfMonth产生每月第一、第二、第三或第四周的星期几
Q-JAN、Q-FEBQuarterEnd对于以指定月份(JAN、FEB、MAR、APR、MAY、JUN、JUL、AUG、SEP、OCT、NOV、DEC)结束的年度,每季度最后一月的最后一个日历日
BQ-JAN、BQ-FEBBusinessQuarterEnd对于以指定月份结束的年度,每季度最后一月的最后一个工作日
QS-JAN、QS-FEBQuarterBeging对于以指定月份结束的年度,每季度最后一月的第一个日历日
BQS-JAN、BQS-FEBBusinessQuarterBegin对于以指定月份结束的年度,每季度最后一月的第一个工作日
A-JAN、A-FEBYearEnd每年指定月份的最后一个日历日
BA-JAV、BA-FEBBusinessYearEnd每年指定月份的最后一个工作日
AS-JAN、AS-FEBYearBegin每年指定月份的第一个日历日
BAS-JAV、BAS-FEBBusinessYearBegin每年指定月份的第一个工作日
resample方法的参数

参数说明
freq表示重采样频率的字符串或DateOffset,例如'M'、'5min'或Second(15)
how='mean'用于产生聚合值的函数名或数组函数,例如'mean'、'ohlc'、np.max等。默认为'mean',其他常用的值有:'first'、'last'、'median'、'ohlc'、'max'、'min'。
axis=0重采样的轴,默认为axis=0
fill_method=None升采样时如何插值,比如'ffill'或'bfill'。默认不插值
closed='right'在降采样中,各时间段的哪一端是闭合(即包含)的,'right'或'left',默认为'right'
label='right'在降采样中,如何设置聚合值的标签,'right'或'left'(面元的右边界或左边界),默认为'right'
loffset=None面元标签的时间校正值,比如'-1s'/Second(-1)用于将聚合标签调早1秒
limit=None在前向或后向填充时,允许填充的最大时期数
kind=None聚合到时期('period')或时间戳('timestamp'),默认聚合到时间序列的索引类型
convention=None当重采样时期时,将低频率转换到高频率所采用的约定('start'或'end'),默认为'end'
移动窗口和指数加权函数

函数说明
rolling_count返回各窗口非NA观测值的数量
rolling_sum移动窗口的和
rolling_mean移动窗口的平均数
rolling_median移动窗口的中位数
rolling_var、rolling_std移动窗口的方差和标准差。分母为n-1
rolling_skew、rolling_kurt移到窗口的偏度(三阶矩)和峰度(四阶矩)
rolling_min、rolling_max移动窗口的最小值和最大值
rolling_quantile移动窗口指定百分位数/样本分位数位置的值
rolling_corr、rolling_cov移动窗口的相关系数和协方差
rolling_apply对移动窗口应用普通数组函数
ewma指数加权移动平均
ewmvar、evmstd指数加权移动方差和标准差
ewmcorr、ewmcov指数加权移动相关系数和协方差
参考文献:

利用Python进行数据分析.    Wes McKinney.    唐学韬译
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: