Python时间序列处理之ARIMA模型的使用讲解
2019-04-03 10:38
1741 查看
ARIMA模型
ARIMA模型的全称是自回归移动平均模型,是用来预测时间序列的一种常用的统计模型,一般记作ARIMA(p,d,q)。
ARIMA的适应情况
ARIMA模型相对来说比较简单易用。在应用ARIMA模型时,要保证以下几点:
- 时间序列数据是相对稳定的,总体基本不存在一定的上升或者下降趋势,如果不稳定可以通过差分的方式来使其变稳定。
- 非线性关系处理不好,只能处理线性关系
判断时序数据稳定
基本判断方法:稳定的数据,总体上是没有上升和下降的趋势的,是没有周期性的,方差趋向于一个稳定的值。
ARIMA数学表达
ARIMA(p,d,q),其中p是数据本身的滞后数,是AR模型即自回归模型中的参数。d是时间序列数据需要几次差分才能得到稳定的数据。q是预测误差的滞后数,是MA模型即滑动平均模型中的参数。
a) p参数与AR模型
AR模型描述的是当前值与历史值之间的关系,滞后p阶的AR模型可以表示为:
其中u是常数,et代表误差。
b) q参数与MA模型
MA模型描述的是当前值与自回归部分的误差累计的关系,滞后q阶的MA模型可以表示为:
其中u是常数,et代表误差。
c) d参数与差分
一阶差分:
二阶差分:
d) ARIMA = AR+MA
ARIMA模型使用步骤
- 获取时间序列数据
- 观测数据是否为平稳的,否则进行差分,化为平稳的时序数据,确定d
- 通过观察自相关系数ACF与偏自相关系数PACF确定q和p
- 得到p,d,q后使用ARIMA(p,d,q)进行训练预测
Python调用ARIMA
#差分处理 diff_series = diff_series.diff(1)#一阶 diff_series2 = diff_series.diff(1)#二阶 #ACF与PACF #从scipy导入包 from scipy import stats import statsmodels.api as sm #画出acf和pacf sm.graphics.tsa.plot_acf(diff_series) sm.graphics.tsa.plot_pacf(diff_series) #arima模型 from statsmodels.tsa.arima_model import ARIMA model = ARIMA(train_data,order=(p,d,q),freq='')#freq是频率,根据数据填写 arima = model.fit()#训练 print(arima) pred = arima.predict(start='',end='')#预测
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对脚本之家的支持。如果你想了解更多相关内容请查看下面相关链接
您可能感兴趣的文章:
相关文章推荐
- How to Save an ARIMA Time Series Forecasting Model in Python (如何在Python中保存ARIMA时间序列预测模型)
- 人工智能:python 实现 第十一章,使用Pandas处理时间序列数据
- Python_Statsmodels包_时间序列分析_ARIMA模型
- python+ARIMA 进行时间序列处理
- [python] 时间序列分析之ARIMA
- [python] 时间序列分析之ARIMA
- 时间序列分析中的ARMA,ARIMA模型整体综述
- 使用时间序列分解模型预测商品销量
- python pd.crosstab在处理时间序列文本数据的用处
- 时间序列分析之ARIMA上手-Python
- 手把手教你用Python处理非平稳时间序列
- 时间序列ARIMA模型相关
- 金融时间序列分析:8. MA模型实例(Python)
- Python中datetime的使用和常用时间处理
- Python中如何使用以及去除时间序列数据中的趋势信息
- python 时间序列分析之ARIMA
- R语言 时间序列之ARIMA模型
- 数据挖掘算法之时间序列算法(平稳时间序列模型,AR(p),MA(q),(平稳时间序列模型,AR(p),MA(q),ARMA(p,q)模型和非平稳时间序列模型,ARIMA(p,d,q)模型)学习笔记梳理
- 时间序列分析--ARIMA模型
- 在Python中处理时间之clock()方法的使用