【大数据部落】R语言GAM(广义相加模型)对物业耗电量进行预测
2017-06-23 14:52
781 查看
人们对于电力的需求与依赖随着生活水平的提高而不断加深,用电负荷预测工作开始变得越来越重要,如果可以发现用电负荷的规律性,我们就可以合理安排用电负荷。我们使用某商业物业两个星期的电耗数据进行分析。
GAM模型
当因变量和自变量不呈线性关系时,可用广义相加模型(GAM)。GAM模型的优点,在于其解决响应变量与预测因子间的高度非线性和非单调关系方面的突出能力,是一种基于数据的模型(data-driven),数据决定着响应变量和预测因子之间的关系。电耗数据不是线性的,同时是一个有季节趋势的时间序列趋势。那么GAM模型是否可以用来预测时间序列呢?
首先绘制出用电量的时间序列图,看下趋势
ggplot(data_r, aes(date_time, value)) +
geom_line() +
theme(panel.border = element_blank(),
panel.background = element_blank(),
panel.grid.minor = element_line(colour = "grey90"),
panel.grid.major = element_line(colour = "grey90"),
panel.grid.major.x = element_line(colour = "grey90"),
axis.text = element_text(size = 10),
axis.title = element_text(size = 12, face = "bold")) +
labs(x = "日期", y = "用电量 (kW)")
gam_1 <- gam(Load ~ s(Daily, bs = "cr", k = period) +
s(Weekly, bs = "ps", k = 7),
data = matrix_gam,
family = gaussian)
绘制时间序列有两个主要自变量:天和周。我们的响应变量是电力负荷。我们来构建出GAM模型
我们可以看到时间变量对电力负荷的影响。在左图中,负荷的峰值是白天下午3点左右。同时我们可以看到,周末耗电量下降。
然后我们绘制耗电量曲面图更直观的发现规律。
我们可以看到,最高峰是当“每日”变量的值接近(3点),“周”变量的值为1(这是星期一)。
最后,我们可以看到,电力负荷的最高值是星期一下午3点直到星期四,然后负载在周末减少。
结语
GAM模型的优点在于其解决高度非线性预测问题的突出能力。GAM模型是否可以应用在其他领域?
抛砖:logistic regression在credit risk里面用的很多,个人认为作为统计进入金融风控是个不错的切入点。
未完待续。。。
大数据部落——中国专业的第三方数据服务提供商,提供定制化的一站式数据挖掘和统计分析咨询服务
统计分析和数据挖掘咨询服务 :y0.cn/teradat(咨询服务请联系官网客服)
QQ:3025393450
【大数据部落】提供定制化的一站式数据挖掘和统计分析咨询服务
分享最新的大数据资讯,每天学习一点数据分析,让我们一起做有态度的数据人
微信客服号:lico_9e
QQ交流群:186388004
人们对于电力的需求与依赖随着生活水平的提高而不断加深,用电负荷预测工作开始变得越来越重要,如果可以发现用电负荷的规律性,我们就可以合理安排用电负荷。我们使用某商业物业两个星期的电耗数据进行分析。
GAM模型
当因变量和自变量不呈线性关系时,可用广义相加模型(GAM)。GAM模型的优点,在于其解决响应变量与预测因子间的高度非线性和非单调关系方面的突出能力,是一种基于数据的模型(data-driven),数据决定着响应变量和预测因子之间的关系。电耗数据不是线性的,同时是一个有季节趋势的时间序列趋势。那么GAM模型是否可以用来预测时间序列呢?
首先绘制出用电量的时间序列图,看下趋势
绘制时间序列有两个主要自变量:天和周。 我们的响应变量是电力负荷。 我们来构建出GAM模型
我们可以看到时间变量对电力负荷的影响。 在左图中,负荷的峰值是白天下午3点左右。 同时我们可以看到,周末耗电量下降。
然后我们绘制耗电量曲面图更直观的发现规律。
我们可以看到,最高峰是当“每日”变量的值接近(3点),“周”变量的值为1(这是星期一)。
最后,我们可以看到,电力负荷的最高值是星期一下午3点 直到星期四,然后负载在周末减少。
结语
GAM模型的优点在于其解决高度非线性预测问题的突出能力。GAM模型是否可以应用在其他领域?
抛砖:logistic regression在credit
risk里面用的很多,个人认为作为统计进入金融 风控是个不错的切入点。
人们对于电力的需求与依赖随着生活水平的提高而不断加深,用电负荷预测工作开始变得越来越重要,如果可以发现用电负荷的规律性,我们就可以合理安排用电负荷。我们使用某商业物业两个星期的电耗数据进行分析。
GAM模型
当因变量和自变量不呈线性关系时,可用广义相加模型(GAM)。GAM模型的优点,在于其解决响应变量与预测因子间的高度非线性和非单调关系方面的突出能力,是一种基于数据的模型(data-driven),数据决定着响应变量和预测因子之间的关系。电耗数据不是线性的,同时是一个有季节趋势的时间序列趋势。那么GAM模型是否可以用来预测时间序列呢?
首先绘制出用电量的时间序列图,看下趋势
ggplot(data_r, aes(date_time, value)) +
geom_line() +
theme(panel.border = element_blank(),
panel.background = element_blank(),
panel.grid.minor = element_line(colour = "grey90"),
panel.grid.major = element_line(colour = "grey90"),
panel.grid.major.x = element_line(colour = "grey90"),
axis.text = element_text(size = 10),
axis.title = element_text(size = 12, face = "bold")) +
labs(x = "日期", y = "用电量 (kW)")
gam_1 <- gam(Load ~ s(Daily, bs = "cr", k = period) +
s(Weekly, bs = "ps", k = 7),
data = matrix_gam,
family = gaussian)
绘制时间序列有两个主要自变量:天和周。我们的响应变量是电力负荷。我们来构建出GAM模型
我们可以看到时间变量对电力负荷的影响。在左图中,负荷的峰值是白天下午3点左右。同时我们可以看到,周末耗电量下降。
然后我们绘制耗电量曲面图更直观的发现规律。
我们可以看到,最高峰是当“每日”变量的值接近(3点),“周”变量的值为1(这是星期一)。
最后,我们可以看到,电力负荷的最高值是星期一下午3点直到星期四,然后负载在周末减少。
结语
GAM模型的优点在于其解决高度非线性预测问题的突出能力。GAM模型是否可以应用在其他领域?
抛砖:logistic regression在credit risk里面用的很多,个人认为作为统计进入金融风控是个不错的切入点。
未完待续。。。
相关文章推荐
- DL开源框架Caffe | 用训练好的模型对数据进行预测
- 【大数据部落】R语言RFM模型在电商行业的应用
- 深度学习-CAFFE利用CIFAR10网络模型训练自己的图像数据获得模型-4应用生成模型进行预测
- GAM(广义相加模型)概要及R程序实现
- keras中如何保存model的数据,以及如何重构模型进行数据预测
- 【大数据部落】R语言对推特数据进行文本情感分析
- 使用Weka进行数据挖掘(Weka教程七)Weka分类/预测模型构建与评价
- 【大数据部落】R语言逻辑回归logistic regression对用户收入进行预测
- 使用三种继承回归模型对美国波士顿房价训练数据进行学习,并对测试数据进行预测
- 集成模型(回归)对Boston数据进行训练并对数据做出预测
- R语言实现 广义加性模型 Generalized Additive Models(GAM) 入门
- 使用两种不同配置的K近邻回归模型对美国波士顿房价数据进行回归预测
- 【大数据部落】R语言多元Copula GARCH 模型时间序列预测
- 简单数据预测—使用Python训练回归模型并进行预测(转自蓝鲸网站分析博客)
- 【CNTK】CNTK学习笔记之应用卷积神经网络模型进行数据预测
- R语言进行数据预处理
- Hibernate动态建表,通过hbm.xml配置文件创建数据表,进行数据库操作, 动态模型
- SharePoint服务器端对象模型 之 使用CAML进行数据查询
- R语言广义线性模型
- R语言利用逻辑回归模型预测用户活跃