[天池竞赛系列]阿里音乐流行趋势预测大赛初赛三等奖思路
2016-08-04 19:17
393 查看
第一赛季8名,第二赛季11名
主要使用模型和规则
预处理:过滤异常用户的操作记录,比如一整天都听同一首歌,疯狂下载歌的等等
构建样本:对每个歌手建模,每一天的播放数据为一个样本,有的歌手会出现很多突然的波动,使用7点平滑
特征:因为是对每个歌手建模,所以不用考虑歌手特征,全部使用时间特征
工作日,节假日,是否加班,放假第几天,工作第几天,星期几,节前,节后等等
趋势特征:不同大小的窗口做差分特征,从训练集开始按时间编号,训练集使用3个月的数据,按天编号1~90,预测集91~150,按周编号,按月编号等等
模型:LR+SVR+RF+XGBOOST bagging融合
训练集训练模型,反过来预测训练集,将偏差过大的歌手从训练集删除,拿出来单独分析
发现这些歌手变动情况比较大,模型难以预测
考虑使用规则,考虑评分公式,排除一些变量,简化公式求导可得一个预测均值,e(1/tk)/e(1/tk^2)作为预测结果
过滤出一些模型预测为负的歌手,观察发现这些歌手趋势下降太快,导致模型预测为负,将预测为负的部分用规则处理
有明显提高,因为有时候偏差过大的话会导致这个歌手的得分为负。
最后融合一下模型和规则就是最后线上成绩
最近在实习,投入这个比赛的精力较少,初赛复赛基本都是最后一周开始搞,所以方案略简单,也没有考虑歌手的一些细节特征
观察过发布新歌和趋势好像没有明显关系?莫非是观察的姿势不对。。
相关文章推荐
- 天池阿里音乐流行趋势预测大赛--初赛
- 阿里音乐流行趋势预测大赛-赛后思路整理
- 阿里音乐流行趋势预测大赛一起做-(7)初赛总结之用户分类
- 天池_阿里音乐流行趋势预测大赛(1) —— 赛题分析
- 阿里音乐流行趋势预测大赛一起做-(3)思路
- 阿里音乐流行趋势预测大赛一起做-(3)思路
- 阿里音乐流行趋势预测大赛一起做-(7)初赛总结之用户分类
- 【天池竞赛系列】资金流入流出预测思路
- 阿里音乐流行趋势预测大赛一起做-(1)介绍
- 阿里音乐流行趋势预测大赛一起做-(6)小结
- 阿里音乐流行趋势预测大赛—浅尝辄止(一)
- 阿里音乐流行趋势预测大赛—浅尝辄止(二)
- 阿里音乐流行趋势预测大赛一起做-(4)成绩提交
- 【天池竞赛系列】菜鸟-需求预测与分仓规划初赛冠军解决方案
- 阿里音乐流行趋势预测大赛 # 第一赛季第21名解决方案
- 阿里音乐流行趋势预测大赛一起做-(1)介绍
- 阿里音乐流行趋势预测大赛一起做-(2)weka初识
- 阿里音乐流行趋势预测大赛一起做-(2)weka初识
- [天池竞赛系列]O2O优惠券使用预测复赛第三名思路
- 阿里音乐流行趋势预测大赛,赛后总结