您的位置:首页 > 其它

2016 美赛C题欧奖论文学习笔记①

2018-02-04 16:11 267 查看
离开题还有4天,发现自己基本上什么都不会,哭了,从今天开始每天看五篇论文,每天写笔记,更新在这里。

16年题目:

为慈善机构设计援助方案,使投资回报率最大。特点:大数据,数据需要自己处理。数据挖掘。

需要提交:

总结(一页);写给CFO的信(需要包括最优投资策略,建模方法,主要结果。简要谈谈你对ROI的定义,不超过两页);论文(竟然没有提到论文的长度?大概是不要求?)

# 50193

这一组用的方法,K均值算法,层次分析法,都是很低级的方法,整篇文章的遣词造句也中式英语明显,但依旧是欧奖,我认为原因在1,考虑得非常全面,他们考虑到了时间和地理因素的影响,以及经济学方面的影响。建模应该贴近现实且尽可能丰富详实。2,讲得很清楚,例如对K均值算法的公式理论讲解,实在是很清楚。用k均值填补缺失不算新颖?一个一个模型看起来不难,但是组合起来就是欧奖。

这一组里应该至少有一个是经济学专业的

这一组考虑到边际效应,不会将大量钱投给哦同一所学校,但是就慈善机构的性质和名声来说,这样做可能无法体现出慈善的效益,所以我认为应该重点扶持一两所学校,然后分散对其他学校的投资,在有重点的情况下不把鸡蛋放在一个篮子里。

1. 数据处理:

这里可以有一个数据处理流程图

筛选 —— 删去小于初始值的

合并参数 —— linear fitting 和PCA(主要成分筛选)

填补缺失数据 —— k均值聚类,用每一类的均值去填补缺失项的值,是很好的数据填补方法,比直接取平均值好。

使各个数据能比较 —— normalize data 数据归一化

什么是填补缺失数据维基百科:https://en.wikipedia.org/wiki/Imputation_(statistics)

机器学习里缺失数据填补的拓展阅读: https://www.zhihu.com/question/26639110
数据归一化拓展阅读:http://blog.csdn.net/xiaotao_1/article/details/79077293

回顾:四种聚类算法:http://blog.csdn.net/summer_upc/article/details/51475512

2. 构建ROI模型

利润 / 投入 X 系数(紧急程度)

使用PCA筛选系数

AHP 层次分析法 衡量权重 虽然层次分析法饱受诟病,但是这里ROI的建立本来就是很主观的一个东西,哪怕需要调整也很容易

这里有一个ROI建立的流程图

建立合理有效的ROI是非常重要的一点,这里用了PCA,主成分分析拓展阅读:http://blog.jobbole.com/109015/

用 Grey Theory 通过过去五年的数据来预测未来五年的数据

THOUGHTS:这里的系数考虑了时间和地理因素,对一个慈善机构的投资是很重要的。参考美国财富分布?

3. 建立一年的基础模型

引入Mixed Portfolio Theory(经济学模型)来描述ROI的变化

Mixed Integer Linear Programming Algorithm

4. 构建5年模型

MILP 和Grey Prediction

5. sensitivity Analysis:找出最佳参数

改变学校数量,金钱限制,是否平均给的钱
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  美赛 MCM