2016 美赛C题欧奖论文学习笔记①
2018-02-04 16:11
267 查看
离开题还有4天,发现自己基本上什么都不会,哭了,从今天开始每天看五篇论文,每天写笔记,更新在这里。
16年题目:
为慈善机构设计援助方案,使投资回报率最大。特点:大数据,数据需要自己处理。数据挖掘。
需要提交:
总结(一页);写给CFO的信(需要包括最优投资策略,建模方法,主要结果。简要谈谈你对ROI的定义,不超过两页);论文(竟然没有提到论文的长度?大概是不要求?)
# 50193
这一组用的方法,K均值算法,层次分析法,都是很低级的方法,整篇文章的遣词造句也中式英语明显,但依旧是欧奖,我认为原因在1,考虑得非常全面,他们考虑到了时间和地理因素的影响,以及经济学方面的影响。建模应该贴近现实且尽可能丰富详实。2,讲得很清楚,例如对K均值算法的公式理论讲解,实在是很清楚。用k均值填补缺失不算新颖?一个一个模型看起来不难,但是组合起来就是欧奖。
这一组里应该至少有一个是经济学专业的
这一组考虑到边际效应,不会将大量钱投给哦同一所学校,但是就慈善机构的性质和名声来说,这样做可能无法体现出慈善的效益,所以我认为应该重点扶持一两所学校,然后分散对其他学校的投资,在有重点的情况下不把鸡蛋放在一个篮子里。
1. 数据处理:
这里可以有一个数据处理流程图
筛选 —— 删去小于初始值的
合并参数 —— linear fitting 和PCA(主要成分筛选)
填补缺失数据 —— k均值聚类,用每一类的均值去填补缺失项的值,是很好的数据填补方法,比直接取平均值好。
使各个数据能比较 —— normalize data 数据归一化
什么是填补缺失数据维基百科:https://en.wikipedia.org/wiki/Imputation_(statistics)
机器学习里缺失数据填补的拓展阅读: https://www.zhihu.com/question/26639110
数据归一化拓展阅读:http://blog.csdn.net/xiaotao_1/article/details/79077293
回顾:四种聚类算法:http://blog.csdn.net/summer_upc/article/details/51475512
2. 构建ROI模型
利润 / 投入 X 系数(紧急程度)
使用PCA筛选系数
AHP 层次分析法 衡量权重 虽然层次分析法饱受诟病,但是这里ROI的建立本来就是很主观的一个东西,哪怕需要调整也很容易
这里有一个ROI建立的流程图
建立合理有效的ROI是非常重要的一点,这里用了PCA,主成分分析拓展阅读:http://blog.jobbole.com/109015/
用 Grey Theory 通过过去五年的数据来预测未来五年的数据
THOUGHTS:这里的系数考虑了时间和地理因素,对一个慈善机构的投资是很重要的。参考美国财富分布?
3. 建立一年的基础模型
引入Mixed Portfolio Theory(经济学模型)来描述ROI的变化
Mixed Integer Linear Programming Algorithm
4. 构建5年模型
MILP 和Grey Prediction
5. sensitivity Analysis:找出最佳参数
改变学校数量,金钱限制,是否平均给的钱
16年题目:
为慈善机构设计援助方案,使投资回报率最大。特点:大数据,数据需要自己处理。数据挖掘。
需要提交:
总结(一页);写给CFO的信(需要包括最优投资策略,建模方法,主要结果。简要谈谈你对ROI的定义,不超过两页);论文(竟然没有提到论文的长度?大概是不要求?)
# 50193
这一组用的方法,K均值算法,层次分析法,都是很低级的方法,整篇文章的遣词造句也中式英语明显,但依旧是欧奖,我认为原因在1,考虑得非常全面,他们考虑到了时间和地理因素的影响,以及经济学方面的影响。建模应该贴近现实且尽可能丰富详实。2,讲得很清楚,例如对K均值算法的公式理论讲解,实在是很清楚。用k均值填补缺失不算新颖?一个一个模型看起来不难,但是组合起来就是欧奖。
这一组里应该至少有一个是经济学专业的
这一组考虑到边际效应,不会将大量钱投给哦同一所学校,但是就慈善机构的性质和名声来说,这样做可能无法体现出慈善的效益,所以我认为应该重点扶持一两所学校,然后分散对其他学校的投资,在有重点的情况下不把鸡蛋放在一个篮子里。
1. 数据处理:
这里可以有一个数据处理流程图
筛选 —— 删去小于初始值的
合并参数 —— linear fitting 和PCA(主要成分筛选)
填补缺失数据 —— k均值聚类,用每一类的均值去填补缺失项的值,是很好的数据填补方法,比直接取平均值好。
使各个数据能比较 —— normalize data 数据归一化
什么是填补缺失数据维基百科:https://en.wikipedia.org/wiki/Imputation_(statistics)
机器学习里缺失数据填补的拓展阅读: https://www.zhihu.com/question/26639110
数据归一化拓展阅读:http://blog.csdn.net/xiaotao_1/article/details/79077293
回顾:四种聚类算法:http://blog.csdn.net/summer_upc/article/details/51475512
2. 构建ROI模型
利润 / 投入 X 系数(紧急程度)
使用PCA筛选系数
AHP 层次分析法 衡量权重 虽然层次分析法饱受诟病,但是这里ROI的建立本来就是很主观的一个东西,哪怕需要调整也很容易
这里有一个ROI建立的流程图
建立合理有效的ROI是非常重要的一点,这里用了PCA,主成分分析拓展阅读:http://blog.jobbole.com/109015/
用 Grey Theory 通过过去五年的数据来预测未来五年的数据
THOUGHTS:这里的系数考虑了时间和地理因素,对一个慈善机构的投资是很重要的。参考美国财富分布?
3. 建立一年的基础模型
引入Mixed Portfolio Theory(经济学模型)来描述ROI的变化
Mixed Integer Linear Programming Algorithm
4. 构建5年模型
MILP 和Grey Prediction
5. sensitivity Analysis:找出最佳参数
改变学校数量,金钱限制,是否平均给的钱
相关文章推荐
- [深度学习论文笔记][Image Classification] 图像分类部分论文导读
- [深度学习论文笔记][Video Classification] Long-term Recurrent Convolutional Networks for Visual Recognition a
- [深度学习论文笔记][arxiv 1711] Non-local Neural Networks
- [深度学习论文笔记] Convolutional Neuron Networks and its Applications
- 2016秋 学习笔记2
- 深度学习论文笔记:Faster R-CNN
- [深度学习论文笔记][Object Localization] OverFeat: Integrated Recognition, Localization and Detection using C
- RCNN学习笔记(7):Faster R-CNN 英文论文翻译笔记
- 结构递归神经网络: 时空领域图像中的深度学习--CVPR2016最佳论文详解
- Deep Learning论文笔记之(一)K-means特征学习
- AlexNet学习笔记-论文翻译和理解(一)
- DenseNet论文学习笔记
- 子空间学习论文笔记01:Normalized Cuts and Image Segmentation
- [Java Path Finder][JPF学习笔记][8]几篇使用JPF的论文
- [深度学习论文笔记][PAMI 17]A Comprehensive Study on Cross-View Gait Based Human Identification wit
- [深度学习论文笔记][总结]Invariant gait feature extraction based on image transformation
- 2016实习的学习笔记VS2013-网络编程
- QA问答系统,QA匹配论文学习笔记