您的位置:首页 > 其它

数据分析常用数据源汇总

2016-08-11 14:42 232 查看
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/jameswangcnbj/article/details/52182486

本文根据知乎相应内容汇总。
1.UCI是最经典的,不过也比较古老
2.数据堂最近异军突起,非常值得称赞
3.国外还有一些网站,比如http://mlcomp.org/http://mldata.org/你可以看看
另外KDDCUP每年都会针对一个特定的问题进行比赛,数据集也是公开的
最近几年,数据挖掘的比赛越来越多了,你可以去PASCAL上看看你感兴趣的领域,自己搜索一下
http://www.delicious.com/pskomoroch/dataset这个是delicious上面一个人搜集的数据集网站书签,比较杂,或许你能找到你所要的(话说delicious改版之前这个里面的内容比现在的多多了)
4.再有就是看具体的做的内容,然后看相关学者都用什么数据集,除了LDC那种变态组织,其他很多数据都可以通过track论文中的信息或者是作者主页上的信息下载到的
做数据挖掘和数据分析都是针对某一个领域或者问题去做,其实也看那个领域会不会有开放的心态去公开数据,前两年在Hans Rosling老先生在TED上公开呼吁之后,很多机构,包括联合国都公开了自己的数据
5.补充,在quora上面看到一个问题中的答案涉及这个问题

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: