您的位置:首页 > 理论基础 > 计算机网络

面向大规模社会关系网络数据的层次数据发现

2015-12-25 16:09 603 查看
现在随便哪个关系网络的数据规模都非常庞大,如https://snap.stanford.edu/data/上面公开的数据集,动不动都是几万个节点,十几万个边的。

然而这种大图数据背后的一些规律挖掘更突显了大数据发现价值的本质。

本篇博客在承接上次社团发现的问题,继续在大规模关系网络挖掘上进行分析测试。

主要实验数据集采用了三个:

(1) https://snap.stanford.edu/data/com-DBLP.html
com-DBLPUndirected, Communities317,0801,049,86613,477DBLP collaboration network
对30多万个节点,100多万个边的测试,速度还是超快的,只需要



(2) https://snap.stanford.edu/data/com-Youtube.html
com-YoutubeUndirected, Communities1,134,8902,987,6248,385Youtube online social network
对110多万个节点,300万条边的测试



(3) 然而对于下面这个数据集,边数超过1000万,就发现内存不够的现象,这种现象简直是无解,普通PC还是胜任不了超大规模图的计算。当然要计算,得进行数据的预处理操作。

cit-PatentsDirected, Temporal, Labeled3,774,76816,518,948Citation network among US Patents
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: