您的位置:首页 > 理论基础 > 计算机网络

复杂网络研究常用载体集

2013-10-21 10:24 573 查看
原文出处:http://blog.sciencenet.cn/home.php?mod=space&uid=237587&do=blog&id=228595

复杂网络的研究常常是和实际的复杂系统紧密结合的。从小世界和无尺度现象的发现开始,人们就逐渐认识到,包括社会网络中人与人之间的交际网络和Internet, web等大量现实网络在内的系统中隐含了大量的秘密等待人们去发现。这里总结了复杂网络研究的常用载体的集合,这些载体大部分是在复杂网络的论文中使用频度很高的。当然,很多时候,我们的网络研究也许会针对某一项特定的实证研究展开,而且这些实证研究的网络是需要自己根据实际情况抽取、构建的。但是无论怎么样,公用的载体集总是可以为我们提供一些帮助的,比如Mark
Newman, Barabasi等人的个人网页上就提供了一些载体集合。这里将复杂网络的载体分成四大类:社会学网络,生物学网络,计算机网络,人造技术网络,最后列举了网络上公开的其他一些网络研究载体集。[特别提醒]每一个特定载体集合的出处均标明,正常引用这些资料的时候需要尊重原始作者的知识产权。

1. 社会学网络

1.1 ZACHARY空手道俱乐部成员关系网络

【简介】Zachary空手道俱乐部成员关系网络是复杂网络、社会学分析等领域中最常用的一个小型检测网络之一。从1970到1972年,Wayne Zachary用三年时间观察了美国一所大学空手道俱乐部成员间的社会关系,并构造出了社会关系网(Zachary’s karate club network)。网络中的每个节点分别表示某一个俱乐部成员,节点间的连接表示两个成员经常一起出现在俱乐部活动(如空手道训练、俱乐部聚会等)之外的其他场合,即在俱乐部之外他们可以被称为朋友。调查过程中,该俱乐部因为主管John A.(节点34)与教练Mr.
Hi(节点1)之间的争执而分裂成2个各自为核心的小俱乐部,不同颜色与形状的节点代表分裂后的小俱乐部成员。规模:34个节点,78条边

【数据集】zarchary

【出处】Zachary W W. An information flow model for conflict and fission in small groups. Journal of Anthropological Research, 1977, 33:452–473

1.2美国政治书网络

【简介】由V. Krebs从Amazon上销售的美国政治相关书籍页面上建立起来的网络。其节点代表在Amazon在线书店上销售的美国政治相关图书,边代表一定数量的读者同时购买了这两本图书(由抽取网页上的“购买了这本书的读者同时也购买了一些图书”指示得到)。节点分成了三类:l, n和c, 分别代表“自由派”、“保守派”和“中间派”。这些派别的划分是由Mark Newman根据Amazon上对于图书观点以及评价情况的人工分析得到的。规模:105个节点,441条边

【数据集】polbooks

【出处】Mark Newman,http://www-personal.umich.edu/~mejn/, and V. Krebs website。

1.3演员合作网络

【简介】国内学者构建了一个2006年中国电影演员合作网络:该数据来自国内著名的网络电影社区——MTime网站,网络中每个节点代表一个演员,边代表两个演员共同出演过同一部电影,即存在合作关系。规模:网络共有587个节点1725条边。

【数据集】暂无

【出处】赫南, 淦文燕, 李德毅. 一个小型演员合作网的拓扑性质分析[J]. 复杂系统与复杂性科学. 2006, vol.3(4):1-10.

淦文燕,数据场方法及其在网络化数据挖掘中的应用研究,清华大学博士后研究报告,2007年6月

1.4高能物理学理论文献引文网络

【简介】高能物理学理论文献引文网络这是规模较大的、同时也是非常有名的合作网络实证载体,不少有影响力的文献里面曾经对它进行过研究。KDD CUP2003竞赛的数据源之一。其数据来源于arXiv.org,涵盖的论文入库(arXiv数据库)时间从1993年1月到2003年4月. 网络边的构建方式是:如果一篇论文i引用了另一篇论文j,在两者之间加上一条从i指向j的有向边。(如果被一篇数据库之外的论文引用或者引用了一篇数据库之外的文献,不做任何处理)。附件提供了300个节点规模的网络,这是按照时间排序,从1993年1月开始添加进arXiv数据库的最初的300篇高能物理理论文献。规模:网络共有29,555个节点,352,807条边。

【数据集】HEPCitation 300

【出处】KDDCUP2003

1.5悲惨世界人物关系网络

【简介】D. E. Knuth根据Victor Hugo(维克多.雨果)的小说Les Misèrables,《悲惨世界》,整理了其中的人物关系网络。网络中的节点表示小说中的角色,边表示两个角色同时出现在一幕或多幕中。网络中有六个主要人物,主人公Jean Valjean(冉阿让),探长Javert(贾维),神父Bishop Myriel(米里哀),女工Fantine(芳汀)及其女儿Cosette(珂赛特)。研究人际网络中关键的边(即人物之间的联系)对网络整体性能的影响,发现网络内关键的边,将对舆情和疾病等的传播具有非常重要的意义。规模:网络共有77个节点,508条边。

【数据集】lesmis

【出处】Knuth D E, The Stanford Graph Base: A Platform for Combinatorial Computing. Addison-Wesley, Reading, MA,1993

1.6卓越亚马逊手机在线销售网络

【简介】根据Amazon-joyo的手机在线销售数据整理而得,具体统计时间为2008年10月到2009年4月,后续的数据正在收集中。手机在线销售数据的节点为手机(由“品牌+型号+颜色”三个属性加以区别)。边由“查看此商品的顾客也查看了(下列商品)”的属性得到。取每天销售量前20名的手机进行统计。规模:每天小于20个,随着天数不断演变。

【数据集】mobilephone

【出处】张海粟,复杂网络研究常用载体集,http://www.sciencenet.cn/m/user_content.aspx?id=228595

1.7美国大学足球俱乐部网络

【简介】【数据集】【出处】

1.8美国南部妇女活动网络

【简介】美国南部“Old City”市18位妇女参加被当地报纸所报道的社会活动(诸如俱乐部集会、教会晚宴等)的数目。图中蓝色方块节点为事件,红色圆圈为妇女,这是一个二模图。规模:18个节点,边数根据二模向一模转化的结果而定。

【数据集】暂无

【出处】Davis, A. Gardner B. B. and Gardner, M. R. 1941, Deep South: A social anthropological study of caste and class. Chicago: University of Chicago Press.

Martin Kilduff and Wenpin Tsai 著,王凤彬等译,社会网络与组织,中国人民大学出版社,2007.1.

2.生物学网络:

2.1海豚家族关系网络

【简介】D. Lusseau等人对栖息在新西兰Doubtful Sound峡湾的一个宽吻海豚群体(该群体由2个家族共62只宽吻海豚组成)进行长达7年的观察所构造出的海豚关系网。图中节点代表一个海豚,边表示两个海豚之间接触频繁,图不同颜色与形状的节点代表属于不同家族的海豚成员。规模:共有62个节点159条边

【数据集】dolphins

【出处】Lusseau D, Newman M E J. Identifying the role that animals play in their social networks, Proceedings of the Royal Society of London Series B-biological Sciences, 2004,271:477-481

2.2新陈代谢网络

[简介]

[数据集]

[出处]

3.计算机网络:

3.1AS级网络

[简介]

[数据集]

[出处]

3.2mushups应用网络

[简介]

[数据集]

[出处]

3.3服务描述单词网络

[简介]

[数据集]

[出处]

4.人造技术网络:

附:网络上其他一些可用的网络数据:

科学家合作网: http://www-personal.umich.edu/~mejn/
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息