您的位置:首页 > 理论基础 > 计算机网络

异构信息网络--基本概念和定义学习笔记

2016-03-24 09:33 1386 查看
详见:Chuan
Shi 的论文A Survey of Heterogeneous Information Network Analysis
(写这篇才知道翻译文献比看痛苦的多


如果觉得下面的格式实在是不堪入目,可以移步
http://note.youdao.com/share/?id=d8910e1cd605dc9c824c911358b73808&type=note

一、基本定义
1.定义一,信息网络(Information Network):
信息网络可以用一个有向图G =
(V, E) 来表示,其中V代表 Object,E代表
Edge。并且用映射函数 ϕ : V →
A 来表示每一个object v ∈ V 属于object类型集
合A: ϕ(v) ∈
A,用映射函数ψ : E →
R.表示每条边 e ∈ E 属于边的类型集
合R: ψ(e) ∈
R。如下图1所示:







图2
图3
注:如果两条边连接的起始节点和终止节点的type都相同,则这两条边是同一种类型。

2.定义二,异构/同构信息网络(Heterogeneous/homogeneous information Network)

如果|A| > 1 或者 |R| > 1 ,则该信息网络为异构信息网络,或简称为异构网
络,否则为同构网络。例如图2即为一个典型的网络实例(network
instance,
following
某种 network schema的信息网络可以称为这种网络模式的网络实例)from
DBLP(如果你要做异构信息网络这个方向,你会经常和这个数据集打交道)

3.定义三,网络模式?(Network schema)

异构信息网络(G = (V, E)with ϕ(v) ∈
A 并且 ψ(e) ∈
R)的network
schema TG =
(A, R),要指定objects和links的类型约束,就是这种约束使得异构网
络变为半结构化。网络模式如图3所示,图2是图3的网络实例。

4.定义四,元路径(Meta path)
元路径P是定义在网络模式TG = (A, R)上的,如

表示了从A1


的复杂的关系,

。元路径P的长度即为关系R的个数。
注:(1)在不引起歧义的情况下也可以直接用object
type来表示元路径。

,例如:

可以直接表示为APA。
(2)



,则

=


(3)形如APA,APVPA,APTPA等,

=

的,则此元路径为对称的。
(4)不同元路径代表着不同的物理意义,元路径所所蕴含的丰富的语义特征,是
HIN的一大非常重要的特征,所以现在非常promising的一个方向语义挖掘(semantic
mining)大部分还是在针对元路径进行研究。



(5)其他元路径举例:



二、相关概念的比较

1.Heterogeneous network vs homogeneous network,同上,不再赘述
2.Heterogeneous
network vs multi-relational network
,后者只有一种object类
型,但是有大于1中link类型

3.Heterogeneous
network vs multi-dimensional/mode network
,后者与multi-
relational
network含义相同

4.Heterogeneous
network vs composite network
,后者是杨强提出来的,是说网络
中的用户之间存在多种关系,在同一时间展示着不同的行为或者是共享着某种潜在的关
系,其实也是一种多关系网络

5.Heterogeneous
network vs complex network
,后者是有着非常规的拓扑特征的网
络,网络中objects间的连接既不规则也不随机。这种非常规的拓扑特征包括:度分布
中的重尾,很高的聚集系数,社区结构和分层结构。社交网络、信息网络、技术网络、
生物网络等都是复杂网络,且很多异构网络也是复杂网络。但是复杂网络的研究主要集
中的网络的结构、功能和特征上。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: