FG-Index: Towards Verification-Free Query Processing on Graph Databases
2017-01-06 16:58
796 查看
简介
这篇paper是香港中文大学James Cheng 郑老师发在sigmod 2007上的一篇paper。这篇paper主要用频繁子图来建索引,来加速图同构算法。
众所周知,图数据的查询因为涉及到子图同构的问题(NPC),所以非常消耗时间。图同构常见的步骤都是生成候选集合(candidate set)将不可能入选结果集的结果过滤掉,第二部就是对候选集合进行验证。
假设现在存在一组频繁子图FG(Frequent subGraph),如果查询图是FG当中的一个元素,那么FG-index就可以直接把对应的结果返回给用户。如果查询不存在FG当中,那么FG-index会给出一个跟正确结果很相近的候选集合,那么这样的验证也相应的可以减少很多。
为了可以让索引载入到内存当中,文章中提出了δ-Tolerance Closed Frequent Graphs。可以调整索引的大小。
背景
图同构两大步骤:过滤=>验证频繁出现的图意味着过滤以后的候选集合会非常大,那么就需要验证很多的候选结果。
较少出现的图意味着利用FG-index可以返回基本和结果一样的候选集合。
需要解决的一个问题是,如果选定的阈值太小δ,那么index将会太大。这也是文章想解决的一个问题。
问题定义
子图同构(subgraph isomorphism)。可自行查阅wiki或者原文。文章基于无向带标签连通图。有向图可在下述方法中做扩展。
基本定义
图频率 给定一个图数据库D,给定一个图g,所有g’满足g是g’的子图,g’是D中的一个元素,这样g’的数量表示g的频率。直观来讲就是g是D中多少个图的子图。计作freq(g).频繁子图 用户给定σ,当一个图g的freq(g)大于σ时,那么就称g是一个频繁子图。
最大频繁子图MFG 对于一个频繁子图的集合F,对于F中的一个元素g,不存在其他的元素g’是g的超图,那么g是F当中的一个MFG。
闭频繁子图CFG 对于一个频繁子图的集合F,对于F中的一个元素g,不存在g’是g的超图,并且freq(g’)=freq(g),那么我们称g是F的一个CFG。
#
======To be continue=========相关文章推荐
- hdu 4677 Query on Graph
- [环套树 bfs序] ICPC 2016 Shenyang J & HDU5957 Query on a graph
- hdu4677 Query on Graph 根号n
- HDOJ 4677 Query on Graph
- 论文注解《Query Languages for Graph Databases》graph数据库查询语法(II)
- 《Keyword Search on RDF Graphs — A Query Graph Assembly Approach》——读书笔记之motivation
- 【HDU】4677 Query on Graph 动态树
- 《Efficient Batch Processing for Multiple Keyword Queries on Graph Data》——论文笔记
- HDU 5957 Query on a graph (拓扑 + bfs序 + 树剖 + 线段树)
- [论文笔记] Crowdsourced Databases: Query Processing with People (CIDR, 2011)
- HDU 4677 Query on Graph
- 论文注解《Query Languages for Graph Databases》graph数据库查询语法(III)
- 论文注解《Query Languages for Graph Databases》graph数据库查询语法(I)
- 【HDU】5957 Query on a graph【分类讨论+bfs序线段树】
- 500错误解决 调试ASP程序错误An error occurred on the server when processing the URL
- NEU 11月组队赛D题 QUERY ON THE TREE
- 【SPOJ375】 Query on a tree——树链剖分
- 安装远程桌面,VNC Server on FreeBSD + VNC Viewer on Windows !
- POJ-2415 Hike on a Graph 搜索
- iconv.h error on configuring zabbix 1.8 agent on FreeBSD 8.2