您的位置:首页 > 移动开发

《Keyword Search on RDF Graphs — A Query Graph Assembly Approach》——读书笔记之motivation

2017-06-24 08:43 405 查看
假期的第一篇论文,希望有一个有意义的暑假

ABSTRACT

关键词搜索为一般用户搜索RDF图提供易用接口。(动机&意义)本文对给定的关键词生成查询图。定义了query graph assembly(QGA)问题,并证明其为NP完全问题。设计了一些heuristic lower bounds and propose a bipartite graph matching-based bset-first search algorithm.实验在DBpedia和Freebase上结果理想。

1. INTRODUCTION

RDF数据增长迅速,由于知识图谱和LOD项目,RDF用途也十分广泛。从RDF数据集中获取信息较难,SPARQL太专业不友好。因此出现了NL sentences和keywords两种方法。句子提供了一定的语法结构和语义信息,关键词更为简短和灵活,因此比较困难。但关键词搜索比较流行,因此本文关注RDF图上的关键词搜索。

两个方面:

Effectiveness:有效的。能够精确地理解查询意图。两部分:关键词的歧义性,查询结构的多样性。

Efficiency:效率。两部分:一是把关键词转换为SPARQL语句。二是执行SPARQL语句。



三种关于关键词在RDF和图上搜索的方法:

1,schema-based:利用RDB的sechma。根据表的外键和主键,建立schema图,然后基于schema图,找到join trees去推测查询模式的结构。但是RDF的特征是没有模式,所以此方法不适用。

2,class-based summarization. 首先,影响RDF类节点的水平结构,生成摘要图。然后图搜索算法应用于摘要图,但因为丢失了关于实体关系的细节,可能得到不完全或不正确的答案。可用于RDF。

3,data graph。在data graph上使用图搜索算法,找到连接所有关键词的最小结构。RDF和RDB都可以表示为数据图。关键词搜索问题可表示为在图G上找到覆盖了所有关键词的连通树T,即group Steiner tree问题,是NP温泉的。

方法2,3的两个通用问题:

1,没有理解输入的关键词。以前工作假设结果树的size越小,携带的语义越多。

2,他们的搜索算法基于查询图。对于大图来说开销大。即便使用summary graph,对于开放领域来说,也比较大。

另外,目前使用监督学习的方法对关键词产生结构化的查询,需要大量的标注工作,基本难以实现。

1.1 Our approach

query graph assembly (QGA for short): 首先将每个关键词匹配到一组基本的query graph element候选中,然后把这些图元素组装成查询Q。

有效性:通过把关键词歧义和查询图生成组合成一个模型。组合模型克服了分离的模型中错误传播的问题。

2

2
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: