您的位置：首页 > 移动开发

《Keyword Search on RDF Graphs — A Query Graph Assembly Approach》——读书笔记之motivation

2017-06-24 08:43 405 查看

假期的第一篇论文，希望有一个有意义的暑假

ABSTRACT

关键词搜索为一般用户搜索RDF图提供易用接口。（动机&意义）本文对给定的关键词生成查询图。定义了query graph assembly（QGA）问题，并证明其为NP完全问题。设计了一些heuristic lower bounds and propose a bipartite graph matching-based bset-first search algorithm.实验在DBpedia和Freebase上结果理想。

1. INTRODUCTION

RDF数据增长迅速，由于知识图谱和LOD项目，RDF用途也十分广泛。从RDF数据集中获取信息较难，SPARQL太专业不友好。因此出现了NL sentences和keywords两种方法。句子提供了一定的语法结构和语义信息，关键词更为简短和灵活，因此比较困难。但关键词搜索比较流行，因此本文关注RDF图上的关键词搜索。

两个方面：

Effectiveness：有效的。能够精确地理解查询意图。两部分：关键词的歧义性，查询结构的多样性。

Efficiency：效率。两部分：一是把关键词转换为SPARQL语句。二是执行SPARQL语句。

三种关于关键词在RDF和图上搜索的方法：

1，schema-based：利用RDB的sechma。根据表的外键和主键，建立schema图，然后基于schema图，找到join trees去推测查询模式的结构。但是RDF的特征是没有模式，所以此方法不适用。

2，class-based summarization. 首先，影响RDF类节点的水平结构，生成摘要图。然后图搜索算法应用于摘要图，但因为丢失了关于实体关系的细节，可能得到不完全或不正确的答案。可用于RDF。

3，data graph。在data graph上使用图搜索算法，找到连接所有关键词的最小结构。RDF和RDB都可以表示为数据图。关键词搜索问题可表示为在图G上找到覆盖了所有关键词的连通树T，即group Steiner tree问题，是NP温泉的。

方法2,3的两个通用问题：

1，没有理解输入的关键词。以前工作假设结果树的size越小，携带的语义越多。

2，他们的搜索算法基于查询图。对于大图来说开销大。即便使用summary graph，对于开放领域来说，也比较大。

另外，目前使用监督学习的方法对关键词产生结构化的查询，需要大量的标注工作，基本难以实现。

1.1 Our approach

query graph assembly (QGA for short): 首先将每个关键词匹配到一组基本的query graph element候选中，然后把这些图元素组装成查询Q。

有效性：通过把关键词歧义和查询图生成组合成一个模型。组合模型克服了分离的模型中错误传播的问题。

2

2

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航