您的位置:首页 > 其它

本体建模与语义Web知识发现 9:基于本体知识库的知识发现

2017-12-31 11:47 288 查看
    目前在Web上进行的信息检索主要是利用搜索引擎,进行基于字符的关键字匹配检索。尽管搜索引擎在一定程度上避免了用户浏览网络信息的盲目性,给用户带来了便利,但是这种检索方式的主要问题是在返回大量不相关的结果的同时却又漏掉了一些相关页面,在很大程度上无法满足用户的需求。面对网络信息量的激增,传统的基于信息定位的Web信息表示方法,使得现有信息检索面临前文中所述的困难和窘境。而语义Web是目前一个较好的、相对与继续使用现有信息表述方法而开发文本处理技术更容易的、解决上述问题的选择,为语义检索和基于知识库的知识发现提供技术基础。因此,建立基于语义Web的知识发现方法具有实际意义和较高学术价值。

    语义检索是将人工智能技术与自然语言处理技术结合,从语义理解的角度分别对信息资源、用户查询请求进行分析的信息检索方法,其检索方式是基于知识、语义的匹配。通过一系列词表控制法、概念空间、语义网络、语料库控制、语义本体等方法能够实现对概念与概念之间语义的描述。词表控制法、概念空间、语义网络、语料库控制等方法都利用词汇在概念上的相关性,形成专业的手工词表或者机器学习生成的关联概念空间,这些方法一个明显的不足就是对概念关系的描述刻画程度有限。例如,主题词表只反映词间关系,无法表现公理、规则等,概念空间表达的多是概念间相关词的集合。这些方法在一定的程度上解决了基于关键字检索的不足,但只是一种初级的语义检索方法,不能更好地理解用户的检索意图和关键字所表达的语义。

    语义本体比上述方法有更为丰富的语义表示途径,具有良好的概念层次结构,通用的本体建模元语,利用概念之间的关系对概念语义进行表达,能很好地支持逻辑推理,在语义、知识层面描述信息资源的概念模型,适合知识的表达和网络环境下的知识共享和互操作,这些特性为语义检索提供了良好的框架结构和知识基础。基于领域本体的语义检索实质上是把借助领域本体规范后的检索请求按领域与标注后的信息源索引库进行语义匹配和语义推理,并提交给检索系统的过程。基于领域本体对术语的严格描述和定义,以及反映术语间关系的语义网络,可以实现对查询请求和信息源知识的规范处理。把本体技术引入知识发现领域之后,就可以实现对某个领域内信息和知识的检索,较好地处理一义多词、一词多义所导致的问题,实现语义化的知识资源发现。

9.1 语义检索和知识发现

     知识发现是一个从数据中发现知识的过程,其核心是数据挖掘,即通过聚类、关联规则分析等技术挖掘信息的频繁模式。基于知识库的知识发现核心是挖掘隐含的知识,通过语义检索和本体推理技术完成。











语义信息检索模型具有下述功能:

1)具有语义推理能力。一定的语义推理能力是基于本体语义检索系统相较于传统信息检索系统明显的进步,不但能够检索出明显的用户需求信息,而且还能根据一定的规则和公理推导出隐含的知识。

2)具有语义扩展能力。利用本体模型对检索式进行相关概念间关系的描述,对用户使用的查询概念,自动进行语义的扩展,即对查询概念的同义词、上位词、下位词进行相关的扩展、泛化等操作,这样可以提高查全率和查准率。

3)传统的信息检索方法是将用户输入的检索关键字与信息资源库中的索引词按照字符进行匹配,检索目标结果的方法,检索系统只是把关键词作为一种标示符号、无法理解其所含有的语义信息。例如,用户检索“美洲住宿费标准”,传统的检索系统只返回含有“美洲住宿费标准”字样的检索结果,而只含“80元/人×天”的检索结果将没有办法被系统直接检索出来。基于领域本体的语义检索系统的核心思想是加入领域本体作为进行检索匹配和推理的核心部件,与传统的检索方式相比,增加了本体推理层。本体层的作用过程如图9-2所示。






9.2 基于本体的语义检索关键技术

     基于本体的语义检索的核心技术是语义推理,涉及推理机机制、推理规则生成和查询语言转换等关键技术。













































9.3 基于知识发现的案例推理应用模型


 





































9.4 基于知识库的知识发现及应用













内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: