中文知识图谱构建方法研究3
2015-12-07 23:31
465 查看
3 知识的应用
3.1 语义检索
传统的检索是基于关键词,搜索引擎并不理解用户的输入,仅对用户的输入进行切分得到关键词,得到关键词后再与目标数据进行匹配,把匹配的结果通过一定的排序算法返回给用户,用户在这些结果中选取想要的目标结果。基于知识图谱的语义检索的目标在于理解用户的输入,为用户给出更加直接和准确的答案。语义检索分为三个过程:
(1)通过分词和实体识别从输入中识别概念、实体和属性;
(2)结合知识图谱的数据模式,对识别的结果进行理解;
(3)把理解的结果在目标数据集上进行搜索并返回结果;
如图所示,用户搜索“罗志祥的年龄”,不仅列出了罗志祥的年龄,还给出了罗志祥相关度较大的人物的年龄,右侧显示了罗志祥的关系图谱以及同年出生的人。这些检索结果看似简単,但这些场景背后蕴含着极其丰富的信息:首先,搜索引擎需要知道用户输入中的“罗志祥”代表的是一个人;其次,需要同时明白“年龄”一词代表什么含义;最后,还需要在后台有丰富的知识图谱数据的支撑,才能回答用户问题。
图3.1 搜狗搜索结果快照
3.2 知识导航
知识图谱包括了概念、实体以及它们之间的关系,是一个具备体系结构的知识库,因此可以辅助和引导用户进行学习:(1) 实体和概念本身的知识,通常以知识卡片的形式提供;
(2) 实体、概念之间的关联关系,主要包括上下位层次关系和属性关系;
3.3 决策支持
决策支持系统,是一种辅助人类做决策的信息系统,强调的是支持而非替代人类进行决策。决策的过程主要是对数据、信息及相关资料进行统计与分析,从中发现数据的规律,为用户决定提供参考。基于知识图谱的决策支持系统的优点如下:
(1)使得一些无结构或者离散孤立的数据的利用变得可能;
(2)同时也可以使用多种类型的数据进行综合分析,提供推理功能,更好地辅助用户决策。
基于知识图谱的决策支持系统的使用方法如下:
(1)使用基于自然语言的语义查询来获取结果;
(2)也可以使用所提供的SPARQL查询接口或RESTful接口进行知识的搜索;
4 参考文献
[1] Buitelaar P, Cimiano P, Magnini B. Ontologylearning from text: methods, evaluation and applications[M]. IOS press, 2005.[2] Maedche A, Staab S. The text-to-onto ontologylearning environment[C]//Software Demonstration at ICCS-2000-EightInternational Conference on Conceptual Structures. 2000, 38.
[3] Stojanovic L, Stojanovic N, Volz R. Migratingdata-intensive web sites into the semantic web[C]//Proceedings of the 2002 ACMsymposium on Applied computing. ACM, 2002: 1100-1107.
[4] Shinzato K, Torisawa K. Acquiring HyponymyRelations from Web Documents[C]//HLT-NAACL. 2004: 73-80.
[5] 维基百科中文版. https://zh.wikipedia.org/wiki/%E4%B8%AD%E6%96%87%E7%BB%B4%E5%9F%BA%E7%99%BE%E7%A7%91
[6] 互动百科. http://www.baike.com/
[7] 百度百科.
http://baike.baidu.com/
[8] Yin X, Shah S. Building taxonomy of web searchintents for name entity queries[C]//Proceedings of the 19th international conferenceon World wide web. ACM, 2010: 1001-1010.
[9] Pasca M. Turning Web Text and Search Queriesinto Factual Knowledge: Hierarchical Class Attribute Extraction[C]//AAAI. 2008:1225-1230.
[10] Novak J D, Cañas A J. The theory underlyingconcept maps and how to construct and use them[J]. 2008.
[11] A.A Krizhanovsky and A.V. Smirnov. An approachto automated construction of a general-purpose lexical ontology based onWiktionary. Journal of Computer and Systems SciencesInternational,2013,52:215-225.
[12] HowNet.http://www.keenage.com/
[13] 梅家驹,高蕴奇.《同义词词林》.上海辞书出版社,1983.
[14] Auer S, Bizer C, Kobilarov G, et al. Dbpedia: Anucleus for a web of open data[M]. Springer Berlin Heidelberg, 2007.
[15] Fabian M S, Gjergji K, Gerhard W. YAGO: A coreof semantic knowledge unifying wordnet and wikipedia[C]//16th InternationalWorld Wide Web Conference, WWW. 2007: 697-706.
[16] Freebase.
https://www.freebase.com/
[17] Niu X, Sun X, Wang H, et al. Zhishi. me-weavingchinese linking open data[M]//The Semantic Web–ISWC 2011. Springer BerlinHeidelberg, 2011: 205-220.
[18] Volz J, Bizer C, Gaedke M, et al. Discoveringand maintaining links on the web of data[M]. Springer Berlin Heidelberg, 2009.
相关文章推荐
- ***浅析JQuery中的html(),text(),val()区别
- Makefile的编写及四个特殊符号的意义@、$@、$^、$<
- 上拉刷新,下拉加载
- FloatingActionButton增强版,一个按钮跳出多个按钮--第三方开源--FloatingActionButton
- POJ 1753 枚举
- XML/JSON 后台数据
- 1137. 河床
- 《Python核心编程》第10章 习题
- 1、osgViewer::Viewer,osgViewer::ViewerBase,osgGA::KeySwitchMatrixManipulator,osg::ArgumentParser的说明
- 关于socket buffer size的调优
- 广告拍卖机制与点击率预估概述
- python语法笔记(三)
- 清华EMBA课程系列思考之三 -- 中国经济与金融
- Python字典里面创建字典
- liunx 中普通用户关机的方法
- Effective C++读书笔记
- while循环和for循环的区别
- mysqlslap
- ubuntu 开机出错disk by-uuid ########### does not exist dropping to a shell
- 设置SOCKET的发送与接收缓冲区