您的位置:首页 > 其它

【分布计算环境学习笔记】7 语义Web

2013-01-04 14:42 375 查看
作者:gnuhpc
出处:http://www.cnblogs.com/gnuhpc/

1.语义网的特征:

每个资源有清晰的定义,如软件,文件,人,地点。概念之间的关系有清晰的定义,如软件产生文件,软件依赖于软件,文件的版本,文件具有主题,人所在地点。目标是实现机器自动处理信息。它将提供诸如信息代理、搜索代理、信息过滤等智能服务。语义Web上提供的这些智能服务应该超越目前这些服务的技术水平,克服它们在功能上仅能独立运行、无法交互的限制。语义网的技术基础是 XML和 RDF;其基本实现方法是开发功能逐层增强的形式化信息规约语言,用以唯一确定信息的含义,其最终目标是成为智能化网络服务和应用开发的基础设施,成为机器与人协同工作的媒介。






 

2.语义网的目标:

让计算机能够“理解”分布在网上的信息和知识,并在“理解”的前提下更好地处理、利用这些信息和知识,使Web成为支持全球化知识共享的智能信息服务平台,为人们提供优质的服务。

3.语义网的相关问题

信息检索 — 关键词检索与基于内容的检索
信息抽取 — 元数据:有关数据的数据。主要包括

语法元数据:描述有关数据内容的非上下文信息。如文档的大小、位置、创建日期等
结构元数据:提供有关内容结构的信息,如使用DTD或者XML Schema 可以定义XML文档用到的元素、属性和实体以及不同元素和属性之间的关系。
语义元数据:对语法和结构元数据添加了关系、规则和约束条件。

信息表示 — 内容与表示的分离
信息与自然语言语义
数据挖掘和知识发现
信息集成和概念集成

4.语义网层次



该体系中从低层到高层分别为:Unicode和URI、XML、RDF、Ontology、Logic、Proof、Trust

第一层Unicode和URI。该层是整个语义Web的基础,其中Unicode处理资源的编码,URI负责标识资源
第二层XML+NS+XML Schema,用于表示数据的内容和结构
第三层RDF+RDF Schema,用于描述Web上的资源及其类型
第四层Ontology vocabulary,它用于描述各种资源之间的联系
第五层到第七层是在下面4层的基础上进行的逻辑推理操作,包括公理和推理规则、认证机制及信任机制
其中核心层为XML、RDF、Ontology,这3层用于表示Web信息的语义
5.RDF

资源描述框架(Resource Description Framework, 简称 RDF)提供了一种用于表达这一信息、并使其能在应用程序间交换而不丧失语义的通用框架。RDF是一种描述资源的语言,是W3C组织推荐的描述Web上元数据的标准。用Web标识符(URI)来标识事物,用简单的属性(property)及属性值来描述资源

主要包括三部分

RDF模型
RDF/XML语法
RDF Schema
RDF三元组 被定义为(Subject,Predicate,Object),它由主体(事物)、谓词(属性)和客体(值)三部分组成。主体和谓词的类型是URI,表示一个Web 资源,客体即可以是URI,也可以是文字(Literal),RDF三元组也被称为RDF声明(Statement)。

RDF的图模型: 可把RDF声明表示为有向、带标签的图。

椭圆节点表示用URI指代的主体和客体
方框节点表示文字类型的客体
有向弧标签则表示用URI指代的谓词



 

RDF /XML 语法:

用于RDF图的表示和交换。如

为RDF图中所有空节点指定一个空节点标志符
对应于每个RDF三元组中的主体,生成一个rdf:Description元素
同一个主体的多个声明可合并为一个rdf:Description元素



RDF Schema: 实现对RDF的扩展,可用于描述和定义于特定应用相关的类和属性,从而可创建自定义的词汇表,如字典表述语言。

RDFS的作用:

定义资源以及属性的类别;
定义属性所应用的资源类以及属性值的类型;
定义上述类别声明的语法;
申明一些由其它机构或组织定义的元数据标准的属性类。
描述RDF类

类是指事物的类型或者分类,rdf:Class、rdf:Resouce、rdf:type、rdf:subClassOf
例如:

描述RDF属性,rdf:Property、 rdf:range、rdf:domain
例如:

Semantic Web和Semantic Web Service。区别就像Web和Web Service的区别。Semantic Web提供了语义化的Web网络,而Semantic Web Service则更进一步,提供了对外调用接口的支持。

6.Ontology

客观存在的一个系统的解释或说明,关心的是客观现实的抽象本质。An ontology is a formal, explicit specification of a shared conceptualization – Gruber

‘Conceptualization’指通过抽象出客观世界中一些现象的相关概念而得到的模型
‘Explicit’指所使用的概念及使用这些概念的约束都有明确的定义
‘Formal’指Ontology是计算机可读的
‘Shared’指Ontology中体现的是共同认可的知识,反映的是相关领域中公认的概念集
“共享”指Ontology中体现的是共同认可的知识,反映的是相关领域中公认的概念集
“概念模型”指通过抽象出客观世界中一些现象的相关概念而得到的模型
“明确”指所使用的概念及使用这些概念的约束都有明确的定义
“形式化”指Ontology是计算机可读、可理解的
建模元语:

类(classes)或概念(concepts):指任何事务,如工作描述、功能、行为、策略和推理过程。从语义上讲,它表示的是对象的集合,其定义一般采用框架(frame)结构,包括概念的名称,与其他概念之间的关系的集合,以及用自然语言对概念的描述 ,e.g. In university-ontology: student and professor are two classes

关系(relations):在领域中概念之间的交互作用,形式上定义为n维笛卡儿积的子集:R:C1×C2×…×Cn  Such as: subclass-of, is-a

函数(functions):一类特殊的关系。该关系的前n-1个元素可以唯一决定第n个元素。形式化的定义为F:C1×C2×…×Cn-1→Cn,如Mother-of就是一个函数,mother-of(x,y)表示y是x的母亲。

公理(axioms):代表永真断言,如概念乙属于概念甲的范围

实例(instances):代表元素。从语义上讲实例表示的就是对象,Such as: Student called Peter is the instance of Student class。

4种基本关系:



构造Ontology的规则:

明确性和客观性:Ontology应该用自然语言对所定义的术语给出明确、客观的语义定义
完全性:所给出的定义是完整的,完全能表达所描述的术语的含义
一致性:由术语得出的推论与术语本身的含义是相容的,不会产生矛盾
最大单调可扩展性:向Ontology中添加通用或专用的术语时,不需要修改已有的内容
最小承诺:对待建模对象给出尽可能少的约束
广泛使用的本体:



语言栈:


 

 

6.语义Web的应用

语义Web服务(Semantic Web Services)
内容管理(Content/Knowledge Management)
概念检索(Concept Searching)
智能代理(Intelligent Agent)
普适计算(Ubiquitous/Pervasive Computing)
 

作者:gnuhpc
出处:http://www.cnblogs.com/gnuhpc/
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: