【分布计算环境学习笔记】7 语义Web
2013-01-04 14:42
375 查看
作者:gnuhpc
出处:http://www.cnblogs.com/gnuhpc/
1.语义网的特征:
每个资源有清晰的定义,如软件,文件,人,地点。概念之间的关系有清晰的定义,如软件产生文件,软件依赖于软件,文件的版本,文件具有主题,人所在地点。目标是实现机器自动处理信息。它将提供诸如信息代理、搜索代理、信息过滤等智能服务。语义Web上提供的这些智能服务应该超越目前这些服务的技术水平,克服它们在功能上仅能独立运行、无法交互的限制。语义网的技术基础是 XML和 RDF;其基本实现方法是开发功能逐层增强的形式化信息规约语言,用以唯一确定信息的含义,其最终目标是成为智能化网络服务和应用开发的基础设施,成为机器与人协同工作的媒介。
2.语义网的目标:
让计算机能够“理解”分布在网上的信息和知识,并在“理解”的前提下更好地处理、利用这些信息和知识,使Web成为支持全球化知识共享的智能信息服务平台,为人们提供优质的服务。
3.语义网的相关问题
信息检索 — 关键词检索与基于内容的检索
信息抽取 — 元数据:有关数据的数据。主要包括
语法元数据:描述有关数据内容的非上下文信息。如文档的大小、位置、创建日期等
结构元数据:提供有关内容结构的信息,如使用DTD或者XML Schema 可以定义XML文档用到的元素、属性和实体以及不同元素和属性之间的关系。
语义元数据:对语法和结构元数据添加了关系、规则和约束条件。
信息表示 — 内容与表示的分离
信息与自然语言语义
数据挖掘和知识发现
信息集成和概念集成
4.语义网层次
该体系中从低层到高层分别为:Unicode和URI、XML、RDF、Ontology、Logic、Proof、Trust
第一层Unicode和URI。该层是整个语义Web的基础,其中Unicode处理资源的编码,URI负责标识资源
第二层XML+NS+XML Schema,用于表示数据的内容和结构
第三层RDF+RDF Schema,用于描述Web上的资源及其类型
第四层Ontology vocabulary,它用于描述各种资源之间的联系
第五层到第七层是在下面4层的基础上进行的逻辑推理操作,包括公理和推理规则、认证机制及信任机制
其中核心层为XML、RDF、Ontology,这3层用于表示Web信息的语义
5.RDF
资源描述框架(Resource Description Framework, 简称 RDF)提供了一种用于表达这一信息、并使其能在应用程序间交换而不丧失语义的通用框架。RDF是一种描述资源的语言,是W3C组织推荐的描述Web上元数据的标准。用Web标识符(URI)来标识事物,用简单的属性(property)及属性值来描述资源
主要包括三部分
RDF模型
RDF/XML语法
RDF Schema
RDF三元组 被定义为(Subject,Predicate,Object),它由主体(事物)、谓词(属性)和客体(值)三部分组成。主体和谓词的类型是URI,表示一个Web 资源,客体即可以是URI,也可以是文字(Literal),RDF三元组也被称为RDF声明(Statement)。
RDF的图模型: 可把RDF声明表示为有向、带标签的图。
椭圆节点表示用URI指代的主体和客体
方框节点表示文字类型的客体
有向弧标签则表示用URI指代的谓词
RDF /XML 语法:
用于RDF图的表示和交换。如
为RDF图中所有空节点指定一个空节点标志符
对应于每个RDF三元组中的主体,生成一个rdf:Description元素
同一个主体的多个声明可合并为一个rdf:Description元素
RDF Schema: 实现对RDF的扩展,可用于描述和定义于特定应用相关的类和属性,从而可创建自定义的词汇表,如字典表述语言。
RDFS的作用:
定义资源以及属性的类别;
定义属性所应用的资源类以及属性值的类型;
定义上述类别声明的语法;
申明一些由其它机构或组织定义的元数据标准的属性类。
描述RDF类
类是指事物的类型或者分类,rdf:Class、rdf:Resouce、rdf:type、rdf:subClassOf
例如:
描述RDF属性,rdf:Property、 rdf:range、rdf:domain
例如:
Semantic Web和Semantic Web Service。区别就像Web和Web Service的区别。Semantic Web提供了语义化的Web网络,而Semantic Web Service则更进一步,提供了对外调用接口的支持。
6.Ontology
客观存在的一个系统的解释或说明,关心的是客观现实的抽象本质。An ontology is a formal, explicit specification of a shared conceptualization – Gruber
‘Conceptualization’指通过抽象出客观世界中一些现象的相关概念而得到的模型
‘Explicit’指所使用的概念及使用这些概念的约束都有明确的定义
‘Formal’指Ontology是计算机可读的
‘Shared’指Ontology中体现的是共同认可的知识,反映的是相关领域中公认的概念集
“共享”指Ontology中体现的是共同认可的知识,反映的是相关领域中公认的概念集
“概念模型”指通过抽象出客观世界中一些现象的相关概念而得到的模型
“明确”指所使用的概念及使用这些概念的约束都有明确的定义
“形式化”指Ontology是计算机可读、可理解的
建模元语:
类(classes)或概念(concepts):指任何事务,如工作描述、功能、行为、策略和推理过程。从语义上讲,它表示的是对象的集合,其定义一般采用框架(frame)结构,包括概念的名称,与其他概念之间的关系的集合,以及用自然语言对概念的描述 ,e.g. In university-ontology: student and professor are two classes
关系(relations):在领域中概念之间的交互作用,形式上定义为n维笛卡儿积的子集:R:C1×C2×…×Cn Such as: subclass-of, is-a
函数(functions):一类特殊的关系。该关系的前n-1个元素可以唯一决定第n个元素。形式化的定义为F:C1×C2×…×Cn-1→Cn,如Mother-of就是一个函数,mother-of(x,y)表示y是x的母亲。
公理(axioms):代表永真断言,如概念乙属于概念甲的范围
实例(instances):代表元素。从语义上讲实例表示的就是对象,Such as: Student called Peter is the instance of Student class。
4种基本关系:
构造Ontology的规则:
明确性和客观性:Ontology应该用自然语言对所定义的术语给出明确、客观的语义定义
完全性:所给出的定义是完整的,完全能表达所描述的术语的含义
一致性:由术语得出的推论与术语本身的含义是相容的,不会产生矛盾
最大单调可扩展性:向Ontology中添加通用或专用的术语时,不需要修改已有的内容
最小承诺:对待建模对象给出尽可能少的约束
广泛使用的本体:
语言栈:
6.语义Web的应用
语义Web服务(Semantic Web Services)
内容管理(Content/Knowledge Management)
概念检索(Concept Searching)
智能代理(Intelligent Agent)
普适计算(Ubiquitous/Pervasive Computing)
作者:gnuhpc
出处:http://www.cnblogs.com/gnuhpc/
出处:http://www.cnblogs.com/gnuhpc/
1.语义网的特征:
每个资源有清晰的定义,如软件,文件,人,地点。概念之间的关系有清晰的定义,如软件产生文件,软件依赖于软件,文件的版本,文件具有主题,人所在地点。目标是实现机器自动处理信息。它将提供诸如信息代理、搜索代理、信息过滤等智能服务。语义Web上提供的这些智能服务应该超越目前这些服务的技术水平,克服它们在功能上仅能独立运行、无法交互的限制。语义网的技术基础是 XML和 RDF;其基本实现方法是开发功能逐层增强的形式化信息规约语言,用以唯一确定信息的含义,其最终目标是成为智能化网络服务和应用开发的基础设施,成为机器与人协同工作的媒介。
2.语义网的目标:
让计算机能够“理解”分布在网上的信息和知识,并在“理解”的前提下更好地处理、利用这些信息和知识,使Web成为支持全球化知识共享的智能信息服务平台,为人们提供优质的服务。
3.语义网的相关问题
信息检索 — 关键词检索与基于内容的检索
信息抽取 — 元数据:有关数据的数据。主要包括
语法元数据:描述有关数据内容的非上下文信息。如文档的大小、位置、创建日期等
结构元数据:提供有关内容结构的信息,如使用DTD或者XML Schema 可以定义XML文档用到的元素、属性和实体以及不同元素和属性之间的关系。
语义元数据:对语法和结构元数据添加了关系、规则和约束条件。
信息表示 — 内容与表示的分离
信息与自然语言语义
数据挖掘和知识发现
信息集成和概念集成
4.语义网层次
该体系中从低层到高层分别为:Unicode和URI、XML、RDF、Ontology、Logic、Proof、Trust
第一层Unicode和URI。该层是整个语义Web的基础,其中Unicode处理资源的编码,URI负责标识资源
第二层XML+NS+XML Schema,用于表示数据的内容和结构
第三层RDF+RDF Schema,用于描述Web上的资源及其类型
第四层Ontology vocabulary,它用于描述各种资源之间的联系
第五层到第七层是在下面4层的基础上进行的逻辑推理操作,包括公理和推理规则、认证机制及信任机制
其中核心层为XML、RDF、Ontology,这3层用于表示Web信息的语义
5.RDF
资源描述框架(Resource Description Framework, 简称 RDF)提供了一种用于表达这一信息、并使其能在应用程序间交换而不丧失语义的通用框架。RDF是一种描述资源的语言,是W3C组织推荐的描述Web上元数据的标准。用Web标识符(URI)来标识事物,用简单的属性(property)及属性值来描述资源
主要包括三部分
RDF模型
RDF/XML语法
RDF Schema
RDF三元组 被定义为(Subject,Predicate,Object),它由主体(事物)、谓词(属性)和客体(值)三部分组成。主体和谓词的类型是URI,表示一个Web 资源,客体即可以是URI,也可以是文字(Literal),RDF三元组也被称为RDF声明(Statement)。
RDF的图模型: 可把RDF声明表示为有向、带标签的图。
椭圆节点表示用URI指代的主体和客体
方框节点表示文字类型的客体
有向弧标签则表示用URI指代的谓词
RDF /XML 语法:
用于RDF图的表示和交换。如
为RDF图中所有空节点指定一个空节点标志符
对应于每个RDF三元组中的主体,生成一个rdf:Description元素
同一个主体的多个声明可合并为一个rdf:Description元素
RDF Schema: 实现对RDF的扩展,可用于描述和定义于特定应用相关的类和属性,从而可创建自定义的词汇表,如字典表述语言。
RDFS的作用:
定义资源以及属性的类别;
定义属性所应用的资源类以及属性值的类型;
定义上述类别声明的语法;
申明一些由其它机构或组织定义的元数据标准的属性类。
描述RDF类
类是指事物的类型或者分类,rdf:Class、rdf:Resouce、rdf:type、rdf:subClassOf
例如:
描述RDF属性,rdf:Property、 rdf:range、rdf:domain
例如:
Semantic Web和Semantic Web Service。区别就像Web和Web Service的区别。Semantic Web提供了语义化的Web网络,而Semantic Web Service则更进一步,提供了对外调用接口的支持。
6.Ontology
客观存在的一个系统的解释或说明,关心的是客观现实的抽象本质。An ontology is a formal, explicit specification of a shared conceptualization – Gruber
‘Conceptualization’指通过抽象出客观世界中一些现象的相关概念而得到的模型
‘Explicit’指所使用的概念及使用这些概念的约束都有明确的定义
‘Formal’指Ontology是计算机可读的
‘Shared’指Ontology中体现的是共同认可的知识,反映的是相关领域中公认的概念集
“共享”指Ontology中体现的是共同认可的知识,反映的是相关领域中公认的概念集
“概念模型”指通过抽象出客观世界中一些现象的相关概念而得到的模型
“明确”指所使用的概念及使用这些概念的约束都有明确的定义
“形式化”指Ontology是计算机可读、可理解的
建模元语:
类(classes)或概念(concepts):指任何事务,如工作描述、功能、行为、策略和推理过程。从语义上讲,它表示的是对象的集合,其定义一般采用框架(frame)结构,包括概念的名称,与其他概念之间的关系的集合,以及用自然语言对概念的描述 ,e.g. In university-ontology: student and professor are two classes
关系(relations):在领域中概念之间的交互作用,形式上定义为n维笛卡儿积的子集:R:C1×C2×…×Cn Such as: subclass-of, is-a
函数(functions):一类特殊的关系。该关系的前n-1个元素可以唯一决定第n个元素。形式化的定义为F:C1×C2×…×Cn-1→Cn,如Mother-of就是一个函数,mother-of(x,y)表示y是x的母亲。
公理(axioms):代表永真断言,如概念乙属于概念甲的范围
实例(instances):代表元素。从语义上讲实例表示的就是对象,Such as: Student called Peter is the instance of Student class。
4种基本关系:
构造Ontology的规则:
明确性和客观性:Ontology应该用自然语言对所定义的术语给出明确、客观的语义定义
完全性:所给出的定义是完整的,完全能表达所描述的术语的含义
一致性:由术语得出的推论与术语本身的含义是相容的,不会产生矛盾
最大单调可扩展性:向Ontology中添加通用或专用的术语时,不需要修改已有的内容
最小承诺:对待建模对象给出尽可能少的约束
广泛使用的本体:
语言栈:
6.语义Web的应用
语义Web服务(Semantic Web Services)
内容管理(Content/Knowledge Management)
概念检索(Concept Searching)
智能代理(Intelligent Agent)
普适计算(Ubiquitous/Pervasive Computing)
作者:gnuhpc
出处:http://www.cnblogs.com/gnuhpc/
相关文章推荐
- 分布计算环境学习笔记7——语义Web
- 分布计算环境学习笔记4——Enterprise Java Bean
- 【分布计算环境学习笔记】3 软件构件结构
- 分布计算环境学习笔记6——面向Web的计算环境之基础部分(发展和XML)
- 【分布计算环境学习笔记】4 Enterprise Java Bean
- 【分布计算环境学习笔记】8 Web 2.0概览
- 分布计算环境学习笔记3——软件构件结构
- 【分布计算环境学习笔记】5 Java Enterprise Edtion基础
- 【分布计算环境学习笔记】9 Web Service
- 分布计算环境学习笔记5——Java Enterprise Edtion基础
- 【分布计算环境学习笔记】6 面向Web的计算环境之基础部分(发展和XML)
- 分布计算环境学习笔记1——基本概念和发展历史
- 分布计算环境学习笔记2——分布式系统中的面向对象技术
- 分布计算环境学习笔记9——Web Service
- 【分布计算环境学习笔记】1 基本概念和发展历史
- 分布计算环境学习笔记8——Web 2.0概览
- 【分布计算环境学习笔记】2 分布式系统中的面向对象技术
- 分布计算环境笔记10——SOA、网格计算、云计算与P2P技术
- 分布计算环境笔记11——代理技术
- React Native for Android 学习笔记(一) 操蛋的环境搭建与demo运行