利用jena读取owl文件的父子属性以及其他属性
2016-04-12 18:12
519 查看
最近,学习的过程中需要处理owl文件,我的需求比较简单,不需要用到推理,但是要读取到owl文件中的所有的属性以及属性值。经过在网上大量的搜索和阅读后,发现大部分都是讲如何创建RDF文件后者是owl文件的,或者是获取指定属性名的属性值,并不能够获取owl文件中所有的属性以及属性值。后来通过查看jena的API找到了方法,记录下来一块分享一下。
为了更好的使用Jena API,我们应该对OWL有个大致的了解。OWL核心是围绕三元组的,即我们在很多资料中看到的陈述(Statement),它的组成为:Statement=(Subject,Property,Object),其中Subject我们熟成为主体,Property成为属性,Object成为客体。在编程中容易让人搞混的他们和Individual的区别。Individual熟称为个体。它是Subject、Object的一个实例,例如在Statement=(Animals,Eat,Plants)陈述中sheep是Animals的一个Individual,grass是Plants的一个Individual。从这个角度上来说我们理解为什么主体、客体被说成是类(Class)。而这一切的主体、客体、个体、类、属性等我们都可以称为资源(Resource)。在编程中OWL常用的是OntModel,Ontclass,OntProperty,Individual。OntClass可以用来创建主体,客体,OntPropety用来创建属性,Individual用来创建个体。
常用的方法有CreatClass,CreatIndividual,listObjects,listObjectsofProperty,listSubjectswithProperty,listPropertyvalues等。
本体文件部分图示:
我的需求很明确,就是将一个owl文件中的所有的属性名称(包括父节点、子节点)以及相对应的属性值读取出来。接下来直接上代码:
这样就完成了整个的遍历过程。再找到此方法之前,自己尝试过直接使用jena自带的PersistentOntology这个类中的方法直接存入数据库,但是发现他会自动生成好多张表。而且里面有一些数据是不可解释的(可能是我没理解吧),而且属性名前面会加上前缀,不利于进一步进行操作。
希望对和我有同样困惑的朋友有所帮助!
为了更好的使用Jena API,我们应该对OWL有个大致的了解。OWL核心是围绕三元组的,即我们在很多资料中看到的陈述(Statement),它的组成为:Statement=(Subject,Property,Object),其中Subject我们熟成为主体,Property成为属性,Object成为客体。在编程中容易让人搞混的他们和Individual的区别。Individual熟称为个体。它是Subject、Object的一个实例,例如在Statement=(Animals,Eat,Plants)陈述中sheep是Animals的一个Individual,grass是Plants的一个Individual。从这个角度上来说我们理解为什么主体、客体被说成是类(Class)。而这一切的主体、客体、个体、类、属性等我们都可以称为资源(Resource)。在编程中OWL常用的是OntModel,Ontclass,OntProperty,Individual。OntClass可以用来创建主体,客体,OntPropety用来创建属性,Individual用来创建个体。
常用的方法有CreatClass,CreatIndividual,listObjects,listObjectsofProperty,listSubjectswithProperty,listPropertyvalues等。
本体文件部分图示:
我的需求很明确,就是将一个owl文件中的所有的属性名称(包括父节点、子节点)以及相对应的属性值读取出来。接下来直接上代码:
//创建一个本体语言指定语言类型. OntModel ontModel = ModelFactory.createOntologyModel(OntModelSpec.OWL_MEM); try { ontModel.read(new FileInputStream("c:/util/owl/symp.owl"), ""); } catch (FileNotFoundException e1) { e1.printStackTrace(); } // 迭代显示模型中的类,在迭代过程中完成各种操作 for (Iterator<?> i = ontModel.listClasses(); i.hasNext();) { <span style="white-space:pre"> </span>parentList.clear(); OntClass c = (OntClass) i.next(); // 返回类型强制转换 if (!c.isAnon()) {//如果不是匿名类,则打印类的名字 // 迭代显示当前类的直接父类 for (Iterator<?> it = c.listSuperClasses(); it.hasNext();){ OntClass sp = (OntClass) it.next(); //得到的id号为obo:SYMP_0000743 因此要去掉obo:因此从3开始截取 parentList.add(sp.getModel().getGraph().getPrefixMapping().shortForm(sp.getURI()).substring(4)); } // 迭代显示当前类的直接子类 for (Iterator<?> it = c.listSubClasses(); it.hasNext();) { OntClass sb = (OntClass) it.next(); childIdBuf.append(sb.getModel().getGraph().getPrefixMapping().shortForm(sb.getURI()).substring(4)+"~"); } StmtIterator iterator = c.listProperties(); while(iterator.hasNext()){ <span style="white-space:pre"> </span>Statement statement = iterator.next(); <span style="white-space:pre"> </span>predict = statement.getPredicate().toString().substring(statement.getPredicate().toString().indexOf("#")+1); //得到的数据类似encephalitis^^http://www.w3.org/2001/XMLSchema#string 因此要截取^^之前的部分 //如果不是字符串类型的数据则没有^^这个符号因此符合这个规范的才进行操作 object = statement.getObject().toString(); }
}
}
这样就完成了整个的遍历过程。再找到此方法之前,自己尝试过直接使用jena自带的PersistentOntology这个类中的方法直接存入数据库,但是发现他会自动生成好多张表。而且里面有一些数据是不可解释的(可能是我没理解吧),而且属性名前面会加上前缀,不利于进一步进行操作。
希望对和我有同样困惑的朋友有所帮助!
相关文章推荐
- @Autowired的使用
- Unity5.x在WP8.1中无法使用Reflection API的解决方法
- java RMI入门指南
- wingIDE5.1中文乱码解决
- C# IndexOf、LastIndexOf、IndexOfAny,LastIndexOfAny
- plsqldev中查看表结构
- Objective-C修改cell左滑按钮背景色
- 数据结构之链表
- ios - loadView与viewDidload
- SVN branch Merge的操作
- java笔记6→java接口(interface)
- TCP/IP(八)DNS域名系统
- Puppet集中配置管理系统(目录)
- Android GestureOverlayView详解
- C++经典开源库
- 错误:'xxx/xxx.h' file not found
- map的排序总结
- 【CodeForces】[617A]Elephant
- 安卓模拟器端口5037被占用
- Unity 5.4 公开测试版发布:增强的视觉效果,更佳的性能表现