TIKA元数据提取
2016-05-04 15:50
344 查看
使用Tika提取图片文件的元数据
package metadata; import java.io.File; import java.io.FileInputStream; import java.io.IOException; import org.apache.tika.exception.TikaException; import org.apache.tika.metadata.Metadata; import org.apache.tika.parser.AutoDetectParser; import org.apache.tika.parser.ParseContext; import org.apache.tika.parser.Parser; import org.apache.tika.sax.BodyContentHandler; import org.xml.sax.SAXException; public class GetMetadata { public static void main(final String[] args) throws IOException, TikaException, SAXException { //Assume that boy.jpg is in your current directory File file=new File("E:\\上海项目测试\\metadata\\boy.jpg"); //Parser method parameters Parser parser = new AutoDetectParser(); BodyContentHandler handler = new BodyContentHandler(); Metadata metadata = new Metadata(); FileInputStream inputstream = new FileInputStream(file); ParseContext context = new ParseContext(); parser.parse(inputstream, handler, metadata, context); System.out.println(handler.toString()); //getting the list of all meta data elements String[] metadataNames = metadata.names(); for(String name : metadataNames) { System.out.println(name + ": " + metadata.get(name)); } } }
相关文章推荐
- ZOJ 3326 An Awful Problem(模拟)
- 【辅助算法】整体二分
- 100个常用的原生JavaScript函数
- 第四章 第三节 YARN调度
- 四则运算之加减法
- ZOJ 3326 An Awful Problem(模拟)
- scandir函数详解
- call()与apply()的区别
- 同时运行多个scrapy爬虫的几种方法(自定义scrapy项目命令)
- 平台电子签章实现方法
- hitTest:withEvent:方法流程
- javaweb学习总结(二十九)——EL表达式
- SCOM-Agent安装—基于Uinx\Linux
- javaweb学习总结(二十八)——JSTL标签库之核心标签
- c++模版函数
- servlet 的request 属性常用方法
- javaweb学习总结(二十七)——jsp简单标签开发案例和打包
- python获取外网IP并发邮件
- 全面解析windows下Memcache技术应用
- 文章标题