您的位置:首页 > 编程语言 > Java开发

java -- 将PDF文件的首页提取为图片

2013-01-01 21:35 239 查看
由于最近在做一个图书分享的应用,需要将PDF格式书籍的首页提取出来作为一张图片来展示。于是在网上找了一些文章和开源的工具。其中个人感觉总结的比较好的:http://www.oschina.net/question/250267_41156

对于文章中介绍的几种开源工具,我只用过pdfbox和icepdf。我最开始用的是pdfbox,但是问题就在于pdfbox对于稍微大点的文件,比较容易发生内存溢出,网上的解释为其会将整个pdf都加载到内存中,对于我只取其中首页来说,有点不太合适。于是后来我选择了icepdf,基本上,这个工具挺不错的,转换速度也挺快,而最为重要的一点就是我还没遇到过内存溢出的情况。不过,如果需要对文件进行索引的话,还是pdfbox会比较好些,其集成了Lucene.

pdfbox官网:http://pdfbox.apache.org/

icepdf官网:http://www.icepdf.org/

我这里使用的是icepdf,导入icepdf相关jar,编写程序如下:

/**
* 生成一本书的缩略图
* @param inputFile        需要生成缩略图的书籍的完整路径
* @param outputFile    生成缩略图的放置路径
*/
public void generateBookIamge(String inputFile, String outputFile) {
Document document = null;

try {
float rotation = 0f;
//缩略图显示倍数,1表示不缩放,0.5表示缩小到50%
float zoom = 0.8f;

document = new Document();
document.setFile(inputFile);
// maxPages = document.getPageTree().getNumberOfPages();

BufferedImage image = (BufferedImage)document.getPageImage(0, GraphicsRenderingHints.SCREEN,
Page.BOUNDARY_CROPBOX, rotation, zoom);

Iterator iter = ImageIO.getImageWritersBySuffix("jpg");
ImageWriter writer = (ImageWriter)iter.next();

FileOutputStream out = new FileOutputStream(new File(outputFile));
ImageOutputStream outImage = ImageIO.createImageOutputStream(out);

writer.setOutput(outImage);
writer.write(new IIOImage(image, null, null));

} catch(Exception e) {
log.warn("to generate thumbnail of a book fail : " + inputFile);
log.warn(e);
}
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: