pdf 文本转换为 java 字符串
2012-04-16 01:42
218 查看
txt,rtf,rtfd->pdf,mac下面有个非常好用的工具,TextEditor,简洁实用!
pdf->txt,如下(依赖两个jar 包:pdfbox-1.6.0.jar、fontbox-1.6.0.jar):
pdf->txt,如下(依赖两个jar 包:pdfbox-1.6.0.jar、fontbox-1.6.0.jar):
package org.bruce.toolkit.experiments; import java.io.ByteArrayOutputStream; import java.io.File; import java.io.OutputStreamWriter; import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.util.PDFTextStripper; /** * @author Bruce Yang * 将 pdf 文件中的字符解析为字符串中的字符~ */ public class Pdf2Text { /** * @param args * @throws Exception */ public static void main(String[] args) throws Exception { // System.out.println(parsePDF("/Users/user/Desktop/QT教程.pdf")); System.out.println(parsePDF("/Users/user/Novels/pdf/《盗墓笔记》第一季:.第二部.怒海潜沙.pdf")); } /** * @param filePath * @return * @throws Exception */ public static String parsePDF(String filePath) throws Exception { File file = new File(filePath); String context = ""; ByteArrayOutputStream out = new ByteArrayOutputStream(); OutputStreamWriter writer = new OutputStreamWriter(out); PDDocument pdfdocument = null; pdfdocument = PDDocument.load(file); PDFTextStripper stripper = new PDFTextStripper(); stripper.writeText(pdfdocument, writer); byte[] contents = out.toByteArray(); System.out.println(contents.length); context = new String(contents); writer.close(); if (pdfdocument != null) { pdfdocument.close(); } return context; } }
相关文章推荐
- pdf 文本转换为 java 字符串
- pdf 文本转换为 java 字符串
- java文本、表格word转换生成PDF加密文件代码下载
- java中将文本转换为字符串
- JAVA 数组格式的json字符串转换成List
- Java:将字符串中的数字转换成整型
- java调用com组件将office文件转换成pdf
- Java中byte与16进制字符串的互相转换
- 使用json-lib将java对象转换成json字符串
- Json字符串转换为java对象
- 字节流、字符串、16进制字符串转换__Java(转)
- 在java中如何把字符串转换成时间格式?
- Java中字符串和byte数组互相转换
- java里面byte数组和String字符串怎么转换
- JAVA开发_图片文件与字符串之间的转换
- java取出以数字开头或者以数字结尾的字符串,将字符串转换为大写
- java将list对象转换为json字符串数据显示为空的信息
- JAVA的整型与字符串相互转换
- Java中Color和16进制字符串互相转换的方法
- 十六进制字符串 char 数组 转换 c/c++/java