java PDF转WORD 只适合纯文本
2016-06-13 08:50
232 查看
直接贴代码
import org.apache.poi.xwpf.usermodel.BreakType; import org.apache.poi.xwpf.usermodel.XWPFDocument; import org.apache.poi.xwpf.usermodel.XWPFParagraph; import org.apache.poi.xwpf.usermodel.XWPFRun; import com.itextpdf.text.pdf.PdfReader; import com.itextpdf.text.pdf.parser.PdfReaderContentParser; import com.itextpdf.text.pdf.parser.SimpleTextExtractionStrategy; import com.itextpdf.text.pdf.parser.TextExtractionStrategy; public class ConvertPdf2Word { public static void main(String[] args) throws IOException { System.out.println("Document converted started"); XWPFDocument doc = new XWPFDocument(); String pdf = "/home/yc/Documents/p1.pdf"; PdfReader reader = new PdfReader(pdf); PdfReaderContentParser parser = new PdfReaderContentParser(reader); for (int i = 1; i <= reader.getNumberOfPages(); i++) { TextExtractionStrategy strategy = parser.processContent(i, new SimpleTextExtractionStrategy()); String text = strategy.getResultantText(); XWPFParagraph p = doc.createParagraph(); XWPFRun run = p.createRun(); run.setText(text); run.addBreak(BreakType.PAGE); } FileOutputStream out = new FileOutputStream("/home/yc/Documents/p1.docx"); doc.write(out); out.close(); reader.close(); System.out.println("Document converted successfully"); } }
所需的jar 包链接
http://download.csdn.net/detail/tingibandequ/9547622
相关文章推荐
- Java开发中的23种设计模式详解(转)
- Java 接口使用,工具类的分析
- eclipse 编码
- Spring MVC hello world example
- 开源 java CMS - FreeCMS2.4 栏目管理
- Eclipse插件开发 实现 复制 粘贴 剪切功能
- JAVA.SWT/JFace: JFace篇之MVC的表格、树和列表
- JDK的get请求方式
- JAVA.SWT/JFace: SWT中的事件模型/SWT常见的事件/SWT类所代表的事件常量/按键与其对应的常量表、KeyEvent事件比较、VerifyEvent事件比较
- GEF 和 eclipse 视图对象
- eclipse 查询结果 在新窗口中打开
- java中堆和栈的区别,递归和迭代的区别
- JAVA中calendar,date,string 的相互转换和详细用法
- struts2 action以及页面跳转
- 当我们说线程安全时,到底在说什么——Java进阶系列(二)
- Dubbo分布式服务+Springmvc容器+Maven项目整合,分布式,kakfka消息中间件整合
- 当我们说线程安全时,到底在说什么——Java进阶系列(二)
- org.xml.sax.SAXParseException: Failed to read schema document错误的完美解决方法 以及 Spring如何加载XSD文件
- 16_AOP入门准备_Jdk动态代理模式
- org.springframework.dao.DataIntegrityViolationException: Data truncation: Data too long for column '