Java maven 读取doc,docx文档
2018-01-24 20:57
197 查看
一、概念分析
1、doc:Word2003版以前的文档保存后缀。docx:Word2007版以后的文档保存后缀。
2、java apache poi组件是专门针对office文档的解析组件,目前是最主流和最成熟的。
重要链接:点击打开链接。
3、使用maven需要配置文件,pom.xml即为配置文件。还需要有远程jar包仓库。
二、相关配置
。maven配置
<!-- 加入解析doc,docx的依赖 -->
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-ooxml</artifactId>
<version>3.17</version>
</dependency>
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-scratchpad</artifactId>
<version>3.17</version>
</dependency>
。代码解析
①doc文档解析
②docx文档解析
③测试功能
三、注意事项
1、要将文档放在工程下才可以写相对路径,不然要写绝对路径。
2、有事可以抽取工具类可以抽取出来,方便以后直接调用。
3、引入相关包的时候注意别引错了。
4、写maven配置文件的时候下面有红线旁边没有红点的时候不是错了。
1、doc:Word2003版以前的文档保存后缀。docx:Word2007版以后的文档保存后缀。
2、java apache poi组件是专门针对office文档的解析组件,目前是最主流和最成熟的。
重要链接:点击打开链接。
3、使用maven需要配置文件,pom.xml即为配置文件。还需要有远程jar包仓库。
二、相关配置
。maven配置
<!-- 加入解析doc,docx的依赖 -->
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-ooxml</artifactId>
<version>3.17</version>
</dependency>
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-scratchpad</artifactId>
<version>3.17</version>
</dependency>
。代码解析
①doc文档解析
②docx文档解析
③测试功能
三、注意事项
1、要将文档放在工程下才可以写相对路径,不然要写绝对路径。
2、有事可以抽取工具类可以抽取出来,方便以后直接调用。
3、引入相关包的时候注意别引错了。
4、写maven配置文件的时候下面有红线旁边没有红点的时候不是错了。
相关文章推荐
- java使用poi读取doc和docx文件(maven自动导入依赖包)
- Java平台要实现类似豆丁百度文科的文档在线阅读,总体思路是讲doc docx等文件格式利用jcom转换成pdf再用swftools转为swf。再用flexpaper组件显示swf。
- java读取txt/pdf/xls/xlsx/doc/docx/ppt/pptx
- maven打包源代码sources.jar和javadoc.jar帮助文档
- Java平台要实现类似豆丁百度文科的文档在线阅读,总体思路是讲doc docx等文件格式利用jcom转换成pdf再用swftools转为swf。再用flexpaper组件显示swf。
- Java用POI读取并显示doc文档
- maven打包源代码sources.jar和javadoc.jar帮助文档
- java使用poi读取doc和docx文件
- Java用POI读取docx文档
- 编程读取文档Doc,Docx,Pdf的内容
- JAVA使用POI操作word文档实例,兼容doc,docx(附源码)
- java利用Freemarker模板生成格式友好的doc或者docx文档
- 将Doc或者Docx文档处理成html的代码逻辑;统计word中的字数,段数,句数,读取word中文档内容的代码逻辑
- java利用Freemarker模板生成格式友好的doc文档(这种方式不支持docx)
- java读取word表格导入数据库,支持doc、docx
- Java读写docx文档(读取内容并替换其中的关键字)
- JAVA读取Doc、Docx及注意点
- Java读取doc文档
- Ubuntu下使用python读取doc和docx文档的内容方法
- Java读写docx文档(读取内容并替换其中的关键字)