Java 读取Word批注中的文本和图片
2019-11-19 10:55
1336 查看
本文将介绍读取Word批注的方法,包括读取Word批注中的文本及图片。关于操作Word批注的方法还可以参考这两篇文章:Java 添加、回复、修改、删除Word批注;Java 给Word指定字符串添加批注。下面将通过Java代码来演示如何读取批注。
工具使用:Word类库(Free Spire.Doc for Java 免费版)
Jar文件获取:可通过官网下载,下载后解压文件,并将lib文件夹下的Spire.Doc.jar文件导入java程序;也可以通过Maven仓库安装导入,具体路径配置及导入方法可以参考教程。
测试文档如下:批注中包含文本和图片
【示例1】读取批注中的文本
import com.spire.doc.*; import com.spire.doc.documents.Paragraph; import com.spire.doc.fields.Comment; import com.spire.doc.fields.TextRange; public class ReadComment { public static void main(String[] args) { //加载测试文档 Document doc = new Document(); doc.loadFromFile("sample.docx"); //实例化String类型变量 String text = ""; //遍历所有批注 for(int i = 0;i< doc.getComments().getCount();i++){ Comment comment = doc.getComments().get(i); //遍历所有批注中的段落 for(int j= 0;j < comment.getBody().getParagraphs().getCount();j++) { Paragraph paragraph = comment.getBody().getParagraphs().get(j); //遍历段落中的对象 for (Object object : paragraph.getChildObjects()) { //读取文本 if (object instanceof TextRange) { TextRange textRange = (TextRange) object; text = text + textRange.getText(); } } } } //输入文本内容 System.out.println(text); } }
批注文本读取结果:
【示例2】读取批注中的图片
import com.spire.doc.*; import com.spire.doc.documents.Paragraph; import com.spire.doc.fields.Comment; import com.spire.doc.fields.DocPicture; import javax.imageio.ImageIO; import java.awt.image.RenderedImage; import java.io.File; import java.io.IOException; import java.util.ArrayList; public class ExtractImgsInComment { public static void main(String[] args) throws IOException{ //加载测试文档 Document doc = new Document(); doc.loadFromFile("sample.docx"); //创建ArrayList数组对象 ArrayList images = new ArrayList(); //遍历所有批注 for(int i = 0;i< doc.getComments().getCount();i++){ Comment comment = doc.getComments().get(i); //遍历所有批注中的段落 for(int j= 0;j < comment.getBody().getParagraphs().getCount();j++) { Paragraph paragraph = comment.getBody().getParagraphs().get(j); //遍历段落中的对象 for (Object object : paragraph.getChildObjects()) { //获取图片对象 if(object instanceof DocPicture){ DocPicture picture = (DocPicture) object; images.add(picture.getImage()); } } } } //提取图片,并指定图片格式 for (int z = 0; z< images.size(); z++) { File file = new File(String.format("图片-%d.png", z)); ImageIO.write((RenderedImage) images.get(z), "PNG", file); } } }
批注图片读取结果:
(本文完)
相关文章推荐
- java/poi读取word,并替换word中的文本内容,向word中插入图片的操作
- java-poi3.17读取word文本及图片
- java/poi读取word,并替换word中的文本内容,向word中插入图片的操作
- 如何使用Java读取PPT文本和图片
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- 读取word文本、图片(一)编程部分
- 转载 -- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例 .
- java-poi3.17读取ppt文本和图片
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- java-pdfbox2.0.8读取pdf文本和图片
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- Java 读取PDF中的文本和图片
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- java 调用jacob和java2word导出word,并实现将带有格式的html文本和图片插入word
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- Java 添加Word文本水印、图片水印