C#仪器数据文件解析-Word文件(doc、docx)
2017-10-17 09:42
621 查看
不少仪器数据报告输出为Word格式文件,同Excel文件,Word文件doc和docx的存储格式是不同的,相应的解析Word文件的方式也类似,主要有以下方式:
1.通过MS Word应用程序的DCOM接口;
2.WPS Word应用程序的DCOM接口,其他Office应用程序,例如Open Office等;
3.NPOI库;
4.MS Open XML;
5.Spire.Doc库;
实际操作中,MS与Open Office等不同厂家对Word(或泛指Office中的字处理软件文档)的格式定义标准有差别,因此存在兼容性的问题;
即使MS的docx格式文件,2007、2010、2013等不同版本虽然都使用XML格式定义,但仍然不同,也存在兼容性问题。
因此,多数客户终端使用MS Office的情况下,如果使用Open Office等其他应用程序来处理Word文档,则会出现很多问题。
能够很好处理MS Word文档的应用程序,好用的应用程序就是MS Office Word、WPS,好用的组件库就是Spire.Doc,NPOI(仅docx)。
使用组件库的好处是不需要安装应用程序,部署简单,另外通过.Net Framework调用也优于DCOM接口。
由于Spire.Doc为收费组件,所以建议使用NPOI解析Word,当然仅限于Word 2007+。
以下为关键代码,供参考:
1.通过MS Word应用程序的DCOM接口;
2.WPS Word应用程序的DCOM接口,其他Office应用程序,例如Open Office等;
3.NPOI库;
4.MS Open XML;
5.Spire.Doc库;
实际操作中,MS与Open Office等不同厂家对Word(或泛指Office中的字处理软件文档)的格式定义标准有差别,因此存在兼容性的问题;
即使MS的docx格式文件,2007、2010、2013等不同版本虽然都使用XML格式定义,但仍然不同,也存在兼容性问题。
因此,多数客户终端使用MS Office的情况下,如果使用Open Office等其他应用程序来处理Word文档,则会出现很多问题。
能够很好处理MS Word文档的应用程序,好用的应用程序就是MS Office Word、WPS,好用的组件库就是Spire.Doc,NPOI(仅docx)。
使用组件库的好处是不需要安装应用程序,部署简单,另外通过.Net Framework调用也优于DCOM接口。
由于Spire.Doc为收费组件,所以建议使用NPOI解析Word,当然仅限于Word 2007+。
以下为关键代码,供参考:
FileStream fileStream = new FileStream(fileName, FileMode.Open, FileAccess.Read); xwpfDocument = new XWPFDocument((Stream)fileStream); foreach (XWPFParagraph xwpfParagraph in (IEnumerable<XWPFParagraph>)xwpfDocument.Paragraphs) stringBuilder.AppendLine(xwpfParagraph.ParagraphText);
相关文章推荐
- C#仪器数据文件解析-PDF文件
- C#仪器数据文件解析-XPS文件
- C#仪器数据文件解析-Excel文件(xls、xlsx)
- C#仪器数据文件解析-RTF文件
- C#仪器数据文件解析Excel文件的方法浅析(xls、xlsx)
- 在Android中解析doc,docx,xls,xlsx,pptx等格式文件
- android中解析doc、docx、xls、xlsx格式文件
- 怎样在Android中解析doc、docx、xls、xlsx格式文件?
- C#把DataSet内数据转化为Excel和Word文件的通用类
- 解析驾考json数据,将其写入word文件中
- 操作Word模板文件.dot 结合具体数据 生成Word文档 .doc
- Android打开 解析 doc,docx,xls,xlsx,ppt等格式文件的源码
- 操作Word模板文件.dot 结合具体数据 生成Word文档 .doc
- Android使用ApachePOI组件读写Worddoc和docx文件
- python如何处理解析word文档doc docx , python-docx,python-docx2txt,zipfile
- 在Android中解析doc,docx,xls,xlsx,pptx等格式文件
- C#把DataSet内数据转化为Excel和Word文件的通用类
- 怎样在Android中解析doc、docx、xls、xlsx格式文件
- C#创建Word文件,并且写入数据的程序
- Java 使用jacob ppt文件转pptx,doc转docx;word 转html、pdf等