关于WORD文档的读取乱码问题
2016-03-24 10:43
363 查看
一直以来都是用File类操作txt文档,今天想尝试能不能打开word文档,无奈,尝试了UTF8,Unicode,Default....等编码方式,打开文件都是乱码,电脑甚至发出警报声。
以下只取一种编码方式进行读取.
读取word文档部分代码
出现乱码之后,我想找网上解决方案,可是并无效果,于是我想是不是可以将docx文件转换成txt文件,再进行读取
于是我加了一行修改文件后缀名
string newPath=Path.ChangeExtension(path,"txt");
byte[] buffer = File.ReadAllBytes(newPath);
如此操作之后以为看到的是文字,可实际上得到的却是空
我以为是文件后缀名未被修改,通过调试看到
文件后缀名被修改了,但获取到的却是
对没错,就是空,不知道各位大神有没有解决办法呢,新入小生
以下只取一种编码方式进行读取.
//读取文件操作 ///1.定义字节数组,将读取到的数据放入字节数组中 ///2.将字节数组中的数据读取出来,按照一定的编码方式, ///3.将读取的数据赋值给字符串 string path = @"C:\Users\Administrator.GQFJZ26L5BEYAEK\Documents\1.docx"; byte[] buffer = File.ReadAllBytes(path); string str = Encoding.UTF8.GetString(buffer); Console.WriteLine(str); Console.ReadKey();
读取word文档部分代码
出现乱码之后,我想找网上解决方案,可是并无效果,于是我想是不是可以将docx文件转换成txt文件,再进行读取
于是我加了一行修改文件后缀名
string newPath=Path.ChangeExtension(path,"txt");
byte[] buffer = File.ReadAllBytes(newPath);
如此操作之后以为看到的是文字,可实际上得到的却是空
我以为是文件后缀名未被修改,通过调试看到
文件后缀名被修改了,但获取到的却是
对没错,就是空,不知道各位大神有没有解决办法呢,新入小生
相关文章推荐
- 对于2016年第一季度做项目的一些想法
- Android 去除String字串空格
- Java 发送带附件邮件
- 【BZOJ 3614】 [Heoi2014]逻辑翻译|乱搞|辣鸡题目|不要入坑
- 通过appearance统一设置所有UITabBarItem的文字属性
- openssl的安装与简单使用
- java中的继承
- onToch dis
- poj 1125 Stockbroker Grapevine(多源最短路)
- 启动app时全屏显示Default.png
- 我们是驴还是主人
- 145. Binary Tree Postorder Traversal
- JAVA 多态 由浅及深介绍
- 【水笔】多年前看到的一道算法题,留念
- rpm|yum包管理|源代码包安装
- adb push build.prop system 重启后无法进入系统解决方法
- 图像颜色分布直方图
- 如何修改SAP已释放的请求
- 事件——win32 API 例子
- 第2次上机作业