C#中StreamReader读取中文时出现乱码问题总结
2017-05-06 20:20
399 查看
之前有一篇文章“ C#读取及写入配置文件教程”(http://blog.csdn.net/lisenyang/article/details/47291083)当中有一个问题就是在读取配置文件时候中文出现乱码情况。这是为什么呢?原因是自Windows
2000之后的操作系统在文件处理时默认编码採用Unicode。所以.NET文件的默认编码也是Unicode。除非另外指定,StreamReader的默认编码为Unicode,而不是当前系统的ANSI代码页。可是文档大部分还是以ANSI编码存储,中文文本使用的是GB2312,所以才造成中文乱码。
首先。先和大家一起了解一个东西---“系统的当前 ANSI 代码页编码”,假设你要处理ANSI且codepage为GB2312的文件。或者其它已知编码类型的I/O接口。那么最好直接写Encoding.GetEncoding("GB2312"),由于Encoding.Default可能会变,而假设是一个全新的系统,则最好使用“Encoding.UTF8”,由于UTF8能够兼容世界上绝大多数语种。且效率较好,.NET默认也是用UTF8编码类型!
我们看下查看和改动当前系统的ANSI代码页编码:
如图:
之前我的代码例如以下:
改动后代码例如以下:
2000之后的操作系统在文件处理时默认编码採用Unicode。所以.NET文件的默认编码也是Unicode。除非另外指定,StreamReader的默认编码为Unicode,而不是当前系统的ANSI代码页。可是文档大部分还是以ANSI编码存储,中文文本使用的是GB2312,所以才造成中文乱码。
首先。先和大家一起了解一个东西---“系统的当前 ANSI 代码页编码”,假设你要处理ANSI且codepage为GB2312的文件。或者其它已知编码类型的I/O接口。那么最好直接写Encoding.GetEncoding("GB2312"),由于Encoding.Default可能会变,而假设是一个全新的系统,则最好使用“Encoding.UTF8”,由于UTF8能够兼容世界上绝大多数语种。且效率较好,.NET默认也是用UTF8编码类型!
我们看下查看和改动当前系统的ANSI代码页编码:
Linux系统查看locale的方法:在终端输入locale windows查看代码页方法:在cmd.exe输入chcp,或者右键cmd.exe属性查看。 改动locale: Linux系统改动配置文件/etc/sysconfig/i18n或/etc/sysconfig/language Windows在開始-控制面板-区域和语言选项-选择一个语言 改动session local的方法: windows在CMD命令行输入 mode con cp select=437 linux在终端export LANG=zh_CN.UTF8
如图:
之前我的代码例如以下:
改动后代码例如以下:
相关文章推荐
- C#中StreamReader读取中文时出现乱码问题总结
- C#中StreamReader读取中文出现乱码
- 遇到问题-用StreamReader读取数据时出现乱码,streamwriter写入中文时出现乱码
- C#中StreamReader读取中文文本出现乱码的解决方法
- C#中StreamReader读取中文文本出现乱码的解决方法(转)
- 【转载】C#中StreamReader读取中文文本出现乱码的解决方法
- C#中读取txt文件中的中文时出现乱码问题
- C#中StreamReader读取中文出现乱码
- 遇到问题-用StreamReader读取数据时出现乱码,streamwriter写入中文时出现乱码
- C#中StreamReader读取中文文本出现乱码的解决方法
- C#中StreamReader读取中文文本出现乱码的解决方法
- 解决StreamReader读取中文出现乱码的问题
- C#中StreamReader读取中文出现乱码
- C# 从剪贴板中读取HTML中的中文字符出现乱码问题的解决方案
- 解决StreamReader读取中文出现乱码的问题
- C#中StreamReader读取中文文本出现乱码的解决方法
- C#中StreamReader读取中文文本出现乱码的解决方法
- C#中StreamReader读取中文出现乱码
- ASP读取数据库的中文出现乱码问题
- C#中使用streamreader读取中文成乱码的解决方法