UTF8转成GB2312乱码问题解决方案
2013-04-03 16:03
375 查看
最近做了一个小项目,遇到此类问题,记录一下,也算是一个总结。
此项目分为两部分,一个是新闻数据采集,一个是采集信息的审核,最后生成XML文件。
数据采集后的数据经过用户编辑完之后,要导出一个ACCESS文件,然后把这个文件导入到信息审核系统。在ACCESS库中存储新闻信息的字段类型是ntext类型,而审核系统库中对应的是varchar(max)类型的字段,导入之后,发现有的空白字符会出现乱码,表现为问号(?),其实经过后面的测试,这不是空白(空格)字符,而一个特殊字符,怎么办?经过几番测试后发现,varchar(max)类型要改成nvarchar(max)类型,这样导入的数据就不会再有此类问题了。
但后面的测试过程中,又会发现对导入后的采集信息更改(通过.net程序编辑功能)后,数据库中此条信息又出现了乱码问题,研究后发现在插入语句中这样写就不会出现此类问题了,如insert into 表名 (news)values(N'"+更新后的值+""),为什么加N?去百度一下就明白了。
到此,心中总算得到安慰,但后面的问题又让人陷入郁闷之中。。。。。。
审核完的信息要生成XML类型的文件,并且XML要采用GB2312编码,因为采集的新闻网站,有很多网站采用的是UTF8编码,这样在转化的过程中又出现乱码(还是那个“空白”特殊字符搞的),怎么办?网上介绍的把UTF8转化成GB2312就可以了,但实际发现,还是解决不了问题,这下弄的一上午为了解决这个问题,最后还是没有办法,正郁闷之时,突然想到通过VS的调试功能来看看这个特殊字符究竟是什么玩意,最后通过把数据库的此字段值读取出来之后,然后转化成字符数组,content.ToCharArray(); 一个一个的看,发现,导致乱码的这个字符是' '注意引号中的空白,这不是一个空格,而是一个在GB2312中无法识别的特殊字符,此时突然想到,能不能把这个字符的值直接用空格替换呢?马上行动,果然,解决了乱码问题。真求郁闷,这一个毛玩意浪费了一半天时间。
注意,必须要用调试出来的这个值(因为这才是真正的导致乱码的那个特殊字符),调试的时候在即使窗体中粘贴。
复制代码 代码如下:
content = content.Replace(" ", " ");
此项目分为两部分,一个是新闻数据采集,一个是采集信息的审核,最后生成XML文件。
数据采集后的数据经过用户编辑完之后,要导出一个ACCESS文件,然后把这个文件导入到信息审核系统。在ACCESS库中存储新闻信息的字段类型是ntext类型,而审核系统库中对应的是varchar(max)类型的字段,导入之后,发现有的空白字符会出现乱码,表现为问号(?),其实经过后面的测试,这不是空白(空格)字符,而一个特殊字符,怎么办?经过几番测试后发现,varchar(max)类型要改成nvarchar(max)类型,这样导入的数据就不会再有此类问题了。
但后面的测试过程中,又会发现对导入后的采集信息更改(通过.net程序编辑功能)后,数据库中此条信息又出现了乱码问题,研究后发现在插入语句中这样写就不会出现此类问题了,如insert into 表名 (news)values(N'"+更新后的值+""),为什么加N?去百度一下就明白了。
到此,心中总算得到安慰,但后面的问题又让人陷入郁闷之中。。。。。。
审核完的信息要生成XML类型的文件,并且XML要采用GB2312编码,因为采集的新闻网站,有很多网站采用的是UTF8编码,这样在转化的过程中又出现乱码(还是那个“空白”特殊字符搞的),怎么办?网上介绍的把UTF8转化成GB2312就可以了,但实际发现,还是解决不了问题,这下弄的一上午为了解决这个问题,最后还是没有办法,正郁闷之时,突然想到通过VS的调试功能来看看这个特殊字符究竟是什么玩意,最后通过把数据库的此字段值读取出来之后,然后转化成字符数组,content.ToCharArray(); 一个一个的看,发现,导致乱码的这个字符是' '注意引号中的空白,这不是一个空格,而是一个在GB2312中无法识别的特殊字符,此时突然想到,能不能把这个字符的值直接用空格替换呢?马上行动,果然,解决了乱码问题。真求郁闷,这一个毛玩意浪费了一半天时间。
注意,必须要用调试出来的这个值(因为这才是真正的导致乱码的那个特殊字符),调试的时候在即使窗体中粘贴。
复制代码 代码如下:
content = content.Replace(" ", " ");
您可能感兴趣的文章:
相关文章推荐
- MySQL字符集 GBK、GB2312、UTF8区别解决 MYSQL中文乱码问题
- PHP substr 截取字符串出现乱码问题解决方法[utf8与gb2312]
- PHP使用UTF8编码读取ACCESS的乱码问题解决方案
- (转)XMLHTTP 乱码的解决方法(UTF8,GB2312 编码 解码)(附带解决DHTMLX不能用在GB2312页面编码下的中文问题)
- MySQL字符集 GBK、GB2312、UTF8区别 解决 MYSQL中文乱码问题
- 不同编码页面之间用form传值出现乱码问题解决方案 utf-8 到 gb2312
- MySQL字符集 GBK、GB2312、UTF8区别 解决PHP MYSQL中文乱码问题
- 处理linux下面的mysql乱码问题(下面的utf8换成gb2312也是可以的)
- MySQL字符集 GBK、GB2312、UTF8区别 解决 MYSQL中文乱码问题
- MySQL字符集 GBK、GB2312、UTF8区别 解决 MYSQL中文乱码问题
- MySQL字符集 GBK、GB2312、UTF8区别 解决 MYSQL中文乱码问题
- MySQL字符集 GBK、GB2312、UTF8区别 解决MYSQL中文乱码问题
- MySQL字符集 GBK、GB2312、UTF8区别 解决MYSQL中文乱码问题
- php(utf8)跨站到asp(gb2312)乱码问题
- Mysql中文乱码问题完美解决方案【需要在my.cnf文件中设置client和mysqld的default-character-set=utf8,建数据库和表的时候也需要制定好编码】
- 网页端的utf8和gb2312 之间关于osd 传参数的乱码问题
- MySQL字符集 GBK、GB2312、UTF8区别 解决 MYSQL中文乱码问题
- CSS页面乱码 GB2312、UTF-8格式问题解决方案
- mvc 上传txt乱码的问题.涉及utf8编码及gb2312
- MySQL字符集 GBK、GB2312、UTF8区别 解决 MYSQL中文乱码问题