如何把UTF-8转为GB2312的
2013-12-06 16:50
260 查看
目前很多的中文网页都采用UTF-8或GB2312编码,UTF-8和GB2312都是字符集的编码,具体格式这里不做讨论,这里主要是看看如何用把UTF-8转为GB2312的。在vc的开发平台里UTF-8汉字会显示成乱码,需要转换成GB2312才能显示。
大概的思路是这样的,先把UTF8转换成UNICODE,再把UNICODE转换成GB2312,为什么会这样想呢,因为windows API里提供了多字节转宽字节(MultiByteToWideChar),宽字节转多字节(WideCharToMultiByte)的方法。好了,下面是具体的API使用:MultiByteToWideChar(CP_UTF8, 0, (LPCTSTR)pIn,inLen, pWchar, len),第一个参数是CP_UTF8,这样就把UTF8转成UNICODE了。你再用WideCharToMultiByte就能把UNICODE转成
GB2312了。
如果你是在MFC下,,直接用CString构造就能把UNICODE转成GB2312,构造函数是有类型转换功能滴。。。
函数源码,VC6编译通过:
BOOL UTF8_2_GB2312(const void * pIn,int inLen,char *pOut,int *outLen )
{
ASSERT( ( (NULL==pIn) ||( NULL==pOut) ) );
int len=MultiByteToWideChar(CP_UTF8, 0, (LPCTSTR)pIn, -1, NULL,0);
wchar_t *pWchar = new wchar_t[len+1];
if (NULL==pWchar)
return FALSE;
memset(pWchar,0,(len+1)* sizeof(wchar_t));
MultiByteToWideChar(CP_UTF8, 0, (LPCTSTR)pIn,inLen, pWchar, len);
CString str=CString(pWchar);
ASSERT(str.GetLength()>(*outLen));//not enough output buff
*outLen = str.GetLength();
memcpy(pOut,str.GetBuffer(0),*outLen);
delete[]pWchar;
return TRUE;
}
大概的思路是这样的,先把UTF8转换成UNICODE,再把UNICODE转换成GB2312,为什么会这样想呢,因为windows API里提供了多字节转宽字节(MultiByteToWideChar),宽字节转多字节(WideCharToMultiByte)的方法。好了,下面是具体的API使用:MultiByteToWideChar(CP_UTF8, 0, (LPCTSTR)pIn,inLen, pWchar, len),第一个参数是CP_UTF8,这样就把UTF8转成UNICODE了。你再用WideCharToMultiByte就能把UNICODE转成
GB2312了。
如果你是在MFC下,,直接用CString构造就能把UNICODE转成GB2312,构造函数是有类型转换功能滴。。。
函数源码,VC6编译通过:
BOOL UTF8_2_GB2312(const void * pIn,int inLen,char *pOut,int *outLen )
{
ASSERT( ( (NULL==pIn) ||( NULL==pOut) ) );
int len=MultiByteToWideChar(CP_UTF8, 0, (LPCTSTR)pIn, -1, NULL,0);
wchar_t *pWchar = new wchar_t[len+1];
if (NULL==pWchar)
return FALSE;
memset(pWchar,0,(len+1)* sizeof(wchar_t));
MultiByteToWideChar(CP_UTF8, 0, (LPCTSTR)pIn,inLen, pWchar, len);
CString str=CString(pWchar);
ASSERT(str.GetLength()>(*outLen));//not enough output buff
*outLen = str.GetLength();
memcpy(pOut,str.GetBuffer(0),*outLen);
delete[]pWchar;
return TRUE;
}
相关文章推荐
- UTF-8、Unicode 标准化表单、BOM
- ASP UTF-8页面乱码+GB2312转UTF-8 +生成UTF-8格式的文件(编码)第1/2页
- ASP+FSO生成的网页文件默认编码格式以及转换成UTF-8编码方法
- php utf-8转unicode的函数第1/2页
- utf-8编码引起js输出中文乱码的解决办法
- jq的get传参数在utf-8中乱码问题的解决php版
- php UTF-8、Unicode和BOM问题
- 将字符串转换成gb2312或者utf-8编码的参数(js版)
- Ajax,UTF-8还是GB2312 eval 还是execScript
- UTF-8 GBK UTF8 GB2312 之间的区别和关系介绍
- utf-8 网页不显示+utf-8网页乱码的通用解决方法
- Web 开发中遇到的UTF-8编码的问题总结第1/2页
- IOS编码GB2312转UTF-8
- JSP中文乱码问题解决方法小结
- Ubuntu 12.04 MySQL改utf-8 启动不了
- Unicode,ANSI,UTF-8,Unicode Big Endian的故事
- utf-8编码用于asp 出现乱码的问题--从数据库调用的是乱码--gb2312转换utf-8
- Tomcat解决UTF-8乱码的问题
- PHP nusoap返回UTF-8中文乱码的解决办法
- 去掉UTF-8 BOM