unix下的汉字处理问题
2007-09-04 09:57
811 查看
如何把一个汉字作为一个字符来处理?在以前,似乎比较麻烦,因为一个汉字一向是由2个字符来表示的。比较汉字,往往变成了字符串的比较。unicode出现之后,情况就好多了,每个汉字都有唯一的编码,从此汉字就可以作为单个字符来对待了。
stl提供了string类来处理字符串,但是针对的是单字节字符串。如果想处理汉字,可以选择wstring。用法和string完全相同,但是处理的是宽字符。string到wstring之间的转换,似乎stl没有提供好的方法,所以还得用c的库函数来处理。
以下给出一段代码,演示在unix下面,处理汉字的方法
#include <iostream>
#include <string>
#include <list>
#include <stdlib.h>
#include <locale.h>
namespace std ...{} using namespace std;
int main()
...{
int cnt;
wchar_t wcs[100], wc;
string myword="列表内容为:";
setlocale(LC_CTYPE, ""); //很重要,没有这一句,转换会失败
mbstowcs(wcs, myword.c_str(), 99);
wstring newword(wcs);
cout<<"string content is:"<<myword.c_str()<< endl;
cout<<"wstring size is:" <<newword.size()<<endl;
return 0;
}
stl提供了string类来处理字符串,但是针对的是单字节字符串。如果想处理汉字,可以选择wstring。用法和string完全相同,但是处理的是宽字符。string到wstring之间的转换,似乎stl没有提供好的方法,所以还得用c的库函数来处理。
以下给出一段代码,演示在unix下面,处理汉字的方法
#include <iostream>
#include <string>
#include <list>
#include <stdlib.h>
#include <locale.h>
namespace std ...{} using namespace std;
int main()
...{
int cnt;
wchar_t wcs[100], wc;
string myword="列表内容为:";
setlocale(LC_CTYPE, ""); //很重要,没有这一句,转换会失败
mbstowcs(wcs, myword.c_str(), 99);
wstring newword(wcs);
cout<<"string content is:"<<myword.c_str()<< endl;
cout<<"wstring size is:" <<newword.size()<<endl;
return 0;
}
相关文章推荐
- [导入]如何在SQL Server2000中处理半个汉字的问题(转)
- 中文在C/C++中的处理和汉字乱码问题(wchar_t)
- PHP中处理截取汉字,出现乱码问题的2个类
- Unix系统环境中“I have no name!”用户名问题处理
- 在SQL Server2000中处理半个汉字的问题(1)
- 不同系统下不同jre使用GBK处理特殊汉字的差异引发乱码问题
- PHP中处理截取汉字,出现乱码问题的2个类
- 中文在C/C++中的处理和汉字乱码问题
- 汉字处理问题
- 如何在2000中处理半个汉字的问题
- 乐其网络2015校园招聘笔试题——处理汉字字符的问题
- 转载:【字符集】处理Toad显示乱码及Windows XP下无法插入“某些汉字”问题
- 在SQL Server 2000中处理半个汉字的问题
- 在Linux/Unix系统下用iconv命令处理文本文件中文乱码问题
- mamp pro下mysql启动时报 Bind on unix socket Address already in use的问题处理
- 中文在C/C++中的处理和汉字乱码问题
- PHP图片处理中的汉字处理问题
- ucGUI汉字处理的一些问题
- mysql 查询的时候处理中文汉字按照字母排序问题
- 【字符集UTF8】处理Toad显示乱码及Windows XP下无法插入“某些汉字”问题