您的位置:首页 > 其它

unix下的汉字处理问题

2007-09-04 09:57 811 查看
  如何把一个汉字作为一个字符来处理?在以前,似乎比较麻烦,因为一个汉字一向是由2个字符来表示的。比较汉字,往往变成了字符串的比较。unicode出现之后,情况就好多了,每个汉字都有唯一的编码,从此汉字就可以作为单个字符来对待了。

  stl提供了string类来处理字符串,但是针对的是单字节字符串。如果想处理汉字,可以选择wstring。用法和string完全相同,但是处理的是宽字符。string到wstring之间的转换,似乎stl没有提供好的方法,所以还得用c的库函数来处理。
以下给出一段代码,演示在unix下面,处理汉字的方法


#include <iostream>


#include <string>


#include <list>


#include <stdlib.h>


#include <locale.h>




namespace std ...{} using namespace std;




int main()




...{


int cnt;


wchar_t wcs[100], wc;




string myword="列表内容为:";




setlocale(LC_CTYPE, ""); //很重要,没有这一句,转换会失败




mbstowcs(wcs, myword.c_str(), 99);




wstring newword(wcs);




cout<<"string content is:"<<myword.c_str()<< endl;




cout<<"wstring size is:" <<newword.size()<<endl;






return 0;


}

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: