unix下的汉字处理问题
如何把一个汉字作为一个字符来处理?在以前,似乎比较麻烦,因为一个汉字一向是由2个字符来表示的。比较汉字,往往变成了字符串的比较。
unicode出现之后,情况就好多了,每个汉字都有唯一的编码,从此汉字就可以作为单个字符来对待了。
stl提供了string类来处理字符串,但是针对的是单字节字符串。如果想处理汉字,可以选择wstring。用法和string完全相同,但是处理的是宽字符。
string到wstring之间的转换,似乎stl没有提供好的方法,所以还得用c的库函数来处理。
以下给出一段代码,演示在unix下面,处理汉字的方法
#include <iostream>
#include <string>
#include <list>
#include <stdlib.h>
#include <locale.h>
namespace std {} using namespace std;
int main()
{
int cnt;
wchar_t wcs[100], wc;
string myword="列表内容为:";
setlocale(LC_CTYPE, ""); //很重要,没有这一句,转换会失败
mbstowcs(wcs, myword.c_str(), 99);
wstring newword(wcs);
cout<<"string content is:"<<myword.c_str()<< endl;
cout<<"wstring size is:" <<newword.size()<<endl;
return 0;
}
评论