由于中文在计算机中的存储是由两位字节, unicode编码中的utf-16实现,所以无法使用常规的字符方式写入文件。
可以采用将string转换为wstring,这样每个汉字存储时使用的是一个字节,就可以循环遍历每个字节写入文件,但在笔者的几次尝试下,这种方式输出暂未找到解决文件乱码的方法。
这里采用的是当某个字节检测到为汉字时,将其紧随的字节和一个 ‘\0’ 标志,一并存到char型数组后输出到文件,从而实现中文写入文件的C++方式的实现。
ps:java有处理中文的包
void write()
{
//string str2 = wstringtoString(str);
//str2 = "chinaisagreatcountry";
str2 = "大数据平台";
FILE *fp1;
if ((fp1 = fopen("vaguenessWords.txt", "a")) == NULL)
cout << "open error" << endl;
else
{
for (int i = 0; i < str2.size(); i++)
{
char s[3];
if (str2[i] & 0x80)//如果当前节点是汉字
{
//一个汉字就是一个字符串,占两个字节,每个字结尾有'\0'标志,占一个字节
s[0] = str2[i]; s[1] = str2[++i]; s[2] = '\0';
printf("%s", s);
fprintf(fp1, "%s", s);//写入文件
}
else
{
fprintf(fp1, "%c", str2[i]);
}
}
fclose(fp1);
}
}