今天晚上闲来无事,便想用C写个读取unicode文件。我平时都是读取ascii文件,一直没什么问题,结果在读取unicode文件时遇到一个小问题,特记下来以做一个留念。
先看刚开始的代码:
FILE* file = _wfopen(L"c:\\BOOTEX.LOG", L"r");
if (file == NULL)
{
perror("open file errror");
system("pause");
return 1;
}
wchar_t line[SIZE1];
_wmemset(line, '\0', SIZE1);
while(fgetws(line, SIZE1, file) != NULL)
{
//line[strlen(line)-1] = '\0';
wprintf(L"%s\n", line);
//memset(line, '\0', SIZE1);
}
fclose(file);
运行程序,只输出了一个字符: C。
BOOST.LOG原文件的内容为:Checking file system on C:
单步调试,发现读文件一次后,line的内容为:C\0h\0e\0c\0k\0i\0n\0g\0 \0f\0i\0l\0e\0 \0s\0y\0s\0t\0e\0m\0 \0o\0n\0 \0C\0:\0\0\n\0,原来每个字符占用了两字节,输出了第一个字符 “C"。接下来读文件,line都是以 '\0' 开头,什么都没有输出。
思来想去,查了许多资料也没找到原因。后来实在没办法,我就心想用二进制文件来打开文件试试:FILE* file = _wfopen(L"c:\\BOOTEX.LOG", L"rb"), 没想到unicode文件输出正常了。为什么二进制文件读写就行呢,我暂时也没有想明白。如果大家知道原因的话,请也告诉我。