用C读取Unicode文件

今天晚上闲来无事，便想用C写个读取unicode文件。我平时都是读取ascii文件，一直没什么问题，结果在读取unicode文件时遇到一个小问题，特记下来以做一个留念。

先看刚开始的代码：

    FILE* file = _wfopen(L"c:\\BOOTEX.LOG", L"r");
    if (file == NULL)
    {
        perror("open file errror");
        system("pause");
        return 1;
    }
    wchar_t line[SIZE1];
    _wmemset(line, '\0', SIZE1);
    while(fgetws(line, SIZE1, file) != NULL)
    {
        //line[strlen(line)-1] = '\0';
        wprintf(L"%s\n", line);
        //memset(line, '\0', SIZE1);
    }
    fclose(file);

运行程序，只输出了一个字符： C。

BOOST.LOG原文件的内容为：Checking file system on C:

单步调试，发现读文件一次后，line的内容为：C\0h\0e\0c\0k\0i\0n\0g\0 \0f\0i\0l\0e\0 \0s\0y\0s\0t\0e\0m\0 \0o\0n\0 \0C\0:\0\0\n\0，原来每个字符占用了两字节，输出了第一个字符 “C"。接下来读文件，line都是以 '\0' 开头，什么都没有输出。

思来想去，查了许多资料也没找到原因。后来实在没办法，我就心想用二进制文件来打开文件试试：FILE* file = _wfopen(L"c:\\BOOTEX.LOG", L"rb")，没想到unicode文件输出正常了。为什么二进制文件读写就行呢，我暂时也没有想明白。如果大家知道原因的话，请也告诉我。

用C读取Unicode文件

悦读