在C程序中,我使用wprintf在
Windows控制台中打印Unicode(UTF-16)文本.这可以正常工作,但是当程序的输出重定向到日志文件时,日志文件的UTF-16编码已损坏.
当在Windows命令提示符中完成重定向时,所有换行符都将被编码为窄ASCII换行符(0d0a).当在PowerShell中重定向时,插入空字符.
当在Windows命令提示符中完成重定向时,所有换行符都将被编码为窄ASCII换行符(0d0a).当在PowerShell中重定向时,插入空字符.
示例程序:
#include <stdio.h> #include <windows.h> #include <fcntl.h> #include <io.h> int main () { int prevmode; prevmode = _setmode(_fileno(stdout),_O_U16TEXT); fwprintf(stdout,L"one\n"); fwprintf(stdout,L"two\n"); fwprintf(stdout,L"three\n"); _setmode(_fileno(stdout),prevmode); return 0; }
在命令提示符中重定向输出.看到0d0a应该是0d00 0a00:
c:\test>.\testu16.exe > o.txt c:\test>xxd o.txt 0000000: 6f00 6e00 6500 0d0a 0074 0077 006f 000d o.n.e....t.w.o.. 0000010: 0a00 7400 6800 7200 6500 6500 0d0a 00 ..t.h.r.e.e....
在PowerShell中重定向输出.看到所有的0000插入.
PS C:\test> .\testu16.exe > p.txt PS C:\test> xxd p.txt 0000000: fffe 6f00 0000 6e00 0000 6500 0000 0d00 ..o...n...e..... 0000010: 0a00 0000 7400 0000 7700 0000 6f00 0000 ....t...w...o... 0000020: 0d00 0a00 0000 7400 0000 6800 0000 7200 ......t...h...r. 0000030: 0000 6500 0000 6500 0000 0d00 0a00 0000 ..e...e......... 0000040: 0d00 0a00 ....