我正在读取一个
文件:
var source = File.ReadAllText(path);
并且字符©未正确加载.
然后,我改为:
var source = File.ReadAllText(path,Encoding.UTF8);
没什么
我决定尝试使用
var source = File.ReadAllText(path,Encoding.Default);
它工作完美.
然后我调试它,并试图找到哪个编码做的诀窍,我发现它是UTF-7.
我想知道的是:
建议使用Encoding.Default,它能保证文件的所有字符都将被读取没有问题吗?
Encoding.Default将仅保证所有UTF-7字符集将被正确读取(整个集合为谷歌).另一方面,如果您尝试以UTF-8模式读取未以UTF-8编码的
文件,则会像您一样收到损坏的字符.
例如,如果文件被编码为UTF-16,并且如果您以UTF-16模式读取该文件,即使该文件不包含单个UTF-16特定字符也将是正常的.这一切归结为文件的编码.
您需要使用相同的编码来保存重新打开的东西,以防止损坏.否则,尝试尽可能多地使用UTF-7,因为它是最紧凑的“电子邮件安全”编码可能,这就是为什么在大多数.NET框架设置中是默认的.