我写了一个小程序来迭代大量文件,并应用一些更改,其中找到某个字符串匹配,我的问题是不同的文件有不同的编码.所以我想做的是检查编码,然后以原始编码覆盖文件.
在C#.net 2.0中做最好的方法是什么?
我的代码看起来很简单,
String f1 = File.ReadAllText(fileList[i]).ToLower(); if (f1.Contains(oPath)) { f1 = f1.Replace(oPath,nPath); File.WriteAllText(fileList[i],f1,Encoding.Unicode); }
我看了一下Auto encoding detect in C#,这使我意识到如何检测编码,但我不知道如何使用这些信息来编写相同的编码.
将非常感谢任何帮助在这里.
解决方法
不幸的是编码是那些不总是有确定答案的主题之一.在很多情况下,更接近于猜测编码而不是检测编码.陈冯富珍在这个题目上做了很好的博客文章,值得一读
> http://blogs.msdn.com/b/oldnewthing/archive/2007/04/17/2158334.aspx
文章的要点是
>如果BOM(字节顺序标记)存在,那么你是黄金的
否则就猜测工作和启发式
不过,我仍然认为最好的方法是在你链接的问题中提到达琳.让StreamReader猜测你,重新发明轮子.它只需要对您的样品进行非常轻微的修改.
String f1; Encoding encoding; using (var reader = new StreamReader(fileList[i])) { f1 = reader.ReadToEnd().ToLower(); encoding = reader.CurrentEncoding; } if (f1.Contains(oPath)) { f1 = f1.Replace(oPath,nPath); File.WriteAllText(fileList[i],encoding); }