C# - 检测文件中的编码,使用找到的编码将更改写入文件

cc0*_*cc0 10 .net c# encoding .net-2.0

我编写了一个小程序,用于迭代大量文件,并在找到某个字符串匹配时应用一些更改,我遇到的问题是不同的文件有不同的编码.所以我想做的是检查编码,然后用原始编码覆盖文件.

在C#.net 2.0中最漂亮的方式是什么?

我的代码现在看起来非常简单;

String f1 = File.ReadAllText(fileList[i]).ToLower();

if (f1.Contains(oPath))
{
    f1 = f1.Replace(oPath, nPath);
    File.WriteAllText(fileList[i], f1, Encoding.Unicode);
}
Run Code Online (Sandbox Code Playgroud)

我看了一下C#中的自动编码检测,这让我意识到我如何检测编码,但我不知道如何使用该信息以相同的编码进行编写.

非常感谢这里的任何帮助.

Jar*_*Par 16

不幸的是,编码是那些并不总是有明确答案的主题之一.在许多情况下,它更接近于猜测编码而不是检测它.Raymond Chen在这个主题上发表了一篇非常好的博客文章,值得一读

文章的要点是

  • 如果BOM(字节顺序标记)存在,那么你就是黄金
  • 还有它的猜测工作和启发式

但是我仍然认为最好的方法是在你联系的问题中提到达林.让StreamReader你猜猜你与重新发明轮子.它只需要对您的样品进行非常轻微的修改.

String f1;
Encoding encoding;
using (var reader = new StreamReader(fileList[i])) {
  f1 = reader.ReadToEnd().ToLower();
  encoding = reader.CurrentEncoding;
}

if (f1.Contains(oPath))
{
  f1 = f1.Replace(oPath, nPath);
  File.WriteAllText(fileList[i], f1, encoding);
}
Run Code Online (Sandbox Code Playgroud)