如何从字节数组中删除BOM

Rav*_*pta 6 .net c# byte-order-mark

我的xml数据byte[] byteArray可能包含或不包含BOM.C#中是否有任何标准方法可以从中删除BOM?如果没有,那么处理包括所有类型编码在内的所有情况的最佳方法是什么呢?

实际上,我正在修复代码中的错误,我不想更改大部分代码.所以如果有人能给我删除BOM的代码会更好.

我知道我可以这样做,找出60哪个是'<'的ASCII值并在此之前忽略字节,但我不想那样做.

Ric*_*lly 6

所有C#XML解析器都会自动为您处理BOM.我建议使用XDocument - 在我看来,它提供了最干净的XML数据抽象.

以XDocument为例:

using (var stream = new memoryStream(bytes))
{
  var document = XDocument.Load(stream);
  ...
}
Run Code Online (Sandbox Code Playgroud)

一旦有了XDocument,就可以使用它来省略没有BOM的字节:

using (var stream = new MemoryStream())
using (var writer = XmlWriter.Create(stream))
{
  writer.Settings.Encoding = new UTF8Encoding(false);
  document.WriteTo(writer);
  var bytesWithoutBOM = stream.ToArray();
}
Run Code Online (Sandbox Code Playgroud)