为什么我在字节数组的开头有一个额外的字符(点或子弹点)?

Col*_*lin 3 c# xml

我有以下代码用于使用UTF-8编码将xml从DataSet转换为字节数组:

private static byte[] fGetXmlBytes(DataTable lvDataTable)
{
  XmlWriterSettings lvSettings = new XmlWriterSettings();
  lvSettings.Encoding = Encoding.UTF8;
  lvSettings.NewLineHandling = NewLineHandling.Replace;
  lvSettings.NewLineChars = String.Empty;

  using(MemoryStream lvMemoryStream = new MemoryStream())
  using (XmlWriter lvWriter = XmlWriter.Create(lvMemoryStream, lvSettings))
  {
    lvDataTable.WriteXml(lvWriter, XmlWriteMode.IgnoreSchema);
    //Lines used during debugging
    //byte[] lvXmlBytes = lvMemoryStream.GetBuffer();
    //String lsXml = Encoding.UTF8.GetString(lvXmlBytes, 0, lvXmlBytes.Length);
    return lvMemoryStream.GetBuffer();
  }
}
Run Code Online (Sandbox Code Playgroud)

我想要一个字节数组,因为我随后将数据传递给在字节数组上工作的压缩和加密例程.问题是我在xml的开头有一个额外的字符.代替:

<?xml version="1.0" encoding="utf-8"?><etc....
Run Code Online (Sandbox Code Playgroud)

我明白了

.<?xml version="1.0" encoding="utf-8"?><etc....
Run Code Online (Sandbox Code Playgroud)

有谁知道为什么角色在那里?有没有办法防止添加角色?或者轻松剥离它?

科林

Mar*_*age 13

您将不得不使用Encoding不发出前导码的类.返回的对象Encoding.UTF8将发出一个前导码,但您可以创建自己的UTF8Encoding,不会发出这样的前导码:

lvSettings.Encoding = new UTF8Encoding(false);
Run Code Online (Sandbox Code Playgroud)

UTF-8前导码是使用UTF-8编码的UNICODE字节顺序标记(U + FEFF).UNICODE字节顺序标记的目的是指示流的16位代码单元的字节顺序(字节顺序).如果流中的初始字节是0xEF 0xFF流是大端; 否则,如果初始字节是0xFF 0xEF流是小端.

使用UTF-8编码的U + FEFF会产生字节0xEF 0xBB 0xBF并且有点讽刺意味,因为UTF-8编码为8位字节的序列,字节顺序不再重要.