我有以下代码用于使用UTF-8编码将xml从DataSet转换为字节数组:
private static byte[] fGetXmlBytes(DataTable lvDataTable)
{
XmlWriterSettings lvSettings = new XmlWriterSettings();
lvSettings.Encoding = Encoding.UTF8;
lvSettings.NewLineHandling = NewLineHandling.Replace;
lvSettings.NewLineChars = String.Empty;
using(MemoryStream lvMemoryStream = new MemoryStream())
using (XmlWriter lvWriter = XmlWriter.Create(lvMemoryStream, lvSettings))
{
lvDataTable.WriteXml(lvWriter, XmlWriteMode.IgnoreSchema);
//Lines used during debugging
//byte[] lvXmlBytes = lvMemoryStream.GetBuffer();
//String lsXml = Encoding.UTF8.GetString(lvXmlBytes, 0, lvXmlBytes.Length);
return lvMemoryStream.GetBuffer();
}
}
Run Code Online (Sandbox Code Playgroud)
我想要一个字节数组,因为我随后将数据传递给在字节数组上工作的压缩和加密例程.问题是我在xml的开头有一个额外的字符.代替:
<?xml version="1.0" encoding="utf-8"?><etc....
Run Code Online (Sandbox Code Playgroud)
我明白了
.<?xml version="1.0" encoding="utf-8"?><etc....
Run Code Online (Sandbox Code Playgroud)
有谁知道为什么角色在那里?有没有办法防止添加角色?或者轻松剥离它?
科林
Mar*_*age 13
您将不得不使用Encoding不发出前导码的类.返回的对象Encoding.UTF8将发出一个前导码,但您可以创建自己的UTF8Encoding,不会发出这样的前导码:
lvSettings.Encoding = new UTF8Encoding(false);
Run Code Online (Sandbox Code Playgroud)
UTF-8前导码是使用UTF-8编码的UNICODE字节顺序标记(U + FEFF).UNICODE字节顺序标记的目的是指示流的16位代码单元的字节顺序(字节顺序).如果流中的初始字节是0xEF 0xFF流是大端; 否则,如果初始字节是0xFF 0xEF流是小端.
使用UTF-8编码的U + FEFF会产生字节0xEF 0xBB 0xBF并且有点讽刺意味,因为UTF-8编码为8位字节的序列,字节顺序不再重要.