为什么File.ReadAllBytes与使用File.ReadAllText时的结果不同？

Dra*_*gon 9 c# string byte

我有一个内容为"test"的文本文件(UTF-8编码).我尝试从这个文件中获取字节数组并转换为字符串,但它包含一个奇怪的字符.我使用以下代码:

var path = @"C:\Users\Tester\Desktop\test\test.txt"; // UTF-8

var bytes = File.ReadAllBytes(path);
var contents1 = Encoding.UTF8.GetString(bytes);

var contents2 = File.ReadAllText(path);

Console.WriteLine(contents1); // result is "?test"
Console.WriteLine(contents2); // result is "test"

Run Code Online (Sandbox Code Playgroud)

conents1不同于contents2- 为什么？

如ReadAllText文档中所述:

此方法尝试根据字节顺序标记的存在自动检测文件的编码.可以检测到编码格式UTF-8和UTF-32(big-endian和little-endian).

因此该文件包含BOM(字节顺序标记),并且ReadAllText方法正确解释它,而第一种方法只读取普通字节,而根本不解释它们.

Encoding.GetString 只说:

将指定字节数组中的所有字节解码为字符串

(强调我的).这当然不是完全确定的,但是你的例子表明这是从字面上理解的.

您可能会在文件开头看到 Unicode BOM（字节顺序标记）。 File.ReadAllText知道如何剥离它，但Encoding.UTF8不知道。

它是UTF8编码前缀字符串。它将文件标记为 UTF8 编码。ReadAllText不返回它，因为它是一个解析指令。

归档时间：	11 年，4 月前
查看次数：	7207 次
最近记录：	9 年，9 月前

这个炭是什么？65279'' 47

更多相关链接

您找到了扩展方法的哪些优点？ 83

何时自定义属性的构造函数运行？ 73

应用程序无法加载.无法创建Visual C#2015 RC编译器 70

C#7.2中Span <T>和Memory <T>有什么区别？ 57

使用JavaScript替换字符串的最后一个字符 42

检测操作是POST还是GET方法 40

将textareas字符串值转换为由新行分隔的JavaScript数组 25

php如何修剪heredoc中的每一行(长字符串) 10

从String中的char位置获取行号的最简单方法是什么？ 8

Java中的字符串字反转给出了错误的结果？ 7

Python有三元条件运算符吗？ 5591

适用于Android UserManager.isUserAGoat()的用例？ 3506

AngularJS:服务与提供商vs工厂 3296

数据绑定如何在AngularJS中运行？ 1924

删除文件或文件夹 1910

在GitHub上使用https://时有没有办法跳过密码输入？ 1806

如何在Java中打破嵌套循环？ 1751

type()和isinstance()之间有什么区别？ 1163

如何将div中的绝对定位元素居中？ 1034

如何列出包含给定提交的分支？ 1029