为什么File.ReadAllBytes与使用File.ReadAllText时的结果不同？

我有一个内容为“test”的文本文件（UTF-8编码）。我尝试从这个文件中获取字节数组并转换为字符串，但它包含一个奇怪的字符。我使用以下代码：

var path = @"C:\Users\Tester\Desktop\test\test.txt"; // UTF-8 var bytes = File.ReadAllBytes(path); var contents1 = Encoding.UTF8.GetString(bytes); var contents2 = File.ReadAllText(path); Console.WriteLine(contents1); // result is "?test" Console.WriteLine(contents2); // result is "test"

conents1与contents2不同 – 为什么？

正如ReadAllText的文档中所述：

此方法尝试根据字节顺序标记的存在自动检测文件的编码。可以检测到编码格式UTF-8和UTF-32（big-endian和little-endian）。

因此该文件包含BOM（字节顺序标记）， ReadAllText方法正确解释它，而第一种方法只读取普通字节，而根本不解释它们。

Encoding.GetString只说它：

将指定字节数组中的所有字节解码为字符串

（强调我的）。这当然不是完全确定的，但是你的例子表明这是从字面上理解的。

您可能在文件的开头看到了Unicode BOM（字节顺序标记）。 File.ReadAllText知道如何剥离它，但Encoding.UTF8没有。

它是UTF8编码前缀字符串。它将文件标记为UTF8编码。 ReadAllText不返回它，因为它是一个解析指令。

为什么File.ReadAllBytes与使用File.ReadAllText时的结果不同？

调试AzureFunction以及部署azure函数时缺少ProviderName

是否可以在自己的应用程序中使用Windows 7任务计划程序

在c＃中将多个参数化变量添加到数据库

如何在激活时将WinForm完全带到前面

运行时创建LINQ表达式

在Entity Framework中获取被忽略的属性

在Windows登录c＃之前打开表单

IIS7 – 当请求参数的大小超过30mb时，Webrequest以404.13失败

F＃（或C＃）中的任何R-Tree实现？

ListView / List过滤Windows Phone 8.1 C＃