什么应该是使用file:protocol从URL读取的API的默认编码?

Mat*_*eau 5 url api-design file character-encoding

我正在设计一个API,它将URL作为输入,并读取该URL的内容.当URL是"file:"协议时,什么会为字符编码提供更好的默认值?

  • 系统的本机编码
  • UTF-8

API允许显式设置.此外,我们可以使用一些启发式方法来确定字符编码,如BOM(如果可用),但是当所有这些都失败时,默认值应该是什么?

据我所知,标准在这个问题上没有提及.在其他条件相同的情况下,我希望对于那些甚至不知道存在字符编码等问题的人来说,最正常的事情就是发生.

Dav*_*err 2

如果可能,请始终使用 UTF-8,并将其记录在 API 文档中。UTF-8 是一个坚如磐石的编码标准,并且非常面向未来 - 我会避免通过支持其他编码来为自己产生潜在的工作 - 如果您迁移 API 以这样的方式使用,UTF-8 也会很容易使用可以通过 Web 服务访问它。