是charset = unicode UTF-8,UTF-16还是其他什么?

Cod*_*ddy 3 html java unicode character-encoding

遇到具有以下Content-Type的html文档时:

text/html; charset=unicode
Run Code Online (Sandbox Code Playgroud)

应该如何阅读?

我目前正在使用charset的值作为Java中InputReader的构造函数的第二个参数,例如:

inputStreamReader = new InputStreamReader(inputStream, charset);
Run Code Online (Sandbox Code Playgroud)

这似乎是把文件读成UTF-16,这是正确的吗?我无法找到任何关于charset名称'unicode'的文档来了解什么是正确的.

Iły*_*sov 5

实际上,这是错误的标题,没有像"unicode"这样的字符集

根据设置HTTP charset参数

在IANA字符集中具有预定义值的任何令牌

这些是可以在Internet中使用的字符集的官方名称,可以在Internet文档中引用

因此,您需要告诉开发人员此服务以修复错误,或检查实际内容,然后才将其假设为utf-7/8/16