Cod*_*ddy 3 html java unicode character-encoding
遇到具有以下Content-Type的html文档时:
text/html; charset=unicode
Run Code Online (Sandbox Code Playgroud)
应该如何阅读?
我目前正在使用charset的值作为Java中InputReader的构造函数的第二个参数,例如:
inputStreamReader = new InputStreamReader(inputStream, charset);
Run Code Online (Sandbox Code Playgroud)
这似乎是把文件读成UTF-16,这是正确的吗?我无法找到任何关于charset名称'unicode'的文档来了解什么是正确的.
实际上,这是错误的标题,没有像"unicode"这样的字符集
在IANA字符集中具有预定义值的任何令牌
这些是可以在Internet中使用的字符集的官方名称,可以在Internet文档中引用
因此,您需要告诉开发人员此服务以修复错误,或检查实际内容,然后才将其假设为utf-7/8/16