Inf*_*hie 5 java unicode inputstream
我正在尝试通过包含一些斯洛伐克语字符的 InputStream 读取逗号分隔的文件,因此我在 InputStream 参数中传递了正确的字符编码。但是角色仍然变得一团糟。
InputStreamReader stream = new InputStreamReader(inputStreamToExcel,"ISO-8859-2");
Run Code Online (Sandbox Code Playgroud)
例如,dd890èš 变成了 dd890?最后两个斯洛伐克字符搞砸了。
请帮忙。
org.apache.commons.lang.StringEscapeUtils escapeHtml(value) 解决了这个问题。通过 escapeHTML,我能够看到确切的 html 实体代码,帮助我分析应用程序读取了正确的字符。但是当它被分配给 String 时,它会以某种方式转换为错误的格式。但是,当将 unescapedHtml 字符串传递给视图时,浏览器会正确显示它,因为浏览器可以正确理解 HTML 实体代码。
参考资料:http://www.w3schools.com/tags/ref_ascii.asp http://www.alanwood.net/demos/ansi.html
这就是我的分析,如果大家有什么需要补充的,欢迎补充。
| 归档时间: |
|
| 查看次数: |
1687 次 |
| 最近记录: |