在java中从csv文件读取时,斯洛伐克字符变得混乱

Inf*_*hie 5 java unicode inputstream

我正在尝试通过包含一些斯洛伐克语字符的 InputStream 读取逗号分隔的文件,因此我在 InputStream 参数中传递了正确的字符编码。但是角色仍然变得一团糟。

InputStreamReader stream = new InputStreamReader(inputStreamToExcel,"ISO-8859-2");
Run Code Online (Sandbox Code Playgroud)

例如,dd890èš 变成了 dd890?最后两个斯洛伐克字符搞砸了。

请帮忙。

Inf*_*hie 0

org.apache.commons.lang.StringEscapeUtils escapeHtml(value) 解决了这个问题。通过 escapeHTML,我能够看到确切的 html 实体代码,帮助我分析应用程序读取了正确的字符。但是当它被分配给 String 时,它会以某种方式转换为错误的格式。但是,当将 unescapedHtml 字符串传递给视图时,浏览器会正确显示它,因为浏览器可以正确理解 HTML 实体代码。

参考资料:http://www.w3schools.com/tags/ref_ascii.asp http://www.alanwood.net/demos/ansi.html

这就是我的分析,如果大家有什么需要补充的,欢迎补充。