小编cod*_*ing的帖子

正确显示(抛光)字符

我正在读一个包含德语,法语,西班牙语,英语和波兰文的xml文件.

为了处理抛光字母(这导致最麻烦)我试图这样做:

File file = new File(path);
InputStream is = new FileInputStream(file);
Reader reader = new InputStreamReader(is, charset);

InputSource src = new InputSource(reader);
src.setEncoding(charset.name());

SAXParserFactory factory = SAXParserFactory.newInstance();
SAXParser saxParser = factory.newSAXParser();

saxParser.parse(src, handler);
Run Code Online (Sandbox Code Playgroud)

我遇到的问题是没有任何默认的字符集正确显示文本.有些人在其中有一些问号,其中有一些其他字符组合,例如Ä..

为了打破它,我写了另一个片段来测试哪个charset工作:

public static void main(String[] args){
        Charset charset = StandardCharsets.UTF_8;
        String chars = "??una d?ugie";
        System.out.println(new String(chars.getBytes(charset), charset));
}
Run Code Online (Sandbox Code Playgroud)

再次测试每一个,但没有任何作用..我希望你有一个想法.

java encoding character-encoding polish

7
推荐指数
1
解决办法
2731
查看次数

标签 统计

character-encoding ×1

encoding ×1

java ×1

polish ×1