我有一个带有"ñ"字符的字符串,我遇到了一些问题.我需要将此String编码为UTF-8编码.我通过这种方式尝试过,但它不起作用:
byte ptext[] = myString.getBytes();
String value = new String(ptext, "UTF-8");
Run Code Online (Sandbox Code Playgroud)
如何将该字符串编码为utf-8?
将字符串从Unicode转换为ASCII而不改变其长度的最佳方法是什么(在我的情况下这非常重要)?此外,没有任何转换问题的字符必须与原始字符串中的位置相同.因此,"Ä"必须转换为"A"而不是具有更多字符的神秘内容.
编辑:
@novalis - 这些符号(例如亚洲语言)应该只转换为一些占位符.我对这些词或他们的意思不太感兴趣.
@MtnViewMark - 在任何情况下我都必须保留所有字符的数量和ASCII可用字符的位置.
这里有一些更多信息:我有一些只能处理ASCII字符串的文本挖掘工具.大多数应该处理的文本是英文的,但有些文本包含非ASCII字符.我对这些单词不感兴趣,但我必须确保我感兴趣的单词(那些只包含ASCII字符的单词)在字符串转换后处于相同的位置.