如何将越南文本转换为普通文本?

Cau*_*ien 3 java android

我有这样的越南文字:

String text = "Xin chào Vi?t Nam";
Run Code Online (Sandbox Code Playgroud)

我想将其转换为普通文本.我的期望结果:

String result = " "Xin chao Viet Nam";
Run Code Online (Sandbox Code Playgroud)

我怎样才能做到这一点?谢谢.

Ahm*_*mal 6

你要找的等化器java.text.Normalizer .它允许您在重音的Unicode字符及其分解之间进行映射:
它基本上将所有重音字符转换为它们的deAccented对应字符,然后是它们的组合变音符号.现在你可以使用正则表达式去除变音符号.

        public static void main(String[] args) {

            System.out.println(deAccent("Xin chào Vi?t Nam"));
        }

        public static String deAccent(String str) {
            String nfdNormalizedString = Normalizer.normalize(str, Normalizer.Form.NFD); 
            Pattern pattern = Pattern.compile("\\p{InCombiningDiacriticalMarks}+");
            return pattern.matcher(nfdNormalizedString).replaceAll("");
        }
Run Code Online (Sandbox Code Playgroud)