我有这样的越南文字:
String text = "Xin chào Vi?t Nam";
Run Code Online (Sandbox Code Playgroud)
我想将其转换为普通文本.我的期望结果:
String result = " "Xin chao Viet Nam";
Run Code Online (Sandbox Code Playgroud)
我怎样才能做到这一点?谢谢.
你要找的等化器在java.text.Normalizer
.它允许您在重音的Unicode字符及其分解之间进行映射:
它基本上将所有重音字符转换为它们的deAccented对应字符,然后是它们的组合变音符号.现在你可以使用正则表达式去除变音符号.
public static void main(String[] args) {
System.out.println(deAccent("Xin chào Vi?t Nam"));
}
public static String deAccent(String str) {
String nfdNormalizedString = Normalizer.normalize(str, Normalizer.Form.NFD);
Pattern pattern = Pattern.compile("\\p{InCombiningDiacriticalMarks}+");
return pattern.matcher(nfdNormalizedString).replaceAll("");
}
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
2713 次 |
| 最近记录: |