相关疑难解决方法(0)

问题是,如你所知,Unicode图表中有数千个字符,我想将所有相似的字符转换为英文字母中的字母.

例如,这里有一些转换:

?->H
?->V
?->Y
?->O
?->C
t?? ?????y --> the Family
...

我看到有超过20个版本的字母A/a.而且我不知道如何对它们进行分类.它们看起来像大海捞针.

如何用Java转换所有这些？请帮我 :(

126
推荐指数

8
解决办法

12万
查看次数

以下代码是众所周知的将重音字符转换为纯文本:

Normalizer.normalize(text, Normalizer.Form.NFD).replaceAll("\\p{InCombiningDiacriticalMarks}+", "");

我用这个替换了我的"手工制作"方法,但我需要理解replaceAll的"正则表达式"部分

1)什么是"InCombiningDiacriticalMarks"？
2)文件在哪里？(和类似的？)

谢谢.

80
推荐指数

2
解决办法

3万
查看次数