cod*_*erz 0 java normalization
是否有一个 Java 库可以通过删除空格/特殊字符、小写所有字母来标准化字符串,例如:S-cube Abc' Inc.to scubeabcinc?
有java.text.Normalizer。Java 以 Unicode 保存文本,并且\xc3\xa9可以写为一个 Unicode 符号、代码点,或写为两个,一个e和一个零宽度'。Unicode 规范化对于字典、文件名来说非常重要。\n规范化器可用于分解字母和重音符号(变音标记),并使用正则表达式删除replaceAll所有重音符号。
Character具有 Unicode 支持,为代码点提供 Unicode 名称,将代码点分类为字母、数字、多种脚本等。
有Collate面向区域设置的,它为单词、排序创建特定的键,如Comparator。在一种语言环境中,顺序可能是 AaBbCc\xc4\x89D..,而在另一种语言环境中,顺序可能是 ABC...abc 等。Locale指定为大写。例如,在土耳其语中有字母 i-without-dotI\xc4\xb1和 i-with-dot \xc4\xb0i。
然后是您的用例:减少。例如,有用于声音相似表示的soundex算法(第三方)。正则表达式可以删除插点等String.replaceAll。