将非ascii符号降级为最接近的7位ASCII等效符号(最好是Java)

Ant*_*n K 5 java unicode ascii character-encoding

是否有任何简单/轻量级的解决方案将至少一些非ASCII符号更改为相应的ASCII模拟?例如这个字符串

abc-åäö.txt
Run Code Online (Sandbox Code Playgroud)

应改为

abc-aao.txt
Run Code Online (Sandbox Code Playgroud)

一点背景:Zip-tools不能可靠地支持UTF-8,因此需要降级.AFAICR Google"将附件下载为单个zip文件"功能会将所有非ascii符号替换为"_"字符.

PS:代码也可能是其他语言,如果它或多或少可以理解,我会把它移植到Java.PPS:到目前为止我的第一个问题,所以请不要在地面以下取消我好吗?

rel*_*let 4

看一下java.text.Normalizer。它可以帮助您转换等效字符:http://en.wikipedia.org/wiki/Unicode_equivalence