我有一个字符串\u0986\u09AE\u09BF \u0995\u09BF\u0982\u09AC\u09A6\u09A8\u09CD\u09A4\u09BF\u09B0 \u0995\u09A5\u09BE \u09AC\u09B2\u099B\u09BF.我需要将其转换Avwg wKse为ANSI格式的wš-i K_v ejwQ`.如何在java中将此Unicode转换为ANSI字符.
编辑:
resultView.setTypeface(typeFace);
String str=new String("\u0986\u09AE\u09BF \u0995\u09BF\u0982\u09AC\u09A6\u09A8\u09CD\u09A4\u09BF\u09B0 \u0995\u09A5\u09BE \u09AC\u09B2\u099B\u09BF");
resultView.setText(str);
Run Code Online (Sandbox Code Playgroud)
我需要将其转换
AvwgwKsewš—i K_v ejwQ为ANSI格式.
这不是ANSI格式.Windows中的(误导性命名的)"ANSI"代码页都基于ASCII,在高字节中添加了不同的字符.字节0x41(A)作为ANSI代码页中的前导字母总是表示拉丁语A而不是孟加拉语?.
我认为你有一个自定义符号字体,它将任意符号映射到完全不相关的代码点.每个这样的字体都有自己的可视编码; 要在Unicode和自定义可视编码之间进行转换,您必须通过查看每个字符的字形并将它们与表示相同字母的Unicode字符进行匹配来构建您自己的转换表.
我强烈建议获得支持孟加拉语的正确的Unicode识别字体.陷入任意字体特定编码的内容很难处理(因为从语义上来说,你真正处理的是一个字符串,意思是"AvwgwKsewš-i K_v ejwQ",其中包含所有编辑和大小写改变的问题.
在Windows具有良好的Unicode(甚至ISCII)支持之前,可视编码字体是一个不愉快的遗留物.它们今天不应该用于任何事情.
| 归档时间: |
|
| 查看次数: |
10113 次 |
| 最近记录: |