从Text String确定脚本系列.NET

Tod*_*ain 5 .net localization

在.NET中是否有办法根据输入字符串确定脚本系列?例如,我有以下内容:

咖啡,กาแฟ,コーヒー,قهوة

(分别为中文,泰文,日文和阿拉伯文的" 咖啡 ")

有没有办法确定这些脚本是什么,例如一般脚本系列(例如,它可能是"Hans/Hant","Thai","Jpan","Arab") - 这些是IANA/ISO 15924分组?

Dar*_*era 3

我遇到了类似的问题(检测字母/脚本来计算单词数),最后我检查了每个字符以查看它包含在哪个Unicode块中,从而确定如何处理它。基本上,不同的中文、日文、阿拉伯文和泰文“字母”是在单独的 Unicode 块中定义的。

  • 那些在不同语言中表示不同含义的 CJK 字符怎么样?大丈夫在日语中是“好吧”的意思,但在中文中是“伟大的男人”的意思。 (3认同)