此链接http://www.sil.org/iso639-3/download.asp和http://en.wikipedia.org/wiki/ISO_639:a中列出了 7707 种语言。
而且 Unicode 支持语言的书写系统,但我想知道语言和 unicode 范围之间的映射。
Unicode 范围在此链接中列出:http://www.unicode.org/roadmaps/bmp/
unicode 范围的示例之一:“start”=>“0x0900”、“end”=>“0x097F”、“block_name”=>“Devanagari”(什么语言使用此 unicode 范围?)
有什么文档吗?我需要 unicode 范围支持的完整语言映射。
您可以查看 ICU4C 语言环境(http://icu-project.org/apiref/icu4c/uloc_8h.html)
您可以获取所有语言环境(使用 uloc_getAvailable),然后针对每个语言环境调用 uloc_addLikelySubtags,然后对结果调用 uloc_getScript。
这将为您提供一种语言最有可能使用的脚本。但有些语言使用多个脚本。其中一些被 ICU 捕获,但另一些则没有。
| 归档时间: |
|
| 查看次数: |
3086 次 |
| 最近记录: |