我在哪里可以开始使用C语言中的Unicode友好编程?

ELL*_*BLE 8 c string unicode encoding unicode-string

所以,我正在研究一个普通的C(ANSI 9899:1999)项目,我正在试图弄清楚从哪里开始:Unicode,UTF-8和所有爵士乐.

具体来说,它是一个语言解释器项目,我有两个主要的地方,我需要处理Unicode:读取源文件(表面上支持Unicode标识符的语言等),以及'字符串'对象.

我熟悉所有关于Unicode,UTF-7/8/16/32和UCS-2/4的明显基础知识,等等......我主要是寻找有用的,特定于C的(也就是说,请没有C++或C#,这就是之前在SO上记录的所有资源)关于实现Unicode友好的东西的"后续步骤"的资源......在C.

任何链接,联机帮助页,维基百科文章,示例代码都非常受欢迎.我还将尝试在原始问题中维护此类资源的列表,以供稍后发生的任何人使用.


Geo*_*edy 10

International Components for Unicode提供了一个用于处理unicode的可移植C库.这是ICU4C的电梯间距:

C和C++语言以及许多操作系统环境不能完全支持Unicode和符合标准的文本处理服务.尽管某些平台确实提供了良好的Unicode文本处理服务,但便携式应用程序代码无法使用它们.ICU4C图书馆填补了这一空白.ICU4C为应用程序提供了一个开放,灵活,可移植的基础,用于满足其软件全球化要求.ICU4C密切跟踪行业标准,包括Unicode和CLDR(通用区域数据存储库).