C 语言环境被定义为使用 ASCII 字符集,而 POSIX 不提供一种在不更改语言环境的情况下使用字符集的方法。
如果将 C 的编码改为 UTF-8 会发生什么?
积极的一面是 UTF-8 将成为任何进程的默认字符集,甚至是系统守护进程。显然,有些应用程序会中断,因为它们假定 C 使用 7 位 ASCII。但这些应用真的存在吗?现在很多编写的代码在一定程度上是语言环境和字符集感知的,我会惊讶地看到只能处理 7 位干净输入的代码并且不能轻易适应接受支持 UTF-8 的 C .
character-encoding compatibility posix unicode locale
character-encoding ×1
compatibility ×1
locale ×1
posix ×1
unicode ×1