Arch Linux 在 中列出了以下不同的中文语言环境/etc/locale.gen
:
#zh_CN.GB18030 GB18030
#zh_CN.GBK GBK
#zh_CN.UTF-8 UTF-8
#zh_CN GB2312
#zh_HK.UTF-8 UTF-8
#zh_HK BIG5-HKSCS
#zh_SG.UTF-8 UTF-8
#zh_SG.GBK GBK
#zh_SG GB2312
#zh_TW.EUC-TW EUC-TW
#zh_TW.UTF-8 UTF-8
#zh_TW BIG5
Run Code Online (Sandbox Code Playgroud)
这些区域设置是特定于区域的(代表中国大陆、香港、新加坡和台湾,甚至不包括日本和韩国),但每个区域仍然有多个区域设置。
由于汉字的非系统性,又由于分布范围如此之大,将汉字编入UTF的过程并非一帆风顺,因地域而异。同一个字有许多变体,也有政治和文化因素在起作用,甚至在一个地区,人们可能更喜欢使用某些字符变体而不是官方的,而不仅仅是手写。
一些技术问题在这里用通俗的语言解释。
我的理解是,繁体中文和简体中文(例如?)中相同的字符以及同一“简体”或“繁体”类别中相同字符的不同变体获得相同的代码点,以及字符变体使用不同的字体实现。
相比之下,足够不同的版本(例如,不同的简体和繁体字符,如 ? 和 ?)获得不同的代码点,因此,同一字体可以包含多个版本的相同字符。
这种交织(简体、繁体和字符变体都包含在 UTF 中)导致了一个问题,为什么所有这些不同的语言环境对于中文都是必要的,以及作为用户,是否有必要安装它们。
在安装了足够字体的系统上(系统上每个要显示的字符都有一个字形):
我真的需要这些语言环境中的哪些才能正确显示大多数字符?
哪些中文编码已经包含在另一种编码中(例如,UTF 是否与 Big5 或其他中文编码向后兼容,如与 ASCII 兼容)?
在打开 pdfevince
然后对该文档进行更改(在 LaTeX 中重新编译)后,evince
将自动刷新到该文档的最新版本。
mupdf
但是不这样做:它一直显示我最初打开的版本。可以使用该r
命令加载最新版本,但是有没有办法使mupdf
行为像evince
在这方面一样?手册没有提到这一点。