Ric*_*haw 5 mac symbols unicode macos
因为我有我的 mac,我一直看到这个奇怪的符号。直到今天,它只在 OpenOffice.org 中代替项目符号。第一张图片在 Windows 系统上创建的 .doc 文件中显示了这一点。
我什么都没想到——只是一个烦恼。无论字体如何,它都会出现。如果我删除文本并使用工具栏插入项目符号列表,则会出现真正的项目符号。
然后,今天我在 iTunes 中注意到了 - 这看起来很奇怪。
图3是角色的放大图。上面写着:私人使用 E000 F8FF。
它是什么(与 unicode 相关?),以及如何让项目符号正常工作?
编辑:情节变厚......如果我在安全模式下启动,这些符号看起来像你在电影中拍摄场景开始时的小快照板......
我只能回答你问题的“它是什么”部分。
旁边的文字“Private Use”和“e000”和“f8ff”指的是 Unicode 字符集——特别是Private Use集:
UCS 包括 137,468 个供私人使用的代码点。这意味着 ISO 和 Unicode 联盟之外的个人、组织和软件供应商可以为这些代码点分配具有特定属性的字符。私人使用区 (PUA) 是保留供私人使用的几个范围之一。对于这个范围,Unicode 标准没有指定任何字符。
基本多语言平面包括一个范围从 U+E000 到 U+F8FF (57344–63743) 的 PUA。平面十五(U+F0000 至 U+FFFFD)和平面十六(U+100000 至 U+10FFFD)也完全保留供私人使用。
PUA 的使用是从某些亚洲编码系统继承的概念。这些系统具有专用区域,以特定于应用程序的方式对日语 Gaiji(罕见的个人姓名字符)进行编码。私人使用区的使用示例之一是 Apple 将 U+F8FF 用于 Apple 标志。
根据Grotto11 的 Brian Tiemann 的说法,当角色未定义时会出现这些:
看那个。像往常一样,对于无法显示的字符,它是正方形。但是现在都是矢量图形,而且因为阿拉伯字体集显然还没有完成(随着他们不断完成 OS X 的点发布,他们不断添加填充这些字母块的字符集包),它与很酷的信息。阿拉伯语占据的 Unicode 范围,加上一个中央符号,告诉你最终会去那里。
这就是 Apple 还没有完全完成某些事情时的样子。
所以我们的好奇心现在很猖獗;我们切换到 Unicode 十六进制输入模式(按住 Option 并键入四位十六进制数字)并开始输入值,以查看范围是什么样的,它们被分配给什么,以及它们有什么符号:
嗯嗯。那不是疯了吗?我喜欢它。(尤其是那个看起来像苏斯博士的“私人用途”。)苹果甚至让未实现的功能看起来很酷。这些方块位于每个指定字符块的开头,并定义该块将是什么,如果字符尚未全部完成,它们都会显示为该通用标识符。
希望我能告诉你为什么它被显示出来,虽然......
(呃,是的,这个答案太长了。子弹没有幸福的结局!以粗体突出显示......)
问题中的图像以Apple 的 Last Resort 字体定义,该字体包含236 个不同的有趣符号。我猜这个名字说明了一切,但根据维基百科:
LastResort 是一种 Mac OS 字体,对最终用户不可见,但系统使用它来显示任何其他字体中不可用的字形。LastResort 提供的符号根据它们在 Unicode 系统中的位置将字形归入类别,并向用户提供有关查看不可用字符所需的字体或脚本的提示。
苹果解释说:
以多种方式选择示例字形。几乎所有的婆罗门文字都显示了首辅音 ka。拉丁语使用字母 A,因为它是第一个字母,并且因为在每个拉丁语块中都有一个字母 A,因此可以轻松区分它们。希腊语和西里尔语使用它们的最后一个字母 omega 和 ya,因为它们非常独特。大多数其他字母和音节使用它们独特的首字母。
(我喜欢Unicode BMP Fallback font,就像在 Firefox 中使用的那样,更好,因为它显示了精确的 4 个字符的 Unicode 代码。)
因此,您的 Mac 不知道要显示什么,而是使用 Last Resort 字体来提供一些信息。
我的第一个猜测是:Microsoft Office 使用一些专有符号字体,其中使用来自私人使用区域(PUA) 的字符代码来定义项目符号的外观。(或者也许作者安装了一些奇怪的字体,其中使用了一些有趣的子弹。)您的 Mac 既不知道该字体,也没有任何其他字体恰好定义了相同的 Unicode 字符代码。即使另一种字体确实为该代码定义了一些字符,它也无济于事,因为根据定义来自私人使用区域的字符可能在不同的字体中有完全不同的含义。在 Mac 上安装 Office 可能还包括字体,这可能会使项目符号在 OpenOffice.org 中也能正常显示。(实际上,安装 Office 试用版可能已经安装了缺少的专有字体。)
嗯,不。
虽然以上对于 Unicode 的任何合理用法都是正确的,但一些进一步的调查了解到,在旧的应用程序中,Microsoft 使用范围 U+F020..U+F0FF 来显示使用另一种字体的符号。当显示该范围内的字符时,它会自动为这些字符切换到另一种字体。一些名为 SIL International 的组织发现:
使用符号字体(至少在某些 Microsoft 应用程序中)格式化的文本的奥秘之一是,即使文档以其他方式以 Unicode 编码,字符似乎也以 8 位代码点编码。当 U+F021 从剪贴板插入写字板时,不仅写字板(更准确地说是 Rich Edit 控件)应用了 Wingdings 字体,它似乎还将代码点更改为 0x21。当字符被重新格式化为非符号字体时,它变成了 U+0021。
或者,正如 Microsoft 所解释的,对于Microsoft Platform Software Development Kit-January 2000 Edition:
Richedit 4.1 将 PUA 中 U+F020 和 U+F0FF 之间的字符范围映射到符号字体。因此,当您映射此范围内的任何字符时,Richedit 4.1 会显示符号字符而不是最终用户定义的字符 (EUDC)。
我认为同时微软已经将符号添加到许多微软版本的字体中,以允许更新的微软软件在不切换字体的情况下显示这些字符。例如,U+F020以大多数字体显示项目符号,但在Mac 上不以 Arial显示。安装 Microsoft 版本的 Arial 可能会有所帮助。但是,当您使用阿拉伯语时,这肯定会让您遇到其他问题......
我怀疑任何非 Microsoft 软件都会处理上述例外情况。
不过,总的来说:
确定字体名称的一种方法:当从 Word 打印到 PDF 时,可以选择在 PDF 中包含字体(或:使用的字符子集),以确保它在没有该字体的系统上打印良好字体安装。因此,查看 PDF 的属性可能会显示该字体的名称。也许只需在 OpenOffice.org 中选择字符,就会在字体列表中显示其名称。(但是,鉴于上述符号的自动显示,这两种方法可能根本不适用于子弹。)
确定确切字符代码的一种方法:复制它(对于 Pub Quiz?,从 iTunes 搜索中的自动建议中复制它)并粘贴到某个 Unicode 代码转换器中。这表明 Pub Quiz 字符是U+E047,这可能是一些奇怪的双引号。但是,由于这是来自私人使用区域,我们不知道开发人员在 iPhone 应用程序商店中输入该名称时想到的是哪种字体,我想只有开发人员可以告诉我们他们希望它会是什么看起来像...
(Fileformat.info 有一个简洁的实用程序,可以使用计算机上的所有字体显示字符。)
归档时间: |
|
查看次数: |
15286 次 |
最近记录: |