标签: unicode

Unicode 符号的好字体

我正在寻找一种用于显示 Unicode 的好字体，特别是我想要一套完整的 U2400-U2800。在 Firefox 中我得到了大部分，但在我的应用程序中，我尝试了 Arial Unicode MS、Lucida Unicode MS、Calibri、Times New Roman、Courier New、Symbol 和 Serif，大部分来自我通过谷歌搜索找到的页面的推荐，一些来自Firefox 默认，但我一直缺少 U2680-U26A0 和其他几个较小的块。

unicode.org上的参考图表当然显示了完整的范围，但它们没有标识使用的字体（大概是为了避免盗版的威胁，尽管这对我来说似乎是自取其辱）。通过 fontforge 或各种网络服务提取字体（仅获取名称）失败，因为字体似乎包含在不受支持的加密部分中（另一种反盗版措施...*叹息*）。

因此，如果有人可以推荐更完整的 Unicode 字体（最好是免费或价格合理的），我将非常感激。

干杯，

埃蒂亚尔。

fonts unicode

Eht*_*yar

lucky-day

6
推荐指数

1
解决办法

2842
查看次数

在 Windows 上查找所有 UTF-16 编码的文件

是否有适用于 Windows 的工具（命令行、gui、脚本等）可以递归目录并识别所有编码为 UTF-16 的文件？

windows encoding unicode

Mar*_*man

lucky-day

6
推荐指数

1
解决办法

2369
查看次数

将大文本文件从 UTF-8 转换为“Windows Unicode”（UTF-16）的 Windows 工具

我需要在 Windows 7 上查看大型 Unicode 文本文件（当前版本为 2,379,415,348 字节）。

通常我更喜欢 UTF-8，但是在查看 SuperUser 之后，似乎最好的 Windows 大文件查看器无法处理 UTF-8，所以我不介意将这些文件一次性转换为 UTF-16-LE，直到更好的观众出现了。

所以同时我需要一个可以转换编码的工具。请注意，我不能为此使用编辑器，否则我只会在该编辑器中查看文件。命令行或 GUI 工具都可以。

^{（我有一台最大内存为 2G 的上网本，有时我可以在 gVim 中很好地查看这些文件，但我经常打开很多浏览器窗口并且多次耗尽内存。LTFViewer 可以直接从磁盘查看文本文件而无需加载整个事情进入RAM）}

windows-7 unicode

hip*_*ail

2017 03-20

6
推荐指数

1
解决办法

2万
查看次数

ALT 代码使用哪种字符编码？

在 Windows 中，使用 ALT+nnn 输入字符时，使用的是哪种字符编码？使用 ALT+0nnn 输入字符时，使用的是哪种字符编码？这些答案如何取决于 Windows 的语言和输入法设置（如果有的话）？代码是否总是在 255 之后重复？

我发现多个网站的信息令人困惑、过时、可能是特定于语言的或错误的。尽管这是众所周知且广泛使用的 Windows 功能，但我似乎找不到任何合理的官方文档。

windows keyboard unicode alt-code

Ang*_*gus

2017 10-19

6
推荐指数

1
解决办法

2314
查看次数

Unicode 字符在 KDE 和 Arch Linux 控制台上显示不正确

我最近从 OpenSuSE 切换到 Arch Linux。名称中带有 unicode 字符的文件过去可以正常显示，但切换后我只得到 mojibake。例如，在我的音乐库中，Queensrÿche 显示为 QueensrÃ¿che。

这也发生在控制台上。

我在 Arch Linux 论坛上找了一个相关的帖子，但没有得到答案。

linux unicode kde-4

Nat*_*han

lucky-day

6
推荐指数

1
解决办法

1万
查看次数

查看未安装字体的字体字符

这个问题假设一个 Windows 系统。

对于已安装的字体，可以使用 Windows 的字符映射来查看这些字体的可用字符（及其 Unicode 代码）。更好的是 Microsoft Office Word 中的“符号”视图。

我可以使用什么来查看系统上尚未安装的字体中的可用字符？我发现的唯一一个可以让我对卸载的字体做任何事情的程序是Opicon，但它只显示“示例文本”，而不是可用的字符。

windows fonts unicode characters

Sve*_*rre

2013 04-30

6
推荐指数

1
解决办法

1350
查看次数

如何让“ls”首先显示点文件并保留 unicode 文件名？

$ export LC_ALL=en_US.UTF-8
$ ls -al
total 24
drwxr-xr-x 6 pi pi 4096 Jul 23 16:34 .
drwxr-xr-x 9 pi pi 4096 Jul 23 16:33 ..
drwxr-xr-x 2 pi pi 4096 Jul 23 16:33 .A
drwxr-xr-x 2 pi pi 4096 Jul 23 16:33 B
drwxr-xr-x 2 pi pi 4096 Jul 23 16:33 .C
drwxr-xr-x 2 pi pi 4096 Jul 23 16:34 ???

Run Code Online (Sandbox Code Playgroud)

当我更改LC_ALL为时C，首先列出点文件，unicode 文件名不可读：

$ export LC_ALL=C
$ ls -al
total 24
drwxr-xr-x 6 pi …

Run Code Online (Sandbox Code Playgroud)

linux unicode ls

ohh*_*hho

2013 07-24

6
推荐指数

2
解决办法

3209
查看次数

是否有支持标点符号的 Unicode 感知 LC_COLLATE 排序顺序？

据我所知，设置环境变量LC_COLLATE=en_US.utf8与相比改变了四件事LC_COLLATE=c，关于程序如何ls对文件进行排序：

Unicode 字符被保留（而不是被??垃圾替换）
重音和变音符号不影响排序顺序
大小写差异不影响排序顺序
标点符号（如点）不影响排序顺序

功能 1 是当今时代必不可少的。
特性 2 和特性 3 也很棒，因为它们可以更方便地处理现实生活中的 Unicode 文件名。
另一方面，特性 4 是我在日常工作中发现的真正反生产力的东西，因为它经常为 Linux 文件名产生违反直觉的排序顺序 - 其中点往往用于分隔后缀或表示点文件。我真的无法想象为什么有人认为在排序文件名时忽略点是个好主意。

例如：

$ touch foo.txt foo2.txt foó3.txt foo4.txt

$ LC_COLLATE=en_US.utf8 ls
foo2.txt  foó3.txt  foo4.txt  foo.txt

$ LC_COLLATE=c ls
foo.txt  foo2.txt  foo4.txt  fo??3.txt

Run Code Online (Sandbox Code Playgroud)

两者都不令人满意。这就是我希望对这些文件进行排序的方式：