我需要在 Vim/ gVim 中设置哪些设置才能查看包含多种语言文本的 Unicode 文本文件?
您可以做出以下假设:
这是一个文本示例,当以 Unicode 保存时,它在记事本中可以正常打开,但在 gVim 中显示为乱码:
This is English.
?????
????????
?????.
??? ?????.
Run Code Online (Sandbox Code Playgroud) 我有一个 pdf 文件,其中包含一些非拉丁欧洲字符。如果我使用突出显示工具复制一些文本,并将其粘贴到另一个程序(单词、记事本)中 - “特殊”字符不能正确传输(我在它们的位置上得到了其他奇怪的字符)。
我曾尝试从 Acrobat Reader 和 Foxit 中复制文本。
有什么我可以在这里复制的吗?
谢谢
我的 Ubuntu 机器上有一些“ttf”格式的字体。
我想知道这些字体的一些元数据,关于这些字体文件支持哪些 unicode 范围和哪些非 unicode 代码页。
我该怎么做?
补充1:忘了说,我想获取数百种字体的信息,所以我需要某种可以自动化的终端实用程序
考虑一下我在 PHP 博客中找到的这行假定的代码,注意引号:
throw new Exception(“That's not a server name!”);
Run Code Online (Sandbox Code Playgroud)
这些引号是正确的双引号(Unicode 代码点:U+201D;UTF-8 十六进制编码值:)0xE2 0x80 0x9D。ga在 VIM 中按在状态栏中显示以下内容:
<”> 8221, Hex 201d, Octal 20035
Run Code Online (Sandbox Code Playgroud)
?
为什么显示的是 Unicode 代码点而不是 UTF-8 代码值?
考虑到文件存储为 UTF-8 并且它是将字节转换为字形的终端,我希望 VIM 显示文件的原始值(UTF-8 代码值),而不是将其转换为 Unicode 代码点.
日本人 (???) -??????????
其他地方的典型 ASCII - 0 1 2 3 4 5 6 7 8 9
为什么需要为相同的数字创建单独的字符集?
Courier New 具有字符 \u05D0 希伯来字母 aleph
其他一些字体也可以,例如 Miriam 和 David。
我可以将其粘贴到记事本中
Lucida Console 没有这个角色。角色地图显示Lucida Console没有角色。
然而,即使设置了 Lucida Console 字体,记事本也会显示它
那么记事本使用的是什么字体?
看,我刚刚发现了一些同时让我印象深刻和困惑的事情。有一个奇怪的字符,它允许您在默认情况下反向输入所有内容。例如,如果我输入:
"Something like this"
Run Code Online (Sandbox Code Playgroud)
然后就会变成:
?"Something like this"
Run Code Online (Sandbox Code Playgroud)
(因为我不必自己颠倒这句话,如果你明白我的意思的话)。
看起来我在欺骗你,但我不是。为确保您明白我想说的内容,我会将特殊字符粘贴到单独的(代码)行中。
?
Run Code Online (Sandbox Code Playgroud)
现在尝试复制它,将其粘贴到文本框中的其他位置并开始输入。你会看到一些非常奇怪的事情发生。
问题是:这个疯狂的隐形角色的名字是什么,它迫使所有东西都用从右到左的语言输入?
我希望你明白我的意思。
我如何在记事本++中找到这个字符(通过unicode搜索)?
如果我去charmap
我选择这个角色
我在 unicode 搜索框中输入 FEC1 并按 ENTER 并找到该字符
我在 fileformat.info 上查找
http://www.fileformat.info/info/unicode/char/fec1/index.htm
Run Code Online (Sandbox Code Playgroud)UTF-8 (hex) 0xEF 0xBB 0x81 (efbb81) UTF-16 (hex) 0xFEC1 (fec1)
如果我按字面意思在搜索框中输入字符,那么它会找到它
但我看不到要搜索什么 unicode 才能找到它
我希望能够在 UTF-8 和 UTF-16 中搜索它
[\uFEC1] 似乎找到了字符,但它找到的不仅仅是那个字符
现在,如果我在那里扔几个 FEC9,那么我看到 [\uFEC1] 似乎也找到了它们
那么,我如何搜索 \uFEC1 并且仅此而已。我也有兴趣通过它的 UTF-8 代码搜索它
在 Word 2010 中,键入(例如)Alt+1或Alt+ 4(使用数字键盘)会为所选字体中的笑脸或菱形符号生成 Unicode 符号 - 例如??![[图片]](https://i.stack.imgur.com/NVfpf.png)
在 Word 2016 中,这些现在被替换为彩色的“表情符号”式图标: 
cnread 提供了有用的建议,通过输入它们的 Unicode 点来生成符号(输入 263A 代表“白色微笑的脸”和 2666 代表“黑色钻石套装”)并使用Alt+ 进行转换X,这是一个方便的解决方法,尽管它缺乏简单性之前的方法。
是否有选项可以强制 Word 显示 Unicode 图标而不是花哨的剪贴画?从设置页面和自动更正选项中都没有明显的跳出。