标签: unicode

Vim:如何处理带有多种(超过两种)语言文本的 Unicode 文件?

我需要在 Vim/ gVim 中设置哪些设置才能查看包含多种语言文本的 Unicode 文本文件?

您可以做出以下假设:

  • 语言数量超过两种。
  • 一些语言是中文、日文和韩文。
  • 如果我可以在 gVim(不一定是 Vim)中查看这些文件就足够了。
  • 在 Windows 上运行的 gVim 7.0。

这是一个文本示例,当以 Unicode 保存时,它在记事本中可以正常打开,但在 gVim 中显示为乱码:

This is English.
?????
????????
?????.
??? ?????.
Run Code Online (Sandbox Code Playgroud)

vim unicode

9
推荐指数
1
解决办法
5807
查看次数

无法从 PDF 文档中复制非拉丁字符

我有一个 pdf 文件,其中包含一些非拉丁欧洲字符。如果我使用突出显示工具复制一些文本,并将其粘贴到另一个程序(单词、记事本)中 - “特殊”字符不能正确传输(我在它们的位置上得到了其他奇怪的字符)。

我曾尝试从 Acrobat Reader 和 Foxit 中复制文本。

有什么我可以在这里复制的吗?

谢谢

pdf unicode character-encoding

9
推荐指数
2
解决办法
2万
查看次数

从 Ubuntu 上的字体 *.ttf 文件获取支持的 Unicode 范围

我的 Ubuntu 机器上有一些“ttf”格式的字体。

我想知道这些字体的一些元数据,关于这些字体文件支持哪些 unicode 范围和哪些非 unicode 代码页。

我该怎么做?

补充1:忘了说,我想获取数百种字体的信息,所以我需要某种可以自动化的终端实用程序

linux fonts unicode ubuntu

9
推荐指数
2
解决办法
4439
查看次数

为什么 VIM 显示 Unicode 代码点而不是 UTF-8 代码值?

考虑一下我在 PHP 博客中找到的这行假定的代码,注意引号:

throw new Exception(“That's not a server name!”);
Run Code Online (Sandbox Code Playgroud)

这些引号是正确的双引号(Unicode 代码点:U+201D;UTF-8 十六进制编码值:)0xE2 0x80 0x9Dga在 VIM 中按在状态栏中显示以下内容:

<”> 8221, Hex 201d, Octal 20035
Run Code Online (Sandbox Code Playgroud)

?

为什么显示的是 Unicode 代码点而不是 UTF-8 代码值?

考虑到文件存储为 UTF-8 并且它是将字节转换为字形的终端,我希望 VIM 显示文件的原始值(UTF-8 代码值),而不是将其转换为 Unicode 代码点.

encoding vim unicode utf-8

9
推荐指数
2
解决办法
1997
查看次数

为什么 ?- 有单独的固定宽度字符?在日语中,与典型的 0-9 相比?

日本人 (???) -??????????

其他地方的典型 ASCII - 0 1 2 3 4 5 6 7 8 9

为什么需要为相同的数字创建单独的字符集?

unicode ascii

9
推荐指数
1
解决办法
1751
查看次数

当记事本声称使用 Lucida Console 但 Lucida Console 没有这些字符时,记事本使用什么字体来显示例如希伯来语?

Courier New 具有字符 \u05D0 希伯来字母 aleph

其他一些字体也可以,例如 Miriam 和 David。

在此处输入图片说明

我可以将其粘贴到记事本中

Lucida Console 没有这个角色。角色地图显示Lucida Console没有角色。

然而,即使设置了 Lucida Console 字体,记事本也会显示它

在此处输入图片说明

那么记事本使用的是什么字体?

windows fonts windows-7 notepad unicode

9
推荐指数
1
解决办法
1847
查看次数

这个 Unicode 块中的其他字母在哪里?

信息

在维基百科页面“Unicode 下标和上标”中,它在“其他上标和下标字符”部分中说,

统一后,Unicode 标准定义了……一个完整的上标拉丁小写字母,除了 q(abcdefghijklmnoprstuv wxyz)[和]……几个下标小写字母(aehijklmnoprstuvx)……

但是,上标和下标块遗漏了以下字母:

  • 标:abcdefghjklmoprstuvwxyz

  • 下标:b, c, d, f, g, i, j, r, u …

encoding unicode code-blocks

9
推荐指数
1
解决办法
1万
查看次数

什么名字,我在哪里可以找到这个奇怪的 RTL 字符?

看,我刚刚发现了一些同时让我印象深刻和困惑的事情。有一个奇怪的字符,它允许您在默认情况下反向输入所有内容。例如,如果我输入:

"Something like this"
Run Code Online (Sandbox Code Playgroud)

然后就会变成:

?"Something like this"
Run Code Online (Sandbox Code Playgroud)

(因为我不必自己颠倒这句话,如果你明白我的意思的话)。

看起来我在欺骗你,但我不是。为确保您明白我想说的内容,我会将特殊字符粘贴到单独的(代码)行中。

?
Run Code Online (Sandbox Code Playgroud)

现在尝试复制它,将其粘贴到文本框中的其他位置并开始输入。你会看到一些非常奇怪的事情发生。

问题是:这个疯狂的隐形角色的名字是什么,它迫使所有东西都用从右到左的语言输入?

我希望你明白我的意思。

unicode right-to-left special-characters

9
推荐指数
1
解决办法
1万
查看次数

我如何在记事本++中找到这个字符(通过unicode搜索)?(\uFEC1 并且只有那个字符)

我如何在记事本++中找到这个字符(通过unicode搜索)?

如果我去charmap

我选择这个角色

我在 unicode 搜索框中输入 FEC1 并按 ENTER 并找到该字符

在此处输入图片说明

我在 fileformat.info 上查找

http://www.fileformat.info/info/unicode/char/fec1/index.htm

UTF-8 (hex)   0xEF 0xBB 0x81 (efbb81)
UTF-16 (hex)  0xFEC1 (fec1)
Run Code Online (Sandbox Code Playgroud)

如果我按字面意思在搜索框中输入字符,那么它会找到它

在此处输入图片说明

但我看不到要搜索什么 unicode 才能找到它

我希望能够在 UTF-8 和 UTF-16 中搜索它

[\uFEC1] 似乎找到了字符,但它找到的不仅仅是那个字符

现在,如果我在那里扔几个 FEC9,那么我看到 [\uFEC1] 似乎也找到了它们

在此处输入图片说明

那么,我如何搜索 \uFEC1 并且仅此而已。我也有兴趣通过它的 UTF-8 代码搜索它

notepad++ unicode character-encoding find-and-replace

8
推荐指数
2
解决办法
5万
查看次数

如何停止 unicode 字形在 MS Word 2016 中显示为“表情符号”

在 Word 2010 中,键入(例如)Alt+1Alt+ 4(使用数字键盘)会为所选字体中的笑脸或菱形符号生成 Unicode 符号 - 例如??[图片]

在 Word 2016 中,这些现在被替换为彩色的“表情符号”式图标: 多彩表情符号

cnread 提供了有用的建议,通过输入它们的 Unicode 点来生成符号(输入 263A 代表“白色微笑的脸”和 2666 代表“黑色钻石套装”)并使用Alt+ 进行转换X,这是一个方便的解决方法,尽管它缺乏简单性之前的方法。

是否有选项可以强制 Word 显示 Unicode 图标而不是花哨的剪贴画?从设置页面和自动更正选项中都没有明显的跳出。

unicode microsoft-word-2016

8
推荐指数
1
解决办法
2404
查看次数