标签: unicode

Vim：如何处理带有多种（超过两种）语言文本的 Unicode 文件？

我需要在 Vim/ gVim 中设置哪些设置才能查看包含多种语言文本的 Unicode 文本文件？

您可以做出以下假设：

语言数量超过两种。
一些语言是中文、日文和韩文。
如果我可以在 gVim（不一定是 Vim）中查看这些文件就足够了。
在 Windows 上运行的 gVim 7.0。

这是一个文本示例，当以 Unicode 保存时，它在记事本中可以正常打开，但在 gVim 中显示为乱码：

This is English.
?????
????????
?????.
??? ?????.

Run Code Online (Sandbox Code Playgroud)

vim unicode

Ash*_*ppa

2012 05-22

9
推荐指数

1
解决办法

5807
查看次数

无法从 PDF 文档中复制非拉丁字符

我有一个 pdf 文件，其中包含一些非拉丁欧洲字符。如果我使用突出显示工具复制一些文本，并将其粘贴到另一个程序（单词、记事本）中 - “特殊”字符不能正确传输（我在它们的位置上得到了其他奇怪的字符）。

我曾尝试从 Acrobat Reader 和 Foxit 中复制文本。

有什么我可以在这里复制的吗？

谢谢

pdf unicode character-encoding

UpT*_*eek

2010 01-07

9
推荐指数

2
解决办法

2万
查看次数

从 Ubuntu 上的字体 *.ttf 文件获取支持的 Unicode 范围

我的 Ubuntu 机器上有一些“ttf”格式的字体。

我想知道这些字体的一些元数据，关于这些字体文件支持哪些 unicode 范围和哪些非 unicode 代码页。

我该怎么做？

补充1：忘了说，我想获取数百种字体的信息，所以我需要某种可以自动化的终端实用程序

linux fonts unicode ubuntu

Sho*_*eNN

2012 04-07

9
推荐指数

2
解决办法

4439
查看次数

为什么 VIM 显示 Unicode 代码点而不是 UTF-8 代码值？

考虑一下我在 PHP 博客中找到的这行假定的代码，注意引号：

throw new Exception(“That's not a server name!”);

Run Code Online (Sandbox Code Playgroud)

这些引号是正确的双引号（Unicode 代码点：U+201D；UTF-8 十六进制编码值：）0xE2 0x80 0x9D。ga在 VIM 中按在状态栏中显示以下内容：

<”> 8221, Hex 201d, Octal 20035

Run Code Online (Sandbox Code Playgroud)

为什么显示的是 Unicode 代码点而不是 UTF-8 代码值？

考虑到文件存储为 UTF-8 并且它是将字节转换为字形的终端，我希望 VIM 显示文件的原始值（UTF-8 代码值），而不是将其转换为 Unicode 代码点.

encoding vim unicode utf-8

dot*_*hen

lucky-day

9
推荐指数

2
解决办法

1997
查看次数

为什么 ?- 有单独的固定宽度字符？在日语中，与典型的 0-9 相比？

日本人（？？？） -??????????

其他地方的典型 ASCII - 0 1 2 3 4 5 6 7 8 9

为什么需要为相同的数字创建单独的字符集？

unicode ascii

Zae*_*lle

2015 04-28

9
推荐指数

1
解决办法

1751
查看次数

当记事本声称使用 Lucida Console 但 Lucida Console 没有这些字符时，记事本使用什么字体来显示例如希伯来语？

Courier New 具有字符 \u05D0 希伯来字母 aleph

其他一些字体也可以，例如 Miriam 和 David。

我可以将其粘贴到记事本中

Lucida Console 没有这个角色。角色地图显示Lucida Console没有角色。

然而，即使设置了 Lucida Console 字体，记事本也会显示它

那么记事本使用的是什么字体？

windows fonts windows-7 notepad unicode

bar*_*lop

2015 08-04

9
推荐指数

1
解决办法

1847
查看次数

这个 Unicode 块中的其他字母在哪里？

信息

在维基百科页面“Unicode 下标和上标”中，它在“其他上标和下标字符”部分中说，

统一后，Unicode 标准定义了……一个完整的上标拉丁小写字母，除了 q（^{abcdefghijklmnoprstuv wxyz}）[和]……几个下标小写字母（_{aehijklmnoprstuvx}）……

但是，上标和下标块遗漏了以下字母：

标：a，b，c，d，e，f，g，h，j，k，l，m，o，p，r，s，t，u，v，w，x，y，z
下标：b, c, d, f, g, i, j, r, u …

encoding unicode code-blocks

Sar*_*aia

lucky-day

9
推荐指数

1
解决办法

1万
查看次数

什么名字，我在哪里可以找到这个奇怪的 RTL 字符？

看，我刚刚发现了一些同时让我印象深刻和困惑的事情。有一个奇怪的字符，它允许您在默认情况下反向输入所有内容。例如，如果我输入：

"Something like this"

Run Code Online (Sandbox Code Playgroud)

然后就会变成：

?"Something like this"

Run Code Online (Sandbox Code Playgroud)

（因为我不必自己颠倒这句话，如果你明白我的意思的话）。

看起来我在欺骗你，但我不是。为确保您明白我想说的内容，我会将特殊字符粘贴到单独的（代码）行中。

Run Code Online (Sandbox Code Playgroud)

现在尝试复制它，将其粘贴到文本框中的其他位置并开始输入。你会看到一些非常奇怪的事情发生。

问题是：这个疯狂的隐形角色的名字是什么，它迫使所有东西都用从右到左的语言输入？

我希望你明白我的意思。

unicode right-to-left special-characters

K0m*_*dia

2018 12-20

9
推荐指数

1
解决办法

1万
查看次数

我如何在记事本++中找到这个字符（通过unicode搜索）？（\uFEC1 并且只有那个字符）

我如何在记事本++中找到这个字符（通过unicode搜索）？

如果我去charmap

我选择这个角色

我在 unicode 搜索框中输入 FEC1 并按 ENTER 并找到该字符

我在 fileformat.info 上查找

http://www.fileformat.info/info/unicode/char/fec1/index.htm

UTF-8 (hex)   0xEF 0xBB 0x81 (efbb81)
UTF-16 (hex)  0xFEC1 (fec1)
Run Code Online (Sandbox Code Playgroud)

如果我按字面意思在搜索框中输入字符，那么它会找到它

但我看不到要搜索什么 unicode 才能找到它

我希望能够在 UTF-8 和 UTF-16 中搜索它

[\uFEC1] 似乎找到了字符，但它找到的不仅仅是那个字符

现在，如果我在那里扔几个 FEC9，那么我看到 [\uFEC1] 似乎也找到了它们

那么，我如何搜索 \uFEC1 并且仅此而已。我也有兴趣通过它的 UTF-8 代码搜索它

notepad++ unicode character-encoding find-and-replace

bar*_*lop

2015 10-12

8
推荐指数

2
解决办法

5万
查看次数

如何停止 unicode 字形在 MS Word 2016 中显示为“表情符号”

在 Word 2010 中，键入（例如）Alt+1或Alt+ 4（使用数字键盘）会为所选字体中的笑脸或菱形符号生成 Unicode 符号 - 例如？? [图片]

在 Word 2016 中，这些现在被替换为彩色的“表情符号”式图标：多彩表情符号

cnread 提供了有用的建议，通过输入它们的 Unicode 点来生成符号（输入 263A 代表“白色微笑的脸”和 2666 代表“黑色钻石套装”）并使用Alt+ 进行转换X，这是一个方便的解决方法，尽管它缺乏简单性之前的方法。

是否有选项可以强制 Word 显示 Unicode 图标而不是花哨的剪贴画？从设置页面和自动更正选项中都没有明显的跳出。

unicode microsoft-word-2016

ms6*_*609

2017 05-13

8
推荐指数

1
解决办法

2404
查看次数

标签统计

unicode ×10

character-encoding ×2

encoding ×2

fonts ×2

vim ×2

ascii ×1

code-blocks ×1

find-and-replace ×1

linux ×1

microsoft-word-2016 ×1

notepad ×1

notepad++ ×1

pdf ×1

right-to-left ×1

special-characters ×1

ubuntu ×1

utf-8 ×1

windows ×1

windows-7 ×1

信息

标签 统计

标签统计