如何获取 PDF 文件中某些字符的 Unicode 代码和符号名称？

Question

如何获取 PDF 文件中某些字符的 Unicode 代码和符号名称？

Ale*_*kin 5 pdf unicode

我有一个包含一些 Unicode 字符的 PDF 文件（见图）。

在此处输入图片说明

我可以将这些字符复制到剪贴板并插入到例如 MS Word 中，我将字符视为一个带有问号的正方形，这可能是因为我的系统中缺少相应的字体。

我想要的是获取 UTF 中的字符代码及其名称。我怎样才能得到它们？这是我感兴趣的字符——也许人们可以直接识别它们？无论如何，PDF 和 Unicode 的通用解决方案会很棒。

Answer 1

Juk*_*ela 4

在 MS Word 中，将光标放在字符后面并输入 Alt X（即，在按下 Alt 键的同时按 X 键）。在任何相当现代的 Word 版本中，这会将字符转换为其 Unicode 代码编号。要获取名称，您可以访问http://www.unicode.org或使用 Windows 中的字符映射程序。或者您可以安装BabelPad，这是一个很棒的 Unicode 编辑器，当您将光标移动到每个字符之前时，它会显示每个字符的 Unicode 编号和 Unicode 名称。

\n\n

或者，为了获得更多乐趣，您可以使用http://shapecatcher.com/并绘制角色。对于简单的图案，这是相当有效的。它立即识别出您的第一个字符是 \xe2\x80\x9c 右上象限 \xe2\x80\x9d U+25F3 的白色正方形，来自我相当笨拙的绘图。

\n

归档时间：	13 年，9 月前
查看次数：	1000 次
最近记录：	8 年，7 月前