如何获取 PDF 文件中某些字符的 Unicode 代码和符号名称?

Ale*_*kin 5 pdf unicode

我有一个包含一些 Unicode 字符的 PDF 文件(见图)。

在此处输入图片说明

我可以将这些字符复制到剪贴板并插入到例如 MS Word 中,我将字符视为一个带有问号的正方形,这可能是因为我的系统中缺少相应的字体。

我想要的是获取 UTF 中的字符代码及其名称。我怎样才能得到它们?这是我感兴趣的字符——也许人们可以直接识别它们?无论如何,PDF 和 Unicode 的通用解决方案会很棒。

Juk*_*ela 4

在 MS Word 中,将光标放在字符后面并输入 Alt X(即,在按下 Alt 键的同时按 X 键)。在任何相当现代的 Word 版本中,这会将字符转换为其 Unicode 代码编号。要获取名称,您可以访问http://www.unicode.org或使用 Windows 中的字符映射程序。或者您可以安装BabelPad,这是一个很棒的 Unicode 编辑器,当您将光标移动到每个字符之前时,它会显示每个字符的 Unicode 编号和 Unicode 名称。

\n\n

或者,为了获得更多乐趣,您可以使用http://shapecatcher.com/并绘制角色。对于简单的图案,这是相当有效的。它立即识别出您的第一个字符是 \xe2\x80\x9c 右上象限 \xe2\x80\x9d U+25F3 的白色正方形,来自我相当笨拙的绘图。

\n