Dod*_*ion 56 clipboard notepad++ unicode
是否有一种快速简便的方法可以找到任何字符的 Unicode 代码点?例如,我在网页、PDF 文件或其他一些文档上看到一个有趣的角色。
我目前所做的是将角色复制到剪贴板,将其保存到文件中,然后使用十六进制查看器查看该文件。或者,我可以打开 Microsoft Word,粘贴并执行 Alt+X。这两种方法都有些麻烦。有更容易的方法吗?
我使用 Notepad++,所以如果有任何方法可以用 Notepad++ 做到这一点,这将是一个合适的答案(它比必须打开 Word 更简单)。或者也许有一种方法可以用一个小的专门应用程序来做到这一点?
Leo*_*iro 36
Notepad++ 有一个名为 Converter的预安装插件,它具有将 ASCII 转换为 HEX 和反之亦然的选项。该工具对于转换要转换为 ASCII 以读取的 HEX 格式的数据文件非常有用:
这就是它的工作原理:
And*_*and 32
我经常使用 Unicode 字符,因此我专门为此编写了一个小型 Windows 应用程序:

此外,我的文本编辑器Rejbrand Text Editor具有广泛的 Unicode 字符支持。
Eri*_*and 17
当我遇到这个问题时,快速的谷歌搜索通常会提供一个快速的答案。例如,当我谷歌“unicode”时,我得到这样的结果:

我喜欢这种方法,因为:
Bap*_*ier 12
有一个名为Unicode Character Inspector(由 Tim Whitlock 构建)的不错的小网站可以做到这一点。我发现它比文本编辑器或桌面程序更方便。
在类 Unix 系统上*:
unicode -s "$(xsel -ob)"
Run Code Online (Sandbox Code Playgroud)
您可以为它设置别名或创建一个脚本来运行它。
输出如下所示:
U+2672 UNIVERSAL RECYCLING SYMBOL
UTF-8: e2 99 b2 UTF-16BE: 2672 Decimal: ♲ Octal: \023162
? (?)
Uppercase: 2672
Category: So (Symbol, Other)
Bidi: ON (Other Neutrals)
Run Code Online (Sandbox Code Playgroud)
* 看起来原始海报可能使用的是 Windows,但是 (a) 未指定,并且 (b) 此解决方案可能对其他人有所帮助。
小智 6
我发现 Rishard Ishida 的Unicode 代码转换器(github 链接)对于查找 unicode 字符代码等非常有用。它还提供对其他代码点、编码和转义序列等的翻译/转换。
\n\n\n\n您可能还想查看 Richard Ishida 的主网页 (rishida.net),因为它包含(链接到)许多有价值的工具和信息,特别是如果您对国际化和字符编码感兴趣的话。例如,链接的另一个非常有用的工具是他的Uniview 工具(github 链接)。
\n\n\n\n最后,我发现 macOS 的字符查看器(虽然主要与 Mac 用户相关)也非常有用,可以通过输入菜单访问,可以在系统偏好设置\xe2\x86\x92键盘中启用它
\n\n尽管Apple 支持网站主要关注如何插入表情符号 (\xe2\x80\xa6),但字符查看器实际上对于查找特定(\'特殊\')字符及其在几种不同编码中的代码点非常有用,以及查找系统上的哪些字体包含特定字形。
\n\n\n\n干杯!
\n您可以使用 PowerShell!
[char]::ConvertToUtf32((gcb), 0)
Run Code Online (Sandbox Code Playgroud)
这将打印剪贴板上文本的第一个 Unicode 代码点。
如果您不必担心基本多语言平面之外的字符(在 .NET 字符串中表示为高低代理),您可以使用它:
[int](gcb)[0]
Run Code Online (Sandbox Code Playgroud)
如果您更喜欢十六进制,则可以使用格式说明符:
'0x{0:x}' -f [char]::ConvertToUtf32((gcb), 0)
Run Code Online (Sandbox Code Playgroud)
小智 5
任何 Emacs 用户的注意事项:您可以键入C-u C-x =,它会为您提供有关光标下字符的一堆信息,包括 Unicode 代码点、Unicode 数据库中的名称和类别等。
position: 146 of 147 (99%), column: 0
character: ? (displayed as ?) (codepoint 9842, #o23162, #x2672)
preferred charset: unicode (Unicode (ISO10646))
code point in charset: 0x2672
script: symbol
syntax: w which means: word
category: .:Base
to input: type "C-x 8 RET 2672" or "C-x 8 RET UNIVERSAL RECYCLING SYMBOL"
buffer code: #xE2 #x99 #xB2
file code: #xE2 #x99 #xB2 (encoded by coding system utf-8-unix)
display: by this font (glyph code)
xft:-PfEd-Mensch-normal-normal-normal-*-16-*-*-*-m-0-iso10646-1 (#x985)
Character code properties: customize what to show
name: UNIVERSAL RECYCLING SYMBOL
general-category: So (Symbol, Other)
decomposition: (9842) ('?')
Run Code Online (Sandbox Code Playgroud)