Mar*_*son 27 byte character-encoding
奇数字符代码:
ก็็็็็็็็็็็็็็็็็็็็กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้ก็็็็็็็็็็็็็็็็็็็็กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้ก็็็็็็็็็็็็็็็็็็็็กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้ก็็็็็็็็็็็็็็็็็็็็กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้
问题: 这些字符的编码是什么?
(提示:尝试编辑这个问题,你就会明白为什么他们很奇怪,LIVE)
是啊,没错.你看到我做同样的事情.
显然,这来自mac.所以,由于我对这个主题知之甚少,我启动了记事本++并尝试用十六进制查看它.
结果?亲自尝试:http://notepad-plus-plus.org/
相当明显; 我勒个去?我可以理解它是否是Just a Bunch of Bits一些奇怪的专有二进制编码(包含颜色,字体等等).但为什么他们出现这么奇怪?
另外,为什么记事本++从一开始就不显示原始字符?如果你打开十六进制编辑器,然后关闭它,它就像它扩展.
(另外)(再次),尝试将上述字符复制粘贴到记事本++中两次.看到区别?除了0x3f偶尔之外什么都没有0x20.对于每个角色也是如此.据我所知,既不是空格也不是问号看起来像上面的字符.但是哦,我当然可能是错的..)
这是一个来自outlook的片段:

编辑:使用UTF-8而不是stupid 编辑这些字符ANSI实际上可以让你看到正确的字节.
编辑2:当我写这个问题时,我可能应该更加清楚我想知道的事情(在我的辩护中,BRAINOVERFLOW当我看到它时,我只是想要发出尖叫声[截图]).
编辑3 :(从雅虎答案复制)它似乎是一个使用泰国字符称为"堆叠变音符号"的东西.
从本质上讲,泰语字符"ko kai"可以有几个上标的变音符号,例如ma"maitaikhu".如果你用"maitaikhu"跟随"ko kai",后者就会显示为上标:ก
如果你在这样的组合之后再加上变音符号,它们就会堆叠起来:ก็็็็็
以下是将要执行此操作的字符:http://graphemica.com/search?q =%E0%B8%81 ...
轻松搜索gnome charmap:
U+0E01 THAI CHARACTER KO KAI
General Character Properties
In Unicode since: 1.1
Unicode category: Letter, Other
Various Useful Representations
UTF-8: 0xE0 0xB8 0x81
UTF-16: 0x0E01
C octal escaped UTF-8: \340\270\201
XML decimal entity: ก
Run Code Online (Sandbox Code Playgroud)
其次是(一个或多个变体):
U+0E47 THAI CHARACTER MAITAIKHU
General Character Properties
In Unicode since: 1.1
Unicode category: Mark, Non-Spacing
Various Useful Representations
UTF-8: 0xE0 0xB9 0x87
UTF-16: 0x0E47
C octal escaped UTF-8: \340\271\207
XML decimal entity: ็
Annotations and Cross References
Alias names:
• mai taikhu
Run Code Online (Sandbox Code Playgroud)
第二个是装饰第一个字符的非间距标记