你有没有在网页上注意到这个角色,ฏ๎ํ?由0x0EOF,0x0E4E和0x0E4D产生.
我可以在这里找到一些信息:http://shapecatcher.com/unicode/info/3599.
但是,它实际上应该是三个字符放在一起,为什么在网页中,它似乎永远不会结束?
(KUbuntu 12.04 Chrome版本23)
它是一个非常强调的字符,你也可以用拉丁字符来做这件事,例如,它是一个带有许多回旋的字母.
这是如何在十六进制编辑器中显示:
所以你可以看到很多CC 82
,它们正在结合CIRCUMFLEX ACCENT,我们分析一下:
EF BB BF
:字节订单标记(BOM)C3 A2
:带有CIRCUMFLEX的拉丁文小写字母A:âCC 82
:组合CIRCUMFLEX ACCENT:^(与预览字母混合)现在让我们尝试一下自己,我做了:EF BB BF C3 AB CC 88 CC 88 CC 88
......这就是结果:ë̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈
EF BB BF
:字节订单标记(BOM)C3 AB
:LATIN SMALL LETTER E with DIAERESIS:ëCC 88
:结合DIAERESIS:¨实际上,二进制句子告诉系统做"无限的字符",它们实际上并不是无限的,它们有一个限制,但是当人们这样做时,他们为了好玩而做了很多口音,让人们相信它是无限的,例如,这个只有2个波浪号:ã,这个其他有3:ã,接下来有很多:ã,这与锐结合:ã