在Unicode中查找类似的ASCII字符

DrD*_*Dol 8 unicode ascii replace fuzzy similarity

有人知道在Unicode中查找与ASCII字符类似的字符的简单方法.一个例子是" CYRILLIC SMALL LETTER DZE())".我想搜索并替换类似的角色.类似的我的意思是人类可读.通过观察你看不出差异.

chr*_*yss 12

正如其他评论者所指出的,Unicode规范化("兼容性字符")在这里不会对您有所帮助,因为您不是在寻找官方对等,而是在寻找字形(字母形状)的相似之处.(链接的Unicode技术报告仍然值得一读,因为它编写得非常好.)

如果我是你,为了免除你自己组装一个字符列表的繁琐工作,我会搜索有关同形异义词攻击的资源:这是一种通过显示包含域名的URL恶意误导网络用户的方法用视觉上相似的字母代替.关于安全性的另一个Unicode技术报告包含有关该问题的部分.还有 - 这可能是你最需要的 - 一个"混乱的"表.这是另一篇主要是标点符号的文章,其中一些是ASCII,在非ASCII代码表中具有视觉上相似的对应物.

我所希望的是你不是在问这个问题来构建这样的攻击.