gedit 错误和 Unix-&-Linux Q/A href 之间有什么联系?

Pet*_*r.O 6 editors character-encoding text-processing unicode

在回答Unix-&-Linux 问题时,我观察到 Gedit 和另外两个编辑器 Leafpad 和 Medit(我总共测试了 12 个编辑器)表现出某个错误。事实证明,该错误在 Canonical 的启动板中是已知的,因为错误 #332321搜索(和替换)将 ss 作为 ß

该错误的行为find ß将同时匹配ßss...(不好,特别是如果您执行全部替换)。

然后我注意到StackExchange软件,以创造问题的href链接,已经从转换的问题的标题How to bind “ß” to Meta-s?how-to-bind-ss-to-meta-s

所以两个完全不相关的环境ß以类似的方式对待..ß和之间的这种奇怪的吸引力是ss什么?......还有其他这样的“关系”吗?

Cal*_*leb 5

ß实际上是ss(德语)的连字。任何使用 aa 表将 Unicode 或其他扩展字母字符转换为 URL 等内容的“安全”字符的人都可能将其转换为ss.

对 URL 执行此操作是很正常的。例如,我说土耳其语,在那里我们找不到英语中的字母,例如ö ü ? â ? ç ? ?. 这些字符在 URL、特殊表单字段等中使用并不总是安全的。我们用类似的字符代替它们,例如o u i a g c s I. 通常这是通过视觉相似性而不是声音来完成的,但是ß听觉相似性的情况ss使其成为一种常见的转换。

这构成了数据的净损失,但作为 URL 或其他特殊字段的安全表示,它可以工作,然后在站点本身上您可以使用真实字符。

为什么gedit要进行这种转换超出了我的理解。这是一个错误。