Pet*_*r.O 6 editors character-encoding text-processing unicode
在回答Unix-&-Linux 问题时,我观察到 Gedit 和另外两个编辑器 Leafpad 和 Medit(我总共测试了 12 个编辑器)表现出某个错误。事实证明,该错误在 Canonical 的启动板中是已知的,因为错误 #332321搜索(和替换)将 ss 作为 ß。
该错误的行为find ß
将同时匹配ß
和ss
...(不好,特别是如果您执行全部替换)。
然后我注意到StackExchange软件,以创造问题的href链接,已经从转换的问题的标题How to bind “ß” to Meta-s?
来 how-to-bind-ss-to-meta-s
。
所以两个完全不相关的环境ß
以类似的方式对待..ß
和之间的这种奇怪的吸引力是ss
什么?......还有其他这样的“关系”吗?
ß
实际上是ss
(德语)的连字。任何使用 aa 表将 Unicode 或其他扩展字母字符转换为 URL 等内容的“安全”字符的人都可能将其转换为ss
.
对 URL 执行此操作是很正常的。例如,我说土耳其语,在那里我们找不到英语中的字母,例如ö ü ? â ? ç ? ?
. 这些字符在 URL、特殊表单字段等中使用并不总是安全的。我们用类似的字符代替它们,例如o u i a g c s I
. 通常这是通过视觉相似性而不是声音来完成的,但是ß
听觉相似性的情况ss
使其成为一种常见的转换。
这构成了数据的净损失,但作为 URL 或其他特殊字段的安全表示,它可以工作,然后在站点本身上您可以使用真实字符。
为什么gedit
要进行这种转换超出了我的理解。这是一个错误。
归档时间: |
|
查看次数: |
176 次 |
最近记录: |