网址中%符号的含义是什么?

emp*_*e-0 3 url

当我复制粘贴这篇维基百科文章时,它看起来像这样.

http://en.wikipedia.org/wiki/Gruy%C3%A8re_%28cheese%29

但是,如果将其粘贴回URL地址,百分号将消失,并且看起来像Unicode字符(可能是特殊的URL字符)代替百分号.

这些是Unicode和特殊URL字符的缩写吗?

我习惯在JavaScript中看到\ u00ff等.

zig*_*igg 6

您正在寻找的参考是RFC 3987:国际化资源标识符,特别是关于将IRI映射到URI的部分.

RFC 3986:统一资源标识符指定保留字符必须是百分比编码,但它规定百分比编码的字符进行解码,以US-ASCII,不包括字符,如è.

RFC 3987指定非ASCII字符应首先编码为UTF-8,因此它们可以根据RFC 3986进行百分比编码.如果您允许我在Python中进行说明:

>>> u'è'.encode('utf-8')
'\xc3\xa8'
Run Code Online (Sandbox Code Playgroud)

在这里,我要求Python è使用UTF-8 将Unicode编码为字符串.返回的字节是0xc30xa8.百分比编码,这看起来像%C3%A8.

您的URL中出现的括号也适用于US-ASCII,因此它们使用US-ASCII代码点进行百分比转义,这些代码点也是有效的UTF-8.

所以,不,没有简单的16×16表 - 这样的表永远不能代表Unicode的丰富性.但有一种明显疯狂的方法.