在我的网站中呈现URL时,如何避免双URL编码?

Cor*_*all 10 html urlencode html-rendering

用户在文本输入中向我的网站提供正确转义的URL和原始URL; 例如,我认为这两个URL是等价的:

https://www.cool.com/cool%20beans
https://www.cool.com/cool beans
Run Code Online (Sandbox Code Playgroud)

现在,我希望<a>稍后在查看此数据时将这些标记呈现为标记.我被困在编码给定文本和获取这些链接之间:

<a href="https://www.cool.com/cool%2520beans">   <!-- This one is broken! -->
<a href="https://www.cool.com/cool%20beans">
Run Code Online (Sandbox Code Playgroud)

或者不编码并得到这个:

<a href="https://www.cool.com/cool%20beans">
<a href="https://www.cool.com/cool beans">       <!-- This one is broken! -->
Run Code Online (Sandbox Code Playgroud)

从现代浏览器的用户体验角度出发,最好的方法是什么?我在对输入进行解码传递或上面列出的第二个选项(我们不对href属性进行编码)之间徘徊.

Chr*_*own 15

如果你想避免双重编码你可以urldecode()在两个链接上使用的链接,然后urlencode(),因为解码诸如" https://www.cool.com/cool beans"之类的URL 将返回相同的值,而解码" https://www.cool.com/cool%20beans "将返回空间.这使得两个链接都可以正确编码.

或者,可以使用strpos()函数扫描编码字符,例如

if ($pos = strpos($url, "%20") {
    //Encoded character found
}
Run Code Online (Sandbox Code Playgroud)

理想情况下,将扫描一系列常见编码字符,代替"%20"