相关疑难解决方法(0)

我知道非标准的%uxxxx方案,但这似乎不是明智的选择,因为该方案已被W3C拒绝.

一些有趣的例子:

心中的人物.如果我在浏览器中输入:

http://www.google.com/search?q=?

然后复制并粘贴它,我看到这个URL

http://www.google.com/search?q=%E2%99%A5

这使得它看起来像Firefox(或Safari)正在这样做.

urllib.quote_plus(x.encode("latin-1"))
'%E2%99%A5'

这是有道理的,除了不能用Latin-1编码的东西,比如三点字符.

…

如果我输入URL

http://www.google.com/search?q=…

进入我的浏览器然后复制粘贴,我明白了

http://www.google.com/search?q=%E2%80%A6

背部.这似乎是做的结果

urllib.quote_plus(x.encode("utf-8"))

这是有道理的,因为...不能用Latin-1编码.

但后来我不清楚浏览器是如何用UTF-8或Latin-1解码的.

因为这似乎含糊不清:

In [67]: u"…".encode('utf-8').decode('latin-1')
Out[67]: u'\xc3\xa2\xc2\x80\xc2\xa6'

有效,所以我不知道浏览器是如何用UTF-8或Latin-1解码的.

使用我需要处理的特殊字符做什么是正确的？

106
推荐指数

4
解决办法

10万
查看次数