相关疑难解决方法(0)

python urllib2会自动解压缩从网页获取的gzip数据吗?

我正在使用

 data=urllib2.urlopen(url).read()
Run Code Online (Sandbox Code Playgroud)

我想知道:

  1. 如何判断URL中的数据是否被gzip压缩?

  2. 如果数据被压缩,urllib2会自动解压缩数据吗?数据总是一个字符串吗?

python gzip urllib2

69
推荐指数
3
解决办法
3万
查看次数

urllib2读取为Unicode

我需要存储可以使用任何语言的网站内容.我需要能够在内容中搜索Unicode字符串.

我尝试过类似的东西:

import urllib2

req = urllib2.urlopen('http://lenta.ru')
content = req.read()
Run Code Online (Sandbox Code Playgroud)

内容是一个字节流,所以我可以在其中搜索Unicode字符串.

我需要一些方法,当我这样做urlopen,然后阅读使用标题中的charset解码内容并将其编码为UTF-8.

python unicode urllib2

46
推荐指数
2
解决办法
6万
查看次数

标签 统计

python ×2

urllib2 ×2

gzip ×1

unicode ×1