如果请求的数据有时是gzip,有时候不会使用pycurl?

bil*_*llc 2 python gzip http libcurl pycurl

我这样做是为了获取一些数据:

c = pycurl.Curl()
c.setopt(pycurl.ENCODING, 'gzip') 
c.setopt(pycurl.URL, url)
c.setopt(pycurl.TIMEOUT, 10)   
c.setopt(pycurl.FOLLOWLOCATION, True)

xml = StringIO()

c.setopt(pycurl.WRITEFUNCTION, xml.write )

c.perform()
c.close()
Run Code Online (Sandbox Code Playgroud)

我的网址通常是这样的:

http://host/path/to/resource-foo.xml
Run Code Online (Sandbox Code Playgroud)

通常我会回到302指向:

http://archive-host/path/to/resource-foo.xml.gz
Run Code Online (Sandbox Code Playgroud)

鉴于我已经设置了FOLLOWLOCATION和ENCODING gzip,一切都很好.

问题是,有时我有一个URL,不会导致重定向到gzip压缩资源.发生这种情况时,c.perform()会抛出此错误:

pycurl.error: (61, 'Error while processing content unencoding: invalid block type')
Run Code Online (Sandbox Code Playgroud)

这告诉我pycurl试图枪杀一个没有经过压缩的资源.

有没有什么方法可以指示pycurl找出响应编码,并在适当时使用gunzip?我玩过使用不同的值ENCODING,但到目前为止还没有bean.

pycurl文档似乎有点缺乏.:/

谢谢!

Pis*_*3.0 5

如果最糟糕的情况发生,你可以省略ENCODING'gzip',将HTTPHEADER设置为{'Accept-Encoding':'gzip'},检查 "Content-Encoding:gzip" 的响应标头,如果它存在,则用gunzip响应你自己.