使用urllib2.urlopen时,如何访问包含重定向的原始响应标头

Raj*_*Raj 2 python location header urllib2 urlopen

我正在尝试解析使用urllib2.urlopen后返回的HTTP响应的位置标头,但我收到的唯一响应标头来自目标重定向 - 而不是包含位置标头的原始响应.

我已经关注了Stack Overflow的其他问题,建议将urllib2.HTTPRedirectHandler子类化,但是我仍然无法理解如何访问urlopen最终跟随的原始响应.

这是一个问题的例子:

import urllib2

req = urllib2.urlopen("http://wp.me")

print req.info()
Run Code Online (Sandbox Code Playgroud)

print的输出包含重定向请求的目标的响应头.我想看看原版.

任何帮助,将不胜感激.

Sen*_*ran 6

urllib2执行透明重定向,但正如您所说,您可以将HTTPRedirectHandler子类化并将其用作开启器以获取所需的值.

import urllib2

class SmartRedirectHandler(urllib2.HTTPRedirectHandler):
    def http_error_302(self, req, fp, code, msg, headers):
        result = urllib2.HTTPRedirectHandler.http_error_302(self, req, fp,
                                                                 code, msg,
                                                                 headers)
        result.status = code
        result.headers = headers
        return result

request = urllib2.Request("http://wp.me")
opener = urllib2.build_opener(SmartRedirectHandler())
obj = opener.open(request)
print 'The original headers where', obj.headers
print 'The Redirect Code was', obj.status
Run Code Online (Sandbox Code Playgroud)

您可以通过结果向您提供可以在SmartRedirectHandler中为您的req设置的任何其他属性.