我必须使用urllib2实现一个函数来获取头文件(不进行GET或POST).这是我的功能:
def getheadersonly(url, redirections = True):
if not redirections:
class MyHTTPRedirectHandler(urllib2.HTTPRedirectHandler):
def http_error_302(self, req, fp, code, msg, headers):
return urllib2.HTTPRedirectHandler.http_error_302(self, req, fp, code, msg, headers)
http_error_301 = http_error_303 = http_error_307 = http_error_302
cookieprocessor = urllib2.HTTPCookieProcessor()
opener = urllib2.build_opener(MyHTTPRedirectHandler, cookieprocessor)
urllib2.install_opener(opener)
class HeadRequest(urllib2.Request):
def get_method(self):
return "HEAD"
info = {}
info['headers'] = dict(urllib2.urlopen(HeadRequest(url)).info())
info['finalurl'] = urllib2.urlopen(HeadRequest(url)).geturl()
return info
Run Code Online (Sandbox Code Playgroud)
使用代码回答这个和这个.但是,即使标志是,也会进行重定向False
.我试过代码:
print getheadersonly("http://ms.com", redirections = False)['finalurl']
print getheadersonly("http://ms.com")['finalurl']
Run Code Online (Sandbox Code Playgroud)
它在两种情况下给予morganstanley.com.这有什么不对?
首先,您的代码包含几个错误:
在您的每个请求中getheadersonly
安装一个新的全局urlopener,然后在后续调用中使用urllib2.urlopen
您发出两个HTTP请求以获取响应的两个不同属性.
实施urllib2.HTTPRedirectHandler.http_error_302
并不是那么微不足道,我不明白它如何能够首先防止重定向.
基本上,您应该了解每个处理程序都安装在一个开启器中以处理某种响应.urllib2.HTTPRedirectHandler
是否将某些http代码转换为重定向.如果您不想重定向,请不要在重定向中添加重定向处理程序.如果您不想打开ftp链接,请不要添加FTPHandler
等.
这就是你需要的只是创建一个新的开启者并添加urllib2.HTTPHandler()
其中,自定义请求为'HEAD'请求并将请求的实例传递给开启者,读取属性,并关闭响应.
class HeadRequest(urllib2.Request):
def get_method(self):
return 'HEAD'
def getheadersonly(url, redirections=True):
opener = urllib2.OpenerDirector()
opener.add_handler(urllib2.HTTPHandler())
opener.add_handler(urllib2.HTTPDefaultErrorHandler())
if redirections:
# HTTPErrorProcessor makes HTTPRedirectHandler work
opener.add_handler(urllib2.HTTPErrorProcessor())
opener.add_handler(urllib2.HTTPRedirectHandler())
try:
res = opener.open(HeadRequest(url))
except urllib2.HTTPError, res:
pass
res.close()
return dict(code=res.code, headers=res.info(), finalurl=res.geturl())
Run Code Online (Sandbox Code Playgroud)
归档时间: |
|
查看次数: |
5581 次 |
最近记录: |