Yar*_*rin 18 python head http-request python-requests
我正在尝试解析使用Python Requests库完成的HEAD请求的结果,但似乎无法访问响应内容.
根据文档,我应该能够访问requests.Response.text中的内容.这对我的GET请求很好,但在HEAD请求时返回None.
GET请求(工作)
import requests
response = requests.get(url)
content = response.text
Run Code Online (Sandbox Code Playgroud)
content = <html>...</html>
HEAD请求(无内容)
import requests
response = requests.head(url)
content = response.text
Run Code Online (Sandbox Code Playgroud)
content = None
编辑
好的我已经很快意识到HEAD请求不应返回仅内容标题的答案.但这是否意味着,要访问在<head>页面标签中找到的东西,比如<link>和<meta>标签,那么必须获取整个文档?
phi*_*hag 26
根据定义,对HEAD请求的响应不包含消息体.
如果您愿意,请发送GET请求,以获得响应正文.如果您只对响应状态代码和标题感兴趣,请发送HEAD请求.
HTTP传输任意内容; HTTP术语标头与HTML完全无关<head>.但是,可以建议HTTP仅下载文档的一部分.如果您知道HTML <head>代码的长度(或其上限),您可以在请求中包含一个HTTP Range标头,建议远程服务器只返回一定数量的字节.如果远程服务器支持HTTP范围,则它将提供简化的答案.
一个HEAD没有任何内容!尝试response.headers- 这可能就是行动的所在.HTTP HEAD请求不会获取<head>您从GET请求获得的HTML响应的元素.我认为那是你的错.