Spa*_*man 9 python scrapy web-scraping scrapy-spider
我们有一个非常标准的Scrapy项目(Scrapy 0.24).
我想捕获特定的HTTP响应代码,例如200,500,502,503,504等.
像这样的东西:
class Spider(...):
def parse(...):
processes HTTP 200
def parse_500(...):
processes HTTP 500 errors
def parse_502(...):
processes HTTP 502 errors
...
Run Code Online (Sandbox Code Playgroud)
我们怎么做?
ale*_*cxe 12
默认情况下,Scrapy仅处理具有状态代码的响应200- 300.
class Spider(...):
handle_httpstatus_list = [500, 502]
Run Code Online (Sandbox Code Playgroud)
然后,在parse()回调中,检查response.status:
def parse(response):
if response.status == 500:
# logic here
elif response.status == 502:
# logic here
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
2723 次 |
| 最近记录: |