如何将参数传递给scrapyd的scrapy crawler？

Question

如何将参数传递给scrapyd的scrapy crawler？

wol*_*ang 5 python scrapy scrapyd

我可以用简单的命令在scrapy中运行蜘蛛

scrapy crawl custom_spider -a input_val=5 -a input_val2=6

在哪里input_val,input_val2我正在传递给蜘蛛的价值观

以上方法工作正常..

但是在安排带有scrapyd的蜘蛛时

赛跑

curl http://localhost:6800/schedule.json -d project=crawler -d input_val=5 -d input_val2=6 -d spider=custom_spider

Run Code Online (Sandbox Code Playgroud)

引发错误

spider = cls(*args, **kwargs)
    exceptions.TypeError: __init__() got an unexpected keyword argument '_job'

Run Code Online (Sandbox Code Playgroud)

我如何让这个工作？

编辑此:在我的初始化程序中:

def __init__(self,input_val=None, input_val2=None, *args, **kwargs):
        self.input_val = input_val
        self.input_val2 = input_val2
        super(CustomSpider, self).__init__(*args, **kwargs)

Run Code Online (Sandbox Code Playgroud)

Answer 1

Eli*_*les 6

一定要支持任意的关键字参数在你的蜘蛛,并呼吁__init__与super() 在文档的蜘蛛参数显示类似:

class MySpider(scrapy.Spider):
    name = 'myspider'

    def __init__(self, category=None, *args, **kwargs):
        super(MySpider, self).__init__(*args, **kwargs) # <- important
        self.category = category

Run Code Online (Sandbox Code Playgroud)

Scrapyd提供作业ID作为_job传递给蜘蛛的参数(参见此处的代码).

归档时间：	10 年，3 月前
查看次数：	1011 次
最近记录：	10 年，3 月前