Python Scrapy:"runspider"和"crawl"命令有什么区别？

Question

Python Scrapy:"runspider"和"crawl"命令有什么区别？

有人可以解释runspider和crawl命令之间的区别吗？应该使用它们的背景是什么？

Answer 1

在命令中：

scrapy crawl [options] <spider>

Run Code Online (Sandbox Code Playgroud)

<spider>是项目名称（在 settings.py 中定义为BOT_NAME）。

并在命令中：

scrapy runspider [options] <spider_file>

Run Code Online (Sandbox Code Playgroud)

<spider_file> 是包含蜘蛛的文件的路径。

否则，选项是相同的：

Options
=======
--help, -h              show this help message and exit
-a NAME=VALUE           set spider argument (may be repeated)
--output=FILE, -o FILE  dump scraped items into FILE (use - for stdout)
--output-format=FORMAT, -t FORMAT
                        format to use for dumping items with -o

Global Options
--------------
--logfile=FILE          log file. if omitted stderr will be used
--loglevel=LEVEL, -L LEVEL
                        log level (default: DEBUG)
--nolog                 disable logging completely
--profile=FILE          write python cProfile stats to FILE
--lsprof=FILE           write lsprof profiling stats to FILE
--pidfile=FILE          write process ID to FILE
--set=NAME=VALUE, -s NAME=VALUE
                        set/override setting (may be repeated)
--pdb                   enable pdb on failure

Run Code Online (Sandbox Code Playgroud)

由于runspider不依赖于BOT_NAME参数，根据您自定义刮板的方式，您可能会发现runspider更灵活。