当我开始学习scrapy时,我已经满足了动态构建Item属性的要求.我只是在抓一个有桌面结构的网页,我想在抓取时形成项目和字段属性.我已经完成了这个示例刮擦数据,而无需明确定义要刮除的每个字段,但却无法做很多事情.
我应该写一个项目pipleline来动态捕获信息.我也查看了Item loader函数,但如果有人能详细解释,那将非常有用.
python scrapy
python ×1
scrapy ×1