如何通过scrapy获取'img'src属性?

uub*_*all 6 scrapy

我想使用scrapy来获取img的链接,所以我在scrapy的爬虫中编写下面的程序:

hxs.select('//dl[@class="clearfix"]//img/@src/text()').extract()
Run Code Online (Sandbox Code Playgroud)

但是,它无论如何都不起作用.有什么问题吗 ?

use*_*ser 14

如果您使用 CSS 选择器而不是 XPath,则语法为 ::attr(src)

response.css('.product-list img::attr(src)').extract() # extract_first() to get only one
Run Code Online (Sandbox Code Playgroud)


Ble*_*der 9

text()是元素的文本.只需使用@src:

hxs.select('//dl[@class="clearfix"]//img/@src').extract()
Run Code Online (Sandbox Code Playgroud)