Scrapy Body Text Only

mmr*_*151 7 python scrapy scraper scrape

我试图使用python Scrapy从身体上刮掉文本,但还没有运气.

希望有些学者可以在这里帮助我从<body>标签中抓取所有文本.

Eli*_*sky 4

Scrapy 使用 XPath 表示法来提取 HTML 文档的部分内容。那么,您是否尝试过仅使用/html/body路径来提取<body>?(假设它嵌套在 中<html>)。使用选择器可能更简单//body

x.select("//body").extract()    # extract body
Run Code Online (Sandbox Code Playgroud)

您可以在此处找到有关 Scrapy 提供的选择器的更多信息。