如何使用scrapy从python中的span获取文本？

Question

如何使用scrapy从python中的span获取文本？

我在这里放置 HTML 代码：

<div class="rendering rendering_person rendering_short rendering_person_short">
  <h3 class="title">
    <a rel="Person" href="https://moh-it.pure.elsevier.com/en/persons/massimo-eraldo-abate" class="link person"><span>Massimo Eraldo Abate</span></a>
  </h3>
  <ul class="relations email">
    <li class="email"><a href="massimo.abate@ior.it" class="link"><span>massimo.abate@ior.it</span></a></li>
  </ul>
  <p class="type"><span class="family">Person: </span>Academic</p>
</div>

Run Code Online (Sandbox Code Playgroud)

从上面的代码如何提取 Massimo Eraldo Abate？

请帮我。

Answer 1

Tom*_*art 5

您可以使用提取名称

response.xpath('//h3[@class="title"]/a/span/text()').extract_first()

Run Code Online (Sandbox Code Playgroud)

另外，请查看此 Scrapinghub 的博客文章，了解 XPath 的介绍。

归档时间：	8 年，5 月前
查看次数：	5694 次
最近记录：	8 年，5 月前