如何使用XPath选择div内的所有文本内容?

Riy*_* PK 5 html xml xpath scrapy

我想选择 a 内的所有文本div而不考虑里面的标签。

<div>
<p>some text here <a href="">a link here  <span>span here<span></a></p>
</div>
Run Code Online (Sandbox Code Playgroud)

我需要得到结果

这里有一些文字,这里有一个链接,这里跨度

我试过这个

response.xpath('//div/text()')
Run Code Online (Sandbox Code Playgroud)

kjh*_*hes 5

您要求的是该字符串值div

string(/div)
Run Code Online (Sandbox Code Playgroud)

或者,如果您希望从末端修剪空白并在内部进行合并:

normalize-space(/div)
Run Code Online (Sandbox Code Playgroud)