Riy*_* PK 5 html xml xpath scrapy
我想选择 a 内的所有文本div而不考虑里面的标签。
<div>
<p>some text here <a href="">a link here <span>span here<span></a></p>
</div>
Run Code Online (Sandbox Code Playgroud)
我需要得到结果
这里有一些文字,这里有一个链接,这里跨度
我试过这个
response.xpath('//div/text()')
Run Code Online (Sandbox Code Playgroud)
您要求的是该字符串值div:
string(/div)
Run Code Online (Sandbox Code Playgroud)
或者,如果您希望从末端修剪空白并在内部进行合并:
normalize-space(/div)
Run Code Online (Sandbox Code Playgroud)