假设我有一些类似 HTML 格式的纯文本,如下所示:
<div id="foo"><p id="bar">Some random text</p></div>
Run Code Online (Sandbox Code Playgroud)
我需要能够在其上运行 XPath 以检索一些内部元素。如何将纯文本转换为可以使用 XPath 的某种对象?
您可以使用普通选择器直接运行相同的xpath,css查询:
from scrapy import Selector
...
sel = Selector(text="<div id="foo"><p id="bar">Some random text</p></div>")
selected_xpath = sel.xpath('//div[@id="foo"]')
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1521 次 |
| 最近记录: |