如何通过xpath解析lxml中的子元素

Question

如何通过xpath解析lxml中的子元素

page = urlopen(req)
doc = parse(page).getroot()
table = doc.xpath('/html/body/div/div/div/table')
table
<Element table ...>
doc.xpath('/html/body/div/div/div/table/tr')
<Element tr ...>...
table.xpath('/tr')
[]

Run Code Online (Sandbox Code Playgroud)

为什么不table.xpath('/tr')产生相同的元素列表doc.xpath('/html/body/div/div/div/table/tr')呢？

Answer 1

str*_*nac 5

这是因为以x开头的xpath /总是在文档根目录开始匹配。

为了避免这种情况，请省略斜线，或者将其显式并用于.匹配当前元素。
这些都应该起作用：

table.xpath('tr')
# or
table.xpath('./tr')

Run Code Online (Sandbox Code Playgroud)

归档时间：	12 年，10 月前
查看次数：	1652 次
最近记录：	12 年，10 月前