小编Meh*_*hdi的帖子

使用 LXML 获取所有 HTML 元素

我正在尝试解析divHTML 文档中的一个大标签,并且需要获取其所有 HTML 和嵌套标签div。我的代码:

innerTree = fromstring(str(response.text))
print("The tags inside the target div are")
print innerTree.cssselect('div.story-body__inner')
Run Code Online (Sandbox Code Playgroud)

但它打印:

[<Element div at 0x66daed0>]
Run Code Online (Sandbox Code Playgroud)

我想让它返回里面所有的HTML标签?如何使用 LXML 做到这一点?

html python parsing lxml

3
推荐指数
1
解决办法
6252
查看次数

标签 统计

html ×1

lxml ×1

parsing ×1

python ×1