令人难以置信的基本lxml问题:获取lxml.etree._Element的HTML /字符串内容?

AP2*_*257 30 python lxml

这是一个基本问题,我实际上在文档中找不到它: - /

在下面的:

img = house_tree.xpath('//img[@id="mainphoto"]')[0]
Run Code Online (Sandbox Code Playgroud)

如何获取<img/>标签的HTML ?

我试过添加html_content()但是得到了AttributeError: 'lxml.etree._Element' object has no attribute 'html_content'.

此外,它是一个内部有一些内容的标签(例如<p>text</p>)我如何获得内容(例如text)?

非常感谢!

von*_*hev 58

我想它会像下面这样简单:

from lxml.etree import tostring
inner_html = tostring(img)
Run Code Online (Sandbox Code Playgroud)

至于从内部获取内容<p>,比如说,选择了一些元素el:

content = el.text_content()
Run Code Online (Sandbox Code Playgroud)