令人难以置信的基本lxml问题:获取lxml.etree._Element的HTML /字符串内容？

Question

这是一个基本问题,我实际上在文档中找不到它: - /

在下面的:

img = house_tree.xpath('//img[@id="mainphoto"]')[0]

如何获取<img/>标签的HTML ？

我试过添加html_content()但是得到了AttributeError: 'lxml.etree._Element' object has no attribute 'html_content'.

此外,它是一个内部有一些内容的标签(例如<p>text</p>)我如何获得内容(例如text)？

非常感谢!

Answer 1

我想它会像下面这样简单:

from lxml.etree import tostring
inner_html = tostring(img)

至于从内部获取内容<p>,比如说,选择了一些元素el:

content = el.text_content()