ako*_*sch 7 python xml lxml html-parsing
我正在使用以下代码来定位div:
parser = etree.HTMLParser()
tree = etree.parse(StringIO(page), parser)
div = tree.xpath("//div[@class='content']")[0]
Run Code Online (Sandbox Code Playgroud)
我唯一的问题是,在执行此操作后,我不想依赖lxml来提取所述div的内容:我只想获取div包含的原始XML.这是可行的还是我必须完全放弃这种方法?
| 归档时间: |
|
| 查看次数: |
2756 次 |
| 最近记录: |