作为一个整体,我对lxml和HTML Parsers相当新.我想知道是否有办法用另一个元素替换树中的元素......
例如,我有:
body = """<code> def function(arg): print arg </code> Blah blah blah <code> int main() { return 0; } </code> """
doc = lxml.html.fromstring(body)
codeblocks = doc.cssselect('code')
for block in codeblocks:
lexer = guess_lexer(block.text_content())
hilited = highlight(block.text_content(), lexer, HtmlFormatter())
doc.replace(block, hilited)
Run Code Online (Sandbox Code Playgroud)
我想沿着这些行做一些事情,但这会导致"TypeError",因为"hilited"不是lxml.etree._Element.
这可行吗?
问候,
关于 lxml,
在 doc.replace(block, hilited)
block是 lxml 的 Element 对象,hilited是字符串,你不能替换它。
有 2 种方法可以做到这一点
block.text=hilited
Run Code Online (Sandbox Code Playgroud)
或者
body=body.replace(block.text,hilited)
Run Code Online (Sandbox Code Playgroud)