min*_*ief 10 python xml minidom
我已经调用elems = xmldoc.getElementsByTagName('myTagName')
了一个我解析为的XML对象minidom.parse(xmlObj)
.现在我正在尝试获取此元素的文本内容,虽然我花了一段时间浏览dir()并尝试了解决方法,但我还没有找到调用.作为我想要完成的一个例子,在:
<myTagName> Hello there </myTagName>
我想提取只是"你好".(显然我可以自己解析这个,但我希望有一些内置的功能)
谢谢
ism*_*ail 24
试试这样:
xmldoc.getElementsByTagName('myTagName')[0].firstChild.nodeValue
Run Code Online (Sandbox Code Playgroud)
等一下...您是否想要给定节点下的所有文本?然后,它必须包含某种子树遍历功能。不一定要递归,但这可以正常工作:
def get_all_text( node ):
if node.nodeType == node.TEXT_NODE:
return node.data
else:
text_string = ""
for child_node in node.childNodes:
text_string += get_all_text( child_node )
return text_string
Run Code Online (Sandbox Code Playgroud)