如何使用Python ElementTree获取元素树的所有子元素?

j5s*_*shi 12 python xml elementtree

我想找到一种方法来获取元素树的所有子元素,就像使用方法ElementTree.getchildren()一样,因为getchildren()自Python版本2.7 以来不推荐使用,我不想再使用它了,尽管我目前仍然可以使用它.

谢谢.

Eli*_*sky 12

所有子元素(后代)elem:

all_descendants = list(elem.iter())
Run Code Online (Sandbox Code Playgroud)

一个更完整的例子:

>>> import xml.etree.ElementTree as ET
>>> a = ET.Element('a')
>>> b = ET.SubElement(a, 'b')
>>> c = ET.SubElement(a, 'c')
>>> d = ET.SubElement(a, 'd')
>>> e = ET.SubElement(b, 'e')
>>> f = ET.SubElement(d, 'f')
>>> g = ET.SubElement(d, 'g')
>>> [elem.tag for elem in a.iter()]
['a', 'b', 'e', 'c', 'd', 'f', 'g']
Run Code Online (Sandbox Code Playgroud)

要排除根本身:

>>> [elem.tag for elem in a.iter() if elem is not a]
['b', 'e', 'c', 'd', 'f', 'g']
Run Code Online (Sandbox Code Playgroud)

  • 抱歉,Eli,但也许我没有让自己理解,我只想获取所有子元素,而不是根元素。即这里不需要根。但我认为你的方法也包含根对象,对吗? (2认同)
  • 但是,如果元素 'a' 中嵌套了多个带有标签 'a' 的 sturct 并且我想获取所有 'a' 结构的所有子元素怎么办? (2认同)
  • @pepr:是的,但这只会给你该元素的直接子元素,而不是所有后代 (2认同)
  • @Eli Bendersky:我明白了。但是 `getchildren()` 也只返回直接子级。新的 `list(elem.iter())` 的旧版本是 `list(elem.getiterator())`。这取决于史蒂文真正想要什么。 (2认同)

pep*_*epr 8

如果你想获取所有元素'a',你可以使用:

a_lst = list(elem.iter('a'))
Run Code Online (Sandbox Code Playgroud)

如果elem也是'a',它将被包括在内。


Har*_*ope 8

在 pydoc 中提到在节点上使用 list() 方法来获取子元素。
list(elem)

  • @GoranKutlaca:检查我的答案。它声明使用 list(elem) 不使用 list(elem.iter())。这两种调用是有区别的。list(elem) 只会给出子元素。 (5认同)