Python:存储在列表中的连接和写入(XML.etrees)树

Bro*_*wnE 5 python xml tree elementtree

我正在循环一些XML文件并生成我想要以defaultdict(list)类型存储的树.每个循环和下一个找到的子项将存储在字典的单独部分中.

d = defaultdict(list)
counter = 0
for child in root.findall(something):
    tree = ET.ElementTree(something)
    d[int(x)].append(tree)
    counter += 1
Run Code Online (Sandbox Code Playgroud)

因此,对多个文件重复此操作将导致精确索引的结果; 跨越不同解析文件的位置1的一组树,依此类推.问题是,我如何加入所有d,并将树(作为累积树)写入文件?

我可以遍历dict来获取每棵树:

for x in d:
    for y in d[x]:
        print (y)
Run Code Online (Sandbox Code Playgroud)

这给出了我的词典中的完整树木列表.现在,我如何从中生产出一棵大树?

示例输入文件1

示例输入文件2

1和2所需的结果

鉴于这样做有明显的困难,我很高兴接受更一般的答案,这些答案显示我如何从两个或更多文件中获取我正在寻找的结果.

Bur*_*lan 2

使用斯宾:

from spyne.model.primitive import *
from spyne.model.complex import *

class GpsInfo(ComplexModel):
    UTC = DateTime
    Latitude = Double
    Longitude = Double
    DopplerTime = Double
    Quality = Unicode
    HDOP = Unicode
    Altitude = Double
    Speed = Double
    Heading = Double
    Estimated = Boolean

class Header(ComplexModel):
    Name = Unicode
    Time = DateTime
    SeqNo = Integer

class CTrailData(ComplexModel):
    index = UnsignedInteger
    gpsInfo = GpsInfo
    Header = Header

class CTrail(ComplexModel):
    LastError = AnyXml
    MaxTrial = Integer
    Trail = Array(CTrailData)

from lxml import etree
from spyne.util.xml import *

file_1 = get_xml_as_object(etree.fromstring(open('file1').read()), CTrail)
file_2 = get_xml_as_object(etree.fromstring(open('file2').read()), CTrail)
file_1.Trail.extend(file_2.Trail)
file_1.Trail.sort(key=lambda x: x.index)

elt = get_object_as_xml(file_1, no_namespace=True)
print etree.tostring(elt, pretty_print=True)
Run Code Online (Sandbox Code Playgroud)

在执行此操作时,Spyne 还将数据字段从字符串转换为其本机 Python 格式,因此您可以更轻松地使用此 xml 文档中的数据。

另外,如果你不介意使用 git 的最新版本,你可以这样做:

class GpsInfo(ComplexModel):
    # (...)
    doppler_time = Double(sub_name="DopplerTime")
    # (...)
Run Code Online (Sandbox Code Playgroud)

这样您就可以从 CamelCased 标签获取数据,而不必违反 PEP8。