解析 xml 找到具有匹配属性的最后一个元素

kam*_*tor 4 python xml xpath parsing python-3.4

我有一些写得不好的 xml,我正在尝试循环并提取每个测试的测试名称、开始和结束时间。我使用该数据将一列附加到 csv 中。我当前的实现检查 xml 中的每个元素,并且似乎很慢。

这是一个 xml 示例

<ProcessStart Id="1" Type="MemTest" Name="WriteRead" Options=" /pi=5 /m=AA" Tick="1233" />
<ProcessStart Id="2" Type="MemTest" Name="WriteRead" Options=" /pi=5 /m=AA" Tick="1233" />
<ProcessStart Id="3" Type="MemTest" Name="WriteRead" Options=" /pi=5 /m=AA" Tick="1233" />
<ProcessEnd Id="1" Tick="7553"/>
<ProcessEnd Id="2" Tick="7553"/>
<ProcessEnd Id="3" Tick="7553"/>
<ProcessStart Id="17" Type="MemTest" Name="WriteRead" Options=" /pi=25 /m=AA" Tick="8126" />
<ProcessStart Id="18" Type="MemTest" Name="WriteRead" Options=" /pi=25 /m=AA" Tick="8127" />
<ProcessStart Id="19" Type="MemTest" Name="WriteRead" Options=" /pi=25 /m=AA" Tick="8127" />
<ProcessEnd Id="17" Tick="12873"/>
<ProcessEnd Id="18" Tick="12873"/>
<ProcessEnd Id="19" Tick="12873"/>
Run Code Online (Sandbox Code Playgroud)

尝试找出如何获取与名称和选项匹配的 processStart 的 Id 值。到目前为止我有:

root.find('ProcessStart[@Name="%s"][last()]' % test_name).get('Id')
Run Code Online (Sandbox Code Playgroud)

但不是检查与测试名称匹配的最后一个元素,而是检查 processStart 的最后一个元素。我该如何解决这个问题?或者提取此信息的最快方法是逐行读取输入文件?

新信息 我想返回 Id 值,其中 Id=3。这是具有匹配名称和选项的所有 ProcessStart 都存在的最后一个值。显示的当前计数立即引用 ProcessStart 的最后一个实例,然后检查名称和选项条件。我正在寻找一种方法来找到具有匹配条件的最后一个 ProcessStart 。

也许更好的例子是按选项匹配,因为此实例的名称相同,因此:

options=" /pi=5 /m=AA"
test_id=root.find('ProcessStart[@Options="%s"][last()]' % options).get('Id')
Run Code Online (Sandbox Code Playgroud)

使用此示例和此数据集,它将返回错误“NoneType”对象没有属性“get”我相信这是因为最后一个元素与选项不匹配。不过,我正在尝试使用匹配的选项来定位最后一个 ProcessStart 。

完整代码:

import xml.etree.ElementTree as ET

#Read the xml file
tree = ET.parse('C:/Users/mkaminski/Desktop/sample.xml')
root = tree.getroot()

#get the first option
test_option=root.find('ProcessStart').get('Options')
test_id=root.find('ProcessStart[@Options="%s"][last()]' % test_option).get('Id')
Run Code Online (Sandbox Code Playgroud)

完整的 XML 文件:

<AppLog App="RPx" Version="0.6.1" BaseVer="0.0.1" Time="20160208153547" Tick="0">
  <RPxTest TestName="Tests/WriteRead" LongName="WriteRead_b=0_pi=5_m=AA_i=0" Instances="16" Memory="49534849024" Options=" /pi=5 /m=AA" IdRange="1-17" Tick="1233" />
  <ProcessStart Id="1" Type="MemTest" Name="WriteRead" Options=" /pi=5 /m=AA" Tick="1233" />
  <ProcessStart Id="2" Type="MemTest" Name="WriteRead" Options=" /pi=5 /m=AA" Tick="1233" />
  <ProcessStart Id="3" Type="MemTest" Name="WriteRead" Options=" /pi=5 /m=AA" Tick="1233" />
  <ProcessEnd Id="1" Tick="7553"/>
  <ProcessEnd Id="2" Tick="7553"/>
  <ProcessEnd Id="3" Tick="7553"/>
  <RPxTest TestName="Tests/WriteRead" LongName="WriteRead_b=0_pi=25_m=AA_i=0" Instances="16" Memory="49534849024" Options=" /pi=25 /m=AA" IdRange="17-33" Tick="8126" />
  <ProcessStart Id="17" Type="MemTest" Name="WriteRead" Options=" /pi=25 /m=AA" Tick="8126" />
  <ProcessStart Id="18" Type="MemTest" Name="WriteRead" Options=" /pi=25 /m=AA" Tick="8127" />
  <ProcessStart Id="19" Type="MemTest" Name="WriteRead" Options=" /pi=25 /m=AA" Tick="8127" />
  <ProcessEnd Id="17" Tick="12873"/>
  <ProcessEnd Id="18" Tick="12873"/>
  <ProcessEnd Id="19" Tick="12873"/>
</AppLog>
Run Code Online (Sandbox Code Playgroud)

错误:

File "C:/Anaconda3/Scripts/samle.py", line 9, in <module>
    test_id=root.find('ProcessStart[@Options="%s"][last()]' % test_option).get('Id')

AttributeError: 'NoneType' object has no attribute 'get'
Run Code Online (Sandbox Code Playgroud)

Mat*_*hew 5

我认为您遇到了 ElementTree 的 xpath 支持的限制(不完整)。使用 lxml 您的命令可以完美运行。

要使用 ElementTree 执行此操作,请检索所有匹配元素并让 Python 选择最后一个。

改变

options=" /pi=5 /m=AA"
test_id=root.find('ProcessStart[@Options="%s"][last()]' % options).get('Id')
Run Code Online (Sandbox Code Playgroud)

options=" /pi=5 /m=AA"
test_id=root.findall('ProcessStart[@Options="%s"]' % options)[-1].get('Id')
Run Code Online (Sandbox Code Playgroud)

在此命令中,我们将所有匹配的ProcessStart元素(按顺序)作为列表获取,并仅获取最后一个。然后我们就可以获取id了。