Dan*_*iel 5 python xml elementtree
我正在尝试解析一个 xml 文档,该文档包含许多未定义的实体,当我尝试运行代码时,这些实体会导致 ParseError ,如下所示:
import xml.etree.ElementTree as ET
tree = ET.parse('cic.fam_lat.xml')
root = tree.getroot()
while True:
try:
for name in root.iter('name'):
print(root.tag, name.text)
except xml.etree.ElementTree.ParseError:
pass
for name in root.iter('name'):
print(name.text)
Run Code Online (Sandbox Code Playgroud)
我只是想忽略它们,而不是进去编辑每一个。我应该如何编辑异常处理来捕获这些错误实例?(即,我做错了什么?)
建议使用一些解决方法,例如定义自定义实体:
但是,如果您能够切换到lxml,它可以在“恢复”模式XMLParser()下工作,该模式将“忽略”未定义的实体:
import lxml.etree as ET
parser = ET.XMLParser(recover=True)
tree = ET.parse('cic.fam_lat.xml', parser=parser)
for name in root.iter('name'):
print(root.tag, name.text)
Run Code Online (Sandbox Code Playgroud)
(为我工作 - 打印标签名称和文本)