xml.etree.ElementTree.ParseError -- 异常处理未捕获错误

Dan*_*iel 5 python xml elementtree

我正在尝试解析一个 xml 文档,该文档包含许多未定义的实体,当我尝试运行代码时,这些实体会导致 ParseError ,如下所示:

import xml.etree.ElementTree as ET

tree = ET.parse('cic.fam_lat.xml')
root = tree.getroot()

while True:
    try:
        for name in root.iter('name'):
            print(root.tag, name.text)
    except xml.etree.ElementTree.ParseError:
        pass

for name in root.iter('name'):
    print(name.text)
Run Code Online (Sandbox Code Playgroud)

该错误的示例如下,有许多未定义的实体都会抛出相同的错误: 错误描述

我只是想忽略它们,而不是进去编辑每一个。我应该如何编辑异常处理来捕获这些错误实例?(即,我做错了什么?)

ale*_*cxe 5

建议使用一些解决方法,例如定义自定义实体:

但是,如果您能够切换到lxml,它可以在“恢复”模式XMLParser()下工作,该模式将“忽略”未定义的实体:

import lxml.etree as ET

parser = ET.XMLParser(recover=True)
tree = ET.parse('cic.fam_lat.xml', parser=parser)

for name in root.iter('name'):
    print(root.tag, name.text)
Run Code Online (Sandbox Code Playgroud)

(为我工作 - 打印标签名称和文本)

  • 这并不能真正回答问题。为什么“ParseError”没有被捕获? (4认同)