lxml解析器提供了一种获取尝试解析文档时发生的错误列表的方法。将其与解析器的recover关键字参数结合起来,您会得到如下所示的结果:
# Warning, untested, may not work
parser = etree.XMLParser(recover=True)
it_would_be_a_tree = etree.parse(your_xml_data, parser)
total_errors = len(parser.error_log)
Run Code Online (Sandbox Code Playgroud)
然后您可以计算所代表的文件的百分比total_errors。您可以使用简单的测量方法,例如每行错误或每个字符错误,而不会出现任何问题。it_would_be_a_tree如果实际上是一个tree结构(total_elements / total_errors例如 ),也可以采用更复杂的措施。
| 归档时间: |
|
| 查看次数: |
141 次 |
| 最近记录: |