美丽的汤与铁蟒一起工作吗?如果是这样的铁蟒的版本?使用iron python在.net 2.0上分发Windows桌面应用程序是多么容易(主要是c#调用一些python代码来解析html)?
我正在处理由perl生成的格式错误的XML,这是由我无法改变的上游进程生成的(这似乎是一个常见的问题).但是,据我所见,XML只有一种特殊的方式格式错误:它的属性值包含未转义的小于号,例如:
<tag v="< 2">
Run Code Online (Sandbox Code Playgroud)
我正在使用带有XML :: LibXML的 perl 进行解析,当然,这会生成解析错误.我已经尝试使用recover选项,它允许我解析,但它只是在遇到第一个解析错误时停止,所以我正在以这种方式丢失数据.
看起来我有两个一般的选择:
我倾向于选项1,因为我想捕获XML的任何其他错误.你会推荐什么?如果#1,有人可以引导我通过正则表达式方法吗?