如何跳过格式良好的检查XML

2 html java xml xpath

我正在使用Xpath(和java)从一些网站中提取信息.但是我的问题是,由于其中一些网站格式不正确,我无法处理它们.有没有办法避免格式良好的检查,或者指定不应该检查格式良好的标签?

谢谢Rp

Mor*_*dil 5

预处理与整洁.