目前,我正在开发一项功能,涉及解析从另一个产品收到的XML.我决定对一些实际的客户数据进行一些测试,看起来其他产品允许来自用户的输入被认为是无效的.无论如何,我仍然需要尝试找出解析它的方法.我们正在使用javax.xml.parsers.DocumentBuilder,我收到的输入错误如下所示.
<xml>
...
<description>Example:Description:<THIS-IS-PART-OF-DESCRIPTION></description>
...
</xml>
Run Code Online (Sandbox Code Playgroud)
正如您所知,描述中的内容似乎是无效的标记(<THIS-IS-PART-OF-DESCRIPTION>).现在,已知此描述标记是叶标记,并且不应在其中包含任何嵌套标记.无论如何,这仍然是一个问题,并产生例外DocumentBuilder.parse(...)
我知道这是无效的XML,但它可以预测无效.有关解析此类输入的方法的任何想法?
我有和打开Price标签的XML文件.尽管有错误,有没有办法解析文件?如何跳过错误的产品并继续解析?
<Products>
<Product Name="Gummi bears">
<Price Currency="GBP">4.07</Price>
<BestBefore Date="19-02-2014"/>
</Product>
<Product Name="Mounds">
<Price Currency="AUD">5.64
<BestBefore Date="08-04-2014"/>
</Product>
<Product Name="Vodka">
<Price Currency="RUB">70</Price>
<BestBefore Date="11-10-2014"/>
</Product>
</Products>
Run Code Online (Sandbox Code Playgroud)