我需要匹配所有这些开始标记:
<p>
<a href="foo">
Run Code Online (Sandbox Code Playgroud)
但不是这些:
<br />
<hr class="foo" />
Run Code Online (Sandbox Code Playgroud)
我想出了这个,并希望确保我做对了.我只抓住了a-z.
<([a-z]+) *[^/]*?>
Run Code Online (Sandbox Code Playgroud)
我相信它说:
/,然后我有这个权利吗?更重要的是,你怎么看?
目前,我正在开发一项功能,涉及解析从另一个产品收到的XML.我决定对一些实际的客户数据进行一些测试,看起来其他产品允许来自用户的输入被认为是无效的.无论如何,我仍然需要尝试找出解析它的方法.我们正在使用javax.xml.parsers.DocumentBuilder,我收到的输入错误如下所示.
<xml>
...
<description>Example:Description:<THIS-IS-PART-OF-DESCRIPTION></description>
...
</xml>
Run Code Online (Sandbox Code Playgroud)
正如您所知,描述中的内容似乎是无效的标记(<THIS-IS-PART-OF-DESCRIPTION>).现在,已知此描述标记是叶标记,并且不应在其中包含任何嵌套标记.无论如何,这仍然是一个问题,并产生例外DocumentBuilder.parse(...)
我知道这是无效的XML,但它可以预测无效.有关解析此类输入的方法的任何想法?
我正在尝试将一段(可能)格式错误的HTML加载到XMLDocument对象中,但它失败了XMLExceptions ...因为有额外的打开/关闭标记,以及格式错误的XML标记,<img >而不是<img />
如何让XML解析数据中的所有错误?在解析之前是否可以应用任何XML验证器来纠正这些错误?或者处理异常解析什么可以解析?
我注意到当我使用"&"字符配置XML文件值时,XML文件无法正确打开
我想这是因为XML文件值不应该有一些字符作为&
并且"&"不应在XML文件中设置为值
如果有更多字符不应在XML中设置为值,请提供建议吗?(或者也许&字符是唯一的??)
来自XML"&"的错误值的示例
<FolderPath>\EEA\E1\C & W 100\AWQ</FolderPath>
Run Code Online (Sandbox Code Playgroud)
来自XML的右行示例
<FolderPath>\EEA\E1\C and W 100\AWQ</FolderPath>
Run Code Online (Sandbox Code Playgroud)