Ton*_*ony 13 html java html-parsing html-validation
从Java验证HTML的快速而简单的方法是什么?我正在寻找一个开源/ PD类(或类集)来描述100多个HTML标签的各种属性,例如:
谢谢!
编辑
我正在寻找HTML文档的逐个标签分析,所以我不太关心整个文档是否有效,而是对每种类型的标记的具体要求.我可以根据W3C规范对规则进行编码,但是想先看看哪些现成的解决方案可用.
如果你想验证某些标签遵循某些规范,那么基于Java的HTML解析器似乎没有结束:
换句话说,您可以解析HTML,然后检查生成的文档以查找您要查找的标记,并确定它们是否符合您所需的规范.如果他们不这样做你就可以抛出一个错误.
我不认为你会发现一个HTML分析工具,它完全按照你的要求编写,主要是因为这些要求没有表达,可能有点模糊不清.
如果解析器没有开箱即用,那么至少此列表是开源的,因此只要您发布更改,就可以破解解析器.