在搜索SO和Google时,我发现有一些Java HTML解析器一直被各方推荐.不幸的是,很难找到有关各种图书馆优势和劣势的任何信息.我希望有些人花了一些时间来比较这些库,并且可以分享他们学到的东西.
这是我见过的:
如果有一个我错过的主要解析器,我也很想知道它的优点和缺点.
谢谢!
html java parsing
我有一个使用Velocity模板和Java 生成HTML页面的项目.但是大多数页面都不符合W3C标准.如何验证这些HTML页面并获取日志,告诉我哪些页面上有哪些错误/警告?
然后我可以手动修复错误.我尝试过JTidyFilter,但这对我不起作用.
html java validation w3c velocity
html ×2
java ×2
parsing ×1
validation ×1
velocity ×1
w3c ×1