如何在Java中解析和修改HTML文件

cha*_*hai 8 html java html-parsing

我正在做一个项目,其中我需要读取HTML文件并识别特定标签,修改标签的内容,以及创建新的HTML文件.是否有一个解析HTML标记的库,并且能够将标记写回新文件?

Vic*_*scu 6

查看http://jsoup.org,它有一个友好的dom-like API,用于简单的任务,你不需要解析html.


Igo*_*nko 2


如果你想修改网页并返回修改后的内容,我认为最好的方法是使用XSL转换。
http://en.wikipedia.org/wiki/XSLT