lis*_*sak 3 html java dom htmlcleaner
可以请任何人推荐能够做到与这些库相反的库吗?
HtmlCleaner,TagSoup,HtmlParser,HtmlUnit,jSoup,jTidy,nekoHtml,WebHarvest或Jericho.
我需要构建html页面,从String内容构建DOM模型.
编辑:我需要它用于测试目的.我有各种类型的输入/字符串可能在各个地方的html页面中...所以我需要动态构建它...然后我根据必须满足或不满足的各种标准处理html页面.
我会告诉你为什么我问这个问题,考虑htmlCleaner这个工作:
List<String> paragraphs = getParagraphs(entity.getFile());
List<TagNode> pNodes = new ArrayList<TagNode>();
TagNode html = cleaner.clean("<html/>");
for(String paragraph : paragraphs) {
TagNode p = new TagNode("p");
pNodes.add(p);
// CANNOT setText() ?
}
html.addChildren(pNodes);
Run Code Online (Sandbox Code Playgroud)
问题是TagNode有getText()方法,但没有setText()方法....
请添加更多关于这个问题是多么模糊的评论......你能做的最好的事情
Jsoup,Jsoup,Jsoup!我已经使用了所有这些,这是我最喜欢的远射.您可以使用它来构建文档,此外它还带来了许多Jquery样式遍历的魔力以及我在Java库中看到的迄今为止最好的HTML文档解析.我很高兴,我不介意无耻地推广它.;)