用于构建HTML文档的库是什么?

lis*_*sak 3 html java dom htmlcleaner

可以请任何人推荐能够做到与这些库相反的库吗?

HtmlCleaner,TagSoup,HtmlParser,HtmlUnit,jSoup,jTidy,nekoHtml,WebHarvest或Jericho.

我需要构建html页面,从String内容构建DOM模型.

编辑:我需要它用于测试目的.我有各种类型的输入/字符串可能在各个地方的html页面中...所以我需要动态构建它...然后我根据必须满足或不满足的各种标准处理html页面.

我会告诉你为什么我问这个问题,考虑htmlCleaner这个工作:

List<String> paragraphs = getParagraphs(entity.getFile());
List<TagNode> pNodes = new ArrayList<TagNode>();

TagNode html = cleaner.clean("<html/>");
for(String paragraph : paragraphs) {                
    TagNode p = new TagNode("p");
    pNodes.add(p);
    // CANNOT setText() ?
}
html.addChildren(pNodes);
Run Code Online (Sandbox Code Playgroud)

问题是TagNodegetText()方法,但没有setText()方法....

请添加更多关于这个问题是多么模糊的评论......你能做的最好的事情

ste*_*vls 8

Jsoup,Jsoup,Jsoup!我已经使用了所有这些,这是我最喜欢的远射.您可以使用它来构建文档,此外它还带来了许多Jquery样式遍历的魔力以及我在Java库中看到的迄今为止最好的HTML文档解析.我很高兴,我不介意无耻地推广它.;)

  • 好吧,很难弄清楚如何使用这些库,因为它们是相反的意思...例如我找不到HtmlCleaner或tagSoup中创建我无法构建的html页面的任何类向上 (2认同)
  • 从这开始:`元素elem = Jsoup.parse("<html />");`然后你有一个非常丰富的API来构建你的文档. (2认同)