TagSoup与Jsoup vs. HTML Parser vs. HotSax vs.

Reg*_*kie 40 java android html-parsing

丰富的HTML解析器可供选择(并坚持使用)令人难以置信:

http://java-source.net/open-source/html-parsers

如何选择最符合以下要求的产品:

  1. 成熟(比其他人更少的错误)
  2. 生活和呼吸(即维持)
  3. 快速且资源效率高(旨在在Android上运行)

根据您的经验,您会推荐哪种HTML解析器(满足上述要求)以及原因?

Reg*_*kie 38

好吧,我找到了答案,这是由@BalusC在另一个主题上给出的:

  1. 如果您只想使用基于XML的工具来遍历它:JTidy.
  2. 如果你想单独测试HTML: HtmlUnit
  3. 如果您想从HTML中提取特定数据:Jsoup

谢谢@BalusC.