nec*_*cer 5 html java html-parsing html-parser
我需要解析一个简单的 HTML 页面,其中包含一个简单的表单。StackOverflow 上类似问题的答案建议使用多种非标准 Java 库之一,例如 TagSoup、JSoup、HTMLParser 等。
然而,网络搜索显示,Java SE 中通过此类存在一些标准功能:http://docs.oracle.com/javase/7/docs/api/javax/swing/text/html/parser/ParserDelegator.html
我的子问题是:
谢谢。
JDK 内置了 HTML 解析器,支持 HTML 1.0 左右。它应该支持解析基本文本格式标签和表单。
使用其他第三方解析器的原因是需要支持“真实”HTML 页面 DHTML、JavaScript 等。
JSoup 是可以完成这项工作的流行解析器之一。有关其他实现的更多信息,请查看以下讨论:
| 归档时间: |
|
| 查看次数: |
3265 次 |
| 最近记录: |