Jsoup 有 2 个html parse() 方法:
- parse(String html) - “由于没有指定基本 URI,绝对 URL 检测依赖于包含标签的 HTML。”
- parse(String html, String baseUri) - “从中检索 HTML 的 URL。用于将相对 URL 解析为绝对 URL,发生在 HTML 声明标签之前。”
我很难理解两者之间差异的含义:
- 在第二个版本中,“在HTML 声明标签之前
parse()将相对 URL 解析为绝对 URL
”是什么意思?如果
页面中从未出现过标签怎么办?<base href><base href>
- 绝对URL检测的目的是什么?为什么Jsoup需要查找绝对URL?
- 最后但也是最重要的:是
baseUriHTML 页面的完整 URL(如原始文档中的措辞)还是HTML 页面的基本URL?