相关疑难解决方法(0)

Jsoup.parse() 与 Jsoup.parse() - 或者 Jsoup 中的 URL 检测如何工作?

Jsoup 有 2 个html parse() 方法:

  1. parse(String html) - “由于没有指定基本 URI,绝对 URL 检测依赖于包含标签的 HTML。”
  2. parse(String html, String baseUri) - “从中检索 HTML 的 URL。用于将相对 URL 解析为绝对 URL,发生在 HTML 声明标签之前。”

我很难理解两者之间差异的含义

  1. 在第二个版本中,“在HTML 声明标签之前parse()将相对 URL 解析为绝对 URL ”是什么意思?如果 页面中从未出现过标签怎么办?<base href><base href>
  2. 绝对URL检测的目的是什么?为什么Jsoup需要查找绝对URL?
  3. 最后但也是最重要的:是baseUriHTML 页面的完整 URL(如原始文档中的措辞)还是HTML 页面的基本URL?

java html-parsing jsoup

5
推荐指数
1
解决办法
3312
查看次数

标签 统计

html-parsing ×1

java ×1

jsoup ×1