使用 HTMLUNIT 从本地 html 文件中读取 html

Jor*_*xon 2 java web-crawler htmlunit web

我正在尝试加载我下载的本地 html 文件。有人知道怎么做这个吗?我目前正在获取状态代码 [404]。

这就是我的做法

HtmlPage htmlPage=webClient.getPage("file:\\\\Users\\njd202\\Desktop\\zipmeupbich\\springbootmongodb\\src\\main\\resources\\downloadedfiles\\Cuban2.html") ;
Run Code Online (Sandbox Code Playgroud)

小智 5

在这里做了一个简短的测试,对我来说效果很好。

webClient.getPage("file:\\\\C:\\Users\\me\\Desktop\\htmlunit\\test.html"
Run Code Online (Sandbox Code Playgroud)

请检查您是否

  • 使用最新的 HtmlUnit 版本
  • 使用正确的路径
  • 从一个包含非常简单的 html 内容的文件开始(没有外部链接/参考)