Ric*_*ard 9 google-chrome screen-scraping
所以,我使用的是 Chrome/Chromium 浏览器(如果需要,可以使用 Firefox)。
我正在查看使用(大概是)AJAX 构建的“动态”网页(想想你如何在 Facebook 上向下滚动,而事情只是不断出现和出现)。
我想在加载一堆东西后保存这样一个页面的 html,但这没有显示在 Chromium 开发人员工具的 DOM 中,右键单击保存只是在 AJAX 加载之前保存原始页面东西。
我能做什么?
获取包含所有动态加载元素的源代码的一种方法是通过 Chrome 开发人员工具 ( F12)。选择<HTML>
页面最开头的标签,然后复制元素 ( CTRL+ C)。这还应该将所有包含的数据(动态加载或以其他方式)复制到剪贴板,然后您可以将其粘贴到您喜欢的任何位置。
这是显示该过程的 gif:
明显的缺点是,如果您想要完整的文件,则必须手动下载任何文件(.js
、.css
、图像)并将它们保存在与 html 文件相同的文件夹中(提示:使用开发工具中的“源”选项卡)网站,或者,如果您不介意从网络获取一些数据,则可以像这样修改 HTML 源中的链接:
===ORIGINAL===
<img src="file.jpg">
===MODIFIED===
<img src="[url_of_website_that_you_want_to_save]/file.jpg">
Run Code Online (Sandbox Code Playgroud)