在Chrome中打开网址并使用命令提示符保存其源代码

Suf*_*ori 9 google-chrome

我很难找到如何使用Chrome浏览器中的命令行将页面保存为html或.txt,

这是我到目前为止所做的,

C:\Users\Cipher\AppData\Local\Google\Chrome\Application>chrome.exe --new-window
http://google.com
Run Code Online (Sandbox Code Playgroud)

此命令将打开Chrome浏览器的新窗口并访问google.com但我无法确定如何将google.com另存为html或txt文件,是否仍然使用命令提示符这样做?

mrc*_*als 9

你真的需要打开谷歌浏览器吗?您可以使用Wget获取页面源(适用于UNIX系统或适用于SuperUser上的此帖子中的 Windows ).安装后,只需使用以下命令:

wget http://google.com -O yourfilename.html
Run Code Online (Sandbox Code Playgroud)

这应该是全部:)我不认为有一种方法告诉Chrome从命令行下载HTML :(

更新: GitHub上有一个名为chrome-cli的回购,允许用户从命令行控制Chrome.缺点是它只适用于Mac OS X.

  • 当页面包含由 javascript 生成的 HTML 时,`wget` 不会帮助你。 (5认同)
  • @Tigra 许多网页的源代码 * 非常* 不同,具体取决于当前登录的用户:-)。 (2认同)

Mik*_*maa 8

您无法手动执行任务,但可以使用WebDriver自动化执行该任务.

Chrome可以使用名为WebDriver的API (Selenium 2自动化套件的一部分)进行远程控制.WebDrive具有各种编程语言的绑定,包括JavaScript和Python.

以下是Python的示例代码(未经测试):

from selenium import webdriver

driver = webdriver.Chrome('/path/to/chromedriver')  # Optional argument, if not specified will search path.
driver.get('http://www.google.com/');
html = driver.page_source
f = open("myhtml", "wt")
f.write(html)
f.close()
Run Code Online (Sandbox Code Playgroud)

Orignal的例子


abi*_*abi 5

我创建了一个小脚本来执行此任务:https : //github.com/abiyani/automate-save-page-as。请参阅自述文件中的演示gif。

它可以自动执行键盘操作,否则将执行手动操作以手动保存页面(将这些键信号发送给OS)。作为在我的另一个项目中使用的副作用,它已经在各种Linux风格上进行了测试:Ubuntu,Mint,Fedora等-并且在所有这些风格上都可以正常工作。在Mac上(至少在没有修改的情况下)它可能无法运行(当然,在Windows上则无法运行)。

  • 干得好。对于任何想知道的人 - 这通过调用 google-chrome 二进制文件来工作,然后使用 `xdotool` 发送击键:https://github.com/abiyani/automate-save-page-as/blob/master/save_page_as (3认同)