如何使用importxml到需要登录的网站?

man*_*.vu 5 google-sheets web-scraping google-sheets-formula

我已经知道如何使用 importxml 将特定文本从网站导入 Google 表格。但是,这个网站experience.aiesec.org需要登录。我当然有用户名和密码。我也已经通过浏览器登录了这个网站。但是当使用 importxml 时,它承认我还没有登录。我也使用了该语法https://username:password@url,但它根本不起作用。有什么建议吗?或者我应该使用其他服务而不是 Google 表格?

小智 3

importXML()功能从 Google 的服务器运行,而不是从您的浏览器运行,因此,仅适用于公开且不需要身份验证的网站。

有 2 种方法可以使用 Google 表格自动从 experience.aiesec.org 导入数据:

  1. 如果 experience.aiesec.org 公共 API,
    您可以在 Google 脚本中编写自定义的、时间触发或事件触发的函数,该函数将使用aiesec.org所需的任何 API 进行身份验证,然后获取数据并将其写入您的 Google电子表格。
  2. 如果 experience.aiesec.org 没有公共 API,
    您可以使用Data Scraper等 Chrome 扩展程序定期将网站抓取到 CSV 文件中,然后将 CSV 导入到您的 Google 电子表格中。