Ant*_*nel 6 python google-analytics-api apache-superset
我愿意通过他们的 API 将 Google Analytics 和 Google Search Console 数据直接显示到 Superset 中。
我怎样才能这样做呢?
我找不到 Google Analytics 数据源。我也找不到 Google Search Console 数据源。
我找不到在 Superset 中显示从 API 检索的数据的方法,只能显示存储在数据库中的数据。我肯定遗漏了一些东西,但我在文档中找不到与身份验证和查询外部 API 相关的任何内容。
Superset可以直接查询外部数据API\xe2\x80\x99s。Superset 必须与受支持的数据库或数据引擎配合使用 ( https://superset.incubator.apache.org/installation.html#database-dependencies )。这意味着您需要找到一种方法从 API 中获取数据并将其存储在支持的数据库/数据引擎中。一些选项:
\n构建一个小型 Python 管道,用于查询数据 API,将数据扁平化为表格/关系型数据,并将该数据上传到支持的数据源 - https://superset.incubator.apache.org/installation.html#database-dependencies - 并设置 Superset,以便它可以与该数据库/数据引擎对话。
\n对于更强大的解决方案,您可能希望使用 devops/基础设施来建立工作流调度程序,例如 Apache Airflow ( https://airflow.apache.org/ ),以定期 ping 该 API 并将其存储在某种数据库中Superset 可以与之交谈。
\n如果您想定期从流行的第 3 方 API 查询数据,我还建议您查看Meltano并了解有关Singer Taps的更多信息。这些将处理定期从 API 获取数据并将其存储在 Postgres 等数据库中的一些繁重工作。好消息是 Google Analytics 有一个 Singer Tap - https://github.com/singer-io/tap-google-analytics
\n不管怎样,Superset 只是数据库/数据引擎之上的一个薄层。因此,\xe2\x80\x99s 无法绕过这样的现实:您需要找到一种方法从 API 中提取数据并将其存储在兼容的数据源中。
\n小智 5
Superset 的一位贡献者将这个项目命名为shillelagh 。这为 REST API 提供了 SQL 接口。Apache Superset 中使用相同的包来连接 gsheets。
新的适配器相对容易实现。有一个分步教程解释了如何在 shillelagh 中创建 API 或文件类型的新适配器。
shillelagh 包底层通过使用 SQLite 包装器APSW使用 SQLite 虚拟表
默认情况下没有可用的此类连接器。
推荐的解决方案是将 Google Analytics 和 Search Console 数据存储在数据库中,您可以编写一个脚本,每 4 小时或任何适合您的时间间隔提取数据。
此外,您不应存储所有数据,而应仅存储您希望在报告中看到的维度/指标。
| 归档时间: |
|
| 查看次数: |
12195 次 |
| 最近记录: |