tru*_*bot 5 google-cloud-storage google-cloud-sql google-bigquery google-cloud-platform google-cloud-functions
我\xe2\x80\x99m 尝试自动执行将 postgres 数据库加载到 BigQuery 的任务作为日常工作。postgres 数据库采用单个 sql 文件的形式,其中包含所有表及其数据。该文件托管在 Google Cloud Storage (GCS) 上。我想获取该 sql 文件并将其中的每个表加载到 BigQuery 中其自己单独的对应表中。
\n\nStackOverflow 中关于此问题的大多数问答都假设 sql 文件仅包含一个表,而不是多个表。不幸的是,目前 BigQuery 似乎不支持内部包含多个表的单个文件。此外,我还在寻找自动化解决方案,而不是一次性的解决方案。所以,我正在寻找其他解决方案。
\n\n我\xe2\x80\x99m 希望解决两个问题:
\n\n我对每个问题都有一些选择。我希望听到有关哪种选项最可行的反馈,以及您之前可能听说过或使用过的任何其他策略。
\n\n对于每个表将文件拆分为单独的 csv 文件:
\n\n对于自动化数据管道中每个步骤的工具:(我\xe2\x80\x99m对它们不太熟悉,如果下面的工具都不是正确的选择,希望我能得到纠正。)
\n\n现在,我正在考虑使用 Cloud Functions 来编排以下管道:GCS -> Cloud SQL -> 拆分为单独的 csv 文件 -> 上传到 GCS -> 引入 BigQuery。如果您知道任何其他替代策略,\xe2\x80\x99d 将不胜感激。
\n| 归档时间: |
|
| 查看次数: |
2545 次 |
| 最近记录: |