RoS*_*RoS 6 scheduled-tasks google-cloud-storage google-bigquery
我是 Google Cloud 的新手,想了解有关如何安排查询并将其导出到 Google Cloud Storage 的最佳用例。我看过有关如何手动导出数据的文档,但找不到任何有关以自动方式执行此操作的具体内容。有没有最好的方法来解决这个问题?
谢谢
可以使用计划查询功能和EXPORT DATA语句创建计划导出作业。例如,下面的脚本每天将数据作为采用 SNAPPY 压缩的 Parquet 文件备份到 GCS。每次执行作业时,都会获取前一天的所有数据。
DECLARE backup_date DATE DEFAULT DATE_SUB(@run_date, INTERVAL 1 day);
EXPORT DATA
OPTIONS ( uri = CONCAT('gs://my-bucket/', CAST(backup_date AS STRING), '/*.parquet'),
format='PARQUET',
compression='SNAPPY',
overwrite=FALSE ) AS
SELECT
*
FROM
`my-project.my-dataset.my-table`
WHERE
DATE(timestamp) = backup_date
Run Code Online (Sandbox Code Playgroud)
然后,您可以从 BiqQuery UI 创建计划查询并设置触发频率和触发时间。
小智 5
| 归档时间: |
|
| 查看次数: |
3883 次 |
| 最近记录: |