Google BigQuery,如何将数据从谷歌云存储加载到BigQuery

dee*_*gar 1 google-cloud-storage google-bigquery

由于性能高,我正在切换到Big Query.但不知道如何将数据从Google云端存储上传到Big Query Database.还有一些问题......我可以在使用Big Query时直接从谷歌云存储访问我的数据库.我是否必须先将其转换为某种格式.我将如何继续将Big Query数据库更新到我的Google云端存储数据库.

提前致谢.

Doi*_*nal 8

假设您的数据采用支持的格式(分隔为csv/tsv或json),您可以使用UI,CLI或API轻松地将数据从Google Cloud Storage加载到BigQuery.例如,使用CLI:

bq load mydataset.mytable gs://my_bucket/file.csv name:string,gender:string,count:integer 
Run Code Online (Sandbox Code Playgroud)

这会将您的Google Cloud Storage存储桶'my_bucket'中的file.csv加载到'mydataset'数据集下的'mytable'表中.该表将有三列, - 字符串类型的名称和性别以及整数类型的计数.您可以查看BigQuery快速入门指南[1]

如果需要添加更多数据,只需bq load再次运行该命令,默认情况下,它会将CSV中的新行追加到BigQuery表中.如果需要覆盖数据,请添加--replace标志,以便在加载新数据之前删除现有内容

此外,您甚至可以在Google云端存储中对您的文件运行查询,而无需先使用外部表[2]将它们加载到BigQuery中

[1] https://cloud.google.com/bigquery/bq-command-line-tool-quickstart

[2] https://cloud.google.com/bigquery/federated-data-sources