连接来自不同区域的 BigQuery 表失败

Hak*_*n54 2 google-bigquery google-cloud-platform

我有两个想要加入的数据集,但是当我尝试加入它们时,GCP 给出了一个错误,指出它无法在同一区域中找到另一个表,这是正确的,因为它托管在不同的区域中。因此,其中一台托管于EU,另一台托管于europe-west1

我想过更改一个数据集的区域,但这是不可能的,并且文档还提到:

在位置之间移动 BigQuery 数据

创建数据集后,您无法更改其位置,但可以创建数据集的副本。您无法将数据集从一个位置移动到另一位置,但可以手动移动(重新创建)数据集。BigQuery Data Transfer Service 可以将数据传输到许多区域的 BigQuery 数据集。

理想情况下,我想在指定数据集/表路径时指定查询编辑器中的区域,但我找不到这样的东西。所以我想问是否有一种方法仍然可以连接表,而不需要将一个数据集迁移到同一区域。

Yun*_*ang 6

目前,您无法连接来自不同区域的 2 个表。将数据集移动到同一区域是唯一的方法。

关于数据集位置,BigQuery 知道每个数据集的位置。因此,如果您不进行跨区域联接,您的查询将始终路由到数据所在的区域。

  • BigQuery 是一个 Peta 字节规模的数据仓库,跨区域并不是查询此类数据的明智方法。即使将来有这样的功能,跨区域传输免费的可能性也很小。 (2认同)