我有多个数据集,每个数据集在 Google BigQuery 中都有数百个表。我想删除一些旧的遗留数据,并且正在寻找最方便的方法来了解每个数据集和表占用了多少存储空间,以便我可以就可以删除哪些数据集/表做出明智的决定。
我尝试使用bq
命令行工具,但找不到显示表存储和整个数据集存储相关信息的方法。
您可以使用TABLES元表访问有关数据集中的表的元数据。即,示例:
select * from [publicdata:samples.__TABLES__]
Run Code Online (Sandbox Code Playgroud)
回报
project_id dataset_id table_id creation_time last_modified_time row_count size_bytes type
publicdata samples github_nested 1348782587310 1348782587310 2541639 1694950811 1
publicdata samples github_timeline 1335915950690 1335915950690 6219749 3801936185 1
publicdata samples gsod 1335916040125 1440625349328 14420316 17290009238 1
publicdata samples natality 1335916045005 1440625330604 37826763 23562717384 1
publicdata samples shakespeare 1335916045099 1440625429551 164656 6432064 1
publicdata samples trigrams 1335916127449 1445684180324 68051509 277168458677 1
publicdata samples wikipedia 1335916132870 1445689914564 13797035 38324173849 1
Run Code Online (Sandbox Code Playgroud)
更多文档在这里: https: //cloud.google.com/bigquery/querying-data