小编use*_*374的帖子

Bigquery 分片与 Bigquery 分区

我有一个包含 340GB 数据的表,但我们只使用了最后一周的数据。因此,为了最小化将这些数据移动到分区表或分片表的成本计划。

我对分片表和分区做了一些实验。我创建了分区表并加载了两天的数据(两个分区)并创建了两个分片表(单个表)。我试图提取最近两天的数据。

全表 - 27 秒分区表 - 33 秒分片表 - 91 秒

请让我知道哪种方式最好。根据实验结果,当我针对全表运行时会给出快速但全表会扫描的结果。

谢谢,

google-bigquery

6
推荐指数
2
解决办法
4107
查看次数

BigQuery全表分区

我在一个表中有340 GB的数据(270天的数据).现在计划将此数据移动到分区表.

这意味着我将有270个分区.将此数据移动到分区表的最佳方法是什么?

我不想运行270个查询,这是非常昂贵的操作.所以寻找优化的解决方案.

我有这样的多个表.我需要将所有这些表迁移到分区表.

谢谢,

google-bigquery

4
推荐指数
2
解决办法
638
查看次数

python中变量值的变量

在我的要求中,列表是动态创建的,每次都有不同列的字典集合.因此,每次我需要打印的内容都会根据某些逻辑而有所不同.

如果我为每个案例创建if ..else语句,我可以打印出我想要的内容.

在这里我有太多的案例,所以我不想写那么多if ... esle语句只是为了打印.

而不是我想要从配置文件中读取我需要打印的内容并打印实际值.

示例:list1 = [{'name':'xyz','age':22,'place':'huj'},{'name':'hjhd','age':44,'place':'wer "}]

想要打印名称和年龄列

the following code will do my work.
if id == 1:
    for i in list1:
        i['name']+","+i['age']
elif id == 2:
    for i in list1:
        i['account']+","+i['spend']
elif id == 3:
    for i in list1:
        i['percentage']+","+i['rank']
Run Code Online (Sandbox Code Playgroud)

我只想写一个if else语句.由于我有100多个案例.

我可以使用ConfigParser或其他任何东西来处理这个问题,而不是编写这些if else语句.

python python-2.7

1
推荐指数
1
解决办法
76
查看次数

Datastax重命名表

我已经在Google云端部署了9个节点的集群。

创建一个表并加载数据。现在要更改表名称。

有什么办法可以更改Cassandra中的表名吗?

谢谢

cassandra datastax-enterprise

0
推荐指数
1
解决办法
6344
查看次数