小编sen*_*en_的帖子

为什么不将时间戳与交错排序键一起使用?

我正在尝试找出Amazon Redshift中不同类型的sortkey,并且在这里遇到了一个奇怪的警告,未作解释:

重要提示:请勿在具有单调递增属性的列(例如标识列,日期或时间戳)上使用交错排序键。

但是,在他们自己的示例中,Amazon在日期列上使用交织键具有良好的性能。

因此,我的问题是-此警告的解释是什么,我应该认真对待吗?更准确地说-在时间戳列上使用交错键是否有问题?

amazon-redshift

5
推荐指数
2
解决办法
319
查看次数

集合真的比列表快吗?

有人告诉我,在成员资格测试方面,Python 集合比列表更快。

尽管如此,timeit表明对于大量值列表实际上更快。

对于具有更多重复的较小集合,差异更小甚至相反,但是集合仍然没有显着优势(我猜性能问题对于非常大的数据集更为重要,不是吗?)

如何解释这些数据?

>>> import timeit
>>> # Few repetitions on a bigger set:
>>> timeit.timeit('10000 in set(range(10000000))', number=10)
9.265543753999737
>>> timeit.timeit('10000 in list(range(10000000))', number=10)
4.788996731000225
>>> # More repetitions on a smaller set:
>>> timeit.timeit('10000 in set(range(10000))', number=100000)
32.068307194000226
>>> timeit.timeit('10000 in list(range(10000))', number=100000)
32.45919990500079
Run Code Online (Sandbox Code Playgroud)

python performance

2
推荐指数
1
解决办法
920
查看次数

标签 统计

amazon-redshift ×1

performance ×1

python ×1