小编San*_*zco的帖子

我想解决以下问题。我必须在一个非常大的集合中进行采样，数量级为 10^20，并提取一个样本而没有重复大小约为 10%-20% 的样本。鉴于集合的大小，我认为像 Fisher-Yates 这样的算法是不可行的。

我在想像随机路径树这样的东西可能适用于 O(n log n) 并且不能更快地完成，但我想问一下是否已经实现了这样的东西。

感谢您的时间！

4
推荐指数

1
解决办法

787
查看次数

小编San_zco的帖子