我想解决以下问题。我必须在一个非常大的集合中进行采样,数量级为 10^20,并提取一个样本而没有重复大小约为 10%-20% 的样本。鉴于集合的大小,我认为像 Fisher-Yates 这样的算法是不可行的。
我在想像随机路径树这样的东西可能适用于 O(n log n) 并且不能更快地完成,但我想问一下是否已经实现了这样的东西。
感谢您的时间!
sorting algorithm sampling resampling
algorithm ×1
resampling ×1
sampling ×1
sorting ×1