使用PRNG而不是改组来生成随机范围

Bar*_*lly 23 language-agnostic random algorithm shuffle

在给定任意种子值的情况下,是否有任何已知的算法可以在线性时间和常数空间(当迭代生成输出时)生成混洗范围[0..n]?

假设n可能很大,例如数百万,因此不需要潜在地产生每种可能的排列,尤其是因为它是不可行的(种子值空间需要很大).这也是需要恒定空间的原因.(所以,我特别不是在寻找一种阵列混洗算法,因为这需要将范围存储在长度为n的数组中,因此会使用线性空间.)

我知道问题162606,但它没有给出这个特定问题的答案 - 从排列索引到该问题中给出的排列的映射需要巨大的种子值空间.

理想情况下,它的行为类似于具有周期和范围的LCGn,但选择ac制作LCG 的艺术是微妙的.只要满足约束a,并c在一个完整周期LCG可满足我的要求,但如果有更好的想法在那里我想知道.

Fry*_*Guy 6

基于Jason的回答,我在C#中做了一个简单直接的实现.找到大于N的下一个最大幂2.这使得生成a和c变得微不足道,因为c需要相对素数(意味着它不能被2整除,也就是奇数),并且(a-1)需要可以被2整除,并且(a-1)需要被4整除.从统计上来说,它应该需要1-2个同余来生成下一个数字(因为2N> = M> = N).

class Program
{
    IEnumerable<int> GenerateSequence(int N)
    {
        Random r = new Random();
        int M = NextLargestPowerOfTwo(N);
        int c = r.Next(M / 2) * 2 + 1; // make c any odd number between 0 and M
        int a = r.Next(M / 4) * 4 + 1; // M = 2^m, so make (a-1) divisible by all prime factors, and 4

        int start = r.Next(M);
        int x = start;
        do
        {
            x = (a * x + c) % M;
            if (x < N)
                yield return x;
        } while (x != start);
    }

    int NextLargestPowerOfTwo(int n)
    {
        n |= (n >> 1);
        n |= (n >> 2);
        n |= (n >> 4);
        n |= (n >> 8);
        n |= (n >> 16);
        return (n + 1);
    }

    static void Main(string[] args)
    {
        Program p = new Program();
        foreach (int n in p.GenerateSequence(1000))
        {
            Console.WriteLine(n);
        }

        Console.ReadKey();
    }
}
Run Code Online (Sandbox Code Playgroud)


Day*_*Day 6

以下是来自FryGuy答案线性同余生成的Python实现.因为无论如何我都需要写它并认为它可能对其他人有用.

import random
import math

def lcg(start, stop):
    N = stop - start

    # M is the next largest power of 2
    M = int(math.pow(2, math.ceil(math.log(N+1, 2))))

    # c is any odd number between 0 and M
    c = random.randint(0, M/2 - 1) * 2 + 1

    # M=2^m, so make (a-1) divisible by all prime factors and 4
    a = random.randint(0, M/4 - 1) * 4 + 1

    first = random.randint(0, M - 1)
    x = first
    while True:
        x = (a * x + c) % M
        if x < N:
            yield start + x
        if x == first:
            break

if __name__ == "__main__":
    for x in lcg(100, 200):
        print x,
Run Code Online (Sandbox Code Playgroud)


Jas*_*n S 5

听起来你想要一个保证产生从 0 到 n-1 的循环而没有任何重复的算法。根据您的要求,几乎可以肯定有一大堆这些;如果您想深入研究其背后的理论,群论将是最有用的数学分支。

如果您想要快速并且不关心可预测性/安全性/统计模式,LCG 可能是最简单的方法。您链接到的维基百科页面包含这组(相当简单的)要求:

一般LCG的周期最多为m,而对于一些选择,a远小于这个。当且仅当:

  1. c 和 m 互质,
  2. a - 1 可以被 m 的所有质因数整除
  3. 如果 m 是 4 的倍数,则 a - 1 是 4 的倍数

或者,您可以选择一个周期 N >= n,其中 N 是具有方便数值属性的最小值,并且只丢弃在 n 和 N-1 之间产生的任何值。例如,最低的 N = 2 k - 1 >= n 将允许您使用线性反馈移位寄存器(LFSR)。或者找到你最喜欢的加密算法(RSA、AES、DES 等等)并给定一个特定的密钥,找出它排列的数字的空间 N,并对每一步应用一次加密。

如果 n 很小但您希望安全性较高,那可能是最棘手的情况,因为任何序列 S 的周期 N 都可能远高于 n,但导出周期较短的非重复数字序列也很重要比 N。(例如,如果您可以采用 S mod n 的输出并保证不重复的数字序列,这将提供有关 S 的信息,攻击者可能会使用)