Chudnovsky二元分裂和分解

Question

Chudnovsky二元分裂和分解

qwr*_*qwr 22 c recursion pi gmp factoring

在本文中,给出了使用二进制分裂的Chudnovsky pi公式的快速递归公式.在python中:

C = 640320
C3_OVER_24 = C**3 // 24
def bs(a, b):
    if b - a == 1:
        if a == 0:
            Pab = Qab = 1
        else:
            Pab = (6*a-5)*(2*a-1)*(6*a-1)
            Qab = a*a*a*C3_OVER_24
        Tab = Pab * (13591409 + 545140134*a) # a(a) * p(a)
        if a & 1:
            Tab = -Tab
    else:
        m = (a + b) // 2
        Pam, Qam, Tam = bs(a, m)
        Pmb, Qmb, Tmb = bs(m, b)

        Pab = Pam * Pmb
        Qab = Qam * Qmb
        Tab = Qmb * Tam + Pam * Tmb
    return Pab, Qab, Tab

N = int(digits/DIGITS_PER_TERM + 1)
# Calclate P(0,N) and Q(0,N)
P, Q, T = bs(0, N)
one = 10**digits
sqrtC = sqrt(10005*one, one)
return (Q*426880*sqrtC) // T

Run Code Online (Sandbox Code Playgroud)

这种方法已经非常快了,但有人提到GMP库网站上的实现gmp-chudnovsky.c也会影响二进制分裂中的分子和分母.由于代码已经过优化且难以理解,因此如何完成这一操作背后的一般概念是什么？我不知道分数是否被简化,数字是分解形式而不是完全相乘,或两者兼而有之.

这是二进制拆分的代码示例:

/* binary splitting */
void
bs(unsigned long a, unsigned long b, unsigned gflag, long int level)
{
  unsigned long i, mid;
  int ccc;

  if (b-a==1) {
    /*
      g(b-1,b) = (6b-5)(2b-1)(6b-1)
      p(b-1,b) = b^3 * C^3 / 24
      q(b-1,b) = (-1)^b*g(b-1,b)*(A+Bb).
    */
    mpz_set_ui(p1, b);
    mpz_mul_ui(p1, p1, b);
    mpz_mul_ui(p1, p1, b);
    mpz_mul_ui(p1, p1, (C/24)*(C/24));
    mpz_mul_ui(p1, p1, C*24);

    mpz_set_ui(g1, 2*b-1);
    mpz_mul_ui(g1, g1, 6*b-1);
    mpz_mul_ui(g1, g1, 6*b-5);

    mpz_set_ui(q1, b);
    mpz_mul_ui(q1, q1, B);
    mpz_add_ui(q1, q1, A);
    mpz_mul   (q1, q1, g1);
    if (b%2)
      mpz_neg(q1, q1);

    i=b;
    while ((i&1)==0) i>>=1;
    fac_set_bp(fp1, i, 3);  /*  b^3 */
    fac_mul_bp(fp1, 3*5*23*29, 3);
    fp1[0].pow[0]--;

    fac_set_bp(fg1, 2*b-1, 1);  /* 2b-1 */
    fac_mul_bp(fg1, 6*b-1, 1);  /* 6b-1 */
    fac_mul_bp(fg1, 6*b-5, 1);  /* 6b-5 */

    if (b>(int)(progress)) {
      printf("."); fflush(stdout);
      progress += percent*2;
    }

  } else {
    /*
      p(a,b) = p(a,m) * p(m,b)
      g(a,b) = g(a,m) * g(m,b)
      q(a,b) = q(a,m) * p(m,b) + q(m,b) * g(a,m)
    */
    mid = a+(b-a)*0.5224;     /* tuning parameter */
    bs(a, mid, 1, level+1);

    top++;
    bs(mid, b, gflag, level+1);
    top--;

    if (level == 0)
      puts ("");

    ccc = level == 0;

    if (ccc) CHECK_MEMUSAGE;

    if (level>=4) {           /* tuning parameter */
#if 0
      long t = cputime();
#endif
      fac_remove_gcd(p2, fp2, g1, fg1);
#if 0
      gcd_time += cputime()-t;
#endif
    }

    if (ccc) CHECK_MEMUSAGE;
    mpz_mul(p1, p1, p2);

    if (ccc) CHECK_MEMUSAGE;
    mpz_mul(q1, q1, p2);

    if (ccc) CHECK_MEMUSAGE;
    mpz_mul(q2, q2, g1);

    if (ccc) CHECK_MEMUSAGE;
    mpz_add(q1, q1, q2);

    if (ccc) CHECK_MEMUSAGE;
    fac_mul(fp1, fp2);

    if (gflag) {
      mpz_mul(g1, g1, g2);
      fac_mul(fg1, fg2);
    }
  }

  if (out&2) {
    printf("p(%ld,%ld)=",a,b); fac_show(fp1);
    if (gflag)
      printf("g(%ld,%ld)=",a,b); fac_show(fg1);
  }
}

Run Code Online (Sandbox Code Playgroud)

Answer 1

Pet*_*lor 6

以下评论是关键:

/*
    g(b-1,b) = (6b-5)(2b-1)(6b-1)
    p(b-1,b) = b^3 * C^3 / 24
    q(b-1,b) = (-1)^b*g(b-1,b)*(A+Bb).
*/

Run Code Online (Sandbox Code Playgroud)

/*
    p(a,b) = p(a,m) * p(m,b)
    g(a,b) = g(a,m) * g(m,b)
    q(a,b) = q(a,m) * p(m,b) + q(m,b) * g(a,m)
*/

Run Code Online (Sandbox Code Playgroud)

/*
          p*(C/D)*sqrt(C)
    pi = -----------------
             (q+A*p)
*/

Run Code Online (Sandbox Code Playgroud)

注意:

如果我们同时调整p和q通过的因素k在最后的划分,它不会影响结果.
当计算其对应于所述第二组的意见,如果我们将缩放每个的合并操作p(a,m),g(a,m)以及q(a,m)通过k然后该因子将被简单地通过以进行p(a,b),g(a,b),q(a,b); 同样,如果我们要扩大各的p(m,b),g(m,b)和q(m,b)那么该因子将贯彻.
这条线
```
fac_remove_gcd(p2, fp2, g1, fg1);
```
Run Code Online (Sandbox Code Playgroud)
是有效的
```
k = gcd(p2, g1);
p2 /= k; // p(m,b) /= k
g1 /= k; // g(a,m) /= k
```
Run Code Online (Sandbox Code Playgroud)
这有缩小的净效应p(a,b),g(a,b)以及q(a,b)通过gcd.通过前两个观察结果,这种降尺度一直干净地贯穿到最终结果.

后记

我已经尝试了三种在Python中实现分解的方法.

使用不可变列表跟踪因子会使事情变得非常糟糕,因为维护列表的繁忙工作太多了.
使用gmpy gcd并不能提高速度
预先计算一个素数列表6 * N(即可能除以g)并测试每个素数的速度会使事情减慢2到3倍.

我得出结论,使用这种方法加速需要使用可变状态来跟踪因子分解,因此它对可维护性来说是一个很大的打击.

Answer 2

Tho*_*hel 3

我没有查看完整的代码，但我快速浏览了一下，以便更好地理解您在问题中提供的摘录。

为了回答您问题中的一些要点，请先看一下这段代码：

typedef struct {
  unsigned long max_facs;
  unsigned long num_facs;
  unsigned long *fac;
  unsigned long *pow;
} fac_t[1];

Run Code Online (Sandbox Code Playgroud)

它将新类型定义为结构（如果您根本不了解 C，可以说它就像一个嵌入变量但没有方法的基本 Pyhton 对象）。这种类型允许将整数处理为两个整数值和两个数组（例如：两个列表）：

最大因素
因素数量
因素清单
这些因素的（相应）权力列表

同时，代码保留与 libgmp 类型中的大整数相同的数字（这就是函数参数中mpz_t p和的含义）。mpz_t g

现在，您所展示的功能怎么样？它被称为fac_remove_gcd；首字母fac与前面描述的类型的名称有关；下面两个词很容易理解：将两个类型的整数fac除以它们的 gcd。

C 代码迭代两个列表中的两个因子列表；同步两个列表很容易，因为因子是有序的（else ifand语句周围的代码部分else）；每当检测到两个公共因子（初始if声明）时，除法就是一个简单的减法：在该因子的两个幂列表中减去最小幂（例如，a=2*5^3*17 和 b=3* 5^5*19，值 3 将在a和b的幂列表中与因数 5 对应的位置减去，导致 a=2*5^0*17 和 b=3*5^2*19) 。

fac在此操作期间，会创建并调用一个数字（相同类型） fmul；显然它是两个数字的最大公约数。

在此步骤之后，调用的 gcdfmul和类型fac将被转换为 GMP 大整数，函数（也在程序的代码中）称为bs_mul。这允许将 GCD 计算为大整数，以便以两种形式同步被除数的新值：大整数和特殊fac类型。一旦 GCD 被计算为一个大整数，就很容易将两个初始数除以 GCD。

因此，这些函数作用于每个初始数字的两个版本。

希望它能有所帮助。

归档时间：	10 年，3 月前
查看次数：	703 次
最近记录：	10 年，2 月前