C - Eratosthenes的筛子 - BitField

Mat*_*ias 8 c arrays sieve sieve-of-eratosthenes bit-fields

我即将实施Eratosthenes筛,并对筛阵有一个普遍的问题.

我现在已经实施了几次筛子(在C中),并且总是使用一组uint8_t(外<stdint.h>)作为筛子.这是非常低效的内存,因为每个数字都使用8位来筛选,即使一位应该足够.

我怎么会用C来解决这个问题呢?我需要一个位数组.我可以几乎创建任何类型的(阵列uint8_t,uint16_t,uint32_t,uint64_t),并与比特掩码等访问单个位

我应该选择哪种数据类型以及在没有性能损失的情况下应该使用哪些操作来访问这些位?

PS:我不认为这是一个重复的只是一个BitArray实现,因为它的问题是具体的关于埃拉托色尼的筛,因为它的主要性质必须是有效的(不仅在内存使用情况,但在访问).我在想,也许可以使用不同的技巧来使筛分过程更有效...

dbu*_*ush 3

正如 Weather Vane 在他的评论中提到的,您可以通过仅考虑所有其他数字来节省额外的空间,因为除 2 之外的所有偶数都是非素数。

因此,在位数组中,每个位代表一个奇数。

这是我几年前使用这种技术完成的一个实现。

#include <stdio.h>
#include <stdlib.h>
#include <fcntl.h>
#include <time.h>
#include <math.h>
#include <stdint.h>

uint8_t *num;
int count = 0;
FILE *primefile;

int main(int argc, char *argv[])
{
  int i,j,root;
  time_t t;

  if (argc>1) count=atoi(argv[1]);
  if (count < 100) {
    fprintf(stderr,"Invalid number\n");
    exit(1);
  }
  if ((num=calloc(count/16,1))==NULL) {
    perror("calloc failed");
    exit(1);
  }
  if ((primefile=fopen("primes.dat","w"))==NULL) {
    perror("Coundn't open primes.dat");
    exit(1);
  }
  t=time(NULL);
  printf("Start:\t%s",ctime(&t));
  root=floor(sqrt(count));
  // write 2 to the output file
  i=2;
  if (fwrite(&i,sizeof(i),1,primefile)==0) {
    perror("Couldn't write to primes.dat");
  }
  // process larger numbers
  for (i=3;i<count;i+=2) {
    if ((num[i>>4] & (1<<((i>>1)&7)))!=0) continue;
    if (fwrite(&i,sizeof(i),1,primefile)==0) {
      perror("Couldn't write to primes.dat");
    }
    if (i<root) {
      for (j=3*i;j<count;j+=2*i) {
        num[j>>4]|=(1<<((j>>1)&7));
      }
    }
  }
  t=time(NULL);
  printf("End:\t%s",ctime(&t));
  fclose(primefile);
  return 0;
}
Run Code Online (Sandbox Code Playgroud)

这里num是位数组,根据搜索的上限动态分配。因此,如果您要查找 1000000000(10 亿)以内的所有素数,则它会使用 64000000(6400 万)字节的内存。

关键表达式如下:

对于“正常”位数​​组:

设置位i

num[i>>3] |= (1<<(i&7);
// same as num[i/8] |= (1<<((i%8));
Run Code Online (Sandbox Code Playgroud)

检查位i

(num[i>>3] & (1<<(i&7))) != 0
// same as (num[i/8] & (1<<(i%8))) != 0
Run Code Online (Sandbox Code Playgroud)

由于我们只跟踪所有其他数字,因此我们除以i2(或等效地右移 1:

num[i>>4] |= (1<<((i>>1)&7);
// same as num[(i/2)/8] |= (1<<(((i/2)%8));

(num[i>>4] & (1<<((i>>1)&7))) != 0
// same as (num[(i/2)/8] & (1<<((i/2)%8))) != 0
Run Code Online (Sandbox Code Playgroud)

在上面的代码中,有一些微优化,其中除以 2 的幂的除法和模被替换为位移位和按位与掩码,但大多数编译器应该为您执行此操作。