pthreads:允许的线程数

Sig*_*ggi 2 c pthreads

我已经在一个使用pthreads的小型C程序上工作了几天.我昨天花了或多或少花了所有寻找死锁的bug,但现在我发现这个问题并不是真正的僵局.以下代码具有完全相同的问题.

#include <stdlib.h>
#include <pthread.h>
#include <semaphore.h>
#include <stdio.h>
#include <unistd.h>
#define NTHREADS 507

pthread_mutex_t runningThreadsMutex;
pthread_cond_t runningThreadsCond;
int runningThreads = 0;

void* HelloWorld(void* arg) {
  sleep(1);

  pthread_mutex_lock(&runningThreadsMutex);
  runningThreads--;
  printf("End thread %d\n", runningThreads);
  pthread_cond_signal(&runningThreadsCond);
  pthread_mutex_unlock(&runningThreadsMutex);

  return NULL;
}

int main() {
  pthread_t thread;

  pthread_mutex_init(&runningThreadsMutex, NULL);
  pthread_cond_init(&runningThreadsCond, NULL);

  for (int i = 0; i < NTHREADS; ++i) {
    pthread_mutex_lock(&runningThreadsMutex);
    printf("Create thread %d\n", runningThreads++);
    pthread_mutex_unlock(&runningThreadsMutex);
    pthread_create(&thread, NULL, HelloWorld, NULL);
  //  pthread_detach(thread);
  }

  pthread_mutex_lock(&runningThreadsMutex);
  while(runningThreads > 0) {
    pthread_cond_wait(&runningThreadsCond, &runningThreadsMutex);
  }
  pthread_mutex_unlock(&runningThreadsMutex);
  return 0;
}
Run Code Online (Sandbox Code Playgroud)

对于NTHREADS <506,上面的代码似乎在我的笔记本电脑(64位Linux机器)上运行良好.在这种情况下,它打印出如下内容:

Create thread 0
Create thread 1
.
.
.
Create thread 505
End thread 505
End thread 504
.
.
.
End thread 0
Run Code Online (Sandbox Code Playgroud)

并且应该终止.但是,如果我使用NTHREADS> = 506,例如NTHREADS = 510我得到

Create thread 0
Create thread 1
.
.
.
Create thread 509
End thread 509
End thread 508
.
.
.
End thread 4
Run Code Online (Sandbox Code Playgroud)

它停止而没有终止.所以似乎最后四个(510-506 = 4)线程永远不会终止(或者根本不会启动?).

我在旧的32位linux机器上也尝试了这个代码.在那里我得到了相同的行为,除了它适用于NTHREADS <38​​2但不适用于NTHREADS> = 382(而不是506).

当我搜索一个解决方案时,我也发现了这个问题:http://bytes.com/topic/c/answers/728087-pthreads-limit,在使用pthread_join时有人遇到同样的问题(这在工作时可能更自然与pthreads)但他们没有给出任何好的解释.

任何人都可以向我解释我做错了什么,这个代码的根本问题是什么?我想这必须对允许的线程数量有某种限制,但我应该如何处理呢?

Ant*_*ams 5

您需要检查返回值pthread_create.如果它不为零,则函数无法创建线程.一个典型的问题是新线程的堆栈内存不足.例如,每个线程使用1Mb堆栈,系统将需要至少510Mb的可用内存来启动510个线程.

你为什么要运行这么多线程?除非你有一个包含数百个处理器的大规模并行系统,否则这些线程将争夺CPU时间和其他资源.您可能会以更少的线程(与系统中处理器数量相同的数量级)以最合适的顺序完成工作.