如何将元素添加到数组的线程安全函数？

Question

如何将元素添加到数组的线程安全函数？

Suy*_*a87 1 c++ multithreading thread-safety c++11 stdthread

我编写了以下函数，它接受一个对象 ( element)，在现有向量 ( elements) 中为它腾出空间，并通过添加新对象来更新向量：

void addElement(const ElementType& element) {
    if (numElements == elements.size()) {
        elements.resize(boost::extents[numElements+1]);
    }

    elements[numElements] = element;

    numElements++;
}

Run Code Online (Sandbox Code Playgroud)

我怎样才能使它对 MPI 线程安全？据我了解，每个线程都知道的大小elements是多少，因此我不明白为什么这个函数不是线程安全的。numElements在此函数外初始化为零，并且是elements向量的大小。

编辑：我使用上面写的函数和 mtx 锁定和解锁如下，但最终elements向量仍然只包含来自第一级的数据。

    #pragma omp parallel for collapse(3) schedule(static)
    for (long n0 = mgr->startN0; n0 < mgr->startN0 + mgr->localN0; n0++) {
      for (int n1 = 0; n1 < ?; n1++) {
        for (int n2 = 0; n2 < ?; n2++) {
          ElementType element;
          std::mutex mtx;
            for(int i=0;i<g_field[n0][n1][n2];i++){
              ... do stuff with element ...
              mtx.lock();
              #pragma omp critical
              addElement(element);
              mtx.unlock();}
       }
     }
   }

Run Code Online (Sandbox Code Playgroud)

编辑：出于速度原因，我不得不稍微更改功能及其使用：

void addElements_MPI(std::vector<ElementType> new_batch,std::mutex& mtx) {

  std::lock_guard<std::mutex> lock(mtx); 
  elements.resize(boost::extents[elements.num_elements()+new_batch.size()]); 

  std::copy(new_batch.begin(), new_batch.end(), elements.begin()+numElements); 

  numElements += new_batch.size();
}

Run Code Online (Sandbox Code Playgroud)

std::mutex mtx;
std::vector<ElementType> all_elements;
#pragma omp parallel for collapse(3) schedule(static)
    for (long n0 = mgr->startN0; n0 < mgr->startN0 + mgr->localN0; n0++) {
      for (int n1 = 0; n1 < ?; n1++) {
        for (int n2 = 0; n2 < ?; n2++) {

          ElementType element;

            for(int i=0;i<g_field[n0][n1][n2];i++){
              ... do stuff with element ...
              mtx.lock();
              #pragma omp critical
              all_elements.push_back(element);
              mtx.unlock();}
       }
     }
   }
 mtx.lock();
 #pragma omp critical
 addElement_MPI(all_elements,mtx);
 mtx.unlock();

Run Code Online (Sandbox Code Playgroud)

Answer 1

Nut*_*ker 5

首先，让我们看看数据竞争何时发生：

两个或多个线程同时访问同一个内存位置
至少有一次访问是为了写
线程不使用任何排他锁来控制他们对该内存的访问

在您的情况下，一个线程可以添加元素，而另一个线程正在读取elements。此外，多个线程可以同时添加新元素。要控制他们的访问，您应该锁定共享资源，即elements。

如何在 C++ 中锁定共享资源？

在 C++ 中，您可以使用std::mutex来保护共享数据不被多个线程同时访问。当std::mutex被一个线程锁定时，其他线程无法访问共享资源。一旦std::mutex被解锁，其他线程就可以访问该资源。您可以使用std::mutex::lock并std::mutex::unlock喜欢：

std::mutex mtx;
ElementsType elements;

...
mtx.lock();

// only one thread accesses this part at a time
// work with elements

mtx.unlock();

Run Code Online (Sandbox Code Playgroud)

开发人员经常忘记一些东西......

由于开发人员经常忘记一些事情......比如解锁std::mutex被锁定的...... C++ 提供std::lock_guard（在 C++11 的std::scoped_lock情况下）和（在 C++17 的情况下）。您可以将std::lock_guard并std::scoped_lock视为某种包装器，它们将std::mutex实例作为构造函数的参数并将该std::mutex实例锁定在构造函数中。当std::lock_guard或std::scoped_lock实例被破坏时，std::mutex实例会自动解锁。

void addElement(const ElementType& element) {
    std::lock_guard<std::mutex> lock(mtx); // similar to mtx.lock()

    if (numElements == elements.size()) {
        elements.resize(boost::extents[numElements+1]);
    }

    elements[numElements] = element;

    numElements++;

    // no need for mtx.unlock() since lock instance is now destructed and mutex is automatically unlocked
}

Run Code Online (Sandbox Code Playgroud)

编辑

由于std::mutex是所有线程之间的某种通信通道，所有线程应该共享同一个std::mutex实例，即同一个std::mutex实例应该对所有线程可见。

在下面的情况下（我从更新的问题中获取）：

for (int n2 = 0; n2 < ?; n2++) {
    ElementType element;
    std::mutex mtx;
    for(int i=0;i<g_field[n0][n1][n2];i++){
         // ... do stuff with element ...
         mtx.lock();
         #pragma omp critical
         addElement(element);
         mtx.unlock();}
    }
}

Run Code Online (Sandbox Code Playgroud)

std::mutex正在创建 N 次，每个线程创建自己的std::mutex实例，这没有任何意义，因为它们无法相互通信。相反，一个std::mutex实例应该对所有线程可见，就像elements对所有线程可见一样。

@Choumbie你错过了一件事......你在函数本身中定义了`std::mutex`，所以每个线程都有自己的`std::mutex`，但所有线程应该共享相同的`std::mutex`，因为它是所有线程之间的某种通信通道。我建议您定义对所有线程可见的全局`std::mutex`实例，它可以在定义`elements`的地方定义。 (3认同)
（已投票）但我认为对数据争用何时发生以及“std::lock_guard”和“std::scoped_lock”的答案进行了一些解释。 (2认同)

归档时间：	5 年，6 月前
查看次数：	85 次
最近记录：	5 年，6 月前