多线程 unordered_map

Question

多线程 unordered_map

Sur*_*cle 1 c++ multithreading hashtable c++11

我在多线程环境中工作。基本上，我有一个unordered_map可以同时被多个线程访问的对象。现在，我的算法是：

function foo(key) {
  scoped_lock()
  if key exists {
    return Map[key]
  }

  value = get_value()
  Map[key] = value
}

Run Code Online (Sandbox Code Playgroud)

显然，这种实现的性能并不好。我可以使用任何算法/方法来提高性能吗？

编辑：

我做了一些测试，我想到了双重检查锁定。所以，我修改了代码：

function foo(key) {
  if key exists {
    return Map[key]
  }

  scoped_lock()
  if key exists {
    return Map[key]
  }

  value = get_value()
  Map[key] = value
}

Run Code Online (Sandbox Code Playgroud)

实际上我只在 scoped_lock() 之前添加了另一个检查。在这种情况下，假设函数被调用了N多次。如果m对foo, where的第一次调用m < N填充了地图，而接下来的N - m调用仅从地图中获取值，则我不需要独占访问权限。此外，在scoped_lock确保线程安全之后还有另一个检查。我对吗？无论如何，第一个代码的执行需要~208s，而第二个代码需要~200s。

Answer 1

Yak*_*ont 5

这是一个实用程序类：

template<class T, class M=std::mutex, template<class...>class S=std::unique_lock, template<class...>class U=std::unique_lock>
struct mutex_protected {
  template<class F>
  auto read( F&& f ) const
  -> typename std::result_of<F&&(T const&)>::type
  {
    auto l = lock();
    return std::forward<F>(f)(data);
  }
  template<class F>
  auto write( F&& f ) 
  -> typename std::result_of<F&&(T&)>::type
  {
    auto l = lock();
    return std::forward<F>(f)(data);
  }
  mutex_protected(mutex_protected&&)=delete;
  mutex_protected& operator=(mutex_protected&&)=delete;

  template<class...Args>
  mutex_protected( Args&&...args ):
    data( std::forward<Args>(args)... )
  {}
private:
  mutable M m;
  T data;

  U<M> lock() { return U<M>(m); }
  S<M> lock() const { return S<M>(m); }
};

Run Code Online (Sandbox Code Playgroud)

它，尤其是在c++14 中，允许您以易于编写的方式与受互斥锁保护的数据实例交互。

在c++14 中你可以使用std::shared_timed_mutex，在c++17 中你可以这样使用std::shared_mutex：

template<class T>
using rw_guarded = mutex_guarded< T, std::shared_mutex, std::shared_lock >;

Run Code Online (Sandbox Code Playgroud)

这使得能够同时拥有多个读者。但是您应该首先确定简单的互斥锁是否足够快。

struct cache {
  using Key=std::string;
  using Value=int;
  using Map=std::unordered_map< Key, Value >;
  Value get( Key const& k ) {
    Value* r = table.read([&](Map const& m)->Value*{
      auto it = m.find(k);
      if (it == m.end()) return nullptr;
      return std::addressof( it->second );
    });
    if (r) return *r;
    return table.write([&](Map& m)->Value{
      auto it = m.find(k);
      if (it != m.end()) return it->second;
      auto r = m.insert( std::make_pair(k, 42) ); // construct data here
      return r.first->second;
    });
  }
private:
  mutex_guarded< std::unordered_map< Key, Value > > table;
};

Run Code Online (Sandbox Code Playgroud)

升级mutex_guarded到rw_guarded并切换到读写锁。

这是一个更复杂的版本：

有两张地图；一为价值，一为价值共享未来。

使用读写锁（又名共享互斥锁）。

要获取，获取共享锁。检查它是否在那里。如果是，返回。

解锁第一张地图。锁定第二张地图进行写作。如果钥匙下还没有共同的未来，请添加一个。解锁地图 2，并等待共享的未来，无论您是否添加它。

完成后，锁定第一张地图以供阅读；检查结果是否已经存在。如果是，请将其退回。如果没有，解锁，重新锁定写入，如果数据不存在，则将数据移入映射 1，返回第一个映射中的数据。

这旨在最小化映射 1 被独占锁定的周期，从而允许最大并发。

其他设计将优化其他考虑因素。

千万不能使用operator[]。不要在没有某种活动锁的情况下与任何地图交互。知道哪个锁对应哪个映射。请注意，在某些情况下，可以在没有锁定的情况下读取元素（不查找）。有时需要阅读共享事物的副本，而不是共享事物。查看每种类型的文档以确定哪些操作需要哪些锁。

归档时间：	7 年，11 月前
查看次数：	1857 次
最近记录：	7 年，10 月前