Bah*_*lov 3 c++ parallel-processing std c++17 c++20
我最近一直在从事一个项目,遇到一个问题,我不想在小向量上使用std::execution::par,因为这会产生开销。
理论上来说,这可以通过返回std::execution::par或std::execution::seq的函数来解决,具体取决于向量的总大小乘以每个元素的大小,并将其与固定值进行比较。但问题是它们的类型不同,这意味着它们无法退回。我们也可以只返回一个布尔值是否值得并行,但这会导致讨厌的分支,我不希望这样。我只是想知道是否有一种方法可以巧妙地解决这个问题
嗯,他们使这些类型变得不同;大概是为了避免这种运行时决策。这至少会导致严重的代码膨胀,因为现在每个算法都必须实例化。但如果你认为有必要,这是我能想到的最短的:
#include <algorithm>
#include <execution>
#include <thread>
#include <variant>
using execution_variant = std::variant<
std::execution::sequenced_policy, std::execution::parallel_policy>;
execution_variant select_execution(std::size_t items)
{
if(items > std::thread::hardware_concurrency() * 16)
return std::execution::par;
return std::execution::seq;
}
void sort(std::vector<int>& vec)
{
std::visit([&](auto policy) {
std::sort(policy, vec.begin(), vec.end()); },
select_execution(vec.size()));
}
Run Code Online (Sandbox Code Playgroud)
或者使用帮助程序使调用站点更加简洁:
struct Execution
{
execution_variant var;
template<class Fun>
auto operator()(Fun&& fun) const
{ return std::visit(fun, var); }
static Execution select(std::size_t items)
{
if(items > std::thread::hardware_concurrency() * 16)
return {std::execution::par};
return {std::execution::seq};
}
};
void sort(std::vector<int>& vec)
{
Execution::select(vec.size())([&](auto policy) {
std::sort(policy, vec.begin(), vec.end()); });
}
Run Code Online (Sandbox Code Playgroud)