我一直在挖掘Linux内核的某些部分,发现这样的调用:
if (unlikely(fd < 0))
{
/* Do something */
}
Run Code Online (Sandbox Code Playgroud)
要么
if (likely(!err))
{
/* Do something */
}
Run Code Online (Sandbox Code Playgroud)
我找到了它们的定义:
#define likely(x) __builtin_expect((x),1)
#define unlikely(x) __builtin_expect((x),0)
Run Code Online (Sandbox Code Playgroud)
我知道它们是为了优化,但它们是如何工作的?使用它们可以预期性能/尺寸减少多少?至少在瓶颈代码中(当然在用户空间中)是否值得麻烦(并且可能失去可移植性).
我遇到了#define
他们使用的一个__builtin_expect
.
文件说:
内置功能:
long __builtin_expect (long exp, long c)
您可以使用
__builtin_expect
为编译器提供分支预测信息.一般来说,你应该更喜欢使用实际的配置文件反馈(-fprofile-arcs
),因为程序员在预测程序实际执行情况方面是非常糟糕的.但是,有些应用程序难以收集此数据.返回值是值
exp
,它应该是一个整数表达式.内置的语义是预期的exp == c
.例如:Run Code Online (Sandbox Code Playgroud)if (__builtin_expect (x, 0)) foo ();
表示我们不打算打电话
foo
,因为我们预计x
会为零.
那么为什么不直接使用:
if (x)
foo ();
Run Code Online (Sandbox Code Playgroud)
而不是复杂的语法__builtin_expect
?
在回答另一个问题时,我对此感到好奇.我很清楚
if( __builtin_expect( !!a, 0 ) ) {
// not likely
} else {
// quite likely
}
Run Code Online (Sandbox Code Playgroud)
通过做一些暗示处理器/更改汇编代码顺序/某种魔术的东西,将使"非常可能"的分支更快(通常).(如果有人能澄清那个也很棒的魔法).
但这是否适用于a)内联ifs,b)变量和c)除0和1以外的值?即会
__builtin_expect( !!a, 0 ) ? /* unlikely */ : /* likely */;
Run Code Online (Sandbox Code Playgroud)
要么
int x = __builtin_expect( t / 10, 7 );
if( x == 7 ) {
// likely
} else {
// unlikely
}
Run Code Online (Sandbox Code Playgroud)
要么
if( __builtin_expect( a, 3 ) ) {
// likely
// uh-oh, what happens if a is 2?
} else {
// unlikely
} …
Run Code Online (Sandbox Code Playgroud)