返回堆栈缓冲区?

use*_*595 7 cpu x86 branch-prediction

据我所知,Return Stack Buffer仅支持4到16个条目(来自wiki:http://en.wikipedia.org/wiki/Branch_predictor#Prediction_of_function_returns)并且不是键值对(基于ret指令位置的索引) ).这是真的吗?上下文切换发生时RSB会发生什么?

假设我们进入了50个函数,这些函数在返回堆栈缓冲区长度为16的CPU中没有返回,之后会发生什么?这是否意味着所有预测都失败了?你能说明一下吗?这种情况在递归函数调用中是否相同?

谢谢!

Lew*_*sey 1

BPU 可以包含自己的 RAS 预测器,当它预测 BTB 中的调用类型时,它将假设的调用 NLIP(后续指令的 IP)推送到 RAS 堆栈上。它在 BTB 中预测的下一个返回将使用 RAS 的顶部作为预测地址(就像当它预测常规间接分支时,ITA 中的并行命中将超越 BTB 中的目标地址)。

BAC 将在解码时通过将每个调用指令的 NLIP 推送到其自己的 RSB 来验证/覆盖这些返回目标预测,下一个返回地址的预测将与该地址进行比较。如果不正确,BAC 将发出 BAclear 并将管道起始处的下一个 IP 逻辑重新引导到正确的返回地址(如果 RSB 已损坏,这可能是错误的)。它可能会用 BAC RSB 状态覆盖 RAS 预测器堆栈。

在一种实现中,BAC向其验证的每个分支预测以及失败地址提供TOS指针。一旦执行了分支并且知道了实际结果,如果发生错误预测,则恢复 RSB TOS。我认为更有效的是在退役时拥有一个架构 RSB,在管道刷新/错误预测时将其复制到 BAC RSB 和 RAS 预测器中。这可以防止恢复到损坏的 RSB。

RAS 预测器可能是一个循环堆栈,根据实现的不同,它可能有也可能没有上溢和下溢检查和保证。当堆栈已满时,新的预测可能会覆盖最旧的预测,以便它始终是最新的(而不是阻止它在满时添加,这意味着保留一个计数器,以了解有多少调用/返回其无法进行预测为了)。对于下溢,它可能拒绝进行预测,而是使用 ITA 进行预测。如果 RSB 下溢,它可能不会覆盖 RAS 预测器所做的预测。

当宏指令的最后一个微指令执行时,上下文切换的硬件中断会导致管道被清除。RSB 可能会恢复到架构状态以在中断后继续运行。预测器 RAS / BAC RSB 很可能会被刷新为微代码,并且如果它被损坏,它最终不会损坏自身。