The*_*ask 5 c c++ compiler-construction algorithm register-allocation
我正在尝试为 Trees 实现一种代码生成/寄存器分配算法,以支持我的旧算法,我将所有内容都放在堆栈中。现在我正在尝试实现Sethi-Ullman 算法,但仅从我在维基百科和一些网页上找到的内容来看,算法的某些部分对我来说仍然不清楚。
我正在寻找对一些伪代码/C/C++ 工作代码缺少的部分的解释。
1)我应该使用哪种方法来选择免费注册?即,正在使用的寄存器堆栈。我正在使用我认为非常糟糕的东西:交替返回寄存器:如果以前使用的寄存器是 R0,则返回 R1。如果是 R1,则返回 R0,依此类推。它不适用于小表达式。
2) 我应该在label(left) >= K and label(right) >= K什么时候做什么?
这是label和sethi-ullman功能
REG reg()
{
static REG r = REG_NONE;
switch(r) {
case REG_NONE:
r = REG_r0;
break;
case REG_r0:
r = REG_r1;
break;
case REG_r1:
r = REG_r0;
break;
default:
assert(0);
break;
}
return r;
}
void SethiUllman(AST *node)
{
static const int K = 2;
if(node->left != NULL && node->right != NULL) {
int l = node->left->n;
int r = node->right->n;
if(l >= K && r >= K) {
SethiUllman(node->right);
node->n = node->n - 1;
//emit(node->right, REG_r0);
SethiUllman(node->left);
//emit(node->left, REG_r1);
}
else if(l >= r) {
SethiUllman(node->left);
SethiUllman(node->right);
node->n = node->n - 1;
}
else if(l < r) {
SethiUllman(node->right);
SethiUllman(node->left);
node->n = node->n - 1;
}
node->reg = reg();
printf("%s %s,%s\n",
op_string(node->type),
reg_string(node->left->reg),
reg_string(node->right->reg));
}
else if(node->type == TYPE::id) {
node->n = node->n + 1;
node->reg = reg();
emit(node);
}
else {
node->reg = reg();
emit(node);
}
}
void label(AST *node)
{
if(node == NULL)
return;
label(node->left);
label(node->right);
if(node->left != NULL && node->right != NULL) {
int l = node->left->n;
int r = node->right->n;
if(l == r)
node->n = 1 + l;
else
node->n = max(1, l, r);
}
else if(node->type == TYPE::id) {
node->n = 1;
} else if(node->type == TYPE::number) {
node->n = 0;
}
}
Run Code Online (Sandbox Code Playgroud)
对于来自这样的 exp 的树:
2+b*3
Run Code Online (Sandbox Code Playgroud)
它确实生成:
LOAD R0,[b]
LOAD R1,3
MUL R0,R1
LOAD R1,2
ADD R1,R0
Run Code Online (Sandbox Code Playgroud)
从这样的一个:
8+(2+b*3)
Run Code Online (Sandbox Code Playgroud)
它确实生成:
LOAD R0,[b]
LOAD R1,3
MUL R0,R1
LOAD R1,2
ADD R1,R0
LOAD R1,8 < R1 is not preserved. I don't know how it should be done.
ADD R0,R1
Run Code Online (Sandbox Code Playgroud)
上面我只提供了主要算法,但如果需要,我可以为您机器上的测试用例提供完整代码。
我不太明白为什么这个8+(2+b*3)表达式不仅仅“起作用”,因为对我来说,表达式在计算中不应该需要超过 2 个寄存器。但是,如果您无法在两个寄存器中执行整个计算,那么您需要进行“溢出” - 将寄存器存储在临时(堆栈)位置,然后在您再次需要时从该临时位置恢复值。
这是您发布的代码:
LOAD R0,[b]
LOAD R1,3
MUL R0,R1 ; R0 = b*3
LOAD R1,2
ADD R1,R0 ; R1 = 2+(b*3)
LOAD R1,8 < R1 is not preserved. I don't know how it should be done.
ADD R0,R1
Run Code Online (Sandbox Code Playgroud)
我们可以使用溢出重写它:
LOAD R0,[b]
LOAD R1,3
MUL R0,R1 ; R0 = b*3
LOAD R1,2
ADD R1,R0 ; R1 = 2+(b*3)
STORE R1, [tmp]
LOAD R1,8 < R1 is not preserved. I don't know how it should be done.
LOAD R0, [tmp]
ADD R0,R1
Run Code Online (Sandbox Code Playgroud)
但是,可以在不溢出的情况下完成,这表明您使用的实际算法是错误的:
LOAD R0,[b]
LOAD R1,3
MUL R0,R1 ; R0 = b*3
LOAD R1,2
ADD R0,R1 ; R0 = 2+(b*3)
LOAD R1,8 ; Use R0 above -> R1 is now free.
ADD R0,R1
Run Code Online (Sandbox Code Playgroud)
或者,同样:
LOAD R0,[b]
LOAD R1,3
MUL R0,R1 ; R0 = b*3
LOAD R1,2
ADD R1,R0 ; R1 = 2+(b*3)
LOAD R0,8 ; Store in R1 above -> R0 is now free.
ADD R0,R1
Run Code Online (Sandbox Code Playgroud)
我不确定,但我认为这很可能是您选择第一ADD条指令的左/右操作数的方法。
我会添加一些打印输出来遵循代码,并看看它在不同情况下的作用。