寄存器分配算法

The*_*ask 5 c c++ compiler-construction algorithm register-allocation

我正在尝试为 Trees 实现一种代码生成/寄存器分配算法,以支持我的旧算法,我将所有内容都放在堆栈中。现在我正在尝试实现Sethi-Ullman 算法,但仅从我在维基百科和一些网页上找到的内容来看,算法的某些部分对我来说仍然不清楚。

我正在寻找对一些伪代码/C/C++ 工作代码缺少的部分的解释。

1)我应该使用哪种方法来选择免费注册?即,正在使用的寄存器堆栈。我正在使用我认为非常糟糕的东西:交替返回寄存器:如果以前使用的寄存器是 R0,则返回 R1。如果是 R1,则返回 R0,依此类推。它不适用于小表达式。

2) 我应该在label(left) >= K and label(right) >= K什么时候做什么?

这是labelsethi-ullman功能

REG reg()
{
    static REG r = REG_NONE;

    switch(r) {
        case REG_NONE:
            r = REG_r0;
            break;
        case REG_r0:
            r = REG_r1;
            break;
        case REG_r1:
            r = REG_r0;
            break;
        default:
            assert(0);
            break;
    }
    return r;
}

void SethiUllman(AST *node)
{
    static const int K = 2;

    if(node->left != NULL && node->right != NULL) {
            int l = node->left->n;
            int r = node->right->n;

            if(l >= K && r >= K) {
                SethiUllman(node->right);
                node->n = node->n - 1;
                //emit(node->right, REG_r0);
                SethiUllman(node->left);
                //emit(node->left, REG_r1);
            }
            else if(l >= r) {
                SethiUllman(node->left);
                SethiUllman(node->right);
                node->n = node->n - 1;
            }
            else if(l < r) {
                SethiUllman(node->right);
                SethiUllman(node->left);
                node->n = node->n - 1;
            }

            node->reg = reg();

            printf("%s %s,%s\n", 
                         op_string(node->type),
                         reg_string(node->left->reg),
                         reg_string(node->right->reg));

        }
    else if(node->type == TYPE::id) {
        node->n = node->n + 1;
        node->reg = reg();
        emit(node);
    }
    else {
        node->reg = reg();
        emit(node);
    }
}

void label(AST *node)
{
    if(node == NULL)
        return;

    label(node->left);
    label(node->right);

    if(node->left != NULL && node->right != NULL) {
        int l = node->left->n;
        int r = node->right->n;
        if(l == r)
            node->n = 1 + l;
        else
            node->n = max(1, l, r);
    }
    else if(node->type == TYPE::id) {
        node->n = 1;
    } else if(node->type == TYPE::number) {
        node->n = 0;
    }
}
Run Code Online (Sandbox Code Playgroud)

对于来自这样的 exp 的树:

2+b*3
Run Code Online (Sandbox Code Playgroud)

它确实生成:

LOAD R0,[b]
LOAD R1,3
MUL R0,R1
LOAD R1,2
ADD R1,R0
Run Code Online (Sandbox Code Playgroud)

从这样的一个:

8+(2+b*3)
Run Code Online (Sandbox Code Playgroud)

它确实生成:

LOAD R0,[b]
LOAD R1,3
MUL R0,R1
LOAD R1,2
ADD R1,R0
LOAD R1,8 < R1 is not preserved. I don't know how it should be done.
ADD R0,R1
Run Code Online (Sandbox Code Playgroud)

上面我只提供了主要算法,但如果需要,我可以为您机器上的测试用例提供完整代码。

Mat*_*son 2

我不太明白为什么这个8+(2+b*3)表达式不仅仅“起作用”,因为对我来说,表达式在计算中不应该需要超过 2 个寄存器。但是,如果您无法在两个寄存器中执行整个计算,那么您需要进行“溢出” - 将寄存器存储在临时(堆栈)位置,然后在您再次需要时从该临时位置恢复值。

这是您发布的代码:

LOAD R0,[b]
LOAD R1,3
MUL R0,R1     ; R0 = b*3
LOAD R1,2     
ADD R1,R0     ; R1 = 2+(b*3)
LOAD R1,8 < R1 is not preserved. I don't know how it should be done.
ADD R0,R1
Run Code Online (Sandbox Code Playgroud)

我们可以使用溢出重写它:

LOAD R0,[b]
LOAD R1,3
MUL R0,R1     ; R0 = b*3
LOAD R1,2     
ADD R1,R0     ; R1 = 2+(b*3)
STORE R1, [tmp]
LOAD R1,8 < R1 is not preserved. I don't know how it should be done.
LOAD R0, [tmp]
ADD R0,R1
Run Code Online (Sandbox Code Playgroud)

但是,可以在不溢出的情况下完成,这表明您使用的实际算法是错误的:

LOAD R0,[b]
LOAD R1,3
MUL R0,R1     ; R0 = b*3
LOAD R1,2     
ADD R0,R1     ; R0 = 2+(b*3)
LOAD R1,8     ; Use R0 above -> R1 is now free.
ADD R0,R1
Run Code Online (Sandbox Code Playgroud)

或者,同样:

LOAD R0,[b]
LOAD R1,3
MUL R0,R1     ; R0 = b*3
LOAD R1,2     
ADD R1,R0     ; R1 = 2+(b*3)
LOAD R0,8     ; Store in R1 above -> R0 is now free.
ADD R0,R1
Run Code Online (Sandbox Code Playgroud)

我不确定,但我认为这很可能是您选择第一ADD条指令的左/右操作数的方法。

我会添加一些打印输出来遵循代码,并看看它在不同情况下的作用。