使用JIT设计虚拟机

Jac*_*ack 4 c++ vm-implementation

我正在开发一种脚本语言,它可以编译自己的虚拟机,这是一个简单的脚本语言,可以处理某些数据,如,向量,浮点数等等.内存单元以这种方式表示:

struct memory_cell
{
    u32 id;
    u8 type;

    union
    {
        u8 b; /* boolean */
        double f; /* float */
        struct { double x, y, z; } v; /* vector */
        struct { double r, g, b; } c; /* color */
        struct { double r, g, b; } cw; /* color weight */
        struct { double x, y, z; } p; /* point variable */
        struct { u16 length; memory_cell **cells; } l; /* list variable */
    };  
};
Run Code Online (Sandbox Code Playgroud)

指令是通用的,能够处理许多不同的操作数.例如

ADD dest, src1, src2
Run Code Online (Sandbox Code Playgroud)

可以使用浮点数,向量,点,颜色根据操作数设置正确的目标类型.

主执行周期只是检查指令的操作码(这是一个包含联合的结构来定义任何类型的指令)并执行它.我使用了一种简化的方法,我没有寄存器,只有大量的存储单元.

我想知道JIT是否可以帮助我获得最佳表现以及如何实现它.

正如我所说到目前为止达到的最佳实现是这样的:

 void VirtualMachine::executeInstruction(instr i)
 {
     u8 opcode = (i.opcode[0] & (u8)0xFC) >> 2;

     if (opcode >= 1 && opcode <= 17) /* RTL instruction */
     {
        memory_cell *dest;
        memory_cell *src1;
        memory_cell *src2;

        /* fetching destination */
        switch (i.opcode[0] & 0x03)
        {
            /* skip fetching for optimization */
            case 0: { break; }
            case MEM_CELL: { dest = memory[stack_pointer+i.rtl.dest.cell]; break; }
            case ARRAY_VAL: { dest = memory[stack_pointer+i.rtl.dest.cell]->l.cells[i.rtl.dest.index]; break; }
            case ARRAY_CELL: { dest = memory[stack_pointer+i.rtl.dest.cell]->l.cells[(int)i.rtl.dest.value]; break; }
        }

     /* omitted code */

     switch (opcode)
     {
         case ADD:
         {
             if (src1->type == M_VECTOR && src2->type == M_VECTOR)
             {
                 dest->type = M_VECTOR;
                 dest->v.x = src1->v.x + src2->v.x;
                 dest->v.y = src1->v.y + src2->v.y;
                 dest->v.z = src1->v.z + src2->v.z;
              }

      /* omitted code */
Run Code Online (Sandbox Code Playgroud)

尝试jit编译是否容易/方便?但我真的不知道从哪里开始,这就是为什么我要问一些建议.

除此之外,在开发它时我还应该考虑其他任何建议吗?

这个虚拟机应该足够快,可以为光线跟踪器计算着色器,但我还没有做过任何基准测试.

Ste*_*sop 7

在编写JIT("Just-in-time")编译器之前,您至少应该考虑如何编写"Way-ahead-of-time"编译器.

也就是说,给定一个由VM指令组成的程序,您将如何生成由x86(或其他)指令组成的程序,该程序与原始程序相同?您将如何优化不同指令集的输出以及相同架构的不同版本?您给出的示例操作码具有相当复杂的实现,因此您可以通过发出执行该作业的代码来实现"内联"哪些操作码,以及通过调用某些共享代码来实现哪些操作码?

JIT必须能够做到这一点,并且它还必须在VM运行时做出决策,执行它所执行的代码,何时执行,以及它如何表示VM指令和本机指令的最终混合.

如果你还不是集会骑师,那么我不建议你写一个JIT.这并不是说"不要做它",但你应该在开始认真之前成为一名集会骑师.

另一种方法是编写一个非JIT编译器,将您的VM指令(或原始脚本语言)转换为Java字节码或LLVM,正如Jeff Foster所说.然后让该字节码的工具链完成困难的,依赖于CPU的工作.


Jef*_*ter 6

VM是一项需要考虑的重大任务.您是否考虑过将您的VM基于LLVM之类的东西?

LLVM将提供一个良好的入门基础,并且有大量示例项目可供您理解.