具体来说,编译器如何积极优化生成的字节码?

Rob*_*cks 4 c# compiler-construction flash optimization llvm

我一直在阅读各种编译器的功能,并且遇到了许多编译器报告执行的术语“积极优化”。例如,LLVM 引用了以下编译时优化功能:

  • 内存/指针特定
  • 循环变换
  • 数据流
  • 算术
  • 死代码消除
  • 内联

这具体是什么意思?假设您有以下代码片段,您如何优化生成的字节码以使其比编译器生成的运行速度更快?我对优化由 JIT 驱动的运行时(如 C#、Java 和 Flash)的字节码特别感兴趣。这很棘手,因为 JIT 仅支持处理器通常执行的操作码的子集,这限制了您可以执行的优化量。尽管如此,我还是很想知道什么是可能的,以及哪些转换可以推动 VM 的极限。

虚构的代码块:

for (i = 0; i < 100; i++){
    in = dataIn[i];
    if ((in % 5) == 0){
        out = ((in / 2) >> 16) - 10;
    }else{
        out = ((in << 5) / 2) * 50 + 10;
    }
    dataOut[i] = out;
}
Run Code Online (Sandbox Code Playgroud)

由编译器生成的近似伪代码,用于基于堆栈的 JIT VM,例如 Flash Player:(请原谅我的任何错误,这完全是手写的!)

// i = 0
label: "forInit"
   push 0
   writeTo "i"

// while i < 100
label: "forStart"
   push "i"
   push 100
   jumpIfMoreThan "forEnd"

       // in = dataIn[i];
       push "i"
       push "dataIn"
       readProp
       saveTo "in"

       // if ((in % 5) == 0)
       push "in"
       push 5
       mod
       push 0
       jumpIfNotEquals "ifPart2"
       label: ifPart1

           // out = ((in / 2) >> 16) - 10;
           push "in"
           push 2
           divide
           push 16
           rightshift
           push 10
           minus
           writeTo "out"
           goto "ifEnd"

       // else
       label: ifPart2

           // out = ((in << 5) / 2) * 50 + 10;
           push "in"
           push 5
           leftshift
           push 2
           divide
           push 50
           multiply
           push 10
           add
           writeTo "out"

       // dataOut[i] = out;
       label: ifEnd
           push "out"
           push "i"
           push "dataOut"
           writeProp

       // i++
       push "i"
       increment
       writeTo "i"

   // while i < 100
   goto "forStart"
label: "forEnd"
Run Code Online (Sandbox Code Playgroud)

Rob*_*cks 6

我也一直在研究这个,LLVM 执行转换的完整列表,在标题下组织:

  • 死代码移除
    • 积极的死代码消除
    • 死代码消除
    • 死参数消除
    • 死亡类型消除
    • 死指令消除
    • 死店消除
    • 死亡全球消除
    • 删除死循环
  • 删除不需要的数据
    • 从模块中剥离所有符号
    • 剥离未使用符号的调试信息
    • 剥离未使用的函数原型
    • 去除所有 llvm.dbg.declare 内在函数
    • 从模块中去除除 dbg 符号以外的所有符号
    • 合并重复的全局常量
    • 删除未使用的异常处理信息
  • 内联函数
    • 合并函数
    • 部分内联
    • 函数集成/内联
  • 循环优化
    • 闭环 SSA 表格通行证
    • 循环不变代码运动
    • 将循环提取到新函数中
    • 最多将一个循环提取到一个新函数中
    • 循环强度降低
    • 旋转循环
    • 规范化自然循环
    • 展开循环
    • 取消切换循环
  • 杂项
    • 将“按引用”参数提升为标量
    • 组合指令以在基本块内形成向量指令
    • 轮廓引导的基本块放置
    • 打破 CFG 中的关键边缘
    • 优化代码生成
    • 简单的常量传播
    • 推导函数属性
    • 全局变量优化器
    • 全局值编号
    • 规范化归纳变量
    • 用于边缘轮廓分析的插入工具
    • 插入用于边缘轮廓分析的最佳仪器
    • 合并冗余指令
    • 内部化全局符号
    • 过程间常量传播
    • 过程间稀疏条件常数传播
    • 跳线程
    • 将原子内在函数降低为非原子形式
    • 降低调用和展开,用于展开代码生成器
    • 降低 SwitchInst 的分支
    • 提升内存注册
    • 内存优化
    • 统一函数出口节点
    • 重新关联表达式
    • 将所有值降级到堆栈槽
    • 聚合的标量替换 (DT)
    • 稀疏条件常数传播
    • 简化知名库调用
    • 简化CFG
    • 代码下沉
    • 将 sret 参数提升为多个 ret 值
    • 尾呼叫消除
    • 尾部复制