Julia/LLVM使用整数结果对整数进行有效划分

你是对的 - 函数中有一点开销div,但不是因为可能有余数.这是因为div(typemin(Int),-1)是错误的div(x, 0).因此,您所看到的开销@code_llvm只是对这些案例的检查.您想要的LLVM指令只是sdiv i64 %0, %1......并且处理器甚至会在这些错误条件下抛出SIGFPE.我们可以llvmcall用来创建我们自己的"无开销"版本:

julia> unsafe_div(x::Int64,y::Int64) = Base.llvmcall("""
           %3 = sdiv i64 %0, %1
           ret i64 %3""", Int64, Tuple{Int64, Int64}, x, y)
unsafe_div (generic function with 1 method)

julia> unsafe_div(8,3)
2

julia> @code_llvm unsafe_div(8,3)

define i64 @julia_unsafe_div_21585(i64, i64) {
top:
  %2 = sdiv i64 %0, %1
  ret i64 %2
}

julia> unsafe_div(8,0)
ERROR: DivideError: integer division error
 in unsafe_div at none:1

Run Code Online (Sandbox Code Playgroud)

因此,如果可行,为什么Julia坚持将这些检查插入LLVM IR本身？这是因为LLVM认为这些错误情况在其优化过程中是未定义的行为.因此,如果LLVM能够通过静态分析证明它会出错,它会改变其输出以完全跳过除法(和后续异常)!这个自定义div函数确实不安全:

julia> f() = unsafe_div(8,0)
f (generic function with 2 methods)

julia> f()
13315560704

julia> @code_llvm f()

define i64 @julia_f_21626() {
top:
  ret i64 undef
}

Run Code Online (Sandbox Code Playgroud)

在我的机器上(旧的Nehalem i5),这个不安全的版本可以加速div大约5-10%,所以这里的开销并不是相对于整数除法的固有成本而言真的那么糟糕.正如@tholy指出的那样,与几乎所有其他CPU操作相比,它仍然非常慢,所以如果你经常除以相同的数字,你可能想要在他的答案中研究替代方案.

归档时间：	9 年，10 月前
查看次数：	691 次
最近记录：	9 年，10 月前