trunc() 和 as.integer() 有什么区别?

rlu*_*ech 3 performance integer truncate r

trunc()和 和有as.integer()什么区别?

为什么as.integer更快?谁能解释一下幕后发生了什么?

为什么trunc()返回类double而不是integer

x <- c(-3.2, -1.8, 2.3, 1.5, 1.500000001, -1.499999999)

trunc(x)
[1] -3 -1  2  1  1 -1

as.integer(x)
[1] -3 -1  2  1  1 -1

all.equal(trunc(x), as.integer(x))
[1] TRUE

sapply(list(trunc(x), as.integer(x)), typeof)
[1] "double" "integer"

library(microbenchmark)
x <- sample(seq(-5, 5, by = 0.001), size = 1e4, replace = TRUE)
microbenchmark(floor(x), trunc(x), as.integer(x), times = 1e4)
# I included floor() as well just to see the performance difference

Unit: microseconds
          expr    min     lq      mean median     uq       max neval
      floor(x) 96.185 97.651 126.02124 98.237 99.411 67892.004 10000
      trunc(x) 56.596 57.476  71.33856 57.770 58.649  2704.607 10000
 as.integer(x) 16.422 16.715  23.26488 17.009 18.475  2828.064 10000
Run Code Online (Sandbox Code Playgroud)

help(trunc)

“trunc 接受单个数值参数 x 并返回一个数值向量,其中包含通过将 x 中的值向 0 截断而形成的整数。”

help(as.integer)

“非整数数值被截断为零(即 as.integer(x) 在那里等于 trunc(x)),[...]”

背景:我正在编写函数来在不同的时间/日期表示之间进行转换,例如120403 (hhmmss) -> 43443(从 00:00:00 开始的秒数)性能才是最重要的。

注:本题与浮点运算无关

SessionInfo: R version 3.3.2, Windows 7 x64
Run Code Online (Sandbox Code Playgroud)

And*_*lin 5

在技​​术方面,这些功能有不同的目标。

trunc函数删除数字的小数部分。

as.integer函数将输入值转换为 32 位整数。

因此as.integer会溢出大量(超过 2^31):

x = 9876543210.5

sprintf("%15f", x)
# [1] "9876543210.500000"

sprintf("%15f", trunc(x))
# [1] "9876543210.000000"

as.integer(x)
# [1] NA
Run Code Online (Sandbox Code Playgroud)