相关疑难解决方法(0)

我怎样才能加速tidyr的功能

我有这样的数据

    n <- 1e5
set.seed(24)
df1 <- data.frame(query_string = sample(sprintf("%06d", 100:1000), 
 n, replace=TRUE), id.x = sample(1:n), 
                  s_val = sample(paste0("F", 400:700), n, 
        replace=TRUE), id.y = sample(100:3000, n, replace=TRUE), 
            ID_col_n = sample(100:1e6, n, replace=TRUE), total_id = 1:n)

Run Code Online (Sandbox Code Playgroud)

我使用spread函数使用以下函数分配公共字符串

library(tidyr)

res <- spread(resNik,s_val,value=query_string,fill=NA)

Run Code Online (Sandbox Code Playgroud)

这种方法很完美,但是当数据量巨大时,它就像永远不会结束.我不知道我的电脑是挂了还是仍然在运行,因为两个小时后仍然没有任何东西出现

我想知道是否可以帮助我使用其他功能或其他更快的工作spread？

r tidyr

nik*_*nik

2016 12-11

2
推荐指数

1
解决办法

140
查看次数

标签统计

r ×1

tidyr ×1

我怎样才能加速tidyr的功能

标签 统计

标签统计