我有这样的数据
n <- 1e5
set.seed(24)
df1 <- data.frame(query_string = sample(sprintf("%06d", 100:1000),
n, replace=TRUE), id.x = sample(1:n),
s_val = sample(paste0("F", 400:700), n,
replace=TRUE), id.y = sample(100:3000, n, replace=TRUE),
ID_col_n = sample(100:1e6, n, replace=TRUE), total_id = 1:n)
Run Code Online (Sandbox Code Playgroud)
我使用spread函数使用以下函数分配公共字符串
library(tidyr)
res <- spread(resNik,s_val,value=query_string,fill=NA)
Run Code Online (Sandbox Code Playgroud)
这种方法很完美,但是当数据量巨大时,它就像永远不会结束.我不知道我的电脑是挂了还是仍然在运行,因为两个小时后仍然没有任何东西出现
我想知道是否可以帮助我使用其他功能或其他更快的工作spread?