我有一个大约150万行和5列的数据帧.一个变量(VARIABLE)属于这种类型NATIONALITY_YEAR(例如SPAIN_1998),我想将它分成两列,一列包含国籍,这是在下划线之前的名称的左侧,另一列包含年份,右侧下划线.我尝试过concat.split,这应该是最简单的方法:
aa <- concat.split(mydata, "VARIABLE", sep = "_", drop = F)
Run Code Online (Sandbox Code Playgroud)
但运行2小时后它没有产生任何输出.我不确定是否应该让它运行更长时间,或者是否有非耗时的方法来执行此操作.
对此问题的任何帮助将非常感谢!
这是一个可重现的(子集!)样本:
mydata<- structure(list(PROVINCE = c(1L, 4L, 7L, 8L, 11L, 14L, 17L, 20L,
24L, 28L, 30L, 33L, 36L, 41L, 44L, 46L, 48L, 3L, 6L, 8L, 10L,
13L, 15L, 18L, 23L, 26L, 29L, 31L, 35L, 38L, 41L, 46L, 47L, 2L,
4L, 8L, 8L, 11L, 15L, 17L, 21L, 24L, 28L, 30L, 33L, 37L, 41L,
45L, 46L, 49L, 3L, 6L, 8L, 10L, 13L, 15L, 19L, 23L, 27L, 29L,
32L, 36L, 39L, …Run Code Online (Sandbox Code Playgroud)