小编Ale*_*Ale的帖子

r data.frame创建新变量

我有一个大约150万行和5列的数据帧.一个变量(VARIABLE)属于这种类型NATIONALITY_YEAR(例如SPAIN_1998),我想将它分成两列,一列包含国籍,这是在下划线之前的名称的左侧,另一列包含年份,右侧下划线.我尝试过concat.split,这应该是最简单的方法:

aa <- concat.split(mydata, "VARIABLE", sep = "_", drop = F)
Run Code Online (Sandbox Code Playgroud)

但运行2小时后它没有产生任何输出.我不确定是否应该让它运行更长时间,或者是否有非耗时的方法来执行此操作.

对此问题的任何帮助将非常感谢!

这是一个可重现的(子集!)样本:

mydata<-  structure(list(PROVINCE = c(1L, 4L, 7L, 8L, 11L, 14L, 17L, 20L, 
24L, 28L, 30L, 33L, 36L, 41L, 44L, 46L, 48L, 3L, 6L, 8L, 10L, 
13L, 15L, 18L, 23L, 26L, 29L, 31L, 35L, 38L, 41L, 46L, 47L, 2L, 
4L, 8L, 8L, 11L, 15L, 17L, 21L, 24L, 28L, 30L, 33L, 37L, 41L, 
45L, 46L, 49L, 3L, 6L, 8L, 10L, 13L, 15L, 19L, 23L, 27L, 29L, 
32L, 36L, 39L, …
Run Code Online (Sandbox Code Playgroud)

r data-manipulation dataframe

3
推荐指数
2
解决办法
736
查看次数

标签 统计

data-manipulation ×1

dataframe ×1

r ×1