我有一个数据帧df有一个ID列例如A,B等.我还有一个包含某些ID的向量:
L <- c("A", "B", "E")
Run Code Online (Sandbox Code Playgroud)
如何过滤数据框以仅获取向量中存在的ID?我会单独使用
subset(df, ID == "A")
Run Code Online (Sandbox Code Playgroud)
但是如何过滤整个矢量?
我一直在使用这两种方法来交替使用R中数据框的数据.
方法1
subset_df <- df[which(df$age>5) , ]
方法2
subset_df <- subset(df, age>5)
我有2个问题属于这些问题.
1.考虑到我有非常大的数据,哪一个更快?
这篇文章在R中对数据框进行子集化表明上述两种方法之间存在差异.其中一个准确处理NA.哪一个可以安全使用呢?