在 R 中删除数据表中的空列的最有效方法是什么

Ant*_*tin 4 datatable null r data-manipulation

我的文件存在一些导入问题,在末尾创建一个空列,例如:

library(data.table)
library(tidyverse)
MWE <- data.table(var1=c(1,2),var2=c(3,4),var3=c(NA,NA))
Run Code Online (Sandbox Code Playgroud)

现在我可以轻松删除它,因为我知道空列是最后一列:

MWE2 <- MWE[,c(length(MWE)):=NULL]
Run Code Online (Sandbox Code Playgroud)

但我想知道如果我只想删除一个随机的空列而不知道它的编号,我该怎么做。在这里和数据表页面上的快速搜索给了我很多关于如何执行以下操作的示例:

  • 删除数据表中的空行,通过na.omit
  • 删除数据框中的空列,例如此处

但我没有找到删除数据表中空列的解决方案。有哪些选项以及哪个最快?

akr*_*run 6

我们可以检查all值是否NA在列中,获取列名并将其分配给 NULL

nm1 <- MWE[, names(which(sapply(.SD, function(x) all(is.na(x)))))] 
# or
# nm1 <- MWE[, names(which(!colSums(!is.na(.SD))))]
MWE[, (nm1) := NULL]
Run Code Online (Sandbox Code Playgroud)

或者与Filter

MWE[, Filter(function(x) any(!is.na(x)), .SD)]
Run Code Online (Sandbox Code Playgroud)

或者使用select

library(dplyr)
MWE %>%
     select(where(~ any(!is.na(.))))
Run Code Online (Sandbox Code Playgroud)