Sir*_*lem 26 r data-manipulation nan
比方说,我有这样的数据:
data <- c(1,2,3,4,5,6,NaN,5,9,NaN,23,9)
attr(data,"dim") <- c(6,2)
data
[,1] [,2]
[1,] 1 NaN
[2,] 2 5
[3,] 3 9
[4,] 4 NaN
[5,] 5 23
[6,] 6 9
Run Code Online (Sandbox Code Playgroud)
现在我想要删除其中包含NaN值的行:第1行和第4行.但我不知道这些行在哪里,如果它是100.000+行的数据集,所以我需要找到它们的函数并删除完整的一行.
任何人都能指出我正确的方向吗?
And*_*rie 41
该函数complete.cases将告诉您所需的行位置:
data <- matrix(c(1,2,3,4,5,6,NaN,5,9,NaN,23,9), ncol=2)
data[complete.cases(data), ]
[,1] [,2]
[1,] 2 5
[2,] 3 9
[3,] 5 23
[4,] 6 9
Run Code Online (Sandbox Code Playgroud)
数据
data <- matrix(rnorm(100000000), ncol=10000)
idx <- sample(1:10000,100)
idy <- sample(1:10000,100)
data[idx,idy] <- NaN
Run Code Online (Sandbox Code Playgroud)
功能
foo <- function(d=data) d[apply(d,2,function(x) any(is.nan(x))),]
Run Code Online (Sandbox Code Playgroud)
运行时间
> system.time(data[complete.cases(data),])
user system elapsed
3.53 0.12 3.65
> system.time(foo(data))
user system elapsed
2.37 0.09 2.46
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
47556 次 |
| 最近记录: |