如何按组选择具有最小值并在R中包含NA的行

Dav*_*d Z 3 r dataframe na

这是一个例子:

set.seed(123)    
data<-data.frame(X=rep(letters[1:3], each=4),Y=sample(1:12,12),Z=sample(1:100, 12))
data[data==3]<-NA
Run Code Online (Sandbox Code Playgroud)

我要意识到的是通过忽略s 来选择X最小的唯一行:YNA

a 4 68
b 1 4
c 2 64
Run Code Online (Sandbox Code Playgroud)

最好的方法是什么?

Jus*_*tin 7

使用该data.table包,这是微不足道的:

library(data.table)

d <- data.table(data)
d[, min(Y, na.rm=TRUE), by=X]
Run Code Online (Sandbox Code Playgroud)

您还可以使用plyr它的ddply功能:

library(plyr)

ddply(data, .(X), summarise, min(Y, na.rm=TRUE))
Run Code Online (Sandbox Code Playgroud)

或者使用基数R:

aggregate(X ~ ., data=data, FUN=min)
Run Code Online (Sandbox Code Playgroud)

根据编辑,我肯定会使用data.table:

d[, .SD[which.min(Y)], by=X]
Run Code Online (Sandbox Code Playgroud)

但是,有使用基本R或其他包的解决方案.