这是一个例子:
set.seed(123)    
data<-data.frame(X=rep(letters[1:3], each=4),Y=sample(1:12,12),Z=sample(1:100, 12))
data[data==3]<-NA
我要意识到的是通过忽略s 来选择X最小的唯一行:YNA
a 4 68
b 1 4
c 2 64
最好的方法是什么?
使用该data.table包,这是微不足道的:
library(data.table)
d <- data.table(data)
d[, min(Y, na.rm=TRUE), by=X]
您还可以使用plyr它的ddply功能:
library(plyr)
ddply(data, .(X), summarise, min(Y, na.rm=TRUE))
或者使用基数R:
aggregate(X ~ ., data=data, FUN=min)
根据编辑,我肯定会使用data.table:
d[, .SD[which.min(Y)], by=X]
但是,有使用基本R或其他包的解决方案.
| 归档时间: | 
 | 
| 查看次数: | 4669 次 | 
| 最近记录: |