根据列中的值范围删除行

Ash*_*Ash 3 r rows subset

如果列中的值(在这种情况下是参与者标识号)落在某个范围内,例如61701到61721和61901到61929,我想删除数据中的数据行.

我知道如何根据阈值对数据进行子集化,例如:

datasetnew = dataset[dataset$X<=100, ]
Run Code Online (Sandbox Code Playgroud)

但不确定如何使用一系列数字来分组和删除行.不确定子集是我需要的.

Bil*_*ard 6

您应该能够通过包含小于,大于和介于它们之间的所有内容来排除这些范围.就像是:

dataset[dataset$X < 61701 | dataset$X > 61929 | (dataset$X > 61721 & dataset$X < 61901),]
Run Code Online (Sandbox Code Playgroud)

或使用subset:

subset(dataset, X < 61701 | X > 61929 | (X > 61721 & X < 61901)
Run Code Online (Sandbox Code Playgroud)


Dav*_*urg 6

或者更简单的实现将只是使用否定这些行 !

dataset[with(dataset, !((X >= 61701 & X <= 61721) | (X >= 61901 & X <= 61929))), ]
Run Code Online (Sandbox Code Playgroud)

要么

dataset[with(dataset, !((X %in% 61701:61721) | (X %in% 61901:61929))), ]
Run Code Online (Sandbox Code Playgroud)

对于大数据集,您可以使用data.tables %between%函数

library(data.table)
setDT(dataset)[!(X %between% c(61701, 61721) | X %between% c(61901, 61929))]
Run Code Online (Sandbox Code Playgroud)