我想获取数据框中所有行的行号,其中列中的元素包含向量中的元素

ag1*_*g14 2 r dataframe

我有一个看起来像这样的字符向量

Categories = sample(make.unique(rep(letters, length.out = 5), sep=''))
Categories
[1] "d-" "e-" "c-" "a-" "b-"
Run Code Online (Sandbox Code Playgroud)

我有一个数据帧df,看起来像:

df = data.frame(name = c(1:10), cat = paste(c(letters[1:10]), "-1", sep = ""))
df
    name cat
1     1   a-1
2     2   b-1
3     3   c-1
4     4   d-1
5     5   e-1
6     6   f-1
7     7   g-1
8     8   h-1
9     9   i-1
10   10   j-1
Run Code Online (Sandbox Code Playgroud)

我希望按照df中"cat"列中包含的Categories元素的顺序获取df中的行号.所以,我想得到

dfRowNumbers
[1] 4,5,3,1,2
Run Code Online (Sandbox Code Playgroud)

我怎么能得到它?

lmo*_*lmo 6

最直接,你可以使用charmatch.

charmatch(vec, df$cat)
[1] 4 5 3 1 2
Run Code Online (Sandbox Code Playgroud)

或者用grep和返回一个命名向量sapply.

sapply(Categories, grep, df$cat, fixed=TRUE)
d- e- c- a- b- 
 4  5  3  1  2 
Run Code Online (Sandbox Code Playgroud)

对于一点语义糖,用以下方法构建自己的函数Vectorize:

vecGrep <- Vectorize(grep, vectorize.args="pattern")
Run Code Online (Sandbox Code Playgroud)

然后用它来返回一个命名向量

vecGrep(Categories, df$cat, fixed=TRUE)
d- e- c- a- b- 
 4  5  3  1  2
Run Code Online (Sandbox Code Playgroud)

数据

vec <- c("d-", "e-", "c-", "a-", "b-")
df = data.frame(name = c(1:10), cat = paste(c(letters[1:10]), "-1", sep = ""))
Run Code Online (Sandbox Code Playgroud)