我有一个看起来像这样的字符向量
Categories = sample(make.unique(rep(letters, length.out = 5), sep=''))
Categories
[1] "d-" "e-" "c-" "a-" "b-"
Run Code Online (Sandbox Code Playgroud)
我有一个数据帧df,看起来像:
df = data.frame(name = c(1:10), cat = paste(c(letters[1:10]), "-1", sep = ""))
df
name cat
1 1 a-1
2 2 b-1
3 3 c-1
4 4 d-1
5 5 e-1
6 6 f-1
7 7 g-1
8 8 h-1
9 9 i-1
10 10 j-1
Run Code Online (Sandbox Code Playgroud)
我希望按照df中"cat"列中包含的Categories元素的顺序获取df中的行号.所以,我想得到
dfRowNumbers
[1] 4,5,3,1,2
Run Code Online (Sandbox Code Playgroud)
我怎么能得到它?
最直接,你可以使用charmatch.
charmatch(vec, df$cat)
[1] 4 5 3 1 2
Run Code Online (Sandbox Code Playgroud)
或者用grep和返回一个命名向量sapply.
sapply(Categories, grep, df$cat, fixed=TRUE)
d- e- c- a- b-
4 5 3 1 2
Run Code Online (Sandbox Code Playgroud)
对于一点语义糖,用以下方法构建自己的函数Vectorize:
vecGrep <- Vectorize(grep, vectorize.args="pattern")
Run Code Online (Sandbox Code Playgroud)
然后用它来返回一个命名向量
vecGrep(Categories, df$cat, fixed=TRUE)
d- e- c- a- b-
4 5 3 1 2
Run Code Online (Sandbox Code Playgroud)
数据
vec <- c("d-", "e-", "c-", "a-", "b-")
df = data.frame(name = c(1:10), cat = paste(c(letters[1:10]), "-1", sep = ""))
Run Code Online (Sandbox Code Playgroud)