R返回行名称的部分匹配

Lau*_*ote 7 r matching dataframe rowname

我遇到了以下问题

vec <- c("a11","b21","c31")
df <- data.frame(a = c(0,0,0), b = c(1,1,1), row.names = vec)
df["a",]
Run Code Online (Sandbox Code Playgroud)

回报

df["a",]
    a b
a11 0 1
Run Code Online (Sandbox Code Playgroud)

然而,

"a" %in% vec 
Run Code Online (Sandbox Code Playgroud)

"a" %in% rownames(df) 
Run Code Online (Sandbox Code Playgroud)

两者都返回False

当使用字母后跟行号的数字时,R允许字符串的部分匹配.我已经在R v3.2.2和R v3.2.1上复制了这个.甚至

df[["a",1,exact=T]]
Run Code Online (Sandbox Code Playgroud)

返回0

有什么我可以设置,以便R不允许这种部分匹配?

Dav*_*arx 5

奇怪的是,甚至没有意识到部分匹配是一件事。

您可以尝试单独识别与 rowname 完全匹配的记录,并根据结果构建索引向量,而不是直接索引到数据帧,如下所示:

> ix <- 'a' == row.names(df)
> df[ix,]
<0 rows> (or 0-length row.names)
Run Code Online (Sandbox Code Playgroud)

或等效的(但更简洁):

> df['a' == row.names(df),]
Run Code Online (Sandbox Code Playgroud)

或者,如果将对象强制到 data.table,它将仅返回精确匹配:

> library(data.table)
> dt <- data.table(df)
> dt[,ix := vec]
> setkey(dt, ix)

> dt['a']
    a  b ix
1: NA NA  a

> dt['a11']
   a b  ix
1: 0 1 a11
Run Code Online (Sandbox Code Playgroud)


Kon*_*rad 2

为什么不尝试:

df[grep(pattern = "a", x = rownames(df)),]
Run Code Online (Sandbox Code Playgroud)

这将返回:

> df[grep(pattern = "a", x = rownames(df)),]
    a b
a11 0 1
Run Code Online (Sandbox Code Playgroud)

使用grep将为您提供额外的灵活性,例如,如果您想匹配只有以下内容的行名称

> df[grep(pattern = "^a$", x = rownames(df)),]
[1] a b
<0 rows> (or 0-length row.names)
Run Code Online (Sandbox Code Playgroud)