Lau*_*ote 7 r matching dataframe rowname
我遇到了以下问题
vec <- c("a11","b21","c31")
df <- data.frame(a = c(0,0,0), b = c(1,1,1), row.names = vec)
df["a",]
Run Code Online (Sandbox Code Playgroud)
回报
df["a",]
a b
a11 0 1
Run Code Online (Sandbox Code Playgroud)
然而,
"a" %in% vec
Run Code Online (Sandbox Code Playgroud)
和
"a" %in% rownames(df)
Run Code Online (Sandbox Code Playgroud)
两者都返回False
当使用字母后跟行号的数字时,R允许字符串的部分匹配.我已经在R v3.2.2和R v3.2.1上复制了这个.甚至
df[["a",1,exact=T]]
Run Code Online (Sandbox Code Playgroud)
返回0
有什么我可以设置,以便R不允许这种部分匹配?
奇怪的是,甚至没有意识到部分匹配是一件事。
您可以尝试单独识别与 rowname 完全匹配的记录,并根据结果构建索引向量,而不是直接索引到数据帧,如下所示:
> ix <- 'a' == row.names(df)
> df[ix,]
<0 rows> (or 0-length row.names)
Run Code Online (Sandbox Code Playgroud)
或等效的(但更简洁):
> df['a' == row.names(df),]
Run Code Online (Sandbox Code Playgroud)
或者,如果将对象强制到 data.table,它将仅返回精确匹配:
> library(data.table)
> dt <- data.table(df)
> dt[,ix := vec]
> setkey(dt, ix)
> dt['a']
a b ix
1: NA NA a
> dt['a11']
a b ix
1: 0 1 a11
Run Code Online (Sandbox Code Playgroud)
为什么不尝试:
df[grep(pattern = "a", x = rownames(df)),]
Run Code Online (Sandbox Code Playgroud)
这将返回:
Run Code Online (Sandbox Code Playgroud)> df[grep(pattern = "a", x = rownames(df)),] a b a11 0 1
使用grep将为您提供额外的灵活性,例如,如果您想匹配只有以下内容的行名称:
Run Code Online (Sandbox Code Playgroud)> df[grep(pattern = "^a$", x = rownames(df)),] [1] a b <0 rows> (or 0-length row.names)