R:我如何在data.frame的行上使用apply并获取$ column_name?

Joh*_*n 11 r dataframe

我正在尝试使用以下示例访问$ a:

df<-data.frame(a=c("x","x","y","y"),b=c(1,2,3,4))

> df
  a b
1 x 1
2 x 2
3 y 3
4 y 4

test_fun <- function (data.frame_in) {
    print (data.frame_in[1])
    }
Run Code Online (Sandbox Code Playgroud)

如果我使用第一列的索引,我现在可以访问$ a:

apply(df,1,test_fun)

  a 
"x" 
  a 
"x" 
  a 
"y" 
  a 
"y" 
[1] "x" "x" "y" "y"
Run Code Online (Sandbox Code Playgroud)

但我无法使用$表示法访问列$ a:错误:"$运算符对原子向量无效"

test_fun_2 <- function (data.frame_in) {
    print (data.frame_in$a)
    }

>apply(df, 1, test_fun_2)
Error in data.frame_in$a : $ operator is invalid for atomic vectors
Run Code Online (Sandbox Code Playgroud)

这不可能吗?

had*_*ley 20

您可以使用adplyplyr包代替:

library(plyr)
adply(df, 1, function (data.frame_in) print(data.frame_in$a))
Run Code Online (Sandbox Code Playgroud)


xie*_*hao 11

因为data.frame.in不是data.frame:

apply(df, 1, function(v){print(class(v))})
Run Code Online (Sandbox Code Playgroud)

但您可以使用以下命令访问命名元素:

test_fun_2 <- function (data.frame_in) {
+     print (data.frame_in['a'])}
Run Code Online (Sandbox Code Playgroud)


Sha*_*ane 5

因为apply更改了函数中的数据类型:

> apply(df, 1, class)
[1] "character" "character" "character" "character"

> apply(df, 1, colnames)
NULL
Run Code Online (Sandbox Code Playgroud)

由于没有列名,因此您无法使用$运算符引用这些值.

apply文档:

如果X不是数组但具有维度属性,则应用尝试通过as.matrix将其强制转换为数组(如果它是二维的(例如,数据帧)或通过as.array).

  • 没有关于如何缓解这个问题的建议? (6认同)