根据条件返回列名

Question

根据条件返回列名

我有一个包含 18 列的数据集，我需要从中返回每个观察值具有最高值的列名称，下面是简单的示例。我遇到了这个答案，它几乎满足了我的需要，但在某些情况下我需要组合名称（如下ab所示maxcol）。我该怎么做？

任何建议将不胜感激！如果可能的话，我会更容易理解基于 tidyverse 的解决方案，因为我比基础更熟悉它。

编辑：我忘了提及我的数据中的某些列具有 NA。

library(dplyr, warn.conflicts = FALSE)

#turn this
Df <- tibble(a = 4:2, b = 4:6, c = 3:5)

#into this
Df <- tibble(a = 4:2, b = 4:6, c = 3:5, maxol = c("ab", "b", "b"))

Run Code Online (Sandbox Code Playgroud)

^{由reprex 包(v0.2.1)于 2018-10-30 创建}

Answer 1

Ron*_*hah 5

继续链接帖子中的答案，我们可以做

Df$maxcol <- apply(Df, 1, function(x) paste0(names(Df)[x == max(x)], collapse = ""))

Df

#      a     b     c maxcol
#  <int> <int> <int> <chr> 
#1     4     4     3  ab    
#2     3     5     4  b     
#3     2     6     5  b

Run Code Online (Sandbox Code Playgroud)

对于每一行，我们检查哪个位置具有最大值以及paste该names位置的。

如果您更喜欢这种tidyverse方法

library(tidyverse)
Df %>%
  mutate(row = row_number()) %>%
  gather(values, key, -row) %>%
  group_by(row) %>%
  mutate(maxcol = paste0(values[key == max(key)], collapse = "")) %>%
  spread(values, key) %>%
  ungroup() %>%
  select(-row)

# maxcol     a     b     c
#  <chr>  <int> <int> <int>
#1 ab         4     4     3
#2 b          3     5     4
#3 b          2     6     5

Run Code Online (Sandbox Code Playgroud)

我们首先使用将数据帧从宽数据帧转换为长数据帧gather，然后为group_by每一行列paste命名max key，然后spread再次将长数据帧转换为宽数据帧。

归档时间：	7 年，3 月前
查看次数：	2853 次
最近记录：	3 年，5 月前