使用 R & dplyr 计算多列中的出现次数

Question

使用 R & dplyr 计算多列中的出现次数

这应该是一个简单的解决方案......我无法解决这个问题。我想计算一个因素在数据框的多列中的出现次数。有 13 列范围从 abx.1 > abx.13 和大量行。

示例数据框：

library(dplyr)
 abx.1 <- c('Amoxil', 'Cipro', 'Moxiflox', 'Pip-tazo')
 start.1 <- c('2012-01-01', '2012-02-01', '2013-01-01', '2014-01-01')
 abx.2 <- c('Pip-tazo', 'Ampicillin', 'Amoxil', NA)
 start.2 <- c('2012-01-01', '2012-02-01', '2013-01-01', NA)
 abx.3 <- c('Ampicillin', 'Amoxil', NA, NA)
 start.3 <- c('2012-01-01', '2012-02-01', NA,NA)
 worksheet <-data.frame (abx.1, start.1, abx.2, start.2, abx.3, start.3)

Run Code Online (Sandbox Code Playgroud)

结果我想要：

姓名数
阿莫西林 3
氨苄西林 2
匹他佐 2
环丙沙星1
莫西氟 1

我试过了：

worksheet %>% group_by (abx.1, abx.2, abx.3) %>% summarise(count = n())

Run Code Online (Sandbox Code Playgroud)

这并没有给我我想要的输出。任何想法将不胜感激。

Answer 1

Dav*_*urg 5

如果您想要一个dplyr解决方案，我建议您将其与它结合起来，tidyr以便首先将您的数据转换为长格式

library(tidyr)
worksheet %>%
  select(starts_with("abx")) %>%
  gather(key, value, na.rm = TRUE) %>%
  count(value)

# Source: local data frame [5 x 2]
# 
#        value n
# 1     Amoxil 3
# 2 Ampicillin 2
# 3      Cipro 1
# 4   Moxiflox 1
# 5   Pip-tazo 2

Run Code Online (Sandbox Code Playgroud)

或者，使用基础 R，它只是

as.data.frame(table(unlist(worksheet[grep("^abx", names(worksheet))])))
#         Var1 Freq
# 1     Amoxil    3
# 2      Cipro    1
# 3   Moxiflox    1
# 4   Pip-tazo    2
# 5 Ampicillin    2

Run Code Online (Sandbox Code Playgroud)

归档时间：	10 年，10 月前
查看次数：	3250 次
最近记录：	10 年，10 月前

使用 R &amp; dplyr 计算多列中的出现次数

使用 R & dplyr 计算多列中的出现次数