在 R 中合并列具有相同值但大小写不同的行

Question

在 R 中合并列具有相同值但大小写不同的行

所以我有许多值 (x) 由于大小写问题而被分开的数据，我想合并所有这些值而忽略大小写并简单地添加其他列（y 和 z）中的值

我有一个数据框，如：

x     y  z 
rain  2   40
Rain  4   50
RAIN  7   25
Wind  8   10
Snow  3    9
SNOW  11  25

Run Code Online (Sandbox Code Playgroud)

我想要一个数据框，如：

x     y   z
Rain  13  115
Wind  8   10
Snow  14  34

Run Code Online (Sandbox Code Playgroud)

Answer 1

Ric*_*ven 7

您可以降低第一列的上限，然后进行汇总。

选项 1： 基础 Raggregate()

with(df, aggregate(list(y = y, z = z), list(x = tolower(x)), sum))
#      x  y   z
# 1 rain 13 115
# 2 snow 14  34
# 3 wind  8  10

Run Code Online (Sandbox Code Playgroud)

或者，也可以使用公式方法。

aggregate(. ~ x, transform(df, x = tolower(x)), sum)

Run Code Online (Sandbox Code Playgroud)

选项 2： data.table。这也会保持您在结果中显示的顺序。

library(data.table)
as.data.table(df)[, lapply(.SD, sum), by = .(x = tolower(x))]
#       x  y   z
# 1: rain 13 115
# 2: wind  8  10
# 3: snow 14  34

Run Code Online (Sandbox Code Playgroud)

要对结果进行排序，请使用keyby代替by

选项 3：基础 Rxtabs()

xtabs(cbind(y = y, z = z) ~ tolower(x), df)
#           
# tolower(x)   y   z
#       rain  13 115
#       snow  14  34
#       wind   8  10

Run Code Online (Sandbox Code Playgroud)

尽管这会生成一个表（可能不是您想要的，但值得注意），但我尚未确定如何更改x结果中的名称。

数据：

df <- tructure(list(x = structure(c(1L, 2L, 3L, 6L, 4L, 5L), .Label = c("rain", 
"Rain", "RAIN", "Snow", "SNOW", "Wind"), class = "factor"), y = c(2L, 
4L, 7L, 8L, 3L, 11L), z = c(40L, 50L, 25L, 10L, 9L, 25L)), .Names = c("x", 
"y", "z"), class = "data.frame", row.names = c(NA, -6L))

Run Code Online (Sandbox Code Playgroud)

Answer 2

Ste*_*pré 5

尝试：

library(dplyr)
df %>%
  group_by(x = tolower(x)) %>%
  summarise_each(funs(sum))

Run Code Online (Sandbox Code Playgroud)

这使：

#Source: local data frame [3 x 3]
#
#      x     y     z
#  (chr) (int) (int)
#1  rain    13   115
#2  snow    14    34
#3  wind     8    10

Run Code Online (Sandbox Code Playgroud)

归档时间：	10 年，2 月前
查看次数：	13134 次
最近记录：	10 年，2 月前