如何使用 Tidyr 在 Tidyverse 中转置 (t)

Question

如何使用 Tidyr 在 Tidyverse 中转置 (t)

使用示例数据（底部），我想使用下面的代码对数据进行分组和汇总。在此之后，我想转置，但我被困在如何使用 tidyr 来实现这一点？

对于上下文，我试图重新创建一个使用 knitr::kable 在 Excel 中创建的现有表，因此我的以下代码的最终产品预计会破坏整洁原则。

例如：

library(tidyverse)

Df <- Df %>% group_by(Code1, Code2, Level) %>%
    summarise_all(funs(count = sum(!is.na(.))))

Run Code Online (Sandbox Code Playgroud)

我可以使用管道添加 t(.) ...

Df <- Df %>% group_by(Code1, Code2, Level) %>%
    summarise_all(funs(count = sum(!is.na(.)))) %>%
    t(.)

Run Code Online (Sandbox Code Playgroud)

或者我可以添加...

Df <- as.data.frame(t(Df)

Run Code Online (Sandbox Code Playgroud)

这两个选项都允许我转置，但我想知道是否有使用 tidyrgather和spread函数实现这一目标的 tidyverse 方法？我想对这个过程有更多的控制，还想删除“V1”、“V2”等，它们在使用转置 ( t)时显示为列名。

如何使用 tidyverse 实现这一目标？

示例代码：

Code1 <- c("H200","H350","H250","T400","T240","T600")
Code2 <- c("4A","4A","4A","2B","2B","2B")
Level <- c(1,2,3,1,2,3)
Q1 <- c(30,40,40,50,60,80)
Q2 <- c(50,30,50,40,80,30)
Q3 <- c(30,45,70,42,81,34)

Df <- data.frame(Code1, Code2, Level, Q1, Q2, Q3)

Run Code Online (Sandbox Code Playgroud)

Answer 1

Cur*_* F. 14

tidyverse 中的一般习惯用法是将gather()您的数据最大化，形成一个“长”数据框，每行一个测量值。然后，spread()可以将此长数据帧恢复为您最喜欢的“宽”格式。这个过程可以有效地转置数据：只是除行名之外的gather()所有标识符列，然后是行名。spread()

例如，这里是如何有效地转置mtcars：

require(tidyverse) mtcars %>% rownames_to_column %>% gather(variable, value, -rowname) %>% spread(rowname, value)
Run Code Online (Sandbox Code Playgroud)
您的数据没有 R 中理解的“行名称”，但Code1有效地用作行名称，因为它唯一标识数据的每一（原始）行。

Df1 <- Df %>% group_by(Code1, Code2, Level) %>% summarise_all(funs(count = sum(!is.na(.)))) %>% gather(column, value, -Code1) %>% spread(Code1, value)
Run Code Online (Sandbox Code Playgroud)
tidyr 1.0 或更高版本的更新（2019 年末起）

新的pivot_wider()和pivot_longer()功能现在比旧的（但仍受支持）gather()和spread(). 因此，转置 mtcars 的首选方法可能是

require(tidyverse) mtcars %>% rownames_to_column() %>% pivot_longer(-rowname, 'variable', 'value') %>% pivot_wider(variable, rowname)
Run Code Online (Sandbox Code Playgroud)

如果您的 data.frame 或 tibble 具有不同的数据类型，您可能必须首先将它们显式强制为一致的数据类型，例如使用 apply(mtcars, 2, as.character)。否则，pivot_longer 可能会导致错误。（适用于 mtcars，但一般情况下可能不适用）。 (2认同)

归档时间：	8 年，1 月前
查看次数：	9546 次
最近记录：	5 年，6 月前