来自多个变量的 Pivot_wider 函数（tidyr r 包）

Question

来自多个变量的 Pivot_wider 函数（tidyr r 包）

我想将数据框置于宽格式中，考虑两个变量作为标准（甚至可能是不必要的）。但我对此发表评论是因为原始 df 是 480 行和几个子级别。

这是返回一个错误！

library(tidyr)
library(dplyr)
                                                                
df <- structure(list(ID = c(1, 2, 3, 4), Gender = c("Men", "Women", "Men", 
"Women"), Country = c("Austria", "Austria", "Austria", "Austria"
), Season_ID = c("2011", "2012", "2011", "2012"), Region_UN = c("A", 
"B", "A", "B")), row.names = c(NA, 
-4L), class = c("tbl_df", "tbl", "data.frame"))

df_wide <- df %>%
  pivot_wider(names_from = Gender,
              values_from = Region_UN,
              id_cols = c(Country, Season_ID))

Run Code Online (Sandbox Code Playgroud)

警告消息：值没有唯一标识；输出将包含列表列。

用于values_fn = list抑制此警告。
用于values_fn = length识别重复项出现的位置
用于values_fn = {summary_fun}总结重复项

我不知道我可以在values_fn中放入哪个参数！

Answer 1

tpe*_*ldt 6

您也可以将其粘贴在一起：

df_wide <- df %>%
  pivot_wider(names_from = Gender,
              values_from = Region_UN,
              id_cols = c(Country, Season_ID),
              values_fn = function(x) paste(x, collapse=","))

df_wide

Run Code Online (Sandbox Code Playgroud)

并且两者也相同：

df_wide <- df %>%
  pivot_wider(names_from = Gender,
              values_from = Region_UN,
              id_cols = c(Country, Season_ID),
              values_fn = first)
df_wide

Run Code Online (Sandbox Code Playgroud)

归档时间：	4 年，8 月前
查看次数：	1647 次
最近记录：	4 年，8 月前