如何控制 R 中旋转(更宽)列的顺序?tidyverse第839期

Ani*_*yal 3 pivot r tidyverse

如果要旋转的值包含在多个列中,我可以以更宽的格式旋转数据。

us_rent_income %>%
  pivot_wider(
    names_from = variable,
    names_glue = "{variable}_{.value}",
    values_from = c(estimate, moe)
  )

# A tibble: 52 x 6
   GEOID NAME                 income_estimate rent_estimate income_moe rent_moe
   <chr> <chr>                          <dbl>         <dbl>      <dbl>    <dbl>
 1 01    Alabama                        24476           747        136        3
 2 02    Alaska                         32940          1200        508       13
 3 04    Arizona                        27517           972        148        4
 4 05    Arkansas                       23789           709        165        5
 5 06    California                     29454          1358        109        3
 6 08    Colorado                       32401          1125        109        5
 7 09    Connecticut                    35326          1123        195        5
 8 10    Delaware                       31560          1076        247       10
 9 11    District of Columbia           43198          1424        681       17
10 12    Florida                        25952          1077         70        3
# ... with 42 more rows
Run Code Online (Sandbox Code Playgroud)

在此代码输出中,我希望列的顺序为income_estimateincome_moerent_estimaterent_moe设置names_sort = T没有帮助。更改顺序names_glue也没有帮助。我知道我可以通过其他函数对列进行重新排序select,但我只想知道是否有任何参数可以pivot_wider这样做?

编辑该问题似乎已经在开发中;至少在这里这里已经讨论过了。

Ani*_*yal 7

随着tidyr 1.2.0的出现,现在使用参数变得非常容易names_vary

library(tidyr)
us_rent_income %>%
  pivot_wider(
    names_from = variable,
    names_glue = "{variable}_{.value}",
    values_from = c(estimate, moe),
    names_vary = 'slowest'
  )
#> # A tibble: 52 x 6
#>    GEOID NAME                 income_estimate income_moe rent_estimate rent_moe
#>    <chr> <chr>                          <dbl>      <dbl>         <dbl>    <dbl>
#>  1 01    Alabama                        24476        136           747        3
#>  2 02    Alaska                         32940        508          1200       13
#>  3 04    Arizona                        27517        148           972        4
#>  4 05    Arkansas                       23789        165           709        5
#>  5 06    California                     29454        109          1358        3
#>  6 08    Colorado                       32401        109          1125        5
#>  7 09    Connecticut                    35326        195          1123        5
#>  8 10    Delaware                       31560        247          1076       10
#>  9 11    District of Columbia           43198        681          1424       17
#> 10 12    Florida                        25952         70          1077        3
#> # ... with 42 more rows
Run Code Online (Sandbox Code Playgroud)

names_vary包帮助页面给出的解释是 -

names_varynames_from标识具有多个唯一值的列(或多列)并且values_from提供了多个列时,应按什么顺序组合结果列名称?

  • “fastest”names_from以最快的速度改变值,从而产生以下形式的列命名方案:value1_name1, value1_name2, value2_name1, value2_name2。这是默认设置。

  • "slowest"改变names_from值的速度最慢,从而产生以下形式的列命名方案:value1_name1, value2_name1, value1_name2, value2_name2