Pau*_*eux 3 r tidyr purrr tidyverse
我正在将许多源文件中的数据读取到嵌套数据框中。某些列具有不兼容的数据类型,这会阻止tidyr::unnest()函数工作。
例如,这是一个基于iris数据集的嵌套数据框:
irisnested <- iris %>% 
    rename_all(tolower) %>% 
    group_by(species) %>% 
    nest()
为了重现我的问题,我data在嵌套数据框的列表列中的子数据框之一中更改了列类型:
irisnested$data[[2]]$sepal.length <- as.character(irisnested$data[[2]]$sepal.length)
现在数据框不能再取消嵌套了:
irisnested %>% 
    unnest(data)
# Error in bind_rows_(x, .id) : Column `sepal.length` can't be converted from numeric to character
为了更正每个嵌套数据框中的列类型,我使用了一个匿名函数:
irisnested %>% 
    mutate(data = map(data,
                      function(dtf){
                          dtf$sepal.length = as.numeric(dtf$sepal.length)
                          return(dtf)
                      })) %>% 
    unnest(data)
现在可以再次取消嵌套数据框。但是这个匿名函数看起来很复杂,我的直觉是肯定有另一种方法可以做到这一点。有没有更好的方法来执行此修改,例如使用modify_at?
我们可以使用~,获取数据为.x,然后使用mutate来改变感兴趣的列的类型
irisnested %>% 
   mutate(data = map(data, ~ 
                       .x %>% 
                         mutate(sepal.length = as.numeric(sepal.length))))
| 归档时间: | 
 | 
| 查看次数: | 703 次 | 
| 最近记录: |