我有一个列表,我正在变成一个数据帧.该列表从API返回,它包含一些NULL值.这里和这里有关于此主题的SO的问题,但它们要么处理数据帧,要么在第二个链接的情况下,鼓励OP首先转换为数据帧.我想保留列表结构.
我正在以下面的方式解析它,这里是一些示例数据:
example <- list(
list(
ID = "1",
Name = "Joe",
Middle_name = "Alan",
Surname = "Smith"
),
list(
ID = "2",
Name = "Sarah",
Middle_name = NULL,
Surname = "Jones"
),
list(
ID = "3",
Name = "Robert",
Middle_name = "Myles",
Surname = "McDonnell"
)
)
N <- NA_character_
df <- tibble::tibble(
id = purrr::map_chr(example, .null = N, "ID"),
name = purrr::map_chr(example, .null = N, "Name"),
middle = purrr::map_chr(example, .null = N, "Middle_name"),
surname = purrr::map_chr(example, .null = N, "Surname")
)
> df
# A tibble: 3 x 4
id name middle surname
<chr> <chr> <chr> <chr>
1 1 Joe <NA> Smith
2 2 Sarah <NA> Jones
3 3 Robert <NA> McDonnell
Run Code Online (Sandbox Code Playgroud)
看来这个问题在purrr repo中有一些历史,但是当我使用像is_empty()或的purrr函数时compact(),我得到一个错误或者它不起作用.
有谁知道我怎么能实现这一点,最好是保持我上面使用的tibble&map_chr方法?
d.b*_*d.b 12
df = setNames(object = data.frame(do.call(rbind, lapply(example, as.character, unlist))),
nm = names(example[[1]]))
df
# ID Name Middle_name Surname
#1 1 Joe Alan Smith
#2 2 Sarah NULL Jones
#3 3 Robert Myles McDonnell
replace(df, df=="NULL", NA)
# ID Name Middle_name Surname
#1 1 Joe Alan Smith
#2 2 Sarah <NA> Jones
#3 3 Robert Myles McDonnell
Run Code Online (Sandbox Code Playgroud)
您的示例确实适用于purrr的开发版本。
该NULL行是造成的办法,如使用的问题dplyr::bind_rows,否则将工作坍塌列表的列表为tibble。删除NULL行的解决方法是循环遍历flatten每个列表。循环通过map_df绑定行并给出您想要的结果。
map_df(example, flatten)
# A tibble: 3 x 4
ID Name Middle_name Surname
<chr> <chr> <chr> <chr>
1 1 Joe Alan Smith
2 2 Sarah <NA> Jones
3 3 Robert Myles McDonnell
Run Code Online (Sandbox Code Playgroud)