我尝试使用汇总来获取每个组的第一个结果,但它返回列标题:
(get_table是一个自定义函数,从 Postgres 数据库获取数据表)
require(dplyr)
require(RPostgres)
tbl <- get_table(my_server, my_table) %>%
select(column_a, column_b) %>%
group_by(column_a) %>%
summarize(first_b = first(column_b))
Run Code Online (Sandbox Code Playgroud)
结果看起来像
a first_b
1 "column_b"
2 "column_b"
3 "column_b"
Run Code Online (Sandbox Code Playgroud)
如果我在获得所需结果dplyr::collect()之前使用summarize(),但这确实会降低性能。有什么想法可以summarize不先使用collect吗?