如何在 SQL 中实现 tidyr 的 complete()?

Mih*_*ael 1 sql oracle r tidyr

使用一个虚拟示例,我需要完成一个包含隐式缺失值的数据集。这在Rusingtidyr的函数中是微不足道的complete

library(tidyr)

df <- data.frame(Borough = c('Brooklyn', 'Brooklyn', 'Queens'),
                 Crime = c('Robbery', 'Homicide', 'Drug'),
                 Count=c(1, 2, 1))

> df
   Borough    Crime Count
1 Brooklyn  Robbery     1
2 Brooklyn Homicide     2
3   Queens     Drug     1

#Complete implicit missing values

> complete(df, Borough, Crime, fill=list(Count=0))
   Borough    Crime Count
1 Brooklyn     Drug     0
2 Brooklyn Homicide     2
3 Brooklyn  Robbery     1
4   Queens     Drug     1
5   Queens Homicide     0
6   Queens  Robbery     0
Run Code Online (Sandbox Code Playgroud)

但是,在实际数据非常大并且存储在 Oracle 的 SQL 表中的情况下,如何使用 SQL 查询来完成?

Vam*_*ala 5

交叉连接具有犯罪的不同行政区并左连接原始表以获取计数为 0 的缺失行。

select b.borough,c.crime,coalesce(t.count,0) as count
from (select distinct borough from tbl) b
cross join (select distinct crime from tbl) c
left join tbl t on t.borough=b.borough and t.crime=c.crime
Run Code Online (Sandbox Code Playgroud)