将 R ggplot 中密度图中的 y 轴归一化为按组比例

Koo*_*133 6 plot r ggplot2

我的问题非常类似于

将 R ggplot 中直方图中的 y 轴归一化为按组比例

除了,我需要密度图,并且我希望将 y 轴作为每 1000 名患者的 x 计数之类的比率。

我有多组不同大小的数据,我希望每个比例都与其组大小有关,而不是总大小。

为了更清楚,假设我在一个数据框中有两组数据

示例数据:

dataA<-rnorm(10000,3,sd=2)
dataB<-rnorm(40000,5,sd=3)
bp_combi<-data.frame(dataset=c(rep('A',length(dataA)),rep('B',length(dataB))),
                     value=c(dataA,dataB))
Run Code Online (Sandbox Code Playgroud)

我可以将分布相对于总大小绘制在一起,但不能相对于相对大小绘制。

combi_dens = ggplot(bp_combi, 
                    aes(x=value, 
                        number_of_cases=nrow(bp_combi),
                        y=(..count..)/number_of_cases*1000, fill=dataset)) +
               geom_density(bw = 1, alpha=0.4, size = 1.5 )
Run Code Online (Sandbox Code Playgroud)

是否有可能相对于每个组的大小?

谢谢!

Koo*_*133 5

对于那些仍然感兴趣的人。答案相当简单。首先使用相对组大​​小创建一个单独的列,并在 ggplot 中使用该列。

unique_episodes = bp_combi %>% group_by(dataset) %>% count(dataset)
data2 = merge(x = bp_combi, y = unique_episodes, by = "dataset", all.x = TRUE)


combi_dens = ggplot(bp_combi, 
                    aes(x=value,,
                        y=(..count..)/n*1000, fill=dataset)) +
  geom_density(bw = 1, alpha=0.4, size = 1.5 )
Run Code Online (Sandbox Code Playgroud)