所有小提琴的面积与ggplot2中的小平面无关

sta*_*kur 5 r data-visualization facet ggplot2

我想创建一个三个不同因素的情节,其中所有小提琴都有相同的区域.但使用facet_grid(. ~ C)似乎迫使每个方面内的小提琴(即只是因子C水平范围内的小提琴)具有相同的区域.我怎么能克服这个?

library(ggplot2)

d <- data.frame(value = c(906, 1013, 1109, 876, 747, 759, 876, 1358, 739, 
                          1086, 807, 954, 1586, 762, 1353, 1221, 976, 1002, 
                          1129, 943, 1270, 1126, 853, 950, 677, 696, 681, 
                          615, 736, 595, 590, 618, 524, 1014, 515, 645, 860, 
                          874, 934, 728, 1078, 659, 1024, 786, 821, 541,
                          681, 744),
                A = gl(2, 12, 48),
                B = gl(2, 6, 48),
                C = gl(2, 24))

ggplot(d, aes(x = A, y = value, fill = B)) +
  geom_violin(trim = FALSE, scale = "area") +
  facet_grid(. ~ C)
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

And*_*din 3

首先,我们将创建一个data.frame具有预先计算的密度的新值:

library('tidyverse')

d2 <- d %>%
  group_by(A, B, C) %>%
  do({
    dens <- density(.$value)
    tibble(x = c(head(dens$x, 1), dens$x, tail(dens$x, 1)), #Add 0s at end to close lines
           y = c(0, dens$y, 0))
  }) %>% 
  ungroup() %>% 
  mutate(ymin = as.numeric(A:B) - .4*y/max(y), # Add offset for factor levels
         ymax = as.numeric(A:B) + .4*y/max(y))
Run Code Online (Sandbox Code Playgroud)

现在我们将密度绘制为丝带:

ggplot(d2)+
  aes(x = x,
      ymin = ymin,
      ymax = ymax,
      group = A:B,
      fill = B)+
  geom_ribbon()+

  # Enclosing lines
  geom_line(aes(y = ymin))+
  geom_line(aes(y = ymax))+

  facet_grid(. ~ C)+

  scale_y_continuous(breaks = c(1.5, 2.5),
                     minor_breaks = c(1.5, 3.5),
                     labels = levels(d2$A))+

  labs(x = 'value', y = 'A')+
  coord_flip()
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

  • @statmerkur,基本上是因为这个`.4*y/max(y)`。在 ggplot 中,每个方面都选择“max”(也应该为“.5”以实现精确匹配)。在我们的例子中,我们使用通用的“max”进行缩放,该缩放发生在第二个方面,因此只有第一个方面出现不同。对于“trim = TRUE”,您应该将密度计算为“do()”内的“密度(.$value, from = min(.$value), to = max(.$value))”。 (2认同)