如何在ggplot2中创建Marimekko/Mosaic图

Jer*_*oen 32 r ggplot2

当x和y都是分类变量时,Marimekko/Mosaic图是一个很好的默认图.使用ggplot创建这些内容的最佳方法是什么?

例

我能找到的唯一参考是这个4yo 博客文章,但这似乎有点过时了.现在是否有更好或更简单的实施方法可供选择?GGally包有一个功能,ggally_ratio但这会产生一些完全不同的东西:

ggally

Edw*_*win 25

我是在一段时间以前自己做的,只是使用它geom_bar,我把它变成了一个通用函数,所以它应该适用于任何两个factors.在此输入图像描述

ggMMplot <- function(var1, var2){
  require(ggplot2)
  levVar1 <- length(levels(var1))
  levVar2 <- length(levels(var2))

  jointTable <- prop.table(table(var1, var2))
  plotData <- as.data.frame(jointTable)
  plotData$marginVar1 <- prop.table(table(var1))
  plotData$var2Height <- plotData$Freq / plotData$marginVar1
  plotData$var1Center <- c(0, cumsum(plotData$marginVar1)[1:levVar1 -1]) +
    plotData$marginVar1 / 2

  ggplot(plotData, aes(var1Center, var2Height)) +
    geom_bar(stat = "identity", aes(width = marginVar1, fill = var2), col = "Black") +
    geom_text(aes(label = as.character(var1), x = var1Center, y = 1.05)) 
  }

ggMMplot(diamonds$cut, diamonds$clarity)
Run Code Online (Sandbox Code Playgroud)

  • 我认为 Z.Lin 在当前的 R / tidyverse 实现方面做得很好。 (2认同)

Z.L*_*Lin 15

有一段时间我对一个项目有同样的问题.我的解决方案是geom_barscales="free_x", space="free_x"选项一起使用facet_grid以适应不同的条宽:

# using diamonds dataset for illustration
df <- diamonds %>%
  group_by(cut, clarity) %>%
  summarise(count = n()) %>%
  mutate(cut.count = sum(count),
         prop = count/sum(count)) %>%
  ungroup()

ggplot(df,
       aes(x = cut, y = prop, width = cut.count, fill = clarity)) +
  geom_bar(stat = "identity", position = "fill", colour = "black") +
  # geom_text(aes(label = scales::percent(prop)), position = position_stack(vjust = 0.5)) + # if labels are desired
  facet_grid(~cut, scales = "free_x", space = "free_x") +
  scale_fill_brewer(palette = "RdYlGn") +
  # theme(panel.spacing.x = unit(0, "npc")) + # if no spacing preferred between bars
  theme_void() 
Run Code Online (Sandbox Code Playgroud)

marimekko情节


Jer*_*oen 10

第一次尝试.我不知道如何将因子标签放在轴上.

makeplot_mosaic <- function(data, x, y, ...){
  xvar <- deparse(substitute(x))
  yvar <- deparse(substitute(y))
  mydata <- data[c(xvar, yvar)];
  mytable <- table(mydata);
  widths <- c(0, cumsum(apply(mytable, 1, sum)));
  heights <- apply(mytable, 1, function(x){c(0, cumsum(x/sum(x)))});

  alldata <- data.frame();
  allnames <- data.frame();
  for(i in 1:nrow(mytable)){
    for(j in 1:ncol(mytable)){
      alldata <- rbind(alldata, c(widths[i], widths[i+1], heights[j, i], heights[j+1, i]));
    }
  }
  colnames(alldata) <- c("xmin", "xmax", "ymin", "ymax")

  alldata[[xvar]] <- rep(dimnames(mytable)[[1]],rep(ncol(mytable), nrow(mytable)));
  alldata[[yvar]] <- rep(dimnames(mytable)[[2]],nrow(mytable));

  ggplot(alldata, aes(xmin=xmin, xmax=xmax, ymin=ymin, ymax=ymax)) + 
    geom_rect(color="black", aes_string(fill=yvar)) +
    xlab(paste(xvar, "(count)")) + ylab(paste(yvar, "(proportion)"));
}
Run Code Online (Sandbox Code Playgroud)

例:

makeplot_mosaic(mtcars, vs, gear)
Run Code Online (Sandbox Code Playgroud)

例


use*_*503 8

您可以使用名为“ggmosaic”的 ggplot2 扩展包(https://github.com/haleyjeppson/ggmosaic)。

此处提供了包含示例代码和视觉结果的广泛教程https://cran.r-project.org/web/packages/ggmosaic/vignettes/ggmosaic.html

  • 平心而论,这个问题是在没有可复制代码的情况下提出的。我添加了对包教程的引用,这将有助于解决问题。 (3认同)

小智 5

Plotluck是基于库GGPLOT2,旨在自动化情节类型的基础上1-3变量的特性选择。它包含一个用于马赛克图的函数。例子: plotluck(mtcars,vs,gear)

在此处输入图片说明