访问 ggplot2 函数中轴标签的变量属性信息

Chr*_*aud 5 r ggplot2

我正在寻找提高大型数据集的数据效率的方法。为此,我使用 ggplot2 创建了几个函数。一些生成的图形可能会用于分发,因此,我希望它们具有易于理解的标题和轴标签。我想我可以使用将可读标签与每个变量相关联attr()。这样我就不必重命名变量并处理包括空格在内的长变量名。使用 ggplot 的函数时我成功了

library(ggplot2)
library(magrittr)

# Set attributes
mt <- mtcars
attr(mt$mpg, "desc") <- "Miles per Gallon"   
attr(mt$cyl, "desc") <- "Number of Cylinders"


mt %>% 
  ggplot() +
  geom_point(aes(x = cyl, y = mpg)) +
  labs(x = attr(mt$cyl, "desc"),
       y = attr(mt$mpg, "desc"))
Run Code Online (Sandbox Code Playgroud)

上面的代码的行为符合我的预期,并返回一个包含轴标签的图表。但是,当我创建图形函数时,我无法弄清楚如何访问变量属性。以下两种尝试都成功创建了图形,但没有生成轴标签

vis_1 <- function(.data, .x, .y) {
  .data %>% 
    ggplot() + 
    geom_point(aes(x = {{.x}}, y = {{.y}})) +
    labs(x = attr({{.data$.x}}, "desc"),
         y = attr({{.data$.y}}, "desc"))
}

vis_1(.data = mt, .x = cyl, .y = mpg)
Run Code Online (Sandbox Code Playgroud)

vis_2 <- function(.data, .x, .y) {
  attr_x <- attr(.data$.x, "desc")
  attr_y <- attr(.data$.y, "desc")
  
  .data %>% 
    ggplot() + 
    geom_point(aes(x = {{.x}}, y = {{.y}})) +
    labs(x = attr_x,
         y = attr_y)
}

vis_2(.data = mt, .x = cyl, .y = mpg)
Run Code Online (Sandbox Code Playgroud)

任何建议,将不胜感激。

nni*_*loc 3

这里的问题是引用您传递的变量。

如果您愿意使用cylmpg作为带引号的变量,这是一种选择。[内部的基本子集attr可以正常工作,并且ggplot您可以使用!!sym().

vis_2 <- function(df, x, y) {
  
  attr_x <- attr(df[,x], "desc")
  attr_y <- attr(df[,y], "desc")
  
  df %>% 
    ggplot() + 
    geom_point(aes(!!sym(x), !!sym(y))) +
    labs(x = attr_x,
         y = attr_y)
}

vis_2(mt, 'cyl', 'mpg')
Run Code Online (Sandbox Code Playgroud)

传递未加引号的变量的版本。该解决方案用于deparse(substitute(x))[通话中使用和!!enquo(x)ggplot.


vis_3 <- function(df, x, y) {
  
  # base quoting
  x_sub <- deparse(substitute(x))
  y_sub <- deparse(substitute(y))
  
  attr_x <- attr(df[,x_sub], "desc")
  attr_y <- attr(df[,y_sub], "desc")
  
  df %>% 
    ggplot() + 
    geom_point(aes(!!enquo(x), !!enquo(y))) +
    labs(x = attr_x,
         y = attr_y)
}


vis_3(mt, cyl, mpg)
Run Code Online (Sandbox Code Playgroud)

还有一个使用不带引号的变量的版本,这个版本使用{{forggplotdeparse(ensym()for [

vis_4 <- function(df, x, y) {
  
  attr_x <- attr(df[,deparse(ensym(x))], "desc")
  attr_y <- attr(df[,deparse(ensym(y))], "desc")
  
  df %>% 
    ggplot() + 
    geom_point(aes({{x}}, {{y}})) +
    labs(x = attr_x,
         y = attr_y)
}


vis_4(mt, cyl, mpg)
Run Code Online (Sandbox Code Playgroud)