我正在寻找提高大型数据集的数据效率的方法。为此,我使用 ggplot2 创建了几个函数。一些生成的图形可能会用于分发,因此,我希望它们具有易于理解的标题和轴标签。我想我可以使用将可读标签与每个变量相关联attr()。这样我就不必重命名变量并处理包括空格在内的长变量名。使用 ggplot 的函数时我成功了
library(ggplot2)
library(magrittr)
# Set attributes
mt <- mtcars
attr(mt$mpg, "desc") <- "Miles per Gallon"
attr(mt$cyl, "desc") <- "Number of Cylinders"
mt %>%
ggplot() +
geom_point(aes(x = cyl, y = mpg)) +
labs(x = attr(mt$cyl, "desc"),
y = attr(mt$mpg, "desc"))
Run Code Online (Sandbox Code Playgroud)
上面的代码的行为符合我的预期,并返回一个包含轴标签的图表。但是,当我创建图形函数时,我无法弄清楚如何访问变量属性。以下两种尝试都成功创建了图形,但没有生成轴标签
vis_1 <- function(.data, .x, .y) {
.data %>%
ggplot() +
geom_point(aes(x = {{.x}}, y = {{.y}})) +
labs(x = attr({{.data$.x}}, "desc"),
y = attr({{.data$.y}}, "desc"))
}
vis_1(.data = mt, .x = cyl, .y = mpg)
Run Code Online (Sandbox Code Playgroud)
和
vis_2 <- function(.data, .x, .y) {
attr_x <- attr(.data$.x, "desc")
attr_y <- attr(.data$.y, "desc")
.data %>%
ggplot() +
geom_point(aes(x = {{.x}}, y = {{.y}})) +
labs(x = attr_x,
y = attr_y)
}
vis_2(.data = mt, .x = cyl, .y = mpg)
Run Code Online (Sandbox Code Playgroud)
任何建议,将不胜感激。
这里的问题是引用您传递的变量。
如果您愿意使用cyl和mpg作为带引号的变量,这是一种选择。[内部的基本子集attr可以正常工作,并且ggplot您可以使用!!sym().
vis_2 <- function(df, x, y) {
attr_x <- attr(df[,x], "desc")
attr_y <- attr(df[,y], "desc")
df %>%
ggplot() +
geom_point(aes(!!sym(x), !!sym(y))) +
labs(x = attr_x,
y = attr_y)
}
vis_2(mt, 'cyl', 'mpg')
Run Code Online (Sandbox Code Playgroud)
传递未加引号的变量的版本。该解决方案用于deparse(substitute(x))在[通话中使用和!!enquo(x)在ggplot.
vis_3 <- function(df, x, y) {
# base quoting
x_sub <- deparse(substitute(x))
y_sub <- deparse(substitute(y))
attr_x <- attr(df[,x_sub], "desc")
attr_y <- attr(df[,y_sub], "desc")
df %>%
ggplot() +
geom_point(aes(!!enquo(x), !!enquo(y))) +
labs(x = attr_x,
y = attr_y)
}
vis_3(mt, cyl, mpg)
Run Code Online (Sandbox Code Playgroud)
还有一个使用不带引号的变量的版本,这个版本使用{{forggplot和deparse(ensym()for [。
vis_4 <- function(df, x, y) {
attr_x <- attr(df[,deparse(ensym(x))], "desc")
attr_y <- attr(df[,deparse(ensym(y))], "desc")
df %>%
ggplot() +
geom_point(aes({{x}}, {{y}})) +
labs(x = attr_x,
y = attr_y)
}
vis_4(mt, cyl, mpg)
Run Code Online (Sandbox Code Playgroud)