我正在尝试使用 ggplot2 在 R 中绘制箱线图。
这是我的带有示例数据的代码:
df = structure(list(Closeness = c(0.0919540229885057, 0.0950259836674091, 0.0957367240089753, 0.0960240060015004, 0.0901408450704225, 0.0970432145564822, 0.0939794419970631, 0.0943952802359882, 0.0921526277897768, 0.0914285714285714, 0.0933625091174325, 0.0953090096798213, 0.0917562724014337, 0.0960960960960961, 0.0937728937728938, 0.0909090909090909, NA, 0.0946045824094605, 0.0864280891289669, 0.0879120879120879, 0.0905233380480905, 0.100313479623824, 0.0993017843289372, 0.0942562592047128, 0.0950965824665676, 0.0907801418439716, NA, NA, 0.0950965824665676, 0.0913633119200571, NA, 0.0926864590876177, NA, 0.0948148148148148, 0.0958801498127341, 0.0945347119645495, 0.0931586608442504, 0.090014064697609, 0.0968229954614221, 0.0963855421686747, 0.0926193921852388, 0.0919540229885057, 0.0947446336047372, 0.0917562724014337, 0.0905874026893135, 0.0950965824665676, NA, 0.0926193921852388, 0.0900774102744546, 0.0977845683728037), Var1 = c("Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group", "Group"), Var2 = c("A", "B", "C", "D", "E", "F", "G", "H", "I", "J", "K", "L", "M", "A", "A", "K", "K", "G", "G", "N", "N", "O", "O", "A", "P", "P", "P", "Q", "Q", "Q", "Q", "A", "A", "A", "A", "R", "R", "R", "R", "S", "S", "S", "S", "L", "L", "L", "L", "L", "L", "L")), .Names = c("Closeness", "Var1", "Var2"), row.names = c(NA, 50L), class = "data.frame")
tmp <- data.frame(df, check.names=T)
tmp <- melt(tmp, id="Closeness", variable.name="Var1", value.name="Var2")
tmp$Var1 <- gsub("(.*)\\.[0-9]", "\\1", tmp$Var1)
df <- subset(tmp, Var2!="")
df_g = subset(df, Var1=="Group")
df_c = subset(df, Var1=="Cat")
ggplot(df_c, aes(x = df_g$Var2, y = df_g$Closeness), position = "dodge") + # geom_point() +
geom_boxplot(outlier.size = 1.5) #+ geom_jitter(position=position_jitter(width=.2, height=0))
Run Code Online (Sandbox Code Playgroud)
产生这个(使用完整数据集):
现在,我有两个问题:
这可以使用ggplot2吗?如果是这样,如何进行?
通常我会评论并关闭,例如,
或者如果您在 Stack Overflow 中搜索“ggplot2 order”,就会出现几乎任何内容。如果您想要特定于箱线图的示例(方法相同),请参阅
甚至是您在不到 2 周前问过的这个问题。不同geom,相同的原理。
但是,您还有一些其他问题,其中之一是data$column在内部使用aes(),这让我有点恼火,所以让我们也解决一下。
不要data$column在里面使用aes()!这意味着您没有正确使用 data 参数。相关:根本不清楚为什么你用空数据框开始绘图df_c,什么时候df_g有你需要的一切:
ggplot(df_g, aes(x = Var2, y = Closeness), position = "dodge") +
geom_boxplot(outlier.size = 1.5)
Run Code Online (Sandbox Code Playgroud)
正确使用data参数而不指定data$columninsideaes()将确保您的绘图在所有情况下都能正常工作。如果您使用$inside aes(),facets 和其他复杂功能可能无法正常工作。如果您需要在一个图中使用多个数据框,请在图层级别(例如,geom_point(data = other_data, aes(x = x_var, y = y_var)))进行。您仍然不需要使用$inside aes()。
至于你提到的两个问题,它们都是通过编辑数据来解决的。ggplot非常擅长绘制数据,你只需要让你的数据看起来像你想要绘制的那样。
我希望类别(A、B、C、D)按降序排列;
订购数据中的因子!
df_g$Var2 = with(df_g, reorder(x = Var2, X = Closeness, FUN = function(x) -mean(x, na.rm = TRUE)))
Run Code Online (Sandbox Code Playgroud)
有些类别只有一个样本(即 B、D 和 E)。我想在绘图之前删除它们。
好的,删除它们!您可以将它们从您的数据中完全删除,或者只是将您提供给绘图的数据子集:
more_than_one = levels(df_g$Var2)[table(df_g$Var2) > 1]
ggplot(subset(df_g, Var2 %in% more_than_one), aes(Var2, Closeness)) +
geom_boxplot()
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
2267 次 |
| 最近记录: |