我想使用来自两个不同条件(下例中的 A 和 B)的数据创建直方图。geom_histogram我想在 R 中使用同一图中绘制两个分布。
然而,对于条件 A,似乎显示了整个数据集的分布(而不是仅显示 A)。
下面的示例显示了三种情况:
比较 1) 和 2) 时,您会发现 A 的分布并不相同。
谁能解释为什么会发生这种情况以及如何解决这个问题?
set.seed(5)
# Create test data frame
test <- data.frame(
condition=factor(rep(c("A", "B"), each=200)),
value =c(rnorm(200, mean=12, sd=2.5), rnorm(200, mean=13, sd=2.1))
)
# Create separate data sets
test_a <- test[test$condition == "A",]
test_b <- test[test$condition == "B",]
# 1) Plot A and B
ggplot(test, aes(x=value, fill=condition)) +
geom_histogram(binwidth = 0.25, alpha=.5) +
ggtitle("Test A …Run Code Online (Sandbox Code Playgroud)