小编cou*_*rix的帖子

谁能解释为什么用两个条件创建直方图会显示 R 中的分布不正确?

我想使用来自两个不同条件(下例中的 A 和 B)的数据创建直方图。geom_histogram我想在 R 中使用同一图中绘制两个分布。

然而,对于条件 A,似乎显示了整个数据集的分布(而不是仅显示 A)。

下面的示例显示了三种情况:

  1. 绘制 A 和 B
  2. 仅绘制 A
  3. 仅绘制 B

比较 1) 和 2) 时,您会发现 A 的分布并不相同。

谁能解释为什么会发生这种情况以及如何解决这个问题?

set.seed(5)

# Create test data frame 
test <- data.frame(
  condition=factor(rep(c("A", "B"), each=200)),
  value =c(rnorm(200, mean=12, sd=2.5), rnorm(200, mean=13, sd=2.1))
)

# Create separate data sets
test_a <- test[test$condition == "A",]
test_b <- test[test$condition == "B",]

# 1) Plot A and B
ggplot(test, aes(x=value, fill=condition)) +
  geom_histogram(binwidth = 0.25, alpha=.5) +
  ggtitle("Test A …
Run Code Online (Sandbox Code Playgroud)

r histogram ggplot2

3
推荐指数
1
解决办法
640
查看次数

标签 统计

ggplot2 ×1

histogram ×1

r ×1