试图理解binwidth为geom_histogram. 虽然到目前为止失败了。
这是可重现的数据
a <- rnorm(10,7,0.1)
b <- rnorm(10,13,5)
df <- data.frame(data = c(a,b),group=c(rep("a",10),rep("b",10)))
kk <- df%>%
group_by(group)%>%
mutate(bin=density(data)$bw)
binns <- round(unique(kk$bin),digits = 2) # to get each binwidth for each group
ggplot()+
geom_histogram(data=kk,aes(x=data, fill=group),binwidth=binss)+
facet_wrap(~group,scales=c("free_y"))
Error in seq.default(round_any(range[1], size, floor), round_any(range[2], :
'from' must be of length 1
Error in seq.default(round_any(range[1], size, floor), round_any(range[2], :
'from' must be of length 1
Error in exists(name, envir = env, mode = mode) :
argument "env" is missing, with no default
Run Code Online (Sandbox Code Playgroud)
然后我试过了
ggplot()+
geom_histogram(data=kk,aes(x=data, fill=group),binwidth=c(binns[1],binns[2]))+
facet_wrap(~group,scales=c("free_y"))
Run Code Online (Sandbox Code Playgroud)
发生了同样的错误。我不明白为什么它会给出同样的错误。
您可以迭代 bin 以创建图层
library(dplyr)
a <- rnorm(10,7,0.1)
b <- rnorm(10,13,5)
df <- data.frame(data = c(a,b),group=c(rep("a",10),rep("b",10)))
kk <- df %>%
group_by(group) %>%
mutate(bin=round(density(data)$bw, 2))
binns <- unique(kk$bin)
Run Code Online (Sandbox Code Playgroud)
附 ggplot2
library(ggplot2)
Run Code Online (Sandbox Code Playgroud)
在列表中为每个 bin 值创建一个直方图图层,其中仅包含该 bin 的数据。如果您有 30 个级别,您将拥有一个包含 30 个直方图图层的列表
lp_hist <- plyr::llply(binns, function(b) {
geom_histogram(data = kk %>%
filter(bin == b),
aes(x = data, fill=group),
binwidth = b)
})
Run Code Online (Sandbox Code Playgroud)
组合这些层,将它们全部添加到ggplot()对象中
p_hist <- Reduce("+", lp_hist, init = ggplot())
Run Code Online (Sandbox Code Playgroud)
根据需要进行构面和缩放
p_hist + facet_grid(. ~ group, scales = "free_y")
Run Code Online (Sandbox Code Playgroud)
您将获得所需的图形,即按方面不同的 binwidth。
小心,因为 30 个级别将提供 30 个方面......很多。
诺塔:使用dplyr 0.4.3,ggplot2 2.1.0和plyr 1.8.3上R 3.2.3