我知道如何绘制直方图或其他频率/百分比相关表.但是现在我想知道,如何在表格中使用这些频率值以便在事后使用.
我有一个庞大的数据集,现在我绘制一个设置binwidth的直方图.我想提取对应于每个binwidth的频率值(即y轴上的值)并将其保存在某处.
有人可以帮我这个吗?谢谢!
请考虑以下几行.
p <- ggplot(mpg, aes(x=factor(cyl), y=..count..))
p + geom_histogram()
p + stat_summary(fun.y=identity, geom='bar')
Run Code Online (Sandbox Code Playgroud)
理论上,最后两个应该产生相同的情节.在实践中,stat_summary失败并抱怨所需的美学缺失.
为什么我不能用..count..的stat_summary?我在文档中找不到有关如何使用这些变量的信息.
我想安排几个 ggplot2 绘图。对于直方图来说,它工作得非常好,代码如下:
df<-NULL
df$Temp<-rnorm(mean=20,sd=3,n=100)
df$Modul<-rep(seq(1,4,1),25)
df<-as.data.frame(df)
qplot(Temp, data=df, geom="histogram",binwidth=1)+
facet_grid(Modul ~ .)
Run Code Online (Sandbox Code Playgroud)

现在我想要累积直方图,我遵循了这个 recipy。但它给了我错误的总和:
qplot(Temp, data=df, geom="histogram",binwidth=1)+
geom_histogram(aes(y=cumsum(..count..)),binwidth=1)+
facet_grid(Modul ~ .)
Run Code Online (Sandbox Code Playgroud)

虽然我大致了解发生了什么,但我还不够专业来解决这个问题。有什么提示吗?
最好的问候,约亨