我有一个罗马硬币的集合,我试图ggplot
在R中使用它.
数据中有25种不同的面额,但我想将只有一次出现的所有面额合并到一个"OTHER"字段中,以便图表更易于阅读.
Medium Method Denom Date Era
1 Silver Struck Denarius 112 B.C.E.:111 B.C.E. Period V – c. 119-91 B.C.E.
2 Bronze Cast ????? ???????? 181 B.C.E.:174 B.C.E. Period III – c. 187-155 B.C.E.
3 Bronze Struck Litra:Half-litra 269 B.C.E. Period I – 269 - c. 222 B.C.E.
4 Bronze Struck Litra:Half-litra 269 B.C.E. Period I – 269 - c. 222 B.C.E.
5 Silver Struck Didrachm 275 B.C.E.:270 B.C.E. Period I – 269 - c. 222 B.C.E.
6 Bronze Struck Double-litra 275 B.C.E.:270 B.C.E. Period I – 269 - c. 222 B.C.E.
Run Code Online (Sandbox Code Playgroud)
使用上面的data.frame示例,"Denom"列需要将每个仅出现一次的值组合在一起并显示为"other".我想我应该在开始绘图之前在数据中这样做.请指出我正确的方向.
这是我正在使用的代码,ggplot
如果有帮助的话.
ggplot(data=longbadian, aes(x=Era, fill=Denom))
+ geom_bar(aes(x=Era2), data = longbadian, stat="bin")
+ theme(axis.text.x = element_text(angle=75, hjust=1),
legend.title=element_blank())
+ xlab("Sydenham Periods")
+ ylab("Coins by Denomination")
Run Code Online (Sandbox Code Playgroud)
这是一个示例图:
像这样的东西:
## example data
dd <- data.frame(DENOM=rep(LETTERS[1:7],c(10,5,4,rep(1,4))))
tt <- table(dd$DENOM) ## count occurrences
singletons <- names(tt)[tt==1] ## find singletons
tmpc <- as.character(dd$DENOM) ## convert from factor to char
tmpc[tmpc %in% singletons] <- "OTHER" ## replace values
dd$DENOM <- factor(tmpc) ## convert back to factor
Run Code Online (Sandbox Code Playgroud)
此解决方案的唯一问题是它会破坏您的DENOM
因子中任何预先存在的非默认排序.