仅在OTHER字段中出现一次的组值

Question

仅在OTHER字段中出现一次的组值

我有一个罗马硬币的集合,我试图ggplot在R中使用它.

数据中有25种不同的面额,但我想将只有一次出现的所有面额合并到一个"OTHER"字段中,以便图表更易于阅读.

  Medium Method Denom            Date                  Era
1 Silver Struck Denarius         112 B.C.E.:111 B.C.E. Period V – c. 119-91 B.C.E.
2 Bronze   Cast ????? ????????   181 B.C.E.:174 B.C.E. Period III – c. 187-155 B.C.E.
3 Bronze Struck Litra:Half-litra            269 B.C.E. Period I – 269 - c. 222 B.C.E.
4 Bronze Struck Litra:Half-litra            269 B.C.E. Period I – 269 - c. 222 B.C.E.
5 Silver Struck Didrachm         275 B.C.E.:270 B.C.E. Period I – 269 - c. 222 B.C.E.
6 Bronze Struck Double-litra     275 B.C.E.:270 B.C.E. Period I – 269 - c. 222 B.C.E.

Run Code Online (Sandbox Code Playgroud)

使用上面的data.frame示例,"Denom"列需要将每个仅出现一次的值组合在一起并显示为"other".我想我应该在开始绘图之前在数据中这样做.请指出我正确的方向.

这是我正在使用的代码,ggplot如果有帮助的话.

ggplot(data=longbadian, aes(x=Era, fill=Denom)) 
+    geom_bar(aes(x=Era2), data = longbadian, stat="bin") 
+ theme(axis.text.x =  element_text(angle=75, hjust=1), 
                       legend.title=element_blank()) 
+ xlab("Sydenham Periods") 
+ ylab("Coins by Denomination")

Run Code Online (Sandbox Code Playgroud)

这是一个示例图:

在此输入图像描述

Answer 1

Ben*_*ker 5

像这样的东西:

## example data
dd <- data.frame(DENOM=rep(LETTERS[1:7],c(10,5,4,rep(1,4))))
tt <- table(dd$DENOM)                  ## count occurrences
singletons <- names(tt)[tt==1]         ## find singletons
tmpc <- as.character(dd$DENOM)         ## convert from factor to char
tmpc[tmpc %in% singletons] <- "OTHER"  ## replace values
dd$DENOM <- factor(tmpc)               ## convert back to factor

Run Code Online (Sandbox Code Playgroud)

此解决方案的唯一问题是它会破坏您的DENOM因子中任何预先存在的非默认排序.

归档时间：	10 年，5 月前
查看次数：	59 次
最近记录：	10 年，5 月前