小编Oll*_*aws的帖子

R:删除额外的x轴值(ggplot2)

我正在使用带有ggplot2库的条形图,并且当x轴上的值的数量(在我的情况下为日期)很高时,在轴的开始和结束处会出现额外的空白值滴答.请问,有没有办法如何删除这些?可重现的代码和图片如下. 在此输入图像描述

library(ggplot2)
a <- runif(28, 2.0, 7.5)
b <- seq(as.Date("1910/1/1"), as.Date("1910/1/28"), "days")
ds = data.frame(a, b)

p <- 
ggplot(data=ds, aes(b, a), environment = environment()) +  
theme(panel.grid.major.x =  element_blank(), panel.grid.minor =  element_blank(),
      panel.grid.major.y = element_line(color="grey"), 
      panel.background = element_blank(), panel.border = element_rect(fill= NA, colour = "grey")) +
geom_bar(width=.4,stat="identity") + 
xlab(" ") + ylab(" ") +
theme(text = element_text(size=20), axis.text.x = element_text(angle=90), axis.text = element_text(color="black"),
      legend.key = element_rect(fill="white")) +
scale_x_date(breaks = date_breaks("1 day"), labels = date_format("%d.%B %y")) 

print(p)
Run Code Online (Sandbox Code Playgroud)

axis r ggplot2

5
推荐指数
1
解决办法
756
查看次数

R:找到语料库中最常见的单词组

有没有一种简单的方法不仅可以在 R 的文本语料库中找到最常见的术语,还可以找到表达式(例如多个单词、一组单词)?

使用 tm 包,我可以找到最常见的术语,如下所示:

tdm <- TermDocumentMatrix(corpus)
findFreqTerms(tdm, lowfreq=3, highfreq=Inf)
Run Code Online (Sandbox Code Playgroud)

我可以使用函数找到与最常见单词相关的单词findAssocs(),因此我可以手动对这些单词进行分组。但是我怎样才能找到这些词组在语料库中出现的次数呢?

谢谢

corpus tm word-frequency

4
推荐指数
1
解决办法
9277
查看次数

标签 统计

axis ×1

corpus ×1

ggplot2 ×1

r ×1

tm ×1

word-frequency ×1