小编hrb*_*str的帖子

如何在ggplot中更改xlim

有几个问题询问如何更改 ggplot x 轴刻度,但我遇到了麻烦,可能是因为我用来绘图的其他美学。我想将 x 轴刻度从 7 扩展到 25。

我正在使用以下向量:

var <- c(2,2,1,0,1,1,1,1,1,3,2,3,3,5,1,4,4,0,3,4,1,0,3,3,0,0,
         1,3,2,6,2,2,2,1,0,2,3,2,0,0,0,0,3,2,2,4,3,2,2,0,4,1,0,1,3,1,4,3,1,2,
         6,7,6,1,2,2,4,5,3,0,6,5,2,0,7,1,7,3,1,4,1,1,2,1,1,2,1,1,4,2,0,3,3,2,2,2,5,3,2,5,2,5)
Run Code Online (Sandbox Code Playgroud)

我使用下面的代码制作一个直方图,其中 x 轴刻度位于条形下方

df <- data.table(x = var)
df <- df[, .N, by=x]

p <- ggplot(df, aes(x=factor(x), y=N)) +
     geom_bar(stat="identity", width=1.0, 
              colour = "darkgreen",
              fill = 'lightslateblue')

p <- p + labs(title = "hello world", x = "x tick", y = "ytick") 

print(p)
Run Code Online (Sandbox Code Playgroud)

当我打印直方图时,我希望 x 轴刻度达到 25

在此处输入图片说明

我尝试使用coord_cartesian(xlim = c(-0, 25))但它没有正确绘制,因为我希望沿着 x 轴标记刻度。

在此处输入图片说明

r histogram ggplot2

1
推荐指数
1
解决办法
2万
查看次数

使用R中的str_count函数计算多个模式

相当新的R并且使用该string_count函数来检测多个未知的单词并且包含在单独的向量中.

现在,我知道如何使用以下代码检测单个模式实例:

str_count(mydf$string, "Apples")
Run Code Online (Sandbox Code Playgroud)

我想要做的是从一个矢量中检测多个单词(例如"苹果","梨子","橙子"等),该矢量本身是从另一个数据帧创建的(例如通过使用Uniques<-unique(mydf1$words)).

这里的关键是,出现的单词mydf1$words完全取决于首先上传到R的数据,因为这将从数据集更改为数据集.

答案可能很简单,但对于我的生活,我似乎无法解决它!

string r count

1
推荐指数
1
解决办法
7058
查看次数

如何在值中提取字符组件并使用-99替换值

我的数据如下:

VAR_A: 134, 15M3, 2004, 301ME, 201E, 41, 53, 22
Run Code Online (Sandbox Code Playgroud)

我想改变这个向量,如下所示:

VAR_A: 134, -99, 2004, -99, -99, 41, 53, 22
Run Code Online (Sandbox Code Playgroud)

如果值包含字符(例如M,E),我想改变这些值与-99.我怎么能在R?我听说正则表达式可能是一种方式,但我并不擅长.

regex r

1
推荐指数
1
解决办法
51
查看次数

ggplot可以改变axis.ticks的方向从下到上吗?

我想意识到的事情如下:

样本

你看到axis.ticks的方向是向上的。

那么ggplot可以使axis.ticks的方向向上吗?

现在我可以意识到这一点

我现在创建的情节

您可以使用Axis Attributes·hadley/ggplot2 Wiki·GitHub的命令看到axis.ticks.length已设置为零 但这不是我想要的,而且网上似乎很少有描述。

谢谢!

plot r ggplot2

1
推荐指数
1
解决办法
926
查看次数

在R中查看巨型CSV文件中的注释

我有一个巨大的CSV文件太大,无法在我的标准笔记本电脑上的任何文本编辑器中打开.但是,我能够将文件导入R和子集以供使用...但我无法在CSV中查看注释.根据CSV相关的README文件,注释中有关于数据版本的基本信息.信息标题行以'#%'开头,注释以'##'开头.我想如果我能查看以'#'开头的前20行代码,我将能够提取我需要的信息.

我不清楚grep和head的R帮助文档,但我找到了一个很好的网站,描述了如何在Unix中做我想做的事情(这里:http: //bconnelly.net/working-with-csvs-on-the-命令行/).

用于打印以'#'开头的所有行的Unix代码是:grep"#"input.csv

谁能告诉我如何在R中这样做?或者至少如何在第一个说20行中打印以'#'开头的行?

unix csv r

1
推荐指数
1
解决办法
90
查看次数

na.rm和is.na给出了不同的答案

我刚刚遇到一个简单的问题,但我不明白发生了什么.我使用R来删除NA值并计算简单的汇总统计信息,但is.na和na.rm给了我不同的答案.

如果我有一个矢量

> test<-c(NA, NA,NA, 1,2,3,4)
Run Code Online (Sandbox Code Playgroud)

我用na.rm = TRUE计算平均值,得到正确的c(1,2,3,4)平均值.

> mean(test, na.rm=TRUE)
[1] 2.5
Run Code Online (Sandbox Code Playgroud)

如果我重复计算,这次用!is.na()删除NA值,我得到了错误的答案.

> mean(!is.na(test))
[1] 0.5714286
Run Code Online (Sandbox Code Playgroud)

!is.na(测试)给了我正确的值,但R如何估算这里的平均值?

> !is.na(test)
[1] FALSE FALSE FALSE  TRUE  TRUE  TRUE  TRUE
Run Code Online (Sandbox Code Playgroud)

r mean na na.rm

1
推荐指数
1
解决办法
1583
查看次数

ggplot2只有ablines

我正在关注ggplot文档中的一个示例

这是代码:

library(plyr)
coefs <- ddply(mtcars, .(cyl), function(df) {
  m <- lm(mpg ~ wt, data=df)
  data.frame(a = coef(m)[1], b = coef(m)[2])
})

p <- ggplot(mtcars, aes(x = wt, y=mpg), . ~ cyl) + geom_point()
p + geom_abline(data=coefs, aes(intercept=a, slope=b))
Run Code Online (Sandbox Code Playgroud)

但是,我想只使用'ablines'相同的图形!没有点!试:

p <- ggplot(mtcars, aes(x = wt, y=mpg), . ~ cyl)
p + geom_abline(data=coefs, aes(intercept=a, slope=b))
Run Code Online (Sandbox Code Playgroud)

给我一个错误:"参数"env"缺失,没有默认值'

plot r ggplot2

1
推荐指数
1
解决办法
355
查看次数

如何在R中的图中的箭头上添加文本

我使用R在图表中绘制了两个点,并用箭头连接点.如何在箭头上添加文本.(固定文本)我的代码如下:

x<-y<-1
new.x<-2
new.y<-2  
Text<-"Direction"
plot(x, y, xaxt='n',yaxt='n',cex=10,pch=19,xlim=c(0,4), ylim=c(0,3))
points(new.x,new.y,cex=10,pch=19)
arrows(x, y, new.x, new.y, col = "orange",lwd=4,lty=4)
Run Code Online (Sandbox Code Playgroud)

在箭头上我想在箭头上添加一个Text对象("Direction").

图像如下:

箭头包括它上面的文字

r graph igraph

1
推荐指数
1
解决办法
2175
查看次数

如何在R中打开文件格式和文件扩展名不同的excel文件?

我有一个 Excel 文件,当我想打开它时,会出现以下警告消息:

您尝试打开的文件“name.ext”的格式与文件扩展名指定的格式不同。打开文件之前,请验证文件是否未损坏且来源可靠。您想现在打开该文件吗?

当我单击“是”打开它时,一切都很好。但是,我想在 R 中读取此文件,尽管有警告,但无法管理 R 加载内容。我怎样才能实现这个目标?

我想用 R 打开的文件示例可以在此处下载。我使用微软 Office 2016。

xml excel warnings r package

1
推荐指数
1
解决办法
1022
查看次数

从文本中删除所有标点符号,包括用于tm包的撇号

我有一个由Tweets(只是消息文本)组成的向量,我正在清理这些向量以用于文本挖掘。我removePunctuation从这样的tm包中使用过:

clean_tweet_text = removePunctuation(tweet_text)
Run Code Online (Sandbox Code Playgroud)

这样就产生了一个矢量,除了撇号,所有标点符号都从文本中删除了,因为没有注册带有撇号的单词,这破坏了我的关键字搜索。例如,我的一个关键字是,climate但是如果有一条推文'climate,则不会被计算在内。

如何删除向量中所有的撇号/单引号?

这是dput可复制示例的标头:

c("expert briefing on climatechange disarmament sdgs nmun httpstco5gqkngpkap", 
"who uses nasa earth science data he looks at impact of aerosols on climateamp weather httpstcof4azsiqkw1 https…", 
"rt oddly enough some republicans think climate change is real oddly enough… httpstcomtlfx1mnuf uniteblue https…", 
"better dead than red bill gates says that only socialism can save us from climate change httpstcopypqmd1fok", 
"i see …
Run Code Online (Sandbox Code Playgroud)

r text-mining tm

1
推荐指数
1
解决办法
225
查看次数

标签 统计

r ×10

ggplot2 ×3

plot ×2

count ×1

csv ×1

excel ×1

graph ×1

histogram ×1

igraph ×1

mean ×1

na ×1

na.rm ×1

package ×1

regex ×1

string ×1

text-mining ×1

tm ×1

unix ×1

warnings ×1

xml ×1