小编hrb*_*str的帖子

你如何让geom_map显示地图的所有部分?

我刚刚开始使用该geom_map功能ggplot2.在阅读了我geom_map在这里找到的29篇帖子后,我仍然遇到了同样的问题.

我的数据框架非常大,包含超过2000行.它基本上是来自世界卫生组织编制的特定基因(TP53)的数据.

请从这里下载.

标题如下所示:

> head(ARCTP53_SOExample)
  Mutation_ID MUT_ID hg18_Chr17_coordinates hg19_Chr17_coordinates ExonIntron Genomic_nt Codon_number
1          16   1789                7519192                7578467     5-exon      12451          155
2          13   1741                7519200                7578475     5-exon      12443          152
3          17   2143                7519131                7578406     5-exon      12512          175
4          14   2143                7519131                7578406     5-exon      12512          175
5          15   2168                7519128                7578403     5-exon      12515          176
6          12   3737                7517845                7577120     8-exon      13798          273
  Description c_description g_description       g_description_hg18 WT_nucleotide Mutant_nucleotide
1         A>G      c.463A>G  g.7578467T>C NC_000017.9:g.7519192T>C …
Run Code Online (Sandbox Code Playgroud)

plot r ggplot2

7
推荐指数
1
解决办法
2646
查看次数

R plot在ggpplot2中输出filled.contour()输出

我想用fill.contour()创建这个图,但是在ggplot2中,我该怎么做?

我想使用ggplot2,因为图形约定更容易.我想使用filled.contour()的原因是因为我尝试了geom_tile()和image.plot()并且它们都创建了类似于输出的平铺,我需要一个类似于filled.contour()的输出.

这是我的数字:

在此输入图像描述

码:

library(akima)

df <-read.table("Petra_phytoplankton+POM_xydata_minusNAs_noduplicates.txt",header=T)
attach(df)
names(df)
fld <- with(df, interp(x = longitude, y = latitude, z = d13C))

filled.contour.ungeoreferenced <- 
  (filled.contour(x = fld$x,
                  y = fld$y,
                  z = fld$z,
                  color.palette =
                    colorRampPalette(c("blue", "green", "yellow",
                                       "orange", "red")),
                  xlab = "Longitude",
                  ylab = "Latitude",
                  key.title = title(main = "d13C", 
                                    cex.main = 1)))
Run Code Online (Sandbox Code Playgroud)

数据片段:

latitude    longitude   d13C
-65 -70 -27.7
-61 150 -32.2
-61 150 -28.3
-60 116 -26.8
-60 116 -24.7
-47 38  -24.8
-38 150 -20.5
19  -65.7 …
Run Code Online (Sandbox Code Playgroud)

graphing r contour ggplot2

7
推荐指数
2
解决办法
1万
查看次数

用dplyr列出sqlite表?

我可以dplyr用来连接sqlite数据库:

library(dplyr)
mydb<- src_sqlite("DATA/mydb.db")
Run Code Online (Sandbox Code Playgroud)

如何列出表格mydb?我在帮助文件中找不到任何相关内容

r dplyr

7
推荐指数
1
解决办法
1061
查看次数

R网页抓取多个页面

我正在开展网络抓取计划,以搜索特定的葡萄酒,并返回该品种的当地葡萄酒清单.我遇到的问题是多页结果.下面的代码是我正在使用的基本示例

url2 <- "http://www.winemag.com/?s=washington+merlot&search_type=reviews"
htmlpage2 <- read_html(url2)
names2 <- html_nodes(htmlpage2, ".review-listing .title")
Wines2 <- html_text(names2)
Run Code Online (Sandbox Code Playgroud)

对于此特定搜索,有39页的结果.我知道网址更改为http://www.winemag.com/?s=washington%20merlot&drink_type=wine&page=2,但是有一种简单的方法可以使代码循环遍历所有返回的页面并编译所有39个结果页面成一个列表?我知道我可以手动完成所有网址,但这看起来有点矫枉过正.

html r web-scraping rvest

7
推荐指数
2
解决办法
9341
查看次数

r多边形点

我有一百万点和一个大的形状文件-8GB-这太大了,无法加载到我系统上的R内存中.形状文件是单层的,因此给定的x,y最多只能击中一个多边形 - 只要它不完全在边界上!每个多边形都标有一个severity-例如1,2,3.我在64位ubuntu机器上使用R,配备12GB内存.

什么是最简单的方法能够"标签"的数据帧的多边形severity,让我得到了data.frame一个额外的列,即x,y,severity

gis r

6
推荐指数
2
解决办法
2853
查看次数

如何检查列中的每一行是否包含子字符串

假设我在数据框中有一列“名称” df

apple
apple123
app
be
aple
Run Code Online (Sandbox Code Playgroud)

并且,我想检查该name列中的每一行是否都包含单词apple。我这样做的方法是使用grepl, grepl('apple',df$name),我希望它会返回'TRUE','TRUE','FALSE','FALSE','FALSE',但是,它返回了 5 'FALSE'

我在这里做错了什么吗?如果没有grep,我应该使用什么函数?

r grepl

6
推荐指数
1
解决办法
2万
查看次数

ggplot在geom_point中给出"参数暗示不同行数"的错误,而不是真的 - 如何调试?

我有一个类型的两个对象大SpatialPointsDataFrame名为ST2ST10.它们来自同一个来源.他们都没有问题:

plot(st2)
Run Code Online (Sandbox Code Playgroud)

要么

plot(st10)
Run Code Online (Sandbox Code Playgroud)

但我想用ggmap和ggplot绘制它们.我可以使用这样的简单代码为st2执行此操作:

map <- get_map(location = 'Pozna?', zoom = 12)
ggmap(map) + geom_point(aes(x =st2@coords[,1], y = st2@coords[,2]))
Run Code Online (Sandbox Code Playgroud)

但是当谈到st10时,我收到一个错误:

Error in data.frame(x = c(16.910848618, 16.910863876, 16.910913467, 16.910936356,  :   
arguments imply differing number of rows: 53885, 4
Run Code Online (Sandbox Code Playgroud)

我用length()检查值:

> length(st10@coords[,1])
[1] 53885
> length(st10@coords[,2])
[1] 53885
Run Code Online (Sandbox Code Playgroud)

我用摘要()检查它们

> summary(st10@coords[,1])
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  16.84   16.88   16.91   16.91   16.91   16.99 
> summary(st10@coords[,2])
   Min. 1st Qu.  Median …
Run Code Online (Sandbox Code Playgroud)

r spatial ggplot2

6
推荐指数
1
解决办法
1万
查看次数

在ggplot2中使用facet_wrap进行映射

我想通过ggplot2中的数据变量facet_wrap一个地图,例如下面例子中的'pets'.这是否需要完全复制每个变量类别的强化地图数据?那会让我觉得有点傻.有替代方法吗?

require(ggplot2)
(nz_dat = data.frame(island = rep(c('North.Island ','South.Island '), 3),
           pets = c('cats','cats','dogs','dogs','birds','birds'),
           n = c(13, 26, 48, 74, 24, 17)))
             island  pets  n
1 North.Island   cats 13
2 South.Island   cats 26
3 North.Island   dogs 48
4 South.Island   dogs 74
5 North.Island  birds 24
6 South.Island  birds 17

nz = map_data("nz")
nz = subset(nz, nz$region %in% c('North.Island ','South.Island ')) # 2 main islands

# simple plot
ggplot(nz, aes(long, lat, group=group, fill=factor(region))) + 
  geom_polygon() + coord_quickmap()
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

plot r ggplot2

6
推荐指数
1
解决办法
1754
查看次数

在传单中绘制 shp 文件,适用于 ggplot

我很难让我的数据框在传单中绘制。我有一个 shapefile 和一个 csv 合并在一起。生成的数据帧有几列,包括 long、lat 和“percent”。

我可以使用 ggplot 和以下代码绘制它:

p <- ggplot() +
    geom_polygon(data = nyc_plotData, aes(x=long, y=lat, group = group, 
                                      fill=percent)) +
    geom_polygon(data = county, aes(x=long, y=lat, group = group), 
                                      fill=NA, color = "black", size = 0.25) +
    coord_map(xlim = c(-74.26, -73.71), ylim = c(40.49,40.92))
Run Code Online (Sandbox Code Playgroud)

结果是纽约收入分布的区域分布图:

纽约情节

当我尝试在传单中使用相同的数据框时,出现此错误:

不知道如何从类 data.frame 的对象中获取路径数据

我知道我必须重新格式化我的数据框。我尝试了各种方法来转换为 SpatialPolygonDataFrame。例如:

xy <- nyc_plotData[,c(1,2)]
spdf <- SpatialPolygonsDataFrame(coords = xy, data = nyc_plotData,
                               proj4string = CRS("+proj=longlat +datum=WGS84 +ellps=WGS84 +towgs84=0,0,0"))
Run Code Online (Sandbox Code Playgroud)

给出以下错误:

SpatialPolygonsDataFrame(coords = xy, data = nyc_plotData, proj4string = …

r shapefile leaflet

6
推荐指数
1
解决办法
5488
查看次数

线性插值时间序列中的缺失值

我想在a data.frame和线性插入所有缺失值之间添加最小和最大日期之间的所有缺失日期,例如

df <- data.frame(date = as.Date(c("2015-10-05","2015-10-08","2015-10-09",
                                  "2015-10-12","2015-10-14")),       
                 value = c(8,3,9,NA,5))

      date value
2015-10-05     8
2015-10-08     3
2015-10-09     9
2015-10-12    NA
2015-10-14     5

      date value approx
2015-10-05     8      8
2015-10-06    NA   6.33
2015-10-07    NA   4.67
2015-10-08     3      3
2015-10-09     9      9
2015-10-10    NA   8.20
2015-10-11    NA   7.40
2015-10-12    NA   6.60
2015-10-13    NA   5.80
2015-10-14     5      5
Run Code Online (Sandbox Code Playgroud)

有没有一个明确的解决方案dplyrapprox?(我不喜欢我的10行for循环代码.)

r time-series linear-interpolation dplyr

6
推荐指数
3
解决办法
7633
查看次数