我刚刚开始使用该geom_map功能ggplot2.在阅读了我geom_map在这里找到的29篇帖子后,我仍然遇到了同样的问题.
我的数据框架非常大,包含超过2000行.它基本上是来自世界卫生组织编制的特定基因(TP53)的数据.
请从这里下载.
标题如下所示:
> head(ARCTP53_SOExample)
Mutation_ID MUT_ID hg18_Chr17_coordinates hg19_Chr17_coordinates ExonIntron Genomic_nt Codon_number
1 16 1789 7519192 7578467 5-exon 12451 155
2 13 1741 7519200 7578475 5-exon 12443 152
3 17 2143 7519131 7578406 5-exon 12512 175
4 14 2143 7519131 7578406 5-exon 12512 175
5 15 2168 7519128 7578403 5-exon 12515 176
6 12 3737 7517845 7577120 8-exon 13798 273
Description c_description g_description g_description_hg18 WT_nucleotide Mutant_nucleotide
1 A>G c.463A>G g.7578467T>C NC_000017.9:g.7519192T>C …Run Code Online (Sandbox Code Playgroud) 我想用fill.contour()创建这个图,但是在ggplot2中,我该怎么做?
我想使用ggplot2,因为图形约定更容易.我想使用filled.contour()的原因是因为我尝试了geom_tile()和image.plot()并且它们都创建了类似于输出的平铺,我需要一个类似于filled.contour()的输出.
这是我的数字:

码:
library(akima)
df <-read.table("Petra_phytoplankton+POM_xydata_minusNAs_noduplicates.txt",header=T)
attach(df)
names(df)
fld <- with(df, interp(x = longitude, y = latitude, z = d13C))
filled.contour.ungeoreferenced <-
(filled.contour(x = fld$x,
y = fld$y,
z = fld$z,
color.palette =
colorRampPalette(c("blue", "green", "yellow",
"orange", "red")),
xlab = "Longitude",
ylab = "Latitude",
key.title = title(main = "d13C",
cex.main = 1)))
Run Code Online (Sandbox Code Playgroud)
数据片段:
latitude longitude d13C
-65 -70 -27.7
-61 150 -32.2
-61 150 -28.3
-60 116 -26.8
-60 116 -24.7
-47 38 -24.8
-38 150 -20.5
19 -65.7 …Run Code Online (Sandbox Code Playgroud) 我可以dplyr用来连接sqlite数据库:
library(dplyr)
mydb<- src_sqlite("DATA/mydb.db")
Run Code Online (Sandbox Code Playgroud)
如何列出表格mydb?我在帮助文件中找不到任何相关内容
我正在开展网络抓取计划,以搜索特定的葡萄酒,并返回该品种的当地葡萄酒清单.我遇到的问题是多页结果.下面的代码是我正在使用的基本示例
url2 <- "http://www.winemag.com/?s=washington+merlot&search_type=reviews"
htmlpage2 <- read_html(url2)
names2 <- html_nodes(htmlpage2, ".review-listing .title")
Wines2 <- html_text(names2)
Run Code Online (Sandbox Code Playgroud)
对于此特定搜索,有39页的结果.我知道网址更改为http://www.winemag.com/?s=washington%20merlot&drink_type=wine&page=2,但是有一种简单的方法可以使代码循环遍历所有返回的页面并编译所有39个结果页面成一个列表?我知道我可以手动完成所有网址,但这看起来有点矫枉过正.
我有一百万点和一个大的形状文件-8GB-这太大了,无法加载到我系统上的R内存中.形状文件是单层的,因此给定的x,y最多只能击中一个多边形 - 只要它不完全在边界上!每个多边形都标有一个severity-例如1,2,3.我在64位ubuntu机器上使用R,配备12GB内存.
什么是最简单的方法能够"标签"的数据帧的多边形severity,让我得到了data.frame一个额外的列,即x,y,severity?
假设我在数据框中有一列“名称” df:
apple
apple123
app
be
aple
Run Code Online (Sandbox Code Playgroud)
并且,我想检查该name列中的每一行是否都包含单词apple。我这样做的方法是使用grepl, grepl('apple',df$name),我希望它会返回'TRUE','TRUE','FALSE','FALSE','FALSE',但是,它返回了 5 'FALSE'。
我在这里做错了什么吗?如果没有grep,我应该使用什么函数?
我有一个类型的两个对象大SpatialPointsDataFrame名为ST2和ST10.它们来自同一个来源.他们都没有问题:
plot(st2)
Run Code Online (Sandbox Code Playgroud)
要么
plot(st10)
Run Code Online (Sandbox Code Playgroud)
但我想用ggmap和ggplot绘制它们.我可以使用这样的简单代码为st2执行此操作:
map <- get_map(location = 'Pozna?', zoom = 12)
ggmap(map) + geom_point(aes(x =st2@coords[,1], y = st2@coords[,2]))
Run Code Online (Sandbox Code Playgroud)
但是当谈到st10时,我收到一个错误:
Error in data.frame(x = c(16.910848618, 16.910863876, 16.910913467, 16.910936356, :
arguments imply differing number of rows: 53885, 4
Run Code Online (Sandbox Code Playgroud)
我用length()检查值:
> length(st10@coords[,1])
[1] 53885
> length(st10@coords[,2])
[1] 53885
Run Code Online (Sandbox Code Playgroud)
我用摘要()检查它们
> summary(st10@coords[,1])
Min. 1st Qu. Median Mean 3rd Qu. Max.
16.84 16.88 16.91 16.91 16.91 16.99
> summary(st10@coords[,2])
Min. 1st Qu. Median …Run Code Online (Sandbox Code Playgroud) 我想通过ggplot2中的数据变量facet_wrap一个地图,例如下面例子中的'pets'.这是否需要完全复制每个变量类别的强化地图数据?那会让我觉得有点傻.有替代方法吗?
require(ggplot2)
(nz_dat = data.frame(island = rep(c('North.Island ','South.Island '), 3),
pets = c('cats','cats','dogs','dogs','birds','birds'),
n = c(13, 26, 48, 74, 24, 17)))
island pets n
1 North.Island cats 13
2 South.Island cats 26
3 North.Island dogs 48
4 South.Island dogs 74
5 North.Island birds 24
6 South.Island birds 17
nz = map_data("nz")
nz = subset(nz, nz$region %in% c('North.Island ','South.Island ')) # 2 main islands
# simple plot
ggplot(nz, aes(long, lat, group=group, fill=factor(region))) +
geom_polygon() + coord_quickmap()
Run Code Online (Sandbox Code Playgroud)
我很难让我的数据框在传单中绘制。我有一个 shapefile 和一个 csv 合并在一起。生成的数据帧有几列,包括 long、lat 和“percent”。
我可以使用 ggplot 和以下代码绘制它:
p <- ggplot() +
geom_polygon(data = nyc_plotData, aes(x=long, y=lat, group = group,
fill=percent)) +
geom_polygon(data = county, aes(x=long, y=lat, group = group),
fill=NA, color = "black", size = 0.25) +
coord_map(xlim = c(-74.26, -73.71), ylim = c(40.49,40.92))
Run Code Online (Sandbox Code Playgroud)
结果是纽约收入分布的区域分布图:

当我尝试在传单中使用相同的数据框时,出现此错误:
不知道如何从类 data.frame 的对象中获取路径数据
我知道我必须重新格式化我的数据框。我尝试了各种方法来转换为 SpatialPolygonDataFrame。例如:
xy <- nyc_plotData[,c(1,2)]
spdf <- SpatialPolygonsDataFrame(coords = xy, data = nyc_plotData,
proj4string = CRS("+proj=longlat +datum=WGS84 +ellps=WGS84 +towgs84=0,0,0"))
Run Code Online (Sandbox Code Playgroud)
给出以下错误:
SpatialPolygonsDataFrame(coords = xy, data = nyc_plotData, proj4string = …
我想在a data.frame和线性插入所有缺失值之间添加最小和最大日期之间的所有缺失日期,例如
df <- data.frame(date = as.Date(c("2015-10-05","2015-10-08","2015-10-09",
"2015-10-12","2015-10-14")),
value = c(8,3,9,NA,5))
date value
2015-10-05 8
2015-10-08 3
2015-10-09 9
2015-10-12 NA
2015-10-14 5
date value approx
2015-10-05 8 8
2015-10-06 NA 6.33
2015-10-07 NA 4.67
2015-10-08 3 3
2015-10-09 9 9
2015-10-10 NA 8.20
2015-10-11 NA 7.40
2015-10-12 NA 6.60
2015-10-13 NA 5.80
2015-10-14 5 5
Run Code Online (Sandbox Code Playgroud)
有没有一个明确的解决方案dplyr和approx?(我不喜欢我的10行for循环代码.)