我有两个包含遗传SNP数据的大型数据表(或将有它们,我仍然需要将它们变成相同的格式).
这些是非常庞大的表格,因此我必须在集群上执行任何操作.
两个表都有> 600,000行,其中包含不同但重叠的SNP的数据.每列是一个人(一个表有942个样本,一个有92个).一旦正确格式化了另一个表,两个表都将如下所示
dbSNP_RSID Sample1 Sample2 Sample3 Sample4 Sample5
rs10000011 CC CC CC CC TC
rs1000002 TC TT CC TT TT
rs10000023 TG TG TT TG TG
rs1000003 AA AG AG AA AA
rs10000041 TT TG TT TT TG
rs10000046 GG GG AG GG GG
rs10000057 AA AG GG AA AA
rs10000073 TC TT TT TT TT
rs10000092 TC TC CC TC TT
rs1000014 GG GG GG GG GG
rs10000154 GG AG AG AA AG
rs10000159 GG AG GG …Run Code Online (Sandbox Code Playgroud) 我正在尝试使用ggmap在地图上绘制点,但我不知道如何从地图的背景中删除国家/地区的名称
library(ggmap)
library(mapproj)
map <- get_map(location = 'middle east', zoom = 4)
read.table("latlon.txt", header = TRUE) -> tbl
plot<-ggmap(map) + geom_point(aes(x = lon, y = lat), color=tbl$color, size=3, data = tbl) + theme(legend.position = "none")+
#geom_text(aes(label=pop),data=tbl,hjust=0, vjust=0)
ggsave(plot=plot,height=7.5,width=11, filename="f4 map.pdf", useDingbats=FALSE)
plot(plot)
Run Code Online (Sandbox Code Playgroud)
我想在我的点上启用标签,但背景文本基本上会妨碍.有谁知道如何保留Google地形图但删除国家/地区名称?谢谢!