我在这里绘制染色体的长度值

没有点的中间区域不包含数据,不应该得到黄土线.如何修改我的代码以阻止该区域的黄土线?数据是连续的但我可以添加行来标记具有一些特殊值的空白区域或添加带有标签的列?但如何在命令中使用它?
我当前的命令:
library(IDPmisc)
# plot settings (edit here)
spanv<-0.05
pointcol1="#E69F00"
pointcol2="#56B4E9"
pointcol3="#009E73"
points=20
linecol="green"
xlabs=paste(onechr, " position", " (loess-span=", spanv, ")", sep="")
data1<-NaRV.omit(data[,c(2,7)]) # keep only x and y for the relevant data
# and clean NA and Inf
ylabs='E / A - ratio'
p1<-ggplot(data1, aes(x=start, y=E.R)) +
ylim(0,5) +
geom_point(shape=points, col=pointcol1, na.rm=T) +
geom_hline(aes(yintercept=1, col=linecol)) +
geom_smooth(method="loess", span=spanv, fullrange=F, se=T, na.rm=T) +
xlab(xlabs) +
ylab(ylabs)
Run Code Online (Sandbox Code Playgroud) 我已经看了一段时间了,有没有人看到这个ggplot语法有什么问题?我收到此错误:
Error: Discrete value supplied to continuous scale
Run Code Online (Sandbox Code Playgroud)
这是z:
Month Value
1 2011-01-01 11
2 2011-02-01 5
3 2011-03-01 6
4 2011-04-01 6
5 2011-05-01 4
6 2011-06-01 5
7 2011-07-01 3
8 2011-08-01 9
9 2011-09-01 19
10 2011-10-01 3
11 2011-11-01 6
12 2011-12-01 2
13 2012-01-01 1
14 2012-02-01 4
15 2012-04-01 1
16 2012-05-01 2
17 2012-06-01 11
18 2012-07-01 5
ggplot(z, aes(Month, Value)) +
geom_bar(fill="orange",size=.3) +
theme_bw() + scale_x_discrete(name="Date") +
scale_y_continuous("Number") +
opts(title="Monthly issues",
axis.title.x …Run Code Online (Sandbox Code Playgroud) 请将文件下载到您的计算机中,然后运行:http:
//freeuploadfiles.com/bb3cwypih2d2
data=read.table("path/to/file", sep="|",quote='',
head=T,blank.lines.skip=T,as.is=T)
ddata=array(data,dim=c(nrow(data),ncol(data)))
ddata[1,1]
Run Code Online (Sandbox Code Playgroud)
我想提取第一列的第一个元素.答案应该是AAC.
我怎么做?
我想编写一个函数来比较R中两个向量的增量.函数返回两个向量一起增加或减少的次数的百分比.
我写了以下函数,我用向量测试了它:
x=c(1,3,5,6,7)
y=c(1,5,6,8,7)
Run Code Online (Sandbox Code Playgroud)
结果应该是0.75,但是当我打电话时correl(x,y)出现错误
Error in if ...missing value where TRUE/FALSE needed
Run Code Online (Sandbox Code Playgroud)
有帮助吗?
correl<-function(x,y){
count = c()
for (i in 1:length(x))
if((((y[i+1]-y[i]) > 0) && ((x[i+1]-x[i]) > 0)) || (((y[i+1]-y[i]) < 0) && ((x[i+1]-x[i]) < 0)))
count <- union(count, c(i))
print(length(count) / length(x)-1)
}
Run Code Online (Sandbox Code Playgroud) 我试图仅将函数应用于满足我的条件的某些行。我从其他线程中看到我应该使用“apply”函数,但我似乎无法让它工作。
这是我到目前为止所拥有的:
a = which(decisionMatrix[,1]>0 & decisionMatrix[,4] < decisionMatrix[,5] &
tail(ratios,1)>decisionMatrix[4])
Run Code Online (Sandbox Code Playgroud)
这给了我满足我的条件的行数。
然后我使用:
apply(decisionMatrix[10],a,decisionMatrix[,1]/decisionMatrix[,5])
Run Code Online (Sandbox Code Playgroud)
我在这里想做的是“对于满足上述条件的每一行,取该行中的第一列,并将其除以该行中的第五列,并将结果存储在该行的第 10 列中”
有人能给我一些建议吗?
选择列时,我得到一列我没有选择但是它是group_by列:
library(magrittr)
library(dplyr)
df <- data.frame(i=c(1,1,1,1,2,2,2,2), j=c(1,2,1,2,1,2,1,2), x=runif(8))
df %>%
group_by(i,j) %>%
summarize(s=sum(x)) %>%
filter(i==1) %>%
select(s)
Run Code Online (Sandbox Code Playgroud)
即使我没有选择它,我也会得到专栏:
i s
1 1 0.8355195
2 1 0.9322474
Run Code Online (Sandbox Code Playgroud)
为什么会发生这种情况(为什么不是第j列?)以及如何避免它?好的,我可以在开始时过滤....
这似乎是一个愚蠢的问题,但我无法通过谷歌搜索找到答案.
R文档通常没有概述特定参数的所有可能值.是否有命令打印该信息?
例如,我想提请使用功能有些地图map()的maps包.R文档声明了该区域的参数:
regions:用于命名要绘制的多边形的字符向量.每个数据库都由一组多边形组成,每个多边形都有一个唯一的名称.当一个区域由多个多边形组成时,各个多边形具有该区域的名称,后跟冒号和限定符,如michigan:north和michigan:south.区域的每个元素都与数据库中的多边形名称进行匹配,并且根据具体情况,选择子集进行绘制.默认选择数据库中的所有多边形.
是否有可能获得区域名称列表?
我有一个大约500,000行和四列的数据帧.数据框包含有关特定用户访问某个位置的数据.数据帧的示例如下:
> head(data)
FirstVisit VisitDate ID visit.count
1 40545 40545 000001 1
2 40545 40545 000002 1
3 40548 40548 000003 1
4 40545 40565 000001 2
5 40545 40575 000002 2
6 40545 40576 000002 3
Run Code Online (Sandbox Code Playgroud)
每个观察包含用户的第一个日期(整数格式,其中1是01/01/1900),他们的访问日期,他们的唯一ID(大约175,000个唯一ID)和访问次数(是他们的第一次访问,第二次访问等等?).访问次数上限为5,因此visit.count列中的最大值小于或等于5.我想创建一个矩阵(或数据帧,如果需要),它存储每个ID的最新访问次数; 就像是:
> head(data.matrix)
ID visit.count1 visit.count2 visit.count3 visit.count4 visit.count5
1 000001 0 1 0 0 0
2 000002 0 0 1 0 0
3 000003 1 0 0 0 0
Run Code Online (Sandbox Code Playgroud)
我的代码如下:
ids <- unique(data$ID)
count.matrix <- matrix(data = 0, nrow = length(ids), …Run Code Online (Sandbox Code Playgroud) 我用这个函数读了一个文件
site_wind <- read.delim(import,header=F,sep="\t",skip=nline,quote="\"")
Run Code Online (Sandbox Code Playgroud)
在第一列中,我在表单中有日期和时间:
01/05/2011 0:10 where "day-month-year hour:min"
Run Code Online (Sandbox Code Playgroud)
我想将site_wind $ V1转换为类POSIXct和POSIXlt,但是当我这样做时:
as.POSIXct(site_wind$V1,"%d-%m-%Y %H:%M",TZ="GMT")
Run Code Online (Sandbox Code Playgroud)
我得到:
"0026-01-20 GMT"
Run Code Online (Sandbox Code Playgroud)
我尝试了一些替代方案,但我不知道如何解决这个问题.
我有以下数据
x y z
1 2 a
1 2
Run Code Online (Sandbox Code Playgroud)
数据[2,3]是一个因素,但没有显示,在数据中,它有很多行像这样.如果z什么都没有删除行?我的意思是删除第二行等行.
输出应该是
x y z
1 2 a
Run Code Online (Sandbox Code Playgroud) 只是一个简短的问题...任何人PLZ帮我如何阅读R中的以下文本文件..
如果#(分隔符)彼此相邻......这意味着缺少价值......
任何的想法?还是提示?谢谢你的好意
20040215#680# - .6#7.6#1457#-7.3#735#1.2#340.3#13.6#1427#0#0 ## - 7.3#735#7.6#1457 ## = 98829
18#680#.4#11.1 #1541#-7.3#635#.9#130.1#6.6#1137#0#0 ## - 7.3#635#11.1#1541 ## = 98834 20040221
#680 ########## 7#2 #1600#1.7#559#7.3#1604 ## = 98835 20040222
#680 ########## 1 ##### 6.8#1108 ## = 98836
20040223#680 ####### ### 0#0 #### 6.8#1602 ## = 98837