如何使用包 ROCR.. 获得精确召回曲线的 AUC(曲线下面积)?
library(ROCR)
data(ROCR.simple)
pred <- prediction( ROCR.simple$predictions, ROCR.simple$labels)
perf <- performance(pred,"tpr","fpr")
plot(perf)
## precision/recall curve (x-axis: recall, y-axis: precision)
perf1 <- performance(pred, "prec", "rec")
plot(perf1)
Run Code Online (Sandbox Code Playgroud) 我在dataframe(df)中有一个列,我想要追加值(不是常量,而是变量).一个例子将使它更清楚:
> df
geneID Sample.290
1 1 0.4018499
2 10 0.2694255
3 100 1.4441846
4 1000 13.7652753
5 10000 2.1552100
6 100008586 0.2358481
Run Code Online (Sandbox Code Playgroud)
我想追加字符"ENSG"和多个"000",这样每个值的总长度将为15(包括ENSG).例如,输出应该是:
geneID Sample.290
1 ENSG00000000001 0.4018499
2 ENSG00000000010 0.2694255
3 ENSG00000000100 1.4441846
4 ENSG00000001000 13.7652753
5 ENSG00000010000 2.1552100
6 ENSG00100008586 0.2358481
Run Code Online (Sandbox Code Playgroud) 我有一个巨大的文件,45 GB。我想把它分成4部分。我可以通过以下方式做到这一点split --bytes=12G inputfile:
问题是它扰乱了文件的模式。此拆分根据大小剪切文件,因此不会保留格式。我的输入文件如下所示:
Inspecting sequence ID chr1:11873-13873
V$ARID3A_04 | 1981 (-) | 0.899 | 0.774 | tttctatAATAActaaa
V$ARID3A_04 | 1982 (+) | 0.899 | 0.767 | ttctaTAATAactaaag
Inspecting sequence ID chr1:11873-13873
V$ARID3A_04 | 1981 (-) | 0.899 | 0.774 | tttctatAATAActaaa
V$ARID3A_04 | 1982 (+) | 0.899 | 0.767 | ttctaTAATAactaaag
Run Code Online (Sandbox Code Playgroud)
我想分割文件,但也要提到分割它的模式,Inspecting以便我返回的分割文件必须如下所示:
Inspecting sequence ID chr1:11873-13873
V$ARID3A_04 | 1981 (-) | 0.899 | 0.774 | tttctatAATAActaaa
V$ARID3A_04 | 1982 (+) | 0.899 | 0.767 …Run Code Online (Sandbox Code Playgroud) 我已经使用rnorm函数从标准正态分布生成了大小为100的样本.我想按照标准对数字进行舍入.如果number介于0和1之间,则将以1小数点舍入.例如
0.123 -> 0.1
0.456 -> 0.5
0.98 -> 1
Run Code Online (Sandbox Code Playgroud)
如果一个数字大于1,那么它将舍入为:
2.34 -> 2
4.98 -> 5
4.4 -> 4
Run Code Online (Sandbox Code Playgroud)
你能指导我怎么做吗?