小编use*_*718的帖子

例如,第1行和第2行是相同的.它们的符号与A列相同.第3行是(4个字母中的3个字母具有相同的字母且序列相同)75%与row1和row2相似.B列中的sybmol将从上面复制,即xxx.由于xx1x(row4)只有4个字母中的2个类似于row3,因此它只使用自己的符号,即xx1x.由于yyyy和gggg完全不同,他们将保留自己的sybmol,如A列.

因此,我的最终结果应该是这样的:

A      B
xxx    xxx
xxx    xxx
xxx1   xxx
xx1x   xx1x
yyyy   yyyy
gggg   gggg

Run Code Online (Sandbox Code Playgroud)

我通过猜测得出这个相似度(如果有正式的字符串相似性搜索方法则不需要使用),如果有任何形式的方法来检查R中的字符串相似性,那么它可能很好用.

您能介意如何使用R有效地添加此符号列吗？

r similarity

use*_*718

lucky-day

4
推荐指数

1
解决办法

1945
查看次数

R:如何编写循环来获取矩阵？

感谢diliop为我之前的问题提出的精彩解决方案.

如何获得~1000种蛋白质的成对"序列相似性得分"？

为了建立这个答案,我尝试编写一个循环来获得1000个蛋白质的所有成对的"序列相似性得分",具有以下代码.

for (i in 1:1000){
score <- score(pairwiseAlignment(seqs[[i]]$seq, seqs[[i+1]]$seq, substitutionMatrix=BLOSUM100, gapOpening=0, gapExtension=-5))}

Run Code Online (Sandbox Code Playgroud)

但是,我很难将每个分数转换为a data.frame,这样自动列出所有分数？

seq1 seq2 score
seq1 seq3 score
seq1 seq4 score
....
seq1000 seq1000 score

Run Code Online (Sandbox Code Playgroud)

专家可以给我一些关于如何获得1000 x 1000蛋白质的更多提示吗？

for-loop r

use*_*718

2017 05-23

0
推荐指数

1
解决办法

513
查看次数

R:在三列上添加带条件检查的列？

我的df1如下:

df1 <- data.frame(A=c("a","b","c","d","e"), B=c("f","g","t","g","u"), C=c("M","NA","NA","NA","M"), D=c("A","NA","NA","NA","NA"), E=c("NA","NA","NA","NA","G"), G=c(1:5))

  A B  C  D  E G
1 a f  M  A NA 1
2 b g NA NA NA 2
3 c t NA NA NA 3
4 d g NA NA NA 4
5 e u  M NA  G 5

Run Code Online (Sandbox Code Playgroud)

我想根据C,D和E列中的读数添加列.如果所有都是NA,我想将X添加到H列.如果其中任何一个都不是NA,我想在列H中添加YES.结果如下:

  A B  C  D  E G H
1 a f  M  A NA 1 YES
2 b g NA NA NA 2 X
3 c t NA NA NA …

Run Code Online (Sandbox Code Playgroud)

r conditional-statements

use*_*718

lucky-day

0
推荐指数

1
解决办法

1792
查看次数

标签统计

r ×7

similarity ×2

conditional-statements ×1

count ×1

distribution ×1

for-loop ×1

prediction ×1

sequence ×1

statistics ×1

标签 统计

小编use_718的帖子

标签统计