小编El *_*vid的帖子

如何合并显示最常见字符的相似字符串

在一个数据帧中,我有一个字符串列表,这些字符串彼此相似,但相差%。我想将这些通用字符串组合成一个在每个位置具有最通用字符的字符串。

数据框如下所示:

pattern  Freq     score rank
DT%E 37568 1138.4242    1
%TGE 37666 1018.0000    2
D%GE 37641 1017.3243    3
DTG% 37665  965.7692    4
%VGNE 34234  684.6800    5
SVGN% 34281  634.8333    6
SV%NE 34248  634.2222    7
SVG%E 34265  623.0000    8
%LGNE 41098  595.6232    9
SL%NE 41086  595.4493   10
SLGN% 41200  564.3836   11
SPT%AYNE 35082  539.7231   12
SP%AAYNE 35094  531.7273   13
SPTA%YNE 35061  531.2273   14
SPTAA%NE 35225  518.0147   15
SPTAAYN% 35144  516.8235   16
%PTAAYNE 35111  516.3382   17
S%TAAYNE 35100  516.1765   18
SPTAAY%E 35130 …
Run Code Online (Sandbox Code Playgroud)

string r bioinformatics

6
推荐指数
1
解决办法
121
查看次数

通过注释排序 pheatmap

我正在尝试使用 pheatmap 包制作一个图形。我想按我正在使用的注释对数据进行分组,但它不会分组在一起。

我的数据在这里:

sub_samp <- structure(c(1, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 
1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 
0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 
0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, …
Run Code Online (Sandbox Code Playgroud)

r heatmap pheatmap

6
推荐指数
1
解决办法
2万
查看次数

在 Perl 中对数组使用编辑距离

我正在尝试比较两个数组之间的编辑距离。我尝试过使用 Text:Levenshtein。

#!/usr/bin/perl -w
use strict;
use Text::Levenshtein qw(distance);

my @words = qw(four foo bar);
my @list = qw(foo fear);
my @distances = distance(@list, @words);

print "@distances\n";
#results: 3 2 0 3
Run Code Online (Sandbox Code Playgroud)

然而,我希望结果如下所示:

2 0 3
2 3 2
Run Code Online (Sandbox Code Playgroud)

通过 @words 数组获取 @list 的第一个元素,并对 @list 的其余元素执行相同的操作。我计划将其升级为更大的阵列。

arrays perl edit-distance bioinformatics levenshtein-distance

3
推荐指数
1
解决办法
355
查看次数