小编El *_*vid的帖子

如何合并显示最常见字符的相似字符串

在一个数据帧中，我有一个字符串列表，这些字符串彼此相似，但相差％。我想将这些通用字符串组合成一个在每个位置具有最通用字符的字符串。

数据框如下所示：

pattern  Freq     score rank
DT%E 37568 1138.4242    1
%TGE 37666 1018.0000    2
D%GE 37641 1017.3243    3
DTG% 37665  965.7692    4
%VGNE 34234  684.6800    5
SVGN% 34281  634.8333    6
SV%NE 34248  634.2222    7
SVG%E 34265  623.0000    8
%LGNE 41098  595.6232    9
SL%NE 41086  595.4493   10
SLGN% 41200  564.3836   11
SPT%AYNE 35082  539.7231   12
SP%AAYNE 35094  531.7273   13
SPTA%YNE 35061  531.2273   14
SPTAA%NE 35225  518.0147   15
SPTAAYN% 35144  516.8235   16
%PTAAYNE 35111  516.3382   17
S%TAAYNE 35100  516.1765   18
SPTAAY%E 35130 …

Run Code Online (Sandbox Code Playgroud)

string r bioinformatics

El *_*vid

2019 05-14

6
推荐指数

1
解决办法

121
查看次数

通过注释排序 pheatmap

我正在尝试使用 pheatmap 包制作一个图形。我想按我正在使用的注释对数据进行分组，但它不会分组在一起。

我的数据在这里：

sub_samp <- structure(c(1, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 
1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 
0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 
0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, …

Run Code Online (Sandbox Code Playgroud)

r heatmap pheatmap

El *_*vid

2023 11-22

6
推荐指数

1
解决办法

2万
查看次数

在 Perl 中对数组使用编辑距离

我正在尝试比较两个数组之间的编辑距离。我尝试过使用 Text:Levenshtein。

#!/usr/bin/perl -w
use strict;
use Text::Levenshtein qw(distance);

my @words = qw(four foo bar);
my @list = qw(foo fear);
my @distances = distance(@list, @words);

print "@distances\n";
#results: 3 2 0 3

Run Code Online (Sandbox Code Playgroud)

然而，我希望结果如下所示：