我有一个包含几百个*.fasta文件的目录,例如:
Bonobo_sp._str01_ABC784267_CDE789456.fasta
Homo_sapiens_cc21_ABC897867_CDE456789.fasta
Homo_sapiens_cc21_ABC893673_CDE753672.fasta
Gorilla_gorilla_ghjk6789_ABC736522_CDE789456.fasta
Gorilla_gorilla_ghjk6789_ABC627190_CDE891345.fasta
Gorilla_gorilla_ghjk6789_ABC117190_CDE661345.fasta
Run Code Online (Sandbox Code Playgroud)
等等
我想连接属于同一物种的文件,因此在本例中为Homo_sapiens_cc21和Gorilla_gorilla_ghjk6789.
几乎每个物种都有不同数量的文件需要连接.
我知道我可以在unix/linux中使用一个简单的循环:
for f in thesamename.fasta; do
cat $f >> output.fasta
done
Run Code Online (Sandbox Code Playgroud)
但我不知道如何在循环中指定它应该如何识别具有相同开头的文件.手动制作数百个文件根本没有意义.
有谁知道我怎么能这样做?