BLAST 数据库错误:未找到核苷酸数据库的别名或索引文件

bru*_*lin 4 bioinformatics blast

我正在尝试运行blastn,然后独立运行SIFT。但是,我遇到了数据库配置问题,因为我收到以下信息:

arron@arron-Ideapad-Z570 ~/Phd/programs/sift4.0.3b $ blastn -query test/lacI.fasta -db db/swissprot/
BLAST Database error: No alias or index file found for nucleotide database [db/swissprot/] in search path [/home/arron/Phd/programs/sift4.0.3b:::]
Run Code Online (Sandbox Code Playgroud)

在其他线程的一些建议之后,我下载了一个蛋白质数据库,例如 swissprot:

wget ftp://ftp.ebi.ac.uk/pub/databases/fastafiles/uniprot/uniprotkb_swissprot.gz

zcat uniprotkb_swissprot.gz | awk '{if (/^>/) { print ">" $2} else { print $_}}' > swissprot.fa
Run Code Online (Sandbox Code Playgroud)

然后使用 makeblastdb 创建一个blast 数据库:

arron@arron-Ideapad-Z570 ~/Phd/programs/sift4.0.3b/db/swissprot $ makeblastdb -in swissprot.fa -dbtype prot

Building a new DB, current time: 10/27/2014 13:18:57
New DB name:   swissprot.fa
New DB title:  swissprot.fa
Sequence type: Protein
Keep Linkouts: T
Keep MBits: T
Maximum file size: 1073741824B
Adding sequences from FASTA; added 546439 sequences in 19.0039 seconds.
Run Code Online (Sandbox Code Playgroud)

但我仍然遇到同样的问题。我究竟做错了什么?

hea*_*ien 5

您已经列出了数据库文件所在的文件夹,而不是数据库本身。尝试:

blastn -query test/lacI.fasta -db db/swissprot/swissprot.fa
Run Code Online (Sandbox Code Playgroud)

(当然,这也行不通,因为您正在尝试使用用于blastn 的蛋白质数据库。您需要使用blastx)