bru*_*lin 4 bioinformatics blast
我正在尝试运行blastn,然后独立运行SIFT。但是,我遇到了数据库配置问题,因为我收到以下信息:
arron@arron-Ideapad-Z570 ~/Phd/programs/sift4.0.3b $ blastn -query test/lacI.fasta -db db/swissprot/
BLAST Database error: No alias or index file found for nucleotide database [db/swissprot/] in search path [/home/arron/Phd/programs/sift4.0.3b:::]
Run Code Online (Sandbox Code Playgroud)
在其他线程的一些建议之后,我下载了一个蛋白质数据库,例如 swissprot:
wget ftp://ftp.ebi.ac.uk/pub/databases/fastafiles/uniprot/uniprotkb_swissprot.gz
zcat uniprotkb_swissprot.gz | awk '{if (/^>/) { print ">" $2} else { print $_}}' > swissprot.fa
Run Code Online (Sandbox Code Playgroud)
然后使用 makeblastdb 创建一个blast 数据库:
arron@arron-Ideapad-Z570 ~/Phd/programs/sift4.0.3b/db/swissprot $ makeblastdb -in swissprot.fa -dbtype prot
Building a new DB, current time: 10/27/2014 13:18:57
New DB name: swissprot.fa
New DB title: swissprot.fa
Sequence type: Protein
Keep Linkouts: T
Keep MBits: T
Maximum file size: 1073741824B
Adding sequences from FASTA; added 546439 sequences in 19.0039 seconds.
Run Code Online (Sandbox Code Playgroud)
但我仍然遇到同样的问题。我究竟做错了什么?
您已经列出了数据库文件所在的文件夹,而不是数据库本身。尝试:
blastn -query test/lacI.fasta -db db/swissprot/swissprot.fa
Run Code Online (Sandbox Code Playgroud)
(当然,这也行不通,因为您正在尝试使用用于blastn 的蛋白质数据库。您需要使用blastx)
| 归档时间: |
|
| 查看次数: |
13328 次 |
| 最近记录: |