ログイン 概要 よくある質問

お世話になります。 Local BLASTを導入するために統合TVのLocal BLASTの使い方(http://togotv.dbcls.jp/20110420.html)を参考にさせていただいております。 ご紹介の通りの手順で作業を進めていましたが、データベースを作成できずに困っております。

まず、データベースとして、ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/ からnr.gzをダウンロードし、解凍しました。 解凍したファイル(nr)をデータベースにするために、makeblastdb -in nr -dbtype prot -hash_indexを実行しました。 すると、以下に記した文が表示されました。

Building a new DB, current time: 11/27/2014 11:30:45
New DB name:   nr
New DB title:  nr
Sequence type: Protein
Keep Linkouts: T
Keep MBits: T
Maximum file size: 1000000000B

しばらくすると、以下の文が何度も繰り返し出現し、最後にvolume: 以下の文が表示され、データベースの作成に失敗しました。

Error: (1431.1) FASTA-Reader: Warning: FASTA-Reader: Ignoring FASTA modifier(s) found because the input was not expected to have any.

volume: nr.00
volume: nr.01

file: nr.00.pin
file: nr.00.phr
file: nr.00.psq
file: nr.00.psi
file: nr.00.psd
file: nr.00.phi
file: nr.00.phd
file: nr.00.pog
file: nr.01.pin
file: nr.01.phr
file: nr.01.psq
file: nr.01.psi
file: nr.01.psd
file: nr.01.phi
file: nr.01.phd
file: nr.01.pog
file: nr.pal

解決策がお分かりになる方がいらっしゃいましたら、ご教授いただければ幸いです。

質問日 Nov 27 '14 at 11:54

sulfuri's gravatar image

sulfuri
111

edited Jan 05 '15 at 23:47

mn3's gravatar image

mn3 ♦♦
5154822


エラーの原因はわかりませんが、

ftp://ftp.ncbi.nih.gov/blast/db/

にそのまま利用可能なnrがあるので、それをダウンロード、展開して使用されてみてはどうですか。

wget・md5sum・tar・gzipがあり、httpプロキシとか通していないなら以下のコマンドでダウンロードと展開ができるはずです。

#download
wget -c ftp://ftp.ncbi.nih.gov/blast/db/nr.??.tar.gz
wget -c ftp://ftp.ncbi.nih.gov/blast/db/nr.??.tar.gz.md5
#check files
for f in nr.??.tar.gz.md5; do md5sum -c $f; done
#extract files
for f in nr.??.tar.gz; do tar -xzf $f; done
#delete files
rm nr.??.tar.gz nr.??.tar.gz.md5

では。

回答日 Dec 01 '14 at 11:17

aki's gravatar image

aki
861

aki様 ご回答ありがとうございます。ご指摘の通りフォーマット済みのものを利用しようと思います。 しかし、別の問題で困っております。 複数のnrデータベースに対してblastを実行したいのですが、結果が出ませんでした。 複数のnrデータベースに対してblastを実行する方法がお分かりの方がいらっしゃいましたらご教授いただければ幸いです。 以下に、問題が生じたまでの過程を説明させていただきます。

Macを使用しており、対応するコマンドが分からなかったので、コマンドを使用せずにnr.00からnr.26を全てダウンロード、解凍しました。 展開されたファイルは nr.00.phd nr.00.phi nr.00.phr nr.00.pin nr.00.pnd nr.00.pni nr.00.pog nr.00.ppd nr.00.ppi nr.00.psd nr.00.psi nr.00.psq nr.pal でした。 全てのファイルに対してblastを実行したいため、これらのファイルを全て同じフォルダにまとめました。 最初は以下のコマンドで実行しましたが、 blastp -db nr -query test.fasta -out test.out 次のエラーがでました。 BLAST Database error: Could not find volume or alias file (nr.27) referenced in alias file (/User/blast/db/nr). そこで、検索対象のデータベースを1つにして試したところ、成功しました(次のコマンド)。 blastp -db nr.00 -query test.fasta -out test.out しかし、実際にはnr.26までの全てのファイルに対して検索をしたいので、次のコマンドを試しました。 blastp -db "nr.00 nr.01 nr.02 nr.03 nr.04 nr.05 nr.06 nr.07 nr.08 nr.09 nr.10 nr.11 nr.12 nr.13 nr.14 nr.15 nr.16 nr.17 nr.18 nr.19 nr.20 nr.21 nr.22 nr.23 nr.24 nr.25 nr.26" -query test.fasta -out test.out すると、30分たっても結果は出ませんでした。

(Dec 01 '14 at 18:04) sulfuri sulfuri's gravatar image
1

nr.27.tar.gzのダウンロードと展開ができていないのではないですか。

(Dec 01 '14 at 18:32) aki aki's gravatar image

aki様

ご指摘の通りでした。 無事blastできるようになりました。誠にありがとうございます。 ところで、結果が出るまでに7分程度は必要のようです。

高速化するための良い案がありましたら、お教えいただければ幸いです。

(Dec 01 '14 at 20:05) sulfuri sulfuri's gravatar image
1
-evalue
-max_target_seqs
-num_threads

の値を適当に指定して下さい。

(Dec 01 '14 at 21:21) aki aki's gravatar image

aki様

ご指摘の通りにコマンドを変更した結果、2倍程早くなりました。

前回:blastp -db nr -query test.fasta -out test.out

今回:blastp -db nr -query test.fasta -out test.out -evalue 1e-50 -num_threads 2 -max_target_seqs 5 -outfmt 6

aki様、大変お世話になりました。誠にありがとうございました。 もし、この他にも高速化する方法をご存知の方がいらっしゃいましたらよろしくお願いいたします。

(Dec 02 '14 at 12:12) sulfuri sulfuri's gravatar image

見逃す確率が上がりますが、

-word_size

の値を大きくしてみて下さい。デフォルトはBLASTPなら3くらいだったと思います。

(Dec 03 '14 at 16:00) aki aki's gravatar image
showing 5 of 6 show all
あなたの回答
プレビューをトグルする

この質問をフォローする

By Email:

Once you sign in you will be able to subscribe for any updates here

By RSS:

回答

回答とコメント

タグ:

×3

質問日: Nov 27 '14 at 11:54

閲覧数: 8,305 回

最終更新日: Jan 05 '15 at 23:49

powered by OSQA