NCBI BLASTのトップページに行くと、 一番上にBLAST Assembled Genomesという項目があると思います。 Human, Mouseなど代表的な生物種が並んで、最後のMicrobesをクリックすると、Microbial Nucleotide BLAST という検索フォームが開きます。 Choose Search Setの項目の中のDatabaseとして、「Representative genomes only」と「All genomes」が選べ、 「All genomes」を選ぶとさらに
が選べるようになっています。これらのデータベースをLocal環境にダウンロードしたいのですが、 FTPサイト (ftp://ftp.ncbi.nlm.nih.gov/blast/db/) を見ても、どれがそのデータにあたるのかが分からず、困っています。 更新日時と、結果画面で表示される「Included: Archaea (taxid:2157), Bacteria(taxid:2)」という表現から推測して、「refseq_genomic.[数字].tar.gz」というデータベースをtaxidで絞り込んで使用しているようなのですが、 これをどうBLASTコマンドで再現すればいいかが分かりません。 統合TVの「Local BLAST の使い方 2011」シリーズ(全2回)
は拝見したのですが、taxidでの絞り込みはなかったので質問させて頂きました。 どうぞよろしくお願い致します。 質問日 Feb 13 '15 at 01:20 TY |
Taxonomy IDに基いてBLAST検索対象の絞り込みを行うには、まずTaxonomy IDから対応する配列のGenBank IDを得ないといけないと思います。以下の3通りの方法があると思います。
3の場合、私が作成しているスクリプトが使えます。お使いになられる場合は以下のURLから最新版をダウンロードしてインストールしてください(今から使うコマンドに必要なのはPerlとLWPのみです。シェルスクリプトは他にも色々入れてしまうので避けてください)。 http://www.claident.org/ インストール後、以下のようにコマンドを実行すると、バクテリアのGI Listが得られます。
ここで得られたファイルをblastnの-gilistに与えればいいはずです。 回答日 Feb 13 '15 at 02:36 aki |
ご教授ありがとうございました。返信が遅くなってしまい失礼いたしました。 複数ご提案頂いたのですが、私の知識が足りず、
という状況だったのですが、 Microbial Nucleotide BLASTが指定しているデータベースの場所がわかりましたので、 それをダウンロードすることで解決することができました。 ftp://ftp.ncbi.nlm.nih.gov/blast/db/ではなく、 ftp://ftp.ncbi.nih.gov/genomes/の中にありました。 書き込んで頂いたことを実行する技量が足りず申し訳ありませんが、お時間を割いてご回答頂いたことに感謝いたします。 回答日 Feb 24 '15 at 16:01 TY |