ログイン 概要 よくある質問

NCBI BLASTのトップページに行くと、 一番上にBLAST Assembled Genomesという項目があると思います。 Human, Mouseなど代表的な生物種が並んで、最後のMicrobesをクリックすると、Microbial Nucleotide BLAST という検索フォームが開きます。

Choose Search Setの項目の中のDatabaseとして、「Representative genomes only」と「All genomes」が選べ、 「All genomes」を選ぶとさらに

  1. Complete genomes
  2. Draft genomes
  3. Complete plasmid
  4. Complete bacteriophages

が選べるようになっています。これらのデータベースをLocal環境にダウンロードしたいのですが、 FTPサイト (ftp://ftp.ncbi.nlm.nih.gov/blast/db/) を見ても、どれがそのデータにあたるのかが分からず、困っています。

更新日時と、結果画面で表示される「Included: Archaea (taxid:2157), Bacteria(taxid:2)」という表現から推測して、「refseq_genomic.[数字].tar.gz」というデータベースをtaxidで絞り込んで使用しているようなのですが、 これをどうBLASTコマンドで再現すればいいかが分かりません。

統合TVの「Local BLAST の使い方 2011」シリーズ(全2回)

  • 第1回 導入・準備編
  • 第2回 検索実行・オプション編

は拝見したのですが、taxidでの絞り込みはなかったので質問させて頂きました。 どうぞよろしくお願い致します。

質問日 Feb 13 '15 at 01:20

TY's gravatar image

TY
111


Taxonomy IDに基いてBLAST検索対象の絞り込みを行うには、まずTaxonomy IDから対応する配列のGenBank IDを得ないといけないと思います。以下の3通りの方法があると思います。

  1. NCBI Taxonomyダンプファイルを落としてきてローカルにTaxonomyデータベースを構築し、Taxonomy IDの分類群の下位の分類群のTaxonomy IDを全て取得して、それらに対応するGenBank IDを取得する
  2. NCBIのウェブサイトで塩基配列を「"refseq"[Filter] AND txid2[Organism:exp]」で検索して、FormatをGI Listにする
  3. E-Utilities経由でNCBIの塩基配列を検索してGenBank IDを取得するスクリプトを使う

3の場合、私が作成しているスクリプトが使えます。お使いになられる場合は以下のURLから最新版をダウンロードしてインストールしてください(今から使うコマンドに必要なのはPerlとLWPのみです。シェルスクリプトは他にも色々入れてしまうので避けてください)。 http://www.claident.org/

インストール後、以下のようにコマンドを実行すると、バクテリアのGI Listが得られます。

clretrievegi --keywords='"refseq"[Filter] AND txid2[Organism:exp]' outputfile

ここで得られたファイルをblastnの-gilistに与えればいいはずです。

回答日 Feb 13 '15 at 02:36

aki's gravatar image

aki
861

ご教授ありがとうございました。返信が遅くなってしまい失礼いたしました。 複数ご提案頂いたのですが、私の知識が足りず、

  1. 「NCBI Taxonomyダンプファイルを落とす」ところがわからない
  2. GI list取得まではできた
  3. Perlはまったく知識がなく、「E-Utilities」がわからない

という状況だったのですが、 Microbial Nucleotide BLASTが指定しているデータベースの場所がわかりましたので、 それをダウンロードすることで解決することができました。 ftp://ftp.ncbi.nlm.nih.gov/blast/db/ではなく、 ftp://ftp.ncbi.nih.gov/genomes/の中にありました。 書き込んで頂いたことを実行する技量が足りず申し訳ありませんが、お時間を割いてご回答頂いたことに感謝いたします。

回答日 Feb 24 '15 at 16:01

TY's gravatar image

TY
111

あなたの回答
プレビューをトグルする

この質問をフォローする

By Email:

Once you sign in you will be able to subscribe for any updates here

By RSS:

回答

回答とコメント

タグ:

×4

質問日: Feb 13 '15 at 01:20

閲覧数: 2,841 回

最終更新日: Feb 24 '15 at 16:01

powered by OSQA