ログイン 概要 よくある質問
1
1

ずっとミーティング中でなかなか調べられないのですが、SRA からのダウンロードでオススメの方法はありますでしょうか?
普段は

cd /Applications/Aspera\ Connect.app/Contents/Resources/ # Mac 環境
./ascp -QT -i asperaweb_id_dsa.putty anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByExp/sra/SRX/SRX026/SRX026379/SRR065068/SRR065068.sra ~/SRA_SeqCapV2

のようにコマンドラインでダウンロードしていますが、以下の点で不満があります。

  1. URLを多少手打ちしないといけないこと (どこかに上記の URL がダイレクトに得られるページがあるのでしょうか…)
  2. ascpは途中切断・復帰が出来ないっぽい (screen との併用では出来なさそうでした…) => ウソでした、-k1 で resume です

みなさん、どのようにダウンロードされたりしているのでしょうか。オススメの方法とかありますか?

質問日 Dec 24 '10 at 11:22

ma_ko's gravatar image

ma_ko ♦♦
3711312

edited Feb 22 '11 at 20:27


個人的には「Aspera Connect(GUI)を使ってブラウザからDLする」という方法が一番良いのではないかと思っています. ウェブブラウザからSRAを開いて目的のファイルをダウンロードすればURLを手打ちせずに済みますし,Aspera ConnectのGUI版では途中切断・復帰が可能です.GUI環境に限られるといった制限もありますが,この方法が一番安定していると思います.

CUI環境に限られるのであれば,「ftpを使ってDLする」という方法が良いと思います.私自身もリモートの計算機ではこの方法を使っています.ftpならばコマンドライン上でファイルサイズの確認もできますし,複数のファイルを一度にDLすることもできます,確かSRAではasperaが推奨されていたように記憶していますが,現状のところCUIのascpは少し使いにくいというのが私の感想です.

この質問の内容からは少し逸れますが,DRA(DDBJ Sequence Read Archive)もSRAと同様にシーケンスデータをアーカイブしているので,そちらを利用するのも手だと思います.現在のところ,ファイルサイズの小さいfastqフォーマットで配布されていますし転送速度も早いと思います.

回答日 Dec 24 '10 at 12:21

yag_ays's gravatar image

yag_ays
241158

Aspera Connect (GUI) だと途中切断・復帰があるんですね。CUI だと ftp + fastq フォーマット、も参考になります。ありがとうございます:)

(Dec 24 '10 at 12:33) ma_ko ♦♦ ma_ko's gravatar image

日本からのダウンロードでしたら、DDBJ から ftp でダウンロードすることをおすすめいたします。
アクセスが集中していない限り、NCBI から aspera で落とすのと同等以上の速度がでると思います。
また、ftp の方が通信の安定性や使い勝手の面でも扱いやすいと思います。

DDBJ では sra_lite と fastq を提供しています。

 ・sra_lite
 ・fastq

また、対象のアクセッション番号が分かっている場合、DRA Search で検索していただくと ftp へのリンクが有ります。

例)
  http://trace.ddbj.nig.ac.jp/DRASearch/getExperimentDetail?query=DRX000001
  http://trace.ddbj.nig.ac.jp/DRASearch/getRunDetail?query=DRR000001

linux もしくは mac をお使いで、転送速度がそれほど出ない場合、簡単なパラメータの変更で速度のチューニングが出来ます。

rootユーザにて(sudo bash)
  echo "1048576" > /proc/sys/net/core/rmem_default
  echo "1048576" > /proc/sys/net/core/rmem_max

とコマンドを打てばチューニング完了です。

再起動すれば上記で変更した値は元に戻ります。
もしご心配の場合には、変更前に既存の値を保存しておいてください。
  cat /proc/sys/net/core/rmem_default
  cat /proc/sys/net/core/rmem_max

上書きすれば元に戻ります。

windows7, vista をお使いの場合には、チューニングする必要はありません。

もし速度がでない等ありましたら状況を確認しますので trace@ddbj.nig.ac.jp までご連絡ください。

回答日 Jan 21 '11 at 16:38

DDBJ's gravatar image

DDBJ ♦
32126

edited Jan 21 '11 at 16:41

CUI でもう少し便利やれるだろうと調べてました。
以下のやり方では

  • -k1 でレジューム
  • -l(数値)M で転送速度調整
  • SRX026379以下にある2つの .lite.sra ファイルをダウンロード

が出来たようです。

./ascp -l200M -k1 -QT -i asperaweb_id_dsa.putty anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByExp/litesra/SRX/SRX026/SRX026379/ ~/SRA_SeqCapV2/

オプションはここを参考にしました (ただし、文中で -l200m となっているが -l200M の間違いと思われる)。
Studies : Browse : Sequence Read Archive : NCBI/NLM/NIH

回答日 Dec 29 '10 at 18:54

ma_ko's gravatar image

ma_ko ♦♦
3711312

参考までにDownload Guide - SRA Handbook - NCBI Bookshelf を紹介します。ウェブサイトとツールキットによるダウンロード方法を解説しています。

回答日 Feb 02 '11 at 18:55

mn3's gravatar image

mn3 ♦♦
5154922

リンク紹介で有益な情報が揃いました。ありがとうございます!

(Feb 02 '11 at 19:10) ma_ko ♦♦ ma_ko's gravatar image
あなたの回答
プレビューをトグルする

この質問をフォローする

By Email:

Once you sign in you will be able to subscribe for any updates here

By RSS:

回答

回答とコメント

タグ:

×47
×13
×6
×2
×1

質問日: Dec 24 '10 at 11:22

閲覧数: 24,891 回

最終更新日: Feb 22 '11 at 20:27

powered by OSQA