現在、NGS現場の会内の有志と協調して、次世代シーケンサーのチュートリアルをwikiにまとめたりしており、 その一環でマッピング結果の可視化などを行うために、BAMファイルをUCSC Genome Browserでカスタムトラックとして追加する方法についてこちらに記載しているのですが、私の理解が正しければ、BAMファイルや、bigBEDファイルをカスタムトラックとして追加するためには、UCSCのサーバからアクセス可能な場所に BAMファイルとBAIファイルをアップロードしなければならず、特に自由に使用可能な公開ファイルサーバなど手元にないwet系の研究者の方などには敷居が高いように思っております。 最近では、クラウドサービスの普及で、google等、廉価に数ギガバイトのストレージを提供するサービスも多々見受けられます。 もしどなたか、気軽に使用可能でUCSCからのサーバアクセスに対応している(BASIC認証対応のHTTPS経由でURIを指定してファイル単位アクセス可能な)フリー、あるいは廉価なストレージサービスをご存知の方はおられますでしょうか。 ちなみに、MSNのSkyDriveを試してみましたが、ファイルのアクセス時にjavascriptを経由するようなので、無理そうでした。 これ以降は、参考情報です 検証用のデータ 以下に検証用の小さいデータを配置しました。 マウスのデータSRRデータをランダムに1000本取り出したデータをBWAデフォルトオプションでmm9にマッピングしたもので"chr1:24,537,471-24,777,916"に張り付きます。 以下からダウンロード可能です。bamとbaiを両方ストレージにアップロードする必要があります。
サイズはbamが52KB、baiが1,2MBです。 検証方法 UCSC genome browserにadd trackする場合は、以下の文字列を参考にしてください。bigDataUrlの部分だけ、 ストレージサービスの対応する公開URLに置き換えると、UCSCサーバからそのストレージに参照に行くはずです。 track type=bam bigDataUrl="http://cell-innovation.nig.ac.jp/export/public/ucsc_101201/SRX000350_SRR001356_1000.bam" visibility="squish" db="mm9" browser position chr1:24,537,471-24,777,916 認証付きの場合は、add custom tracksの際にUCSCに接続する際にhttpでなくhttpsを指定するようにして、 add tracksする文字列としては以下のように"user:password@"を付加するようにして下さい。 httpsにしないと、ID、パスワードが漏洩しますのでご注意ください。 track type=bam bigDataUrl="https://user:password@server.com/somepath/SRX000350_SRR001356_1000.bam" visibility="squish" db="mm9" browser position chr1:24,537,471-24,777,916 注意 いただいた情報は記載していただいた方のattributionが分かる形でwikiの方に引用させていただきたいと考えておりますので、ご了承いただけますと幸いです。 背景
その他、リンク先のwikiでお気づきの点へのコメント等もよろしくお願いします。 |
3つの方法を思いつきました。
どれもテキストファイルとしてアクセスできるアドレスが提供できます。また、どれも無料で利用できる範囲です。github は git コマンドをつかってファイルを配置するので、この目的には敷居が高いかもしれません。 ただし、アクセス制御の認証はありません。 情報ありがとうございます。 "アクセス制御の認証はありません"は、1~3全てにかかるのでしょうか。 私の知る限り、予算をかけて取得したデータを、論文公開前に公開の場所に置くというのは、 多くの場合NGだと思うので、引き続きBASIC認証があり、HTTPSにも対応している 場所の回答も期待したいと考えております。 公開しても、差し支えないデータについては、1や3を推奨するとして、 3の場合は、open_idがあれば、利用は可能と考えてよろしいでしょうか また、公開ヒストリの利用のガイドラインなどは、 統合TVのGalaxyを使い倒すを参照すれば把握できますでしょうか。 (すみませんまだ見れていません。) 1
mn3さんも検証済みかもしれませんがdropboxは、"DropboxPublic"以下に、ソート済み、index作成済みのbamファイルと対応するbaiファイルを配置した後、bamファイルのDrop boxメニューの"Copy public link"でコピーされるURIを以下の要領でtrackに追加すると、ブラウザからのデータ参照ができることが確認できましたのでお知らせします。 track type=bam name="MyBAM1" bigDataUrl="http://dl.dropbox.com/u/9150959/SRX000350_SRR001356_1000.bam" 現在2GBまで無料なので、1run程度であれば使用できると思います。 |