Bowtieでマッピングをwindowsのcygwin上で行いたいと考えていますが、 入力の仕方がよくわかりません。 教えていただけないでしょうか。 現在までにBowtieのPrebuild indexをダウンロードし、解凍後、 Bowtie ファイルのindexesに移し、 またNCBIのSRAファイルをfastqファイルに変換するところまでは行っております。 どのファイルをどこに配置し、 またどのようなコマンドを入力したらいいのかが良くわかりません。 Build 37のゲノムに対して、fastqファイルを複数同時に複数マッピングしたい状況です。 用いるデータは、基本的には、illumina 100baseのもので、4塩基の違いまで許容することを考えています。 |
お持ちのデータはsingle-endと考えてよろしいでしょうか?
indexファイルもfastqファイルもどこにおいても構いませんが、それぞれ特定のディレクトリ内に
入れておくとまとまっていていいと思います。(例えば、fastqファイルはreadsというディレクトリにすべていれておくとか)。
なのでindexファイルをindexes、fastqファイルをreadsというディレクトリに入れておいたと仮定すると、
複数同時にマッピングするにはコンピューターのCPU数も考える必要があります。 もしマルチCPUならばbowtieを2回走らせればいいだけですが、そうでないならば 一つずつ走らせてやる方がいいと思います。メモリの制限もありますので。 |
ご返信ありがとうございます。
また、paired endの場合は、Manualを見ますと、
3ヶ月前の件なので、もう解決されているのかもしれませんが、 m_musculus_ncbi37のindexファイルが、dna さんが「ここに置く」と思っている場所と、このコマンドを使ったときに置くべき位置が一致していない可能性というのは考えられないでしょうか。 cygwinを普通にインストールした時、cygwinウィンドウを開いた時の「Windowsから見た」フォルダの位置は、 C:¥cygwin¥home¥(ユーザー名)¥ となります。 なので、C:¥cygwin¥home¥(ユーザー名)¥ にbowtieプログラムがあって、
indexes/ ディレクトリは、 フォルダC:¥cygwin¥home¥(ユーザー名)¥indexes¥ という関係になります。
(May 29 '11 at 00:21)
mya_ ♦
|
少し間違いがありました。
1に関してはもう一度ダウンロードをしなおしてやれば解決できます。2の場合はbowtie-buildで自分で indexファイルを作成することで解決できます。 私の手元にあったbowtieはversionが0.12.2でしたが、それではダウンロードしたindex fileでうまくいきました。 |