FindPeaks (3-1-9-2)を用いて以下のようなデータ形式のsamファイルを処理したいと思っています。manualでは
のファイル名のところに、入力するファイル名を打ち込めば染色体ごとの Finsdpeaksに同封されていたテストファイルではできました。データの形式が違うからできないのでしょうか?よろしければ処理する方法をご教授下さい。 SOLEXA2_90529:1:1:155:301 16 chr21.fa 37858680 85 32M * 0 0 GACAAATCACAAATATGAATTCAGATCGTCGC >96=@@@4=@@AB@A?>?A9@>A@@@?>?6&5 MD:Z:1T30 SOLEXA2_90529:1:1:160:77 0 chr21.fa 34353666 94 32M * 0 0 TTTCCGTGTATTGTGTGTGGTATATTGGACAC C0BBBB@BAACCB@>AB?B>?ABABB?<aab9 md:z:32="" .="" .="" .="" <="" pre=""> |
同封のテストファイルはEland(というツールの)フォーマットです。 同じく同封のマニュアルに出ていますが、Findpeaks3.1.9.2はデフォルトがElandモードでsamは読めません。BEDフォーマットも、フリーダウンロード可能な版では読めません。 データフォーマット変換ツールを探されるよりは、扱えるフォーマットが増えているFindPeaks4系を導入して解析された方がよさそうです。⇒WorkFlows |