ログイン 概要 よくある質問

36bpのシングルエンドRNA-seqデータを使って解析をしようとしているのですが、 バージョン1.0.12から追加された--butterfly-searchというオプションを使ったことの ある方、または使った時と使わなかった時の比較をされた方はいらっしゃいませんでしょうか? 36bpなので--segment-length 18でジャンクション同定してもノイズが多くなりそうで、 そのままbowtieでマッピングしてしまおうと考えていたのですが、Tophatのマニュアルを 見ていて、このオプションがあることを知ってどうしようか迷っています。 Tophatの論文にはこのbutterflyのアルゴリズムに関する記述はなく、SEQanswersでは 数百GBものoutputを出すとの報告があり 、ラボに大型サーバーがない私では自分で このオプションをテストするのが難しい状況です。 もしお試しになった方がいらっしゃれば、ご教授お願いいたします。

質問日 Nov 18 '11 at 23:07

Tanakky's gravatar image

Tanakky
121138

edited Mar 28 '12 at 22:01

mn3's gravatar image

mn3 ♦♦
5154922

1

Tanakkyさんにはお世話になっておりますので、以下試しましょうか。

tophat -o outdir1 bowtieIndex/hg19.fa query/SRX014531/SRR031811.fastq --butterfly-search
tophat -o outdir2 bowtieIndex/hg19.fa query/SRX014531/SRR031811.fastq --no-butterfly-search
tophat -o outdir3 bowtieIndex/hg19.fa query/SRX014531/SRR031811.fastq --segment-length 17

SRR031811はおよそ1000万リード35baseのsingle-endのRNA-Seqです。(もっといいデータがあればお知らせ下さい。DRA/SRA/ERAであれば対応します。) 結果のbamをどこかに配置すれば良いですか?

(Nov 19 '11 at 15:20) nob_fj ♦ nob_fj's gravatar image

nob_fjさん。大変助かります。--butterfly-searchを入れたコマンドは途中まで走らせただけですが、その時特にエラー等は出なかったのでこのコマンドで大丈夫だと思います。 大まかにはマッピング効率の変化、同定ジャンクション数の変化がわかればうれしいです。 もしbamとjunction.bedの結果がいただけるのであれば、なおうれしいです。

(Nov 20 '11 at 06:01) Tanakky Tanakky's gravatar image

NGS Sufer's Wiki(tophat butterflyオプションの比較) にオプションを変えた結果をアップしてみました。

butterflyオプションになじみが無いため、オプションの渡し方がおかしいか、入力データ依存とは思いますが、 試したデータではbutterflyオプションとno-buttterflyに違いはありませんでした。

試した選択肢は以下

  1. --butterfly-search
  2. --no-butterfly-search
  3. --segment-length 17
  4. --segment-length 10
  5. --segment-length 15
  6. --segment-length 17 --butterfly-search
  7. --segment-length 10 --butterfly-search
  8. --segment-length 15 --butterfly-search

junctionの数は以下

  1. 0
  2. 0
  3. 308
  4. 0
  5. 3
  6. 306
  7. 0
  8. 323

詳しくはページをご覧ください。 使用データはSRR031811

回答日 Nov 22 '11 at 22:52

nob_fj's gravatar image

nob_fj ♦
50761328

edited Nov 28 '11 at 17:34

解析ありがとうございます。 もしお手数でなければ --segment-length 17 --butterfly-search --segment-length 17 --butterfly-search で結果はでますでしょうか?

(Nov 24 '11 at 03:29) Tanakky Tanakky's gravatar image

6~8追加しました。

(Nov 28 '11 at 17:35) nob_fj ♦ nob_fj's gravatar image

ありがとうございます。--segment-length 15の時、大きな違いが出ているようですね。 セグメント長さ10は短すぎてジャンクション同定ができないのでしょう。 17で差がでないのはアルゴリズムの詳細がわからないとなんともいえなさそうです。 精度の問題はありそうですが、この結果は短配列長RNA-seqでジャンクション同定をしたいときの 指標になりそうで、たいへん助かります。貴重なデータありがとうございます。

(Nov 29 '11 at 02:50) Tanakky Tanakky's gravatar image
あなたの回答
プレビューをトグルする

この質問をフォローする

By Email:

Once you sign in you will be able to subscribe for any updates here

By RSS:

回答

回答とコメント

タグ:

×47
×11
×4
×1

質問日: Nov 18 '11 at 23:07

閲覧数: 3,068 回

最終更新日: Mar 28 '12 at 22:01

powered by OSQA