ログイン 概要 よくある質問

de novo transcriptome assemblyプログラムの一つにtrans-ABySSというのがあり、このプログラムの実行時にエラーが出て計算が止まってしまう問題を抱えています。 trans-ABySSのGoogleディスカッショングループに質問を投げたところ、Blatのところが問題なんじゃないかというコメントがありましたが、このような問題に遭遇した方がもしいらっしゃったら解決法についてご指南いただければ幸いです。

質問日 Feb 16 '11 at 18:21

%E3%81%8B%E3%81%A9%E3%81%9F's gravatar image

かどた
1861410

edited Feb 17 '11 at 11:56

mn3's gravatar image

mn3 ♦♦
5154922

1

あ、すいません。 GoogleディスカッショングループのURLをつけ忘れました。 http://groups.google.com/group/trans-abyss です。

(Feb 16 '11 at 18:23) かどた %E3%81%8B%E3%81%A9%E3%81%9F's gravatar image
1

さらにやらかしてますねm(_ _)m あのURLだけだとどのスレッド(という表現でいいのか?!)かわかりません。 「Error in stage1, perhaps merge.pl」 というタイトルのやりとりです。

(Feb 16 '11 at 18:58) かどた %E3%81%8B%E3%81%A9%E3%81%9F's gravatar image

ひょっとしたらBlatでqueryできる最大の配列長が5000bpで自分のデータは1106370番目のコンティグ長が6471bpでリミットを超えちゃっているからではないかと思い始めました。ちょっと調べてみます。ちなみに私はblatをこれまで一度も使ったことがないのですが、blatってちょっと短めの配列用?!だから5000bp程度までしかできない ような設定になってるっていうようなことがあるんですかね。。。ほとんど独り言ですが。 あ、mn3さま編集どうもありがとうございますm(_ _)m

(Feb 17 '11 at 09:19) かどた %E3%81%8B%E3%81%A9%E3%81%9F's gravatar image

Blat with -fastMap option is used as an alignment tool in trans-ABySS とtrans-ABySSの開発者が書いてあるので、このオプションをつけなければ25,000bpまで大丈夫だが、このオプションを使ったときに5000bpという長さ制限を加えることで早くしているとか、、、そういうこともあるかもしれませんね。 今日はまだ自分のデータを眺められてはいませんが、もしコンティグ長が全て25,000bp以下ならtrans-ABySSのプログラムをいじって、-fastMapオプションをつけないようにすることも一つの手ですね。 ありがとうございます! ひょっとして、このようなプログラムを使いこなすための会合がBiohackathon(つづりあやしい)だったりして。。。

(Feb 17 '11 at 15:06) かどた %E3%81%8B%E3%81%A9%E3%81%9F's gravatar image

fastMapの言及しているのが、configs/projects.cfg の上2行だけなんで

 
[default]
blat_1_2: FA2 FA1 OUT_DIR/KOUT1-KOUT2.psl -minIdentity=100 -maxGap=0 -fastMap
blat_2_1: FA1 FA2 OUT_DIR/KOUT2-KOUT1.psl -minIdentity=100 -maxGap=0 -fastMap
のオプション削ればfastMap無しで受け付けそうなんですが、だいたいこういうパイプラインってデフォルト設定が前提のコーディングしていてmergerがおかしくなるとか出そうなんですよね。

(Feb 22 '11 at 15:10) mya_ ♦ mya_'s gravatar image

そうなんですよ。 その後「Error in stage1, perhaps merge.pl」 上で開発者に上記の-fastMapのところを外せばいい、というアドバイスを受けてやったところ、blatのところでは(相当時間がかかりましたが)エラーがでなかったようですが、そのあとのところでエラーがでました。。。 「ImportError: No module named pysam」みたいなエラーが出て。えー、pysamいれてるのにー、なんでよ、みたいな。。。 今は意地でtrans-ABySSを動かそうとしていますが、別のプログラムに乗り換えたほうがいいのか、、、難しいところです。 どなたか私このプログラム使って無事動かせましたよ、っていうのがありましたら、コメントよろしくお願いしますm(_ _)m

(Feb 22 '11 at 19:52) かどた %E3%81%8B%E3%81%A9%E3%81%9F's gravatar image
2

おかげさまで無事実行できました。 pysamのre-installでうまく動きました。 まだstage1でkの値が二つだけで試しただけですが、とりあえずはエラーを吐かずにいけたことがなによりです。 pysam問題ですが、おそらく、他のエラーが出ていた際に、pythonのre-installをしたので、pysamの以前のインストールが無効になってしまっていたのでしょう。

(Feb 28 '11 at 15:49) かどた %E3%81%8B%E3%81%A9%E3%81%9F's gravatar image
showing 5 of 7 show all

blat は 5000bp より長いクエリを受け付けています。たとえば、http://genome.ucsc.edu/cgi-bin/hgBlat?command=startでは、

Only DNA sequences of 25,000 or fewer bases and protein or translated sequence of 10000 or fewer letters will be processed. Up to 25 sequences can be submitted at the same time. The total limit for multiple sequence submissions is 50,000 bases or 25,000 letters.

といのことで、すくなくとも 25,000 塩基までは受け付けています。ですので、クエリの長さ制限以外のところにエラーがあるようですね。BLAT Program Specifications にもクエリ長さ制限については記載がありませんでした。

回答日 Feb 17 '11 at 12:09

mn3's gravatar image

mn3 ♦♦
5154922

あなたの回答
プレビューをトグルする

この質問をフォローする

By Email:

Once you sign in you will be able to subscribe for any updates here

By RSS:

回答

回答とコメント

タグ:

×47
×3
×2
×1

質問日: Feb 16 '11 at 18:21

閲覧数: 6,215 回

最終更新日: Mar 28 '12 at 22:28

powered by OSQA