ある生物のゲノムをde novo assemblのために454で委託して読みました。 CABOGでアセンブルしようとインストールしようとしたのですが、最初にpythonは見つかるがpython.hがないといわれました。 現在macOS X10.6.7でpython2.7が入っています。 Finkを用いてpython2.7-devをインストールしようと思うのですが、Finkをインストールし、 [sudo apt-get install python2.7-dev]とterminalで打っても[E: Couldn't find package python2.7-dev] と出てしまい、完了しません。調べてもわからないので、よろしくお願いします。 また使い方に関しても少しREADMEを読みましたが、わからなくなるのは目に見えているので、簡単に教えて頂けると助かります。 委託業者からは.qual .sff .sff.gz .fastが送られてきています。 質問が多くて申し訳ありませんが、よろしくお願いします。 質問日 Jun 17 '11 at 12:33 pan |
runCAパイプラインに必要なプログラムは原則として(このケースの場合) /Users/pan/Desktop/wgs-6.1/Darwin-amd64/bin/に入ります。この中に存在するmerylプログラムで、 別の反応であるか、そもそもそういうプログラムが見当たらないのであれば、コンパイルが失敗しています。 make cleanしてコンパイルをやりなおすか、違うディレクトリにソース展開して最初から構築しなおすのが早いかと思います。 PATHの設定はしなくてもrunCAは動くはずですが、PATH設定しておけばなにかと便利でしょう。 回答日 Jun 26 '11 at 14:21 mya_ ♦ 遅くなりましたが、今日実行する事ができました。ありがとうございます。meryl -V と入力すると version: CA $Id: AS_MER_meryl.cc,v 1.14 2009/06/10 18:05:13 brianwalenz Exp $ような 表示ですが平気ですか。 最後に一つだけお聞かせください。454だけでアセンブルする際皆さんはどのようなオプションを 設定されてますか?454 only のRunCA Examplesが白紙になっていて参考にするものがないので よろしくお願いします。
(Jul 12 '11 at 18:35)
pan
実行できて何らかの結果が出ているのであれば、とりあえず良いと思います。 メモリとスレッド周りは、実行しているマシンのスペックに合わせて増減可能、 sgeが含まれている関連はクラスタマシンを使わないのであれば設定不要です。 RunCA Examples - 454 + Sanger Hybrid Microbeと454 + Sanger Metagenomicのサンプルから、454関連の設定を引き出し、一度に変えるのではなく少しずつ設定変更して結果が返ってくるかトライアンドエラー、が結局成果出す道だと思います。
(Jul 18 '11 at 16:00)
mya_ ♦
|
CABOG (Celera Assembler with the Best Overlap Graph)というのは独立したプログラムではなく、WGS assemblerに組み込まれている、454などのデータを混ぜてアセンブルするパイプラインの名称です。darwin版でうまくいっているのでしたら、wgsそのものをソースからコンパイルしなおす必要はありません。 http://bioinformatics.oxfordjournals.org/content/24/24/2818.full 454を混ぜたexampleは、前述のwgs-assemblerのホームページ内左下のsearchから探せますのでやってみて下さい。 回答日 Jun 19 '11 at 19:42 mya_ ♦ |
sffToCAでsample.frgと.log、.statsを作成しました。以下の様に実行しました。 sffToCA \ -libraryname sample \ -insertsize 3200 900 \ -linker flx \ -trim chop \ -output FJRUAFO.frg \ sample.sff.bz \ 次にRunning WGS Assemblerしたいのですが、 自分ではきちんとインストールしたつもりでしたが 'overmerry' programがみつからないとエラーがでました。 どこがおかしいのでしょうか?? また何か間違いなどありましたら指摘してください。 見よう見まねでやってます。 回答日 Jun 21 '11 at 19:31 pan CA6.1(version6)において、runCA-OBT.pl=runCAのaliasで、OS-X版の場合wgs-6.1/Darwin-i386/bin/の下にあります。overmerryもwgs-6.1/Darwin-i386/bin/の下です。おそらくファイルが正しく展開されていません。 OS-Xにおけるgmakeについては、「gmake make OS-X」 でgoogleしてください。 このアセンブラはパイプライン内でエラーが発生した場合、自力でデータを操作して復旧処理を行う必要があります。wgsの内部データは当然扱っている配列の情報を含みますので、もし情報解析担当者もしくは共同研究者の方がいらっしゃるのでしたら一度ご相談される事をお勧めします。
(Jun 22 '11 at 12:32)
mya_ ♦
いつも返信ありがとうございます。'overmerry' program見つかって、実行したところ早速、以下のエラーがおきました。 ERROR! merCompression not supported without installing kmer
If you have installed kmer, then your build is broken, as I did not find the correct 'meryl' (meryl -V should have said Mighty). Died at /Users/pan/Desktop/wgs-6.1/Darwin-amd64/bin/runCA line 2617. もちろんkmerはインストール済みです。いくつかのkmer(もともと入っていたやつ、ダウンロードしてきたやつ)のフォルダで試しましたが、すべて駄目でした。所内でアセンブルやっている方を聞いた事ありませんが、探してみます。
(Jun 22 '11 at 14:10)
pan
強引にmerCompression=0をオプションに加えましたが WARNING! auto picking a mer threshold not supported without installing kmer
Using historical defaults.の後に ERROR: Failed with signal HUP (1) runCA failed. Stack trace: at /Users/pan/Desktop/wgs-6.1/Darwin-amd64/bin/runCA line 1118 main::caFailure('overlap store building failed', '/Users/pan/Desktop/celera/0-o...... Last few lines of the relevant log file (/Users/pan/Desktop/celera/0-overlaptrim-overlap/handa.merStore.err): No input files? Failure message: overlap store building failed のようなエラーです。
(Jun 22 '11 at 19:37)
pan
|
コンパイル済バーションが用意されていて、Darwin≒MacOS-X なので、まずdarwin版で動くか試されてみてはどうでしょうか。
http://sourceforge.net/apps/mediawiki/wgs-assembler/index.php?title=Main_Page
あとこのソフトはメモリ、ディスク領域、計算時間を食いますので稼働テスト用の小さめのデータセットを作っておくと良いかと思います。
お返事ありがとうございました。うまくいきました。本当にありがとうございます。
まだCABOGインストールできてません。 % bzip2 -dc wgs-6.1.tar.bz2 | tar -xf -
% cd wgs-6.1
% cd kmer
% sh configure.sh
とやると今までと違うエラーが出てしまいます
configure.sh: line 507: gmake: command not found
Configured.
ご存知でしたら、アドバイスお願いします。
GNU Make 3.81が入っています。