お世話になっております. 表題の内容についてお聞きしたいことがあります. 454GS FLXで得られた底生動物のCOI領域のロングリード(平均300bp・合計16万配列)を,国際DNAデータバンクからダウンロードしたCOI領域(658bp)の配列に対しマッピングを行いました. マッピングツールはBWAを用い,出力されたSAMファイルをFASTA形式のファイルに変換したいと考えています. 例) リファレンス配列 ACGTAAACGTTTACGT クエリ配列 ACGTAA-CGTT クエリ配列 CGTAAACGTT-A クエリ配列 GTAA-CG このようにマッピングされた時,マッピングされた配列の開始位置やギャップ等の情報が反映された下のようなFASTAファイルへの変換は可能でしょうか. >Query1 ACGTAA-CGTT >Query2 -CGTAAACGTT-A >Query3 --GTAA-CG FASTA形式への変換を行った後,Collapseを行いハプロタイプ数を出し,進化系統樹を作りたいと考えています. SAMをFASTAファイルに変換するソフト,もしくはSAMファイルを用いてCollapse→進化系統樹作成が行えるソフトをご存知でしたらご教授ください. 質問日 Jan 27 '14 at 14:54 izumi |
こちらのスクリプトとかいかがでしょう? http://cell-innovation.nig.ac.jp/wiki/tiki-index.php?page=samtools#mpileup_ 回答日 Jan 27 '14 at 15:37 gaou ♦♦ 回答ありがとうございます. 重ねて質問申し訳ありません. コンセンサス配列ができると記述されているのですが,紹介していただいたページのスクリプトを使うと,INDEL込の各クエリ配列が得られるのでしょうか
(Jan 27 '14 at 16:30)
izumi
あ、すみません、一つ一つのリードのFASTAを作りたいということでしたか?コンセンサスかと勘違いしていました。その場合こういうスクリプトのイメージかと思います。 https://github.com/iontorrent/TMAP/blob/master/scripts/util/sam2aln.py
(Jan 27 '14 at 16:47)
gaou ♦♦
ありがとうございます. TMAPというソフトウェアを使えばできるかもしれないということですね. スクリプトを書く必要がある場合,不勉強なので理解を深めたいと思います.
(Jan 27 '14 at 17:22)
izumi
|
集団遺伝学のラボが作った,PGDSpider というGUIツールが便利かもしれません. 回答日 Jan 27 '14 at 16:05 yuifu すみません.試しに使ってみたのですが,そんなに分かりやすくない感じでした.
(Jan 27 '14 at 16:21)
yuifu
回答ありがとうございます.実際に試してみます
(Jan 27 '14 at 17:38)
izumi
PGDSpiderを使うことでSAMファイルからFASTAファイルに変換できました.ありがとうございます
(Apr 08 '14 at 11:15)
izumi
|