ログイン 概要 よくある質問

お世話になっております.

表題の内容についてお聞きしたいことがあります.

454GS FLXで得られた底生動物のCOI領域のロングリード(平均300bp・合計16万配列)を,国際DNAデータバンクからダウンロードしたCOI領域(658bp)の配列に対しマッピングを行いました.

マッピングツールはBWAを用い,出力されたSAMファイルをFASTA形式のファイルに変換したいと考えています.

例)

リファレンス配列  ACGTAAACGTTTACGT

クエリ配列     ACGTAA-CGTT

クエリ配列      CGTAAACGTT-A

クエリ配列       GTAA-CG

このようにマッピングされた時,マッピングされた配列の開始位置やギャップ等の情報が反映された下のようなFASTAファイルへの変換は可能でしょうか.

>Query1

ACGTAA-CGTT

>Query2

-CGTAAACGTT-A

>Query3

--GTAA-CG

FASTA形式への変換を行った後,Collapseを行いハプロタイプ数を出し,進化系統樹を作りたいと考えています.

SAMをFASTAファイルに変換するソフト,もしくはSAMファイルを用いてCollapse→進化系統樹作成が行えるソフトをご存知でしたらご教授ください.

質問日 Jan 27 '14 at 14:54

izumi's gravatar image

izumi
11146

edited Jan 27 '14 at 15:37


こちらのスクリプトとかいかがでしょう? http://cell-innovation.nig.ac.jp/wiki/tiki-index.php?page=samtools#mpileup_

回答日 Jan 27 '14 at 15:37

gaou's gravatar image

gaou ♦♦
22125

回答ありがとうございます. 重ねて質問申し訳ありません. コンセンサス配列ができると記述されているのですが,紹介していただいたページのスクリプトを使うと,INDEL込の各クエリ配列が得られるのでしょうか

(Jan 27 '14 at 16:30) izumi izumi's gravatar image

あ、すみません、一つ一つのリードのFASTAを作りたいということでしたか?コンセンサスかと勘違いしていました。その場合こういうスクリプトのイメージかと思います。 https://github.com/iontorrent/TMAP/blob/master/scripts/util/sam2aln.py

(Jan 27 '14 at 16:47) gaou ♦♦ gaou's gravatar image

ありがとうございます. TMAPというソフトウェアを使えばできるかもしれないということですね. スクリプトを書く必要がある場合,不勉強なので理解を深めたいと思います.

(Jan 27 '14 at 17:22) izumi izumi's gravatar image

集団遺伝学のラボが作った,PGDSpider というGUIツールが便利かもしれません.
最初に,samtoolsとbcftoolsのパスを設定する必要がありますが.

回答日 Jan 27 '14 at 16:05

yuifu's gravatar image

yuifu
51114

edited Jan 27 '14 at 16:05

すみません.試しに使ってみたのですが,そんなに分かりやすくない感じでした.

(Jan 27 '14 at 16:21) yuifu yuifu's gravatar image

回答ありがとうございます.実際に試してみます

(Jan 27 '14 at 17:38) izumi izumi's gravatar image

PGDSpiderを使うことでSAMファイルからFASTAファイルに変換できました.ありがとうございます

(Apr 08 '14 at 11:15) izumi izumi's gravatar image
あなたの回答
プレビューをトグルする

この質問をフォローする

By Email:

Once you sign in you will be able to subscribe for any updates here

By RSS:

回答

回答とコメント

タグ:

×47
×4
×4
×2

質問日: Jan 27 '14 at 14:54

閲覧数: 14,433 回

最終更新日: Apr 08 '14 at 11:15

powered by OSQA