流域で採取した河川底生動物を次世代シーケンシング解析し,GMYCモデルを用いたDNA種分類法によって種数を評価したいと考えています. シーケンシング解析したのはミトコンドリアDNAのCOI領域で,HCOプライマー側からの一方向のみをシーケンシングしました. その結果,合計16万配列(平均塩基長330bp)が得られました. DNA解析を以下の手順で行いたいと考えています. クオリティスコアに基づいたフィルタリング, リファレンス配列(国際DNAデータベース上の既知の配列)に対するグローバルアライメント, 進化距離が時間に比例している進化系統樹の作成, GMYCモデルによって種の境界年代を推定 → 種数の決定 一致度の高い塩基配列をクラスタリングし,OTU数を種多様度の指標とする方法があると思いますが,私の研究ではクラスタリングではなく,種分化する年代を塩基配列の違いから推定するGMYCモデルを用いて種数を推定したいと考えています. 現在,クエリの挿入欠損を修正するために,リファレンスに対するアライメントを行っているのですが,ローカルアライメントではなくグローバルアライメントを選択している理由としては,アラインされた配列の5’末端が揃うからです. ソフトウェア「Bowtie」によって,クエリに挿入欠損がうまく入っているのですが,アラインされる配列が16万配列の1割未満と少ないのが現状です. そこで,グローバルアライメントを行うソフトウェアで,リファレンスとクエリ間での最小類似度のパラメータ設定が変更でき,リファレンスを複数インプットしてアライメントできるソフトウェアをご教授いただきたくお願いします. また,OTUクラスタリングの際に配列がアライメントされてから類似度の計算が行われていると思うのですが,そのアライメント結果がファイルとして出力できるかを教えていただきたいです. よろしくお願いします.
This 質問 is marked "community wiki".
質問日 May 13 '14 at 16:31 izumi |
mothurのalign.seqs しかし、
とか、ツッコミどころ満載ですね。 フツーは先に問題ありそうでもまずスタンダードな解析をやるもんでしょ。それもできない人が頭でっかちな理想を思い描いても、意味ないよ。GMYCやるにしても、まずクラスタリングして数減らしてから。数減らせればグローバルマルチプルアライメントもできる。 回答日 May 13 '14 at 17:15 aki 何度も類似の質問をしてしまい大変申し訳ありません.ご指摘のとおり,クラスタリングによる解析をまずは行ってみたいと思います.ソフトウェアのご紹介まことにありがとうございます
(May 13 '14 at 18:24)
izumi
|