ログイン 概要 よくある質問

流域で採取した河川底生動物を次世代シーケンシング解析し,GMYCモデルを用いたDNA種分類法によって種数を評価したいと考えています.

シーケンシング解析したのはミトコンドリアDNAのCOI領域で,HCOプライマー側からの一方向のみをシーケンシングしました. その結果,合計16万配列(平均塩基長330bp)が得られました.

DNA解析を以下の手順で行いたいと考えています. クオリティスコアに基づいたフィルタリング, リファレンス配列(国際DNAデータベース上の既知の配列)に対するグローバルアライメント, 進化距離が時間に比例している進化系統樹の作成, GMYCモデルによって種の境界年代を推定 → 種数の決定

一致度の高い塩基配列をクラスタリングし,OTU数を種多様度の指標とする方法があると思いますが,私の研究ではクラスタリングではなく,種分化する年代を塩基配列の違いから推定するGMYCモデルを用いて種数を推定したいと考えています.

現在,クエリの挿入欠損を修正するために,リファレンスに対するアライメントを行っているのですが,ローカルアライメントではなくグローバルアライメントを選択している理由としては,アラインされた配列の5’末端が揃うからです.

ソフトウェア「Bowtie」によって,クエリに挿入欠損がうまく入っているのですが,アラインされる配列が16万配列の1割未満と少ないのが現状です.

そこで,グローバルアライメントを行うソフトウェアで,リファレンスとクエリ間での最小類似度のパラメータ設定が変更でき,リファレンスを複数インプットしてアライメントできるソフトウェアをご教授いただきたくお願いします.

また,OTUクラスタリングの際に配列がアライメントされてから類似度の計算が行われていると思うのですが,そのアライメント結果がファイルとして出力できるかを教えていただきたいです. よろしくお願いします.

This 質問 is marked "community wiki".

質問日 May 13 '14 at 16:31

izumi's gravatar image

izumi
11246

wikified Feb 05 '15 at 16:26


mothurのalign.seqs

しかし、

  • リファレンスにグローバルアライメントする意味がわからない
  • QVによるフィルタリングで読み間違いが十分除去できると思ってるの?
  • キメラ除去はしないの?
  • 昆虫のCOI 330bpぽっちでまともな系統樹推定できると思ってるの?

とか、ツッコミどころ満載ですね。

フツーは先に問題ありそうでもまずスタンダードな解析をやるもんでしょ。それもできない人が頭でっかちな理想を思い描いても、意味ないよ。GMYCやるにしても、まずクラスタリングして数減らしてから。数減らせればグローバルマルチプルアライメントもできる。

回答日 May 13 '14 at 17:15

aki's gravatar image

aki
861

何度も類似の質問をしてしまい大変申し訳ありません.ご指摘のとおり,クラスタリングによる解析をまずは行ってみたいと思います.ソフトウェアのご紹介まことにありがとうございます

(May 13 '14 at 18:24) izumi izumi's gravatar image
あなたの回答
プレビューをトグルする

この質問をフォローする

By Email:

Once you sign in you will be able to subscribe for any updates here

By RSS:

回答

回答とコメント

タグ:

×47

質問日: May 13 '14 at 16:31

閲覧数: 7,603 回

最終更新日: Feb 05 '15 at 16:26

powered by OSQA