最近DNAメチル化に関する論文をよく目にしたり、実際にSRAの登録データを触ったりします。 そこで少し気になったのですが、ハイスループットなDNAメチル化同定には大まかに3つの方法が あると思うのですが、
これらの方法の違い(長所・短所)はどういったところでしょうか? 例えばバイサルファイトは非メチル化CpGをUpGに変換するのでBisulfite-Seqは個々のCpGの メチル化を同定できるなど(マッピングがちょっと大変そうですが・・・)。 私はWet実験のラボに属していないため、サンプル調整や費用などの点に特に興味があります。 ご教授お願いいたします。 質問日 Dec 25 '10 at 15:54 Tanakky |
費用は"Bisul-seq > MeDIP-seq > HELP-seq"で、ほぼ、シークエンス解析=リード数の必要量に依存すると考えます。 HELP-seq(Genome biology (2010) 4:R36)はシークエンスがうまくいけばGAIIxで1セルで6サンプル(ヒト、マウス:約150万箇所/3-4Gbpゲノム)の比較が可能です。 直接解析していないので実践的な数値はわかりませんが、Bisul-seqなら単純計算で、 {3.3Gbp x 2(両strand)x [希望するリードdepth] } bp (ヒト)が必要になりますので、 GAIIxなら数セルx希望リード数が必要かと思います(間違っていたら訂正してください)。 サンプル調製法は、入り口が多少違いますが、大体3つとも操作および費用(シークエンス解析費用に比較しての違い)にそれほど大きな差はないと考えてよいかと思います。 具体的な方法の違いについては以下に纏めました(すみません、長くなりました…)。 どの方法が適しているかは、ゲノム配列のどの領域に注目するかに依存して変わってくると思いますので、参考までにゲノム全体を解析したい場合の比較について私見を述べました。各方法の中にもvariationがありますので。 1)バイサルファイトを使う方法:最も詳細なDNAメチル化率データが得られる。1サンプルあたりの解析費用は最も高い。 長所)理論上すべてのC(CpG配列以外も含む)のメチル化状態を1塩基解像度で、表裏のstrandごとのメチル化状態を解析できる。SNPなどの多型を含む領域ではalleleごとのメチル化状態の違いもみることができる。 短所)1サンプルを解析するのに必要なリード数が多い。データ量が大きい。リピート配列のマッピング等の問題がある。 2)免疫沈降を使う方法:全体のメチル化率を大まかにみる。control(Input)はすべてのシトシンがメチル化されている状態と仮定できる。 長所)理論上すべてのCのメチル化状態を(数百bpの解像度で)解析できる。 短所)解像度はDNA断片化と抗体による免疫沈降の効率によって数百bp程度。哺乳類ゲノムのCpG配列の偏りのバイアスを受けやすく、シグナル強度は近傍配列のメチルシトシン量の総和として得られる(normalizationが難しい)。mono-/bi-allelicなメチル化は識別できない。シトシンの少ない領域では感度が低い。 3)制限酵素を使う方法:抜粋された配列のメチル化率をみる。control(HELPの場合メチル化感受性酵素HpaIIに対するメチル化非感受性MspIによるreference)はすべて対象配列がメチル化されていない状態と仮定できる。 長所)1サンプルあたりの解析に必要なリード数が少ないため、低費用で解析できる。解析対象配列のメチル化状態を認識配列ごとに独立に解析でき、シトシン頻度のバイアスを受けにくい。 短所)使用する制限酵素配列の認識配列しか解析できない(最初に制限酵素認識配列により解析可能な配列は決まってくる)→数種の制限酵素を組み合わせてより多くのシトシンを解析する方法も提唱されている(controlはとれない)。mono-/bi-allelicなメチル化は識別できない。制限酵素の切断効率に依存。 私は実際に全行程を扱ったのはHELP-seqだけですし、機器の最新のupdateについていけてないので間違っているところがあったら誰か補完してください(笑)。宜しくお願いします。 詳細なご説明どうもありがとうございます。 HELP-Seqは低費用なのがいいですね。特にallelicやSNPに着目しないのであれば、 複数の細胞種や条件下でメチル化を調べるのに適してそうですね。
(Dec 26 '10 at 13:49)
Tanakky
|
Odamameさん、詳しい説明ありがとうございます。Odamameさんの回答に少し補足します。 HELP-seq(Genome biology (2010) 4:R36) (正確にはHELP-taggingと呼びます)は最小でそれぞれMspI ライブラリー約20ミリオン(Reference)、HpaIIライブラリー約5ミリオン(test)のリード数で解析が可能です。また、referenceのMspIは純系マウスでは1系統で一つのデータを、ヒトではSNPs情報を無視できる場合は既存のreferenceを使用することが可能です。HiSeq2000ではインデクッスをつけて1レーンあたり4サンプルが可能です。 詳しいプロトコールなどはこちらのサイトにありますので、参考にしてください。 回答日 Dec 27 '10 at 12:07 MasakoSuzuki mn3 ♦♦ 補足説明ありがとうございます。 正式名はHELP-taggingというのですね。失礼いたしました。 プロトコールの詳細が載っているサイトはいいですね。 エピゲノム関連の研究はここ最近かなり盛んなので、 こういった情報はありがたいです。
(Dec 27 '10 at 12:49)
Tanakky
|