ログイン 概要 よくある質問

ここ数ヶ月でNGSデータ解析について学んでいます。 現在は主に公共データのChIP-Seqデータのピーク検出や比較を行っています。 今回新たに利用したいデータセットがあるのですが,その利用について少々悩んでおりますので本サイトに投稿しています。 詳しい先生方がいらっしゃいましたらご助言頂けると幸いです。

質問内容は以下の通りです。

異なる機種のIllumina HiSeqを用いて得たSRAデータは互いにデータとして比較することができるのでしょうか。

たとえば,公共ゲノムデータベースGEOに公開されている, GSE86164:Illumina HiSeq 2500を用いて得たChIP-Seqデータ GSE76655:Illumina HiSeq 2000を用いて得たChIP-Seqデータ GSE47043:Illumina HiSeq 2000を用いて得たChIP-SeqデータとRNA-Seqデータ は,FASTQ変換,マッピング,ピーク検出などの処理をした後,ピークコールの違いとして互いのデータを比較できるのでしょうか。 このように公共ゲノムデータベースのデータセット間での比較について悩んでおります。

どうぞよろしくお願いいたします。

質問日 Jan 12 '18 at 18:25

takebo's gravatar image

takebo
1111


シーケンサーの機種だけでなく、その他の実験条件を揃えたデータ同士でなければ「比較できる」とは厳密に言えないとは思いますが、ピークの違いをブラウズすることは技術的には可能です。

たとえば同じ転写因子を対象にしたpublicなChIP-Seqデータが複数あり、ピークコール後のデータを比較して差があったとき、その原因がシーケンサーの機種の違い (=リード数やリード長、ベースコール精度) に依存するものなのか、それともサンプルの違いによるものかは、該当する領域にmapされたリードの数や精度、総リード数に著しい違いがないか、などを鑑みて判断することになると思います。

手前味噌ですが、公共のChIP-Seqデータを全て同じワークフローpeak callして比較する ChIP-Atlas というウェブサービスを作っています。peak browserを使えばゲノムブラウザでピークの比較ができます。また、ピークコール時のマップ率やピーク数などの情報も個別の実験ごとに見ることができます(例: http://chip-atlas.org/view?id=SRX018625)。ぜひ使ってみてください。 http://chip-atlas.org/

回答日 Mar 05 '18 at 14:36

inutano's gravatar image

inutano
163

inutanoさん 詳細の解説を頂きありがとうございます。大変参考になりました。 ピークデータのブラウズはこれまでNGSデータのダウンロードからマッピング,ピークコールの作業まで独自に行っておりました。ご紹介いただいたWebサイトは感覚的に容易にこれらを操作,視覚化できるようで大変ありがたいです。ぜひ利用させていただきます。 ありがとうございました。

(May 01 '18 at 18:45) takebo takebo's gravatar image
あなたの回答
プレビューをトグルする

この質問をフォローする

By Email:

Once you sign in you will be able to subscribe for any updates here

By RSS:

回答

回答とコメント

タグ:

×13
×7

質問日: Jan 12 '18 at 18:25

閲覧数: 34,057 回

最終更新日: May 01 '18 at 18:45

powered by OSQA