各種転写因子結合配列を(主にヒト、マウスで)ゲノムワイドに調べる方法を教えてください。 以前、少しだけTRANSFACを見てみたのですが、web上では1箇所ずつしか調べられないこと、各パラメーターをどの程度重要視すべきかという点がわからず、結局データベース全体を利用するのは有料であることから、利用は保留にしていました。 利用可能な転写因子結合配列のデータベースの実践的な使用方法、データベース以外を用いた方法(あれば)、またそれらが効果的に使用されている参考文献などありましたら指摘していただけると幸いです。どうぞよろしくお願い致します。 質問日 Dec 12 '10 at 12:43 odamame |
直接的な答えになっていないかもしれませんが、cisRED (cis-regulatory element database)というものがあります。冒頭の説明では、 The cisRED database holds conserved sequence motifs identified by genome scale motif discovery, similarity, clustering, co-occurrence and coexpression calculations. Sequence inputs include low-coverage genome sequence data and ENCODE data. となっていて、保存されたモチーフについて、TRANSFACやJASPAR, ORegAnnoのアノテーションがつけられています。TRANSFAC, JASPAR, ORegAnnoは既出ですね。 回答日 Dec 13 '10 at 16:20 ogishima 回答ありがとうございます。今までで一番使えそう…な気がする(笑)ので、不慣れなmysqlを何とかして、使ってみようと思います(できるか不安ですが…w)。 どうもありがとうございます!
(Dec 13 '10 at 19:52)
odamame
|
全く同じ質問をBMB2010でも受けました(w 転写因子予測結合配列のデータベースでよく使われているTRANSFACって有料なんですよ。 大昔のフリーだったころのTRANSFACを元に計算した結果がUCSC Genome BrowserのTrack(アノテーショントラック) として利用可能なゲノムのバージョンもあるので、それ('Regulation'の'TFBS Conserved')を追加してみるとよいかと。 http://genome.ucsc.edu/cgi-bin/hgTrackUi?hgsid=175468335&c=chrX&g=tfbsConsSites #ゲノムのバージョン、種によっては利用可能でないものも多々あるようです。 アノテーショントラックって何という方は、こちらの統合TVを http://togotv.dbcls.jp/20100722.html フリーの転写因子予測結合配列のデータベースのJASPARとかもありますけど、それほど頻繁には更新されていない ようですし、最近使っていないからよく知りません。知っている方教えてください。 http://jaspar.genereg.net/ この種の計算を自分でやるためのパイプラインとして前職時代にSayaMatcherというのをつくっておりました。 その際は特定の転写因子の結合配列を自分たちで論文からデータを集めてきて、それを元に「パターン」を作成して 計算させてその結果を眺めてターゲットを絞っておりました。そういった個別に作られた「パターン」を集めて データベース化していくと「知のめぐり」がよくなっていいのになあ、と思っていますが、未だ果たせずにいます。 もちろん、上記のデータベースがそれになっていってくれるのが一番いいのですが。ないのなら、できるところから 始めないといけないのかなとも思っています。蛇足でした。 回答日 Dec 12 '10 at 13:07 hub ♦♦ 回答ありがとうございます。Trackにはマウスのものもあるのでしょうか?また、UCSCのアノテーショントラックに何が含まれているのかをまとめてチェックするにはどこを見たらいいかご助言お願いします。
(Dec 12 '10 at 13:22)
odamame
マウス(July 2007 (NCBI37/mm9) Assembly)では'Expression and Regulation'のなかの'ORegAnno'というのがそれのようですけど http://genome.ucsc.edu/cgi-bin/hgTrackUi?hgsid=175468867&c=chr12&g=oreganno 別に私も前から知っているわけじゃなくて今調べてここに書いているだけですけど…
(Dec 12 '10 at 13:29)
hub ♦♦
ありがとうございます!探してみたのですが、自分で見つけられませんでした。Trackの名前だけでなくて内容もチェックするべきなんですね。内容をよく確かめて利用してみようと思います。本当にありがとうございます!
(Dec 12 '10 at 23:35)
odamame
|
私も転写屋なので、よくこの手の調べものをよくやります。 「転写因子の結合配列のデータベース」とあったので、結合予測結果のデータベース(もしくは解析パイプライン) ではないと勘違いしていました。結合予測ということでしたら最もリファレンスが多いのは、残念ながら有料の TRANSFACとGenomatixだと思います。 また、JASPARはmatrixそのものが古いので(TRANSFACのmatrixの古いもの)、 それが嫌ならば有料を選ぶか自分で作るしか他ないのが現状です。 下記は余談ですが。。 マイクロアレイ解析結果に基づくgenome wideの場合 JASPARを使った解析パイプラインは色々ありますが、co-expressionしているgene setの中から共通のTFBS matrixをみつけてくるoPOSSUMや、TFBS予測に基づく遺伝子セット(C3)が既にあるGSEAを使うのも手です。 予測ではなく、実験結果に基づく場合 ChIP-Seq or ChIP-on-Chip のpublic dataに基づいて、ChEAは、上記と同様に特定の遺伝子セットのproxymal promoterにenrichする転写因子を探してくれます。データ数がまだまだ少ないので個人的にはあまり面白くなかったのですが、使えるようでしたら。リンクはusecaseなので、見たら使い方がわかるとおもいます。 あ、literature baseのデータベースが抜けてますが、これはよく知らないのでだれか補間してくれるかな。。 回答日 Dec 13 '10 at 16:05 suimye ありがとうございます。私自身はゲノムワイドエピゲノム解析を行っているので、必要なのは結合予測の結果である候補配列がどのようにゲノム上にmapされるか、という情報になります…もしそういったものがまとまって利用出来るのであれば利用したい、と考えていました。とりあえず、見てみたい転写因子候補を絞って自作してみて、意味がありそうだったら有料のもので確かめる、(または、自作で済ませる?)という方向を考えてみようかなと思います。ご指摘いただいて、具体的に必要な情報の現状が把握できました。oPOSSOUM、GSEAについては、当初考えていたのと少し違う方向からこちらも利用できそうな気がします。検討してみます!ありがとうございました!
(Dec 13 '10 at 16:29)
odamame
|
参考までに BioStar にあった 回答日 Dec 20 '10 at 11:06 ma_ko ♦♦ 情報ありがとうございます!海外での状況が把握できて良いですね。こちらもチェックしながら各データベースの妥当と思われる利用法を検討してみます。どうもありがとうございました!
(Dec 20 '10 at 11:20)
odamame
|
なかなか思い出せなかったのですが、transfacの他にJASPARというTFBS matrix DB(リポジトリ?)があります... 昨年一度DLして、今年になって更新されていたので再度DLした記憶がありますので、更新が再開されていると期待したいです。 DLしたtfbs matrixは、EMBOSSパッケージのjaspscan http://emboss.sourceforge.net/apps/release/6.0/emboss/apps/jaspscan.html で扱えたおぼろげな記憶があります。 回答日 Dec 12 '10 at 18:45 bak_a_mono mn3 ♦♦ ありがとうございます。まだ理解してないですが、ちょっと良く読んで使ってみるようにしてみます。ありがとうございました!
(Dec 13 '10 at 01:00)
odamame
|