植物の研究に携わっております。R-TipsによるGO解析のパッケージがありましたら、お教えいただきたく質問させて頂いております。現在の自分のGO解析の方法は、(1)TAIRの最新のデータベースより、GO番号とそこに帰属(?)されているATH遺伝子を入手して、エクセル表に入れます。(2)自分の研究材料はアラビドプシスではないので、解析したい遺伝子群の予測アミノ酸配列をBLASTPでATH遺伝子に対応をつけます(トップ・ホモロジーの1遺伝子に対応させています。ホモロジーの低いものはスコアーを指標に切っています)。(3)エクセル表中のGO-ATH遺伝子を、自分の遺伝子群(対応がついたATH遺伝子群)中で探し、数え上げます(エクセル関数の式を組んでいます)。(4)Fisherの正確検定を基に、袋の中の赤色と白色の玉の数の確率を求めるやり方で、GO中の遺伝子が有意に自分の遺伝子群中に濃縮されているかどうかを調べます。以上の方法の場合、GO-ATH遺伝子の数が非常に多いので、自分の遺伝子群が1000個程度あると、数え上げの操作で、エクセルの動作が非常に不安定になります。そこで、R-Tipsなど、パソコンで比較的楽に操作できる解析方法が、もしあれば、お教え願えれば、非常に嬉しいです。また、自分の方法が、GO解析として、適切かどうかについても、ご教唆願えれば嬉しいです。よろしくお願いいたします。 |
以下,R-Tips というのは,統計言語Rのことと判断し,回答します. (R-Tipsは,Rについて紹介しているこちらのサイトの名前でしょうか) RでGO解析を行うパッケージRでGO解析を行うパッケージはいくつかあります.以下に,生物系のRパッケージのレポジトリであるBioconductorで提供されているパッケージを挙げます(すべてではないかもしれません). 個人的には,topGOが使いやすかったです. 質問者のGO解析の方法についてFisher's exact test で基本的に問題ないと思われます.また,オーソログ遺伝子からGOアノテーションをひっぱってくる方法も特に問題はないと思います. ただし,多重検定の問題があるため,p-valueに対し,補正が必要になると思います (一方で,多重検定補正は必ずしも重要でないと考える人もいます(topGOのマニュアル (PDF)の6.2節を参照).) 回答日 Jul 31 '13 at 00:06 yuifu |