DAVIDを用いてエンリッチメント解析を行いたいのですが、UploadしたIDが上手く認識されず困っています。
RNA-seqにより得られた発現遺伝子のデータに対して、BLASTXを用いて相同性検索を行い、「GI number」と「RefSeq ID」を得ています。
「GI number」や「RefSeq ID」を用いてDAVIDによるエンリッチメント解析を行いました。『Select Identifier』の項目ではそれぞれ「PROTEIN_GI_ACCESSION」と「REFSEQ_PROTEIN」を選んでいます。2300のIDを用いて調べた結果、認識されるのは232と非常に少ない結果しか得られませんでした。DAVIDに用意されている「Gene ID conversion」を用い、「AFFYMETRIX」のIDに変換を試みましたが、変換されるIDの数が少なく未だ解析できずにいます。BioMartを用いてIDを変換しようとしましたが、現在一時的にサイトが使えなくなっていました。 みなさんはRNA-seqから得られたデータを用いてエンリッチメント解析を行う際、どのようにしているのでしょうか?また、自分が行った行動の中で不適切な点があれば、ご教授をお願いいたします。 質問日 Aug 15 '16 at 10:54 lonicera |
Nomenclatureは頭を悩ませるところですね。RNA-seqからBLASTXという解析手法から判断して非モデル生物の発現データを他の生物のホモログで機能を知りたいという実験だと思われますが、RNA-seqを行った生物とBLASTXのデータベースに用いた生物を上げていただけませんか?それによって解決手法が異なると思います。 回答日 Aug 15 '16 at 11:33 kaho 回答ありがとうございます。研究対象、データベースに用いたものは次の通りです。 ・RNA-seqを行った生物 Lonicera caerulea var. emphyllocalyx ・データベースに用いた生物 NCBI FTPサイトに用意されているRefSeq Plantアミノ酸配列データベースを用いています。 “ftp://ftp.ncbi.nlm.nih.gov/refseq/release/plant/” よろしくお願いいたします。
(Aug 15 '16 at 20:44)
lonicera
|