去年DRY解析教本を読んでMacを買い、色々なサイトで勉強させて頂いているバイオインフォ初心者です。 この度、かなり行き詰まってしまいましたので、こちらの先生方にご相談させて頂きたく存じます、よろしくお願いいたします。 ・やりたいこと RNA-seqデータ(HiSeq2000 paired-end read)をtranscriptomeのreferenceにマップして発現量解析。 最終的にはcummeRubundで各サンプル間の遺伝子発現の違いを表示したいと考えております。 ・やったこと bowtie2でリードをtranscriptome referenceにマッピング、得られたbamファイルをeXpressで定量しFPKMやTPMを算出。しかし各ライブラリーごとの数値を統合するところで手段を失いました。 ・問題点 解析対象の動物種おけるGTFファイルが存在しないため(ゲノム情報が整理されていない)、genomeをreferenceとした一連のTophat-cufflinks-cuffdiffのワークフローが使えない。また、transcriptomeをreferenceとして発現量解析をするワークフローに関する情報が乏しい。 以上のことから、何が現在もっとも正確なtranscriptomeをreferenceとした発現量解析なのか自身には判断できない状態になっております。 どんな情報でもありがたいです、どなたかアドバイス頂きたく存じます。よろしくお願いいたします。 質問日 Jan 10 '18 at 19:14 SOCM |
やりたいのは発現定量でしょうか? 初心者向けではありませんが、中上級向けに「統合データベース講習会 AJACSadvanced(AJACSa) 三島3」というのを2016年12月に国立遺伝学研究所でやりました。 http://dbcls.rois.ac.jp/archives/3274 その内容が pitagora-galaxyを使ったデータ解析環境の構築とTrinityによる Transcriptome assemblyということで非モデル生物向けの発現データ解析でした。資料は以下に置いてあります。 https://github.com/AJACS-training/AJACSa3 ご参考まで。 回答日 Jan 11 '18 at 09:23 hub ♦♦ |