いつもお世話になっています。 おかげさまでhisat2 -> stiringTie -> DESeq2まで進みそれらしいデータも取れました。 DESeq2ではTranscript_IDでデータが出てきますが、これをGene_IDに紐付けすることができません。 Mergeなど試してみましたが、data0(O obs)が返されます。解決策をご教示いただければ幸いです。 ーーーーー たとえば部分的なファイルを切り出してmergeしてみるとうまく行きます。
テスト材料作ってからmerge
これはうまくできました。 全体でMergeするとうまくいかないところなのですが、なんとかする方法はありますでしょうか? バイオではなくてRの問題かもしれませんが、ご教示いただけますと幸いです。 よろしくお願いします。(そもそも根本的に間違っているかもしれません。) 追記:Rでの作業を書きます。
公式ページに従って入力。transcritp_count_matrix.csvはstringtieで生成
合計6未満(N=3で2郡間の比較)の微弱発現を除去
PHENO_DATA.txtでサンプル割り当て。#PHENO_DATA.txtの中身Genotype1 WT2 WT3 WT4 KO5 KO6 KOcolData <- read.csv("PHENO_DATA.txt", sep="t", row.names=1) 確認1all(rownames(colData) %in% colnames(countData1)) [1] TRUE がでるのでOKall(rownames(colData) == colnames(countData1)) [1] TRUE がでるのでOKDEseq2に流し込み。dds <- DESeqDataSetFromMatrix(countData = countData1, colData = colData, design = ~ Genotype) dds <- DESeq(dds) res <- results(dds) res_gene_id$gene_id <- row.names(res) Gene IDをつけるためrtracklayarうごかす。Stringtieでmergeしたファイルをいれる。library(rtracklayer) gtf <- readGFF("stringtie.merge.gtf") stringtieの場合はtypeがexonかtranscript のようなので、exonにする。gtf_gene <- subset(gtf, gtf$type == "exon") 紐付けされたリストを取り出しておく。gtf_gene_1 <- gtf[,c("gene_id","gene_name","transcript_id")] colnames(gtf) **#二つの票を合体することで、transcript_IDとgeneIDを紐付けする。ここがうまくいかない
CSVへの書き出しで終わるはず。
参考ページ(どうもありがとうございます。)https://ncrna.jp/blog/item/388-deseq2-ggplot2http://ccb.jhu.edu/software/stringtie/index.shtml?t=manual#https://qiita.com/rouninnomi/items/5441bef2f50780035127 後半文字の大きさがみづらくなってすみません。修正法がわかりませんでした。質問日 Jul 28 '18 at 17:05 mikan03 |
自己レスですみません。DAVIDに投げ込んだら変換できました。最後までRでできるのかと思っていましたが、あまりこだわらなくてよかったかもしれません。どうもありがとうございます。