ログイン 概要 よくある質問

いつもお世話になっています。

おかげさまでhisat2 -> stiringTie -> DESeq2まで進みそれらしいデータも取れました。

DESeq2ではTranscript_IDでデータが出てきますが、これをGene_IDに紐付けすることができません。 Mergeなど試してみましたが、data0(O obs)が返されます。解決策をご教示いただければ幸いです。

ーーーーー

たとえば部分的なファイルを切り出してmergeしてみるとうまく行きます。

trancript_ID33 <- c("NR_131893","NR_131893")

gene_name33 <- c("Porcn", "Porcn")

gene_id33 <- c("MSTRG.71262","MSTRG.71262")

test33 <- data.frame(trancript_ID33,gene_name33,gene_id33)   baseMean <- c(53.33436)

log2FoldChange <- c(-0.431138)

pValue <- c(0.2859373)

gene_id_NR <- c("NR_131893")

test66 <- data.frame(baseMean,log2FoldChange,pValue,gene_id_NR)

テスト材料作ってからmerge

merge99 <- merge(test33,test66)

これはうまくできました。

全体でMergeするとうまくいかないところなのですが、なんとかする方法はありますでしょうか? バイオではなくてRの問題かもしれませんが、ご教示いただけますと幸いです。 よろしくお願いします。(そもそも根本的に間違っているかもしれません。)

追記:Rでの作業を書きます。

library("DESeq2")

公式ページに従って入力。transcritp_count_matrix.csvはstringtieで生成

countData <- as.matrix(read.csv("transcript_count_matrix.csv", row.names="transcript_id"))

合計6未満(N=3で2郡間の比較)の微弱発現を除去

countData1 <- countData[apply(countData,1,sum)>6,]

PHENO_DATA.txtでサンプル割り当て。#PHENO_DATA.txtの中身

Genotype

1 WT

2 WT

3 WT

4 KO

5 KO

6 KO

colData <- read.csv("PHENO_DATA.txt", sep="t", row.names=1)

確認1

all(rownames(colData) %in% colnames(countData1))

[1] TRUE がでるのでOK

all(rownames(colData) == colnames(countData1))

[1] TRUE がでるのでOK

DEseq2に流し込み。

dds <- DESeqDataSetFromMatrix(countData = countData1,         colData = colData, design = ~ Genotype) dds <- DESeq(dds) res <- results(dds) res_gene_id$gene_id <- row.names(res)

Gene IDをつけるためrtracklayarうごかす。

Stringtieでmergeしたファイルをいれる。

library(rtracklayer) gtf <- readGFF("stringtie.merge.gtf")

stringtieの場合はtypeがexonかtranscript のようなので、exonにする。

gtf_gene <- subset(gtf, gtf$type == "exon")

紐付けされたリストを取り出しておく。

gtf_gene_1 <- gtf[,c("gene_id","gene_name","transcript_id")] colnames(gtf)

**#二つの票を合体することで、transcript_IDとgeneIDを紐付けする。ここがうまくいかない

DEseq2_result_ref <- merge(DEseq2_result,gtf_gene_1,all=T, sort=F)**

CSVへの書き出しで終わるはず。

write.csv(DEseq2_result_ref,"DEseq2_result_ref.csv", quote=FALSE, row.names=FALSE)

参考ページ(どうもありがとうございます。)

https://ncrna.jp/blog/item/388-deseq2-ggplot2

http://ccb.jhu.edu/software/stringtie/index.shtml?t=manual

#https://qiita.com/rouninnomi/items/5441bef2f50780035127

後半文字の大きさがみづらくなってすみません。修正法がわかりませんでした。

質問日 Jul 28 at 17:05

mikan03's gravatar image

mikan03
32

edited Jul 28 at 17:06

自己レスですみません。DAVIDに投げ込んだら変換できました。最後までRでできるのかと思っていましたが、あまりこだわらなくてよかったかもしれません。どうもありがとうございます。

(Jul 30 at 09:38) mikan03 mikan03's gravatar image
この質問の最初の回答者になりましょう!
プレビューをトグルする

この質問をフォローする

By Email:

Once you sign in you will be able to subscribe for any updates here

By RSS:

回答

回答とコメント

タグ:

×1
×1

質問日: Jul 28 at 17:05

閲覧数: 126 回

最終更新日: Jul 30 at 09:38

関係した質問

powered by OSQA