あるGEO SeriesがSuperSeries(いくつかのSeriesがまとまったSeries)である場合には,SOFTファイルのSeries_summaryにSuperSeriesであることが記述されます. R/BioConductorにはGEOデータを扱うGEOqueryライブラリがあり,getGEO(gse_id)とすると,そのIDのSOFTファイルを読み込みます.
このgseの中にSeries_summaryが入っていると思うのですが,どのように探せば良いのでしょうか? (GSE20861はSuperSeriesの例 ) 質問日 Jan 16 '12 at 20:30 dancing_infobio |
GSE から それぞれの GSM を取り出して、series_id をみればよいと思います。SuperSeries があれば元の GSE ID だけでなく、SubSeries の GSE ID も返ってきます。 回答日 Jan 16 '12 at 21:27 dritoshi ♦ なるほど. SubSeriesのGSEから始めた場合には,SuperSeriesも返ってくるので,Super/Subは包含関係から類推することになりますか.
(Jan 16 '12 at 21:52)
dancing_infobio
Super から始めた場合、a の1カラム目がいくつかの ID になり、2カラム目がすべて Super の ID になるはず。 Sub から始めた場合は、1 カラム目が自分の ID しかなく、2カラム目がすべて Super の ID になっているはず。 多重とか Super が2つ以上ある場合が想定されるなら、類推はもう少し複雑になりそうですね。
(Jan 16 '12 at 22:03)
dritoshi ♦
Sub,Super と 1,2カラム目の関係を10以上のSuperSeriesで確認しました.これはSuperのID番号はSubよりも大きいというのに基づいているでしょうか? ともあれ,自分自身が1カラム目でなければSuperSeriesであることを疑う,というので良さそうですね. ありがとうございます.
(Jan 17 '12 at 21:31)
dancing_infobio
|