初心者です。ご助言お願いいたします。 Trinityを用いてHiseqのペアエンドデータのde novo アセンブリを行いました。 コンティグ数やN50やコンティグ長頻度分布をみるとまずまずのコンティグが作成されたように思います。 しかし、各コンティグが作成されるのに用いられたリード数やcoverage dapthの情報が、出力された複数のファイルのどこにあるかわかりません(パッと見では見当たりません)。 どうすれば上記の情報を知ることができますでしょうか? お助け下さい。 質問日 Nov 11 '14 at 19:12 TNSI_HD |
アセンブリーの段階ではK-merに分解して行うので、一つのcontigについていくつのリードが使われたか、というのは正確には出せないはずです。ただし、Trinityだと付属しているRSEMまでかければ (例えば http://trinityrnaseq.sourceforge.net/analysis/abundance_estimation.html#align_and_estimate )expected_countと発現量の目安(FPKM)が求められます。 |