Bioinformaticsの初学者です。 微生物やウィルスのde novo assembleを目標としています。 Paired endが昨今主流であることを聞きました。ファイル名も*_1.fastq, *_2.fastqというようにpaired endであることが明確にわかるようにふってあるそうですね。 DRA等からpaired endなデータセットをダウンロードしてきて練習したいのですが、ダウンロードしてきて解凍したファイルのどれも、上記のような_1.fastq, _2.fastqというファイル名になっていません。ダウンロードしてきたファイルが不適切なのでしょうか? 適切なファイルがありましたらaccession numberをご紹介ください。 また、quality checkでassemble時に捨てるReadはpairとして捨てないといけないということですが、いかがでしょうか? Linuxでやるか、CLCのような一体型パッケージでやるか未定ですが、推奨などあればお願いいたします。 |