Rでfastaファイルを読み込む方法としてGeneRパッケージのreadFasta関数がありますが、 BiostringsパッケージのreadFASTA関数、seqinrパッケージのread.fasta関数などもあり、 どれを使えばよいのかわかりません。他にも読み込む方法があるかと思いますが、 Rでfastaファイルを読み込む際におすすめのパッケージ・関数はありますでしょうか? 追記 http://www.iu.a.u-tokyo.ac.jp/~kadota/r_seq.html#read_fasta Biostringsパッケージにはread.DNAStringSet関数というものもあり、メモリ消費量が少ないとの記述がありました。 やや脱線してしまいますが、メモリ消費量は読み込みの前後でgc()を実行すればよさそうです。 質問日 Jul 10 '11 at 19:49 wakuteka ♦ mn3 ♦♦ |
相当昔の質問ですが、一応私の見解を述べさせていただきます。 まず、http://www.iu.a.u-tokyo.ac.jp/~kadota/r_seq.html#read_fasta項目はもはやないです、すいませんm(_ _)m。そしてread.DNAStringSet関数ももはや存在しません(これは私のせいではなくBiostringsパッケージ開発者のポリシーか?!)。今はreadDNAStringSet関数です。基本的にはhttp://www.iu.a.u-tokyo.ac.jp/~kadota/r_seq.html#intro_ngs_read_fasta_multifasta1などで書いてあるように、readDNAStringSet関数を利用するのが一番手っ取り早いでしょうね。ただし、この関数はdescription行が異常に長い場合にエラーが出たような記憶があります。このような場合にseqinrパッケージのread.fasta関数を利用しています。 回答日 May 04 '14 at 21:37 かどた |