とある遺伝病の原因遺伝子を調べて、リシーケンシングからSNPs解析を行っています。 |
GATKはどのバージョンをお使いでしょうか? 最新のver2以上でしたら、複数のBAMファイルを指定できませんか? また、各BAMファイル内のサンプル名(@RG行)は、適切に記述されているでしょうか? なお、GATKでは結果は一つのVCFファイルに複数サンプルのGenotypeがまとめて出力されます。 後でSelectVariantsなどで各サンプルごとに分けることはできると思います(-snオプション)。 回答日 Oct 25 '13 at 14:05 yamagu 質問した当時は分かっていなかったのですが、yamaguさんのご指摘されたとおり、RG行が適切に設定されておらず、全てのBAMで同一のサンプル名を付けていたことが原因でした。 今は、bwa sampe をかけるときに -r オプションで、 "@RGtID:sample1tSM:sample1tPL:IlluminatLB:sample1" とし、BAMファイルごとに異なる IDを設定しています。 レスありがとうございます。
(Jan 08 '14 at 18:29)
kyoshitake
|