質問:
bwa indexによって生成されるすべての参照ファイルは何ですか?これらは参照が圧縮されているかどうかによって異なりますか?
mattm
2017-06-03 00:36:08 UTC
view on stackexchange narkive permalink

gzipで圧縮された参照にbwa: bwa index reference.fa.gz のインデックスを付けました。これにより、他の一連のファイル reference.fa.gz。{amb、ann、bwt、 pac、sa} 。これらはbwaアラインメントで正常に機能しています。

samtoolsがgzip圧縮された参照を取得しないことを発見したため、ワークフローに2つの別々の表現を処理する代わりに、解凍されたバージョンの参照を使用することを計画しています。参照。

ファイル reference.fa.gz。{amb、ann、bwt、pac、sa} は、gzipで圧縮されている参照に依存していますか?解凍したreference.faをbwaで再インデックスする必要がありますか、それとも現在のファイルの名前を変更してファイル名の .gz 部分を削除できますか?

1 回答:
#1
+6
Devon Ryan
2017-06-03 00:46:16 UTC
view on stackexchange narkive permalink

まったく同じインデックス( amb ann bwt pac sa ファイル)参照がgzip圧縮されているかどうか。 BWAは独自のパックされた参照シーケンス(.pacファイル)も作成するため、インデックスを作成した後もゲノムは必要ありません。



このQ&Aは英語から自動的に翻訳されました。オリジナルのコンテンツはstackexchangeで入手できます。これは、配布されているcc by-sa 3.0ライセンスに感謝します。
Loading...