いいえ、samtools(したがってbcftools)はソフトクリップされたベースを使用しません。 samtoolsdepth
または samtools mpileup
を使用して、ソフトクリップされた配置の領域を確認することで、これをすばやく確認できます。ソフトクリップされた領域は深度/パイルアップでは使用されないことに注意してください(どちらのツールも同じ基になるコードを使用するため、どちらを使用してもかまいません)。興味がある場合、samtoolsはソフトクリップされたベースを無視します。これは、各位置をカバーするアライメントのベースごとのスタックを作成することに基づいているためです。 BAM形式では、配置は開始/終了位置に従って並べ替えられ、ビンに割り当てられます。これにはソフトクリッピングは含まれません。その結果、samtoolsがパイルアップを作成しているとき、ソフトクリップされたベースが含まれている場合に特定のベースとオーバーラップするアライメントも表示されません。
これは、GATKのHaplotypeCallerが何をしているのかという疑問を投げかけます。別の方法で。そこでは、ゲノム内の領域は基本的に小さなde Bruijnグラフに組み立てられます。これにより、グラフがインデルの両側を少し過ぎて開始/終了する場合、インデルの周りのソフトクリップされたベースを解決できます。これが、HaplotypeCallerでインデルの再調整を行う必要がない理由でもあります(これは古いUnifiedGenotyperで必要でした)。
編集:HaplotypeCallerの詳細については、を参照してください。 GATKのウェブサイトのこの素敵なページは、私がここで行ったよりもはるかに詳細になっています。