パッケージ atlasに実装されている最尤法と古典的な置換モデルを使用して、ゲノム全体のヘテロ接合性レベルを推定しました。これらの推定値は、大きなウィンドウからの情報を1つの推定値に統合するため、従来のSNP呼び出しや、単に異種の場所の数を数えるよりもはるかに堅牢です。つまり私は自分のゲノムのSNPのヘテロ接合性レベルについてかなり確信しています。
しかし、今度はインデルのヘテロ接合性についても知り、以前のロバストな推定値を使用して個々のsnpsを呼び出したいと思います。 GATKでは、SNPとインデルの両方のヘテロ接合性の事前確率を指定できます。これにより、バリアント呼び出しが大幅に改善される可能性があります。これは、デフォルトのGATKがヒト用にパラメーター化されているためです(ヘテロ接合型SNPのデフォルトの事前確率は0.001で、インデル1.25E-4です)。しかし、私は自分のSNPのヘテロ接合性が0.01から0.03(1%-3%)の間にあることを知っている昆虫を扱っています。
それで、SNPのヘテロ接合性を知っているなら、簡単に質問があります。インデルのヘテロ接合性の合理的な前兆を推測しますか?以前のGATKのデフォルトは10倍異なりますが、同じ関係を想定する必要がありますか?インデルのヘテロ接合性の事前予測を推測する合理的な方法はありますか?