質問:
SNPヘテロ接合性をインデルヘテロ接合性のプロキシとして使用することは可能ですか?
Kamil S Jaron
2018-03-14 00:01:32 UTC
view on stackexchange narkive permalink

パッケージ atlasに実装されている最尤法と古典的な置換モデルを使用して、ゲノム全体のヘテロ接合性レベルを推定しました。これらの推定値は、大きなウィンドウからの情報を1つの推定値に統合するため、従来のSNP呼び出しや、単に異種の場所の数を数えるよりもはるかに堅牢です。つまり私は自分のゲノムのSNPのヘテロ接合性レベルについてかなり確信しています。

しかし、今度はインデルのヘテロ接合性についても知り、以前のロバストな推定値を使用して個々のsnpsを呼び出したいと思います。 GATKでは、SNPとインデルの両方のヘテロ接合性の事前確率を指定できます。これにより、バリアント呼び出しが大幅に改善される可能性があります。これは、デフォルトのGATKがヒト用にパラメーター化されているためです(ヘテロ接合型SNPのデフォルトの事前確率は0.001で、インデル1.25E-4です)。しかし、私は自分のSNPのヘテロ接合性が0.01から0.03(1%-3%)の間にあることを知っている昆虫を扱っています。

それで、SNPのヘテロ接合性を知っているなら、簡単に質問があります。インデルのヘテロ接合性の合理的な前兆を推測しますか?以前のGATKのデフォルトは10倍異なりますが、同じ関係を想定する必要がありますか?インデルのヘテロ接合性の事前予測を推測する合理的な方法はありますか?

1 回答:
winni2k
2018-11-15 20:23:05 UTC
view on stackexchange narkive permalink

SNP、挿入、および削除は、さまざまな生物学的プロセスによって生成されます(たとえば、ここを参照)。これらの突然変異プロセスの世代ごとの割合は、種によって異なると思います。また、それぞれの突然変異プロセスが種によって異なる程度も異なると予想します。あなたの質問に対する答えは「おそらくそれ以上の情報がないわけではない」と思います。

ただし、事前確率はベイズ統計の特徴です。ベイズ推定では、いくつかの事前確率を使用して分析をやり直し、選択した事前確率に対する結果の感度を確立することをお勧めします。事前確率の範囲を使用してインデルを呼び出し、呼び出しセットの品質を比較して、事前確率の選択が実際にどれほど重要かを判断することをお勧めします。

1、突然変異を生成するプロセスは確かに異なりますが、それらを維持するプロセスは同じです(ドリフト、選択)。2、異なる事前の結果を見るのは、最尤法を使用するのと同じようなものです。それらを意味のある形で指定する方法がなかった場合、事前確率のポイントは何でしょうか?
明確な「はい/いいえ」の答えがないので、それは良い質問ではないと私は考え始めています。
質問を「どうすれば...」または「...するためにどのような情報が必要か」と言い換える価値があるかもしれません。
事後確率は尤度倍前だと思いました。次に、複数の事前確率を試す(または情報量の少ない事前確率を取る)ことは、事前確率なしで最尤推定値を計算するのと同じようなものです。それとも私は何かを逃したことがありますか?
そうですか。 ML(ブートストラップと共に!)とベイズ推定はどちらも、同様の問題を解決するために一般的に使用される統計的手法です。その点で、彼らは「同じようなもの」です。 2番目の質問については、「事前確率を意味のある形で指定する方法がなかった場合、事前確率のポイントは何でしょうか?」:もちろんありません;)しかし、ポイントは、時々可能であり、ベイジアンアプローチが機能するということです。あなたが強い事前確率を持っているかどうかに関係なく。


このQ&Aは英語から自動的に翻訳されました。オリジナルのコンテンツはstackexchangeで入手できます。これは、配布されているcc by-sa 3.0ライセンスに感謝します。
Loading...