質問:
WGSデータを使用してグループを比較する方法は?
Jessica
2017-06-05 23:06:35 UTC
view on stackexchange narkive permalink

患者(非がん)(n = 60)および健常対照者(n = 20)の全ゲノムシーケンスデータがあります。シーケンシングセンターは、読み取りマッピング(.BAM)、GATK(.vcf)を使用したバリアント呼び出し、注釈(.vcfおよび.gVCFの注釈付き)などのベストプラクティスのバイオインフォマティクス分析を提供してくれました。

次のステップは何ですか?グループ間に(グローバルおよび/または特定の)違いがあるかどうかを確認することに関心があります。

それは本当にあなたが興味を持っていることですか、それともおそらく原因となる違いを見つけたいですか?
こんにちはジェシカ、Bioinformatics StackExchangeに質問を書いてくれてありがとう。あなたの質問は、特定のタスクに固有であり、その背後にあるストーリーが少し含まれているという点で、このサイトで私たちが好む形式によく適合しています。この質問に対する回答の質を向上させたい場合は、すでに精通している、または慣れている分析の種類に関する情報を追加することをお勧めします。以前にGATKまたはRを使用したことがありますか?これは、構造化され、文書化され、複製可能な分析が重要な診断設定ですか?
[GWAS](https://en.wikipedia.org/wiki/Genome-wide_association_study)を実行したいようですが、そのためにはおそらくもっと多くのサンプルが必要になります。バリアントをサブセット化して、ゲノムの関連領域のみをテストできますか?それはあなたが統計的検出力を得るのを助けるでしょう(より少ないテスト->より良い)。
二 答え:
#1
+2
gringer
2017-06-06 02:16:01 UTC
view on stackexchange narkive permalink

私はこのプログラムに精通していませんが、明らかに Hailは、バリアントと呼ばれるデータセットのダウンストリーム分析を行うためのスイス軍チェーンソープロジェクトとして設定されています。

Hailの概要については、こちらをご覧ください:

http://blog.cloudera.com/blog/2017/05/hail-scalable-genomics-analysis-with-spark/

アソシエーションテストのチュートリアルはここにあります:

https://hail.is/hail/tutorial.html#Association-testing

#2
+2
morgantaschuk
2017-06-06 20:26:24 UTC
view on stackexchange narkive permalink

gVCFがある場合、最初に試す必要があるのは、ジョイントバリアントの呼び出しです。 GATKによると、共同バリアント呼び出しは、「複数のサンプルのコホートからの母集団全体の情報を活用する機能を提供することにより、バリアントの発見を強化し、感度と遺伝子型のサンプルを可能な限り正確に検出できるようにします」と述べています。 ソース

高品質のバリアントが2セットあると、次に何をするかはリサーチクエスチョンによって異なります。薬にできる突然変異を探していますか?根本的な原因?バイオマーカー?患者の予後は?患者コホートで最も頻繁に変異する位置を調べて、それらを参照コホートと比較し、共起する変異をチェックし、クラスター化し、主成分分析を行い、機械学習を行ってそれらを層別化することができます。



このQ&Aは英語から自動的に翻訳されました。オリジナルのコンテンツはstackexchangeで入手できます。これは、配布されているcc by-sa 3.0ライセンスに感謝します。
Loading...