質問:
インデルを説明するためのゲノム座標の再マッピング
Greg Slodkowicz
2017-05-30 19:35:08 UTC
view on stackexchange narkive permalink

1000人ゲノム(および同様のプロジェクト)からすべての個人のお気に入りの遺伝子のコード配列を取得することに興味があります。 GATKを使用してバリアントの適切なサブセットを取得し、vcf-consensusを使用してこれらのバリアントをリファレンスゲノムにマッピングし、最後にsamtoolsを使用して個々のエクソンを抽出します。バリアントがSNPの場合、これは正常に機能しますが、インデルがある場合、これによりエクソンの座標が変更され、間違った領域を取得することになります。インデルによって作成された変更を説明するためにゲノム座標を再マッピングする一般的な方法はありますか?

二 答え:
#1
+8
Karel Brinda
2017-05-30 20:23:34 UTC
view on stackexchange narkive permalink

座標を変換するには、LiftOverチェーンファイルが必要だと思います。このようなファイルは、 bcftools consensus -c パラメータを使用して取得できます。

  -c、-chain<file>チェーンファイルを書き込むリフトオーバーの場合 

次に、 CrossMapを使用してさまざまなゲノム形式で座標を変換できます。

いいね、+ 1。これを拡張して、OPが実行できるコマンドの例、必要な手順などを含めることができれば素晴らしいと思います。StackExchangeサイトには、答えが何であるかについて非常に厳格なガイドラインがあり(そのため、私はあなたを悩ませてきました)、理想的には、質問を解決するために必要なすべての情報を回答で提供する必要があります。言い換えれば、回答としてポインタ(このような非常に役立つものでさえも)を投稿しないでください。コメントを投稿するか、ポインタを具体化して完全な回答にします。
たぶん私だけかもしれませんが、彼の答えはSEの基準に対しても問題ないようですが、それは私だけです。
@nuinは同意しました。それが、私が賛成した理由です。詳細があればさらに良いと思います。それだけです。
何恨みっこない。
#2
+2
finswimmer
2019-01-16 01:17:46 UTC
view on stackexchange narkive permalink

特定の地域のコンセンサス配列を抽出することが目標の場合、2019年の仕組みは次のとおりです。

bgzip とインデックスを作成する vcf ファイル。

   $ bgzip -c input.vcf > input.vcf.gz $  span> tabix input.vcf.gz  

chr:from-to の形式で1行に1つのリージョンを含む regions.txt を作成します。すでに bed ファイルがある場合は、次の小さな awk スクリプトを使用して作成できます。

   $ awk '{print $ 1": "$ 2 + 1"-"$  span> 3}' input.bed > region.txt  

次に、この samtools および bcftools

  $ samtools faidx -rregions.txtgenome.fa | bcftools consensus input.vcf.gz -oconsensus。 fa  


このQ&Aは英語から自動的に翻訳されました。オリジナルのコンテンツはstackexchangeで入手できます。これは、配布されているcc by-sa 3.0ライセンスに感謝します。
Loading...