GRCh38アセンブリに一般的な癌の変異を含むvcfファイルがありますか?どこかにダウンロードできますか?おそらく、国際的な大きな癌ゲノミクスコンソーシアムの1つからですか?
一般的に、さまざまな種類の癌で再発することがわかっている突然変異を意味します。
GRCh38アセンブリに一般的な癌の変異を含むvcfファイルがありますか?どこかにダウンロードできますか?おそらく、国際的な大きな癌ゲノミクスコンソーシアムの1つからですか?
一般的に、さまざまな種類の癌で再発することがわかっている突然変異を意味します。
がんの変異を探している場合、主要なリソースはCOSMICであり、GRCh38VCFを提供します。ダウンロードページはこちらです: http://cancer.sanger.ac.uk/cosmic/download
「共通」をどのように定義するかはあなた次第ですが、 VCFには、使用できる多くの情報が含まれています。
あなたの質問は特定の答えに十分な情報を提供していませんが、これは最初に役立つはずです。
NCBIからClinvarのすべての亜種を説明するVCFファイルを入手してください:
wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh38/clinvar.vcf.gz
VCF行に「cancer」という単語が含まれているバリアントを抽出します。
zgrep-iE '^#| CLNDBN = [^;] * cancer' clinvar.vcf.gz >cancer.vcf
ここで、バリアントの頻度や癌の種類などに基づいてさらにフィルタリングする必要がありますが、それは良いスタートになるはずです。
がんに関連する変異体を探す際の問題は、原因となる変異体から偽の影響(民族性など)を引き出すことが難しい場合があることです。 遺伝子がほとんどの種類の癌に関係していることに興味がある場合は、NanoStringパネルの注釈が非常に優れています:
これらのページの「サポートドキュメント」セクションには、遺伝子リストとプローブを含むExcelファイルへのリンクがあります。シーケンス。これらのリストは機能を破壊する変異体に関する情報を提供していませんが、CRISPRなどを介して癌を誘発することが目的でない限り、それを知ることがなぜ役立つのかを事前に考えるのに少し苦労しています。