質問:
Affymetrixアレイ間のプローブセットからプローブセットへのマッピング
Prradep
2017-05-18 17:52:23 UTC
view on stackexchange narkive permalink

異なるタイプのAffymetrixアレイ間のマッピングを特定することに興味があります。 EnsemblのBiomartデータベースを使用して、遺伝子とプローブセット間のマッピングを抽出できることを認識しています。

  Ensembe遺伝子IDENSG00000181019は1にマップされます。AFFYHG-U133_Plus_2の210519_s_at2。 AFFY HuGene-1_0-st-v1's 8002303  

2つのアレイ(例:HG-U133_Plus_2、HuGene-1_0-st-v1)間のプローブセットIDのマッピングを抽出する方法はありますか?

 例:210519_s_atおよび8002303  
アレイ間で重複するプローブセットを見つける方法について質問がありますか?または、一般的にプローブセットを識別する方法は?はっきりしていません。
例を追加しました。これは今意味がありますか?
したがって、基本的には、EnsemblのBiomartから2つの遺伝子IDマッピングを取得できます。正しい? Ensembl遺伝子IDに基づいてこれら2つのテーブルを結合できない理由は何ですか? Rでは `merge`関数を、SQLでは` JOIN`ステートメントを使用できます。
@IakovDavydovまたはUnixの `join`も機能します
問題は次のとおりです。すべてのマッピングが正確に1対1ではありません。 1つのアンサンブル遺伝子IDにマッピングするHG-U133_Plus_2またはHuGene-1_0-st-v1のプローブセット。
@Prradep解決しようとしている根本的な問題が何であるかを説明すると、より良いアドバイスを提供できる可能性があります
必ずしも1対1のマッピングが表示されることを期待する必要はありません。以下の私の回答を参照してください。
三 答え:
#1
+9
neilfws
2017-05-19 06:18:14 UTC
view on stackexchange narkive permalink

質問が次の場合:プローブセットを遺伝子にマッピングするのと同様の方法で、異なるプラットフォームのプローブセットIDを相互にマッピングできますか?答えは「はい」です。 BioMartを使用すると、IDを持つほとんどすべてのものを、IDを持つ他のすべてのものにマップできます。

BioMartは、Webインターフェイスまたはプログラムで使用できます。 HG U133 Plus2をHuGene1.0にマッピングするためのWebインターフェイスの使用に関する簡単なガイド:

  1. スタートページに移動
  2. Hを選択。データベース用のsapiensEnsembl遺伝子。データセットのヒト遺伝子(GRCh38.p10)
  3. 左側の列の[フィルター]をクリックします
  4. [地域]を展開し、[GENE]まで下にスクロールして、[マイクロアレイプローブ/プローブセットIDの入力]を選択しますリスト[最大500推奨] "
  5. AFFY HG U133 PLUS 2プローブIDを選択し、リストを1行に1つずつコピー/貼り付けまたはアップロードします
  6. 左側の[属性]をクリックします-手の列
  7. スクロールして、見たくないもののチェックを外し、実行することを選択します。たとえば、Gene Stable ID、AFFY HuGene 1 0 st v1プローブ、AFFY HG U133 Plus2プローブ
  8. 最後に左側の列の上部にあるメニューの[結果]をクリックします
  9. ol>

    そしてこのような結果が表示されます(あなたは[結果]ボタンをクリックする必要があります。

    2つの理由から、1対1のマッピングがあると期待するべきではありません。

  • 遺伝子には複数のトランスクリプトとプローブセットが各トランスクリプトにマッピングされます
  • 一部のトランスクリプトには複数のプローブセットがあります。この場合、HuGene ID8002301と8002303は次のトランスクリプトにマッピングされます。この遺伝子

最後に: R / BioMartを使用したプログラム例を次に示します:

  library(biomaRt)mart.hs <- useMart( "ensembl"、 "hsapiens_gene_ensembl")results <- getBM(attributes = c( "ensembl_gene_id"、 "affy_hugene_1_0_st_v1"、 "affy_hg_u133_plus_2")、filters = "affy_hg_u133_plus_2"、values = "affy_hg_u133_plus_2"、values .hs)結果ensembl_gene_id affy_hugene_1_0_st_v1 affy_hg_u133_plus_2
1 ENSG00000181019 8002301 210519_s_at2 ENSG00000181019 8002303 210519_s_at  
#2
+7
rmflight
2017-05-19 06:53:56 UTC
view on stackexchange narkive permalink

biomaRtの代わりに、Bioconductor自体に組み込まれているマッピングデータベースを使用して、プローブから遺伝子にマッピングし、次に遺伝子からプローブにマッピングすることもできます。別のもので提供されている同じプローブIDを使用してhgu133とhgu95の間で変換するいくつかのRコード:

  library(hgu133plus2.db)library(hgu95av2.db)query_probe <- "210519_s_at" hgu133_ensembl <- select (hgu133plus2.db、keys = query_probe、columns = "ENSEMBL")ensembl_hgu95 <- select(hgu95av2.db、keys = hgu133_ensembl $ ENSEMBL、keytype = "ENSEMBL"、columns = "PROBEID")dplyr :: inner_join(hgu133_ensembl 、by = "ENSEMBL"、suffix = c( "。133"、 "。95")) 
#3
+2
rmflight
2017-05-19 06:57:32 UTC
view on stackexchange narkive permalink

他の回答は、プローブ間に1対1のマッピングがない理由を説明しています。

AbsIDデータベースは、プローブ配列をゲノムビルドにマッピングすることに基づいて変換を行います。次に、重複するゲノムアラインメント座標に基づいてマッピングを決定します。これは、2つのプローブが実際に同じ転写産物を測定していることを確認したい場合に非常に便利です。

ただし、ゲノムに整列している両方のプローブに依存します。 em p>

免責事項:私はAbsIDマッピングツールを提供するグループで働いていました。



このQ&Aは英語から自動的に翻訳されました。オリジナルのコンテンツはstackexchangeで入手できます。これは、配布されているcc by-sa 3.0ライセンスに感謝します。
Loading...