質問:
RNA-Seq ERCCスパイクを使用した正規化方法?
SmallChess
2017-05-17 10:24:25 UTC
view on stackexchange narkive permalink
RNA-Seq ERCCスパイクを使用した正規化方法?
バルクまたはシングルセルRNA-seqに興味がありますか?スパイクインの値はそれに応じて大きく異なります
二 答え:
Scott Gigante
2017-05-17 10:43:41 UTC
view on stackexchange narkive permalink

RUVSeqの使用を検討してください。 2013 NatureBiotechnologyの出版物からの抜粋を次に示します。

外部RNAコントロールコンソーシアム(ERCC)のスパイクインコントロールのパフォーマンスを評価し、正規化のためにそれらを直接使用します。スパイクインは、標準のグローバルスケーリングまたは回帰ベースの正規化手順で使用するのに十分な信頼性がないことを示しています。制御遺伝子の適切なセット(ERCCスパイクインなど)またはサンプル(複製ライブラリなど)で因子分析を実行することにより、厄介な技術的影響を調整する、不要な変動の除去(RUV)と呼ばれる正規化戦略を提案します。

RUVSeqは、基本的に一般化線形モデル(GLM)を式データに適合させます。ここで、式行列$ Y $は$ m $ x $ n $行列であり、$ m $はサンプル数です。そして$ n $は遺伝子の数です。モデルは要約すると

$ Y = X * \ beta + Z * \ gamma + W * \ alpha + \ epsilon $

ここで、$ X $は対象の条件を表します(たとえば、治療と対照)、$ Z $は観察された共変量(たとえば、性別)を表し、$ W $は観察されなかった共変量(たとえば、バッチ、温度、実験室)を表します。 $ \ beta $、$ \ gamma $、および$ \ alpha $は、$ X $、$ Z $、および$ W $の寄与を記録するパラメーター行列であり、$ \ epsilon $はランダムノイズです。慎重に選択された遺伝子のサブセット(ERCCスパイクイン、ハウスキーピング遺伝子、技術的複製など)の場合、$ X $と$ Z $はゼロであると想定し、サンプル内の「不要なバリエーション」である$ W $を見つけることができます。

gringer
2017-08-02 03:16:10 UTC
view on stackexchange narkive permalink

他の人が将来役立つと思われる場合に備えて、すべてのRNASeqデータにERCCスパイクインを追加しました。ただし、合理的な使用方法が考えられないため、自分の分析では使用したことがありません。

ERCCの一般的な推奨事項は、入力RNA量に比例して追加することです。 、しかし、それは、総細胞RNA数が異なる細胞間で類似していることを前提としています(これは、単一細胞RNASeqの結果を見ると明らかに誤りです)。元の読み取りからサンプリングされた「ハウスキーピング」遺伝子セットよりも結果。

何の役にも立たないのに、なぜERCCを急上昇させるのでしょうか。
同じことを行います。必要なシーケンス深度は非常に小さいため、安価で「申し訳ないより安全」です。
追加するものを見つけようとしました。これは、将来、実行をやり直す必要がないことを意味します。
潜在的な利点の1つは、特定のサンプルに極端な偏りがあるように見える場合(たとえば、読み取りの大部分がERCCに送られる)、核酸に​​問題が発生したことを知っていることです(たとえば、抽出不良、入力が低すぎるなど)。
はい、ERCCはサンプル準備の妥当なポジティブコントロールだと思います。これらのサンプル準備の問題は、他の手段でも発生する傾向があります(たとえば、リボソームマッピングの割合が高い、マッピング率が低い、GCの差、Xレベルを超えて発現する転写産物の数、PCA)。


このQ&Aは英語から自動的に翻訳されました。オリジナルのコンテンツはstackexchangeで入手できます。これは、配布されているcc by-sa 3.0ライセンスに感謝します。
Loading...