質問:
RNASeqデータから細胞株の寄与をどのように推定できますか?
llrs
2017-05-30 12:30:54 UTC
view on stackexchange narkive permalink

細胞のレーザーキャプチャーマイクロダイセクションを使用して、目的のマーカーで染色された細胞のグループの配列を決定しました。別の患者コホート(これはすべてヒトの肝臓組織です)では、組織全体のシーケンスが行われました(どちらの場合もRNA-seq)

肝臓全体でマークされた細胞の寄与を推定できますか(「私のPIの言葉で言えば、肝臓のこれらの細胞」?

私の腸の感覚は、この方法では実行できないということです。の寄与を推定するには、単一細胞シーケンスと全組織シーケンスの両方が必要になります。各細胞株。しかし、おそらく、細胞株または他の細胞株の主な発現を考慮して、 GSVAまたは同様のツールを使用して比較できるツールがあります。

混合物推定のためのツールを見たことがありますか(それがあなたがしていることです)?見積もりをどの程度正確にする必要がありますか?
混合推定について聞いたことがないので、そのキーワードを持つツールを探していません。精度の要件はありませんが、多ければ多いほど良いです:D。しかし、私のデータはあまり良くないのではないかと思います(レーザーマイクロダイセクションの技術的な複製は6つしかありません)ので、あまり期待できません。
四 答え:
#1
+6
Iakov Davydov
2017-06-01 14:01:04 UTC
view on stackexchange narkive permalink

これを実行しようとする計算方法がいくつかあります(私はそれらを使用したことがないため、経験がありません):

  1. CellMix、マーカー遺伝子のセットに基づくリスト
  2. 濃縮相関からのサブセット予測。これは、一連のサンプルにわたるサブセット固有の遺伝子との相関に基づいています。
  3. 細胞タイプの濃縮、高度に発現された細胞特異的遺伝子データベースを使用
  4. 細胞タイプごとの差次的遺伝子発現を使用した細胞タイプ特異的有意性分析
  5. ol >

    いくつかの方法については、公開データベースまたは論文からいくつかの参照発現レベルを取得する必要がある場合があります。

    覚えておくべきことの1つは、細胞の比率を実際に計算することはできず、RNAの比率のみを計算することです。細胞あたりのRNA量が非常に類似していると考える十分な理由がある場合、これは組織内の細胞比率の適切な代理です。

素敵なリファレンス。私はその制限を念頭に置いています。ありがとう
#2
+4
gringer
2017-06-01 17:48:19 UTC
view on stackexchange narkive permalink

細胞のデコンボリューションについては、このBiostarsの投稿で言及されています。この投稿では、免疫細胞混合物のCIBERSORTと、Bioconductorパッケージの DeconRNASeqについて言及しています。

シーケンサーとサンプル準備ワークフローは、シーケンスに関係なく同じ数のリードが出​​力されるように設計されているため、標準的なハイスループットシーケンス結果から転写産物発現の比例代表を取得することしかできないことを私は知っています。入力量。

CIBERSORTは、試してみる価値のある素晴らしいツールのように聞こえます。
#3
  0
Dr_Hope
2020-08-18 19:18:02 UTC
view on stackexchange narkive permalink

参照用に精製された初代細胞の公開シングルセルRNA-seqデータまたはバルクRNA-seqをダウンロードし、CIBERSORTまたはMuSiCを使用してデコンボリューションできます。注意すべき点の1つは、バルクRNA-seqとシングルセルリファレンスを作成することです。互換性のある、RNA-seqのTPMは、3 '(10X、Drop-seqなど)シングルセルデータのCPMおよびフルレングスシングルセルデータ(SMARTseqなど)のTPMと比較できます。

#4
  0
Reza Rezaei
2020-08-18 21:31:11 UTC
view on stackexchange narkive permalink

実は1か月前、同じ質問を探していたところ、使用できるパッケージがいくつか見つかりました。まず第一に、それらの機能は、細胞比率推定、細胞特異的遺伝子発現推定、またはこれらの機能の両方である可能性があります。第二に、彼らの一次入力は、予想通り、バルクRNA-seqデータであり、二次入力としてシングルセルRNA-seqデータを必要とするものもあります。最も人気のあるものは、有名なcibersortの子であるCIBERSORTXです。私は彼らのウェブサイトを見て、チュートリアルを読みました。プラットフォームの学習に使用できるデータセットの例がいくつかあります。ただし、2つの最大の欠点は、ソースコードを共有していないことです。つまり、独自のシステムで結果を再現できず、すべてのデータをスタンフォードサーバーにアップロードする必要があります(セキュリティ上の懸念があります)。 2番目の問題は、サーバーへのAPIアクセスがなく、すべてをオンラインで行う必要があることです。これは、他のツールとの互換性が非常に低いことを意味します。

デコンボリューションとディープラーニングを使用して、バルクから細胞の亜集団を推測するというアイデアRNA-seqは素晴らしいです。それで、私は他の人たちも同じようなことをしたか、そしておそらくもっと良いことをしたかどうかを調べました。他に3つのツールを見つけました:

  1. MuSiC: https://www.nature.com/articles/s41467-018-08023-x
    ネイチャーコミュニケーションズで公開され、cibersortxより数か月古い。私はまだ彼らのアルゴリズムを研究していないので、彼らの方法がcibersortxよりも優れているかどうかはわかりません。ただし、違いを生むのは、ソースコードを含むすべての作品がオープンソースであるということです。したがって、私は彼らのコードにアクセスでき、未公開のデータを安全でないオンラインサーバーにアップロードする必要はありません(cibersortxとは異なります)。 2つ目の良い点は、ほとんどのRNA-seqデータ分析に使用するR言語で実装されているため、他のツールと簡単に互換性があることです。

  2. Scaden: https://advances.sciencemag.org/content/6/30/eaba2619.full これもオープンソースで、簡単にアクセスできます。 Pythonで記述され、シェルで実行されます。そのため、他のツールとある程度互換性があります(MuSicほど互換性はありません)。ここでもデータをローカルで処理でき、データをサーバーにアップロードする必要はありません(これは良いことです)。彼らは、彼らの方法が、cibersortxとMuSicの両方よりも実際のscRNA-seqデータとより良い相関関係があると主張しています(常にではありません!!)。彼らのチュートリアルに基づくと、彼らのツールの実行は簡単に思えます(私はまだ私のシステムでそれを実行していません!)。ただし、チュートリアルは少しわかりにくいようで、まだプレリリースバージョンであり、バグがあるようです!!

  3. CDSeq: https:/ /github.com/kkang7/CDSeq_R_Package最後に、バルクデータで単一細胞の比率と細胞特異的な遺伝子発現を見つけるためにscRNA-seq入力を必要としないCDSeqパッケージを見つけました。それはあなたのbuldカウントを入力として取得し、非常に少数のパラメーターに関する情報を取得し、すべてを自動的に実行します。驚くほど良いことを確認しました。特定の細胞の遺伝子発現パターンを見つけてそれを入力として使用できる場合、それはオプションであり、さらに正確な推定が可能になります。

  4. ol>


このQ&Aは英語から自動的に翻訳されました。オリジナルのコンテンツはstackexchangeで入手できます。これは、配布されているcc by-sa 3.0ライセンスに感謝します。
Loading...