アラインメントベースとリファレンスフリー（トランスクリプトーム解析）？

質問:

SmallChess

2017-05-17 10:19:49 UTC

view on stackexchange narkive permalink

アラインメントベースとリファレンスフリー（トランスクリプトーム解析）？

参照なしの定量化は実際には存在しません（そしてKallistoはそうではありません）。

これは、参照なしでハイスループットシーケンスデータ用のツールを構築しようとするプロジェクトです：https：//colibread.inria.fr/project/

二答え:

Sarah Carl

2017-05-17 12:58:47 UTC

view on stackexchange narkive permalink

まず第一に、SalmonやKallistoのような「アライメントフリー」の定量化ツールは参照フリーではないことを強調しておきます。それらとより伝統的なアライナーとの基本的な違いは、読み取りがマップされる特定の位置（ゲノムまたはトランスクリプトームのいずれか）を報告しないことです。ただし、それらの全体的な目的は、既知の転写産物セットの発現レベル（または差異）を定量化することです。したがって、参照が必要です（任意に定義できます）。

使用するアプローチを決定するための最も重要な基準（これはゲノミクスのほとんどすべてに当てはまります）は、まさにあなたが望む質問です。回答。既知の転写産物からの成熟mRNAの発現の定量化と比較に主に関心がある場合は、トランスクリプトームベースのアラインメントが最速かつ最良の場合があります。ただし、新しいアイソフォーム、ノンコーディングRNA、プレmRNAレベルに関する情報など、既知のトランスクリプト以外の潜在的に興味深い機能を見逃す可能性があります。これらは、イントロンの読み取りから収集されることがよくあります（ EISA aを参照）。 >方法）。

このペーパーには、回答したい質問に応じて、どのツールが最適に機能するかについても考慮されています。

最後に、別の高速で柔軟なアライナ（参照トランスクリプトームの有無にかかわらず使用できます）は STARです。

H. Gourlé

2017-05-17 11:29:37 UTC

view on stackexchange narkive permalink

Kallisto（または Salmon）が参照なしであるとは言いません。トランスクリプトームを参照として使用し、 pseudo-alignment と呼ばれる概念を使用して、読み取りをトランスクリプトに割り当てるプロセスを大幅に高速化します。

とはいえ、（i）マッピングの両方のアプローチリファレンスゲノムに対して（アラインメントワークフローと呼んでいます）、（ii）リファレンストランスクリプトームに対してマッピングするとさまざまな目的に役立ちます

疑似アラインメントを使用したトランスクリプトームマッピングが遺伝子の選択方法になりつつあります/トランスクリプトの定量化と差次的発現分析。欠点は、既知のトランスクリプトのみに焦点を当てることです。

2つの典型的なワークフローは次のとおりです。

Kallistoの後に sleuth
サーモン、続いてtximportおよびDESeq2 / EdgeR

ゲノムマッピングは、たとえば新しいアイソフォームの発見に役立ちます。 TopHatは作成者によって廃止されたため、使用しないでください。

一般的なワークフローは次のとおりです。

Hisat2（配置）
StringTie（トランスクリプトの組み立てと存在量の推定）
ボールガウン（差分表現）

サーモンは[wasabi]（https://github.com/COMBINE-lab/wasabi）パッケージを使用して、sleuthと一緒に使用することもできます（この非常に便利な回答に加えて）ことは注目に値します。

ⓘ

このQ＆Aは英語から自動的に翻訳されました。オリジナルのコンテンツはstackexchangeで入手できます。これは、配布されているcc by-sa 3.0ライセンスに感謝します。

about - legalese