まず第一に、SalmonやKallistoのような「アライメントフリー」の定量化ツールは参照フリーではないことを強調しておきます。 それらとより伝統的なアライナーとの基本的な違いは、読み取りがマップされる特定の位置(ゲノムまたはトランスクリプトームのいずれか)を報告しないことです。ただし、それらの全体的な目的は、既知の転写産物セットの発現レベル(または差異)を定量化することです。したがって、参照が必要です(任意に定義できます)。
使用するアプローチを決定するための最も重要な基準(これはゲノミクスのほとんどすべてに当てはまります)は、まさにあなたが望む質問です。回答。既知の転写産物からの成熟mRNAの発現の定量化と比較に主に関心がある場合は、トランスクリプトームベースのアラインメントが最速かつ最良の場合があります。ただし、新しいアイソフォーム、ノンコーディングRNA、プレmRNAレベルに関する情報など、既知のトランスクリプト以外の潜在的に興味深い機能を見逃す可能性があります。これらは、イントロンの読み取りから収集されることがよくあります( EISA aを参照)。 >方法)。
このペーパーには、回答したい質問に応じて、どのツールが最適に機能するかについても考慮されています。
最後に、別の高速で柔軟なアライナ(参照トランスクリプトームの有無にかかわらず使用できます)は STARです。
Kallisto(または Salmon)が参照なしであるとは言いません。トランスクリプトームを参照として使用し、 pseudo-alignment と呼ばれる概念を使用して、読み取りをトランスクリプトに割り当てるプロセスを大幅に高速化します。
とはいえ、(i)マッピングの両方のアプローチリファレンスゲノムに対して(アラインメントワークフローと呼んでいます)、(ii)リファレンストランスクリプトームに対してマッピングするとさまざまな目的に役立ちます
疑似アラインメントを使用したトランスクリプトームマッピングが遺伝子の選択方法になりつつあります/トランスクリプトの定量化と差次的発現分析。欠点は、既知のトランスクリプトのみに焦点を当てることです。
2つの典型的なワークフローは次のとおりです。
ゲノムマッピングは、たとえば新しいアイソフォームの発見に役立ちます。 TopHatは作成者によって廃止されたため、使用しないでください。
一般的なワークフローは次のとおりです。