質問:
Rna-seqデータの5 'および3'バイアス
stack_learner
2018-02-18 16:36:18 UTC
view on stackexchange narkive permalink

私はrna-seqサンプルを扱っています。ベースシーケンスのコンテンツプロットには、5 'バイアスと3'バイアスがあります。このリンクから、シーケンスの開始時の偏りは、ライブラリからのフラグメントの偏った選択の結果であるように見えることがわかります。そして、これはダウンストリーム分析には影響しません。しかし、私のすべてのサンプルでは、​​シーケンスの最後にバイアスも見られます。何が問題になる可能性がありますか?サンプルは、ポリA選択プロトコルを使用して鎖特異的にシーケンスされます。

トランスクリプトカバレッジプロファイルでは、すべてのサンプルの5'-3 'バイアスが次のようになっています。0.9

-サンプルの1つのベースシーケンスプロット:すべてのサンプルで、5 'と3'のバイアスが見られます。

アダプタのコンテンツを見ると、次のようになっています。

アダプターの汚染が0.1%を超えるサンプルは見つかりませんでした

enter image description here

二 答え:
Devon Ryan
2018-02-18 20:34:53 UTC
view on stackexchange narkive permalink

最後の塩基の間にシーケンスの問題があったと思います。そこでは、いくつかの試薬がシーケンサーで不足していました。これは実際の問題を引き起こすことはありません。STARのようなRNAseqアライナーは、ミスマッチの場合、最後の1つまたは2つの塩基をソフトクリップします。

5 'または3に少し偏るのが一般的です。 'はRNAseqで終わります。これは主に、ポリAの選択が行われたか、少し劣化したかによるものです。確認する主なことは、バイアスがサンプル/グループ間で類似していることです。その場合は、ダウンストリーム分析が何らかのグループごとのバイアスの影響を受けることを心配する必要はありません。

私はhisat2を使用していますが、バイアスはサンプル間で類似していることがわかります。答えてくれてありがとう。
ああ、hisat2の場合、最後の1〜2塩基をトリミングすると、少し良い結果が得られる可能性があります。これは、hisat2がグローバルアライメントを実行するためです(つまり、ソフトクリッピングを実行しません)。または、少なくとも前回チェックしたときはそうだった。
涼しい。私はこれを考慮し、3 '末端のいくつかの塩基をトリミングします。 5 '端にもトリミングが必要ですか?
いいえ、5フィートの端は大丈夫です。
hisat2には `--local`オプションがあると思いましたが、` hisat2 -h |を実行するとgrep local`、 `--ma マッチボーナス(--end-to-endの場合は0、-localの場合は2)`のみを取得します。 `--local`は適切ではありません。ヘルプは首尾一貫していないように見えます。
@bliバイオインフォマティクスパッケージドキュメントの喜び...
ewels
2020-05-20 14:22:49 UTC
view on stackexchange narkive permalink

これが古い投稿であることはわかっていますが、このプロットがトリミング後の である場合は、別の説明をお勧めします。一部のトリミングツールは、読み取りからポリAシーケンスを削除します。その場合、 A で終わる読み取りはすべて削除され、最終的な基本位置に0%の A 基本コンテンツが作成されます(そして%最後の2つのベースの)。

これはアライメントや分析に影響を与えないはずです。



このQ&Aは英語から自動的に翻訳されました。オリジナルのコンテンツはstackexchangeで入手できます。これは、配布されているcc by-sa 3.0ライセンスに感謝します。
Loading...