質問:
マッピング効率に対する不完全なバイサルファイト変換の影響
DDRRpy
2017-05-24 11:41:10 UTC
view on stackexchange narkive permalink

この質問は Biostarsにも投稿されています

私は、ヒトサンプルに由来するBSアンプリコン-seqライブラリの多数の多重化プールをシーケンスしました。過去数週間のMiSeq。私はアラインメントにトリムガロアとビスマークを利用しており、マッピング効率が2つのプール(それぞれ55%& 30%)で非常に低いことがわかりました。どちらも、塩基配列あたりのシトシンが全体で約10〜20%でした。 fastqcファイルを読んでください。

fastqcファイルに表示される高いC含有量は、バイサルファイト変換がゼロに近いと予想されるため、マッピング効率が低いのはバイサルファイト変換が不十分なためだと思います。実際に行われました。

私はこの分野に不慣れなので、どんな助けでも大歓迎です。

バイサルファイト変換リードのマッピングの背後にある手順を理解しておくとよいでしょう。 [biostars](https://www.biostars.org/p/107871/)のこの投稿では、ご覧になりたい場合に必要な手順の簡単な内訳を示します(もちろん、利用できる資料はたくさんあります)その上)。
1 回答:
#1
+7
Devon Ryan
2017-05-24 11:46:37 UTC
view on stackexchange narkive permalink

バイサルファイト変換効率は、ビスマークおよび同様のツールのマッピング率に影響を与えません。その理由は、マッピングの偏りを最小限に抑えるために、読み取りがアライメント前に in silico で完全にバイサルファイト変換されるためです。

bowtie2に渡された設定を試してみることをお勧めします。ローカルアラインメントと -score-min オプションの変更により、不一致を増やすことができます。または、 bwamethのような別のアライナーを試すこともできます。これは常にローカルアラインメントを実行します。

ありがとうございました。 --bowtie2ドキュメントのローカルフラグは有望に見えます。オフィスに入ったらこれを試してみます。 Bismarkはbowtie2オプション/フラグをbowtie2に解析しますか(--localはbisamarkドキュメントには存在せず、bowtie2ドキュメント内にのみ存在するため)? fastqcファイルの塩基配列あたりのシトシンが高いことについて何を結論付けることができますか?私は一般的に、これは以前の分析では0%、または端で10%であり、その時点で端をトリミングすることを発見しました。
読み取りが完全に整列されるか、ソフトクリッピングなしで破棄されることを想定しているため、bismarkが `--local`フラグを正しく処理するとは思いません。
ビスマークを実行した後、MBIASプロットが比較的平坦に見えない場合は、フィルターパラメーターをbismark_methylation_extractorに渡すことができます。各読み取りの最後の10bpは無視します。
@719016:正解かもしれませんが、ビスマルクコードを確認してから数年が経ちましたが、非常に遅く、結果が悪いため、通常は使用を避けようとしています。
Devon Ryanも提案しているように、bwa-memの単純なラッパーであり、ソフトクリップされた配置が存在する場合はそれを保持するbwamethを試してみることをお勧めします。次に、bamからCpGをカウントするための別のスクリプトを適用できます。これ:https://github.com/dariober/bioinformatics-cafe/tree/master/bam2methylation
私は通常、メチル化抽出とQCに[MethylDackel](https://github.com/dpryan79/MethylDackel)をお勧めしますが、偏見があります:P


このQ&Aは英語から自動的に翻訳されました。オリジナルのコンテンツはstackexchangeで入手できます。これは、配布されているcc by-sa 3.0ライセンスに感謝します。
Loading...