質問:
長い読み取りに基づくゲノムアセンブリの研磨中にヘテロ接合性に対処する方法は?
Kamil S Jaron
2017-05-21 16:49:59 UTC
view on stackexchange narkive permalink

すべてのロングリードシーケンスプラットフォームは、単一分子シーケンスに基づいているため、ベースあたりのエラー率が高くなります。このため、ゲノムアセンブリパイプラインに研磨ステップが追加されました。生の読み取りをアセンブリにマッピングし、アセンブリの詳細を修正します。

非常にヘテロ接合の非モデル種の単一の個別ゲノムの適切なPacBioRSIIデータセットがあります。 。アセンブリはうまくいきましたが、矢筒を使用してアセンブリを研磨しようとすると、2、3回の反復で収束できず、ハプロタイプの相違が大きすぎるためだと思います。

このような特性を持つゲノムを研磨する他の方法はありますか?たとえば、長い読み取りをハプロタイプで分離して、1つのハプロタイプのみを使用して研磨できる方法はありますか?

二 答え:
#1
+4
roblanf
2017-05-22 08:36:12 UTC
view on stackexchange narkive permalink

いくつかの可能性:

ファルコン

ファルコンとファルコンを試してください-解凍します。これらは、問題とデータに合わせて正確に設計されています: https://github.com/PacificBiosciences/FALCON

Falconではありません

ハプロタイプを組み立てたと思う場合(十分なカバレッジがあれば期待できると思われます)、コンティグのすべてのペアワイズアラインメントを実行するだけで2つのハプロタイプを確認できるはずです。ハプロタイプは、他のペアよりもはるかに類似しているコンティグのペアとして表示される必要があります(ハプロタイプ間の相違が多い場合でも)。そのようなペアがすべて揃ったら、各ペアの1つを選択するだけで磨くことができます。

私は確かに両方のハプロタイプ配列を持っています。 [haplomerger2](http://www.ncbi.nlm.nih.gov/pubmed/22555592)というツールを使用して入手しました。しかし、このツールはキメラ半数体アセンブリを生成するため、実際には正しくフェーズされたハプロタイプではありません。 Falcon-unzipは確かに機能するソフトウェアです。当時は若すぎて試せませんでしたが、今度はもう一度試してみることができました。
#2
+3
gringer
2017-05-22 13:12:38 UTC
view on stackexchange narkive permalink

Canuに行くこともできます。複雑な集団シーケン​​ス用ではありませんが、長時間のアセンブリ(PacBioとNanoporeの両方)用に設計されています。ゲノムを独自のコンポーネントに分解しようとし、読み取りから十分にサポートされているコンポーネントからパスを生成します。

研磨に関しては、研磨が行われない場合のようです。収束し、2つの可能性の間で振動するだけのバリアントがたくさんあります。私と今年のロンドン・コーリングの少なくとも1人の人にとって、3回目の反復を過ぎても研磨の精度は基本的に向上しませんでした。私は独自のエラー訂正アルゴリズムを使用しましたが、Pilonを使用したより「標準的な」研磨を使用しました。ナノポアWGSコンソーシアムは、その価値のために、カヌアセンブリの研磨にRaconを使用しました。

私は実際にCanuを使用してゲノムを組み立てましたが、ゲノムの約2倍の倍数体サイズが得られ、[HaploMerger2](http://www.ncbi.nlm.nih.gov/pubmed/22555592)を使用してハプロタイプに折りたたまれました。世界的にアセンブリが良いことを知っています。磨くだけです。
そうそう。申し訳ありませんが、私は最初の答えを見て、これはちょうど組み立てについてだと思っていました。私は今、質問が組み立てではなく*研磨*について議論していたことに気づきました。
@gringer Racon(Quiverはハプロタイプを崩壊させる)を使用して、高度にヘテロ接合のゲノムアセンブリ(canuによって生成される)を研磨しようとしましたが、満足のいく出力を得ることができませんでした(基本的に統計は変更されていません)。何かアドバイス?
現時点での私の一般的な推奨事項は、メチル化モードでナノポリッシュを使用して修正することです。次に、イルミナを使用したPilonは、ホモポリマーフラグメントを*のみ*修正します(つまり、SNP修正なし、長距離足場なし)。これに基づく:https://github.com/rrwick/Basecalling-comparison#methylation


このQ&Aは英語から自動的に翻訳されました。オリジナルのコンテンツはstackexchangeで入手できます。これは、配布されているcc by-sa 3.0ライセンスに感謝します。
Loading...