aechchiki
2018-07-05 15:29:30 UTC
PacBioを使用して(2倍体、脊索動物、高度に異質な)ゲノムを生成し、系統固有の重複(基本的にはパラログ)が含まれているかどうかを確認したいと思いました。ゲノムはまだEnsemblにありません。
現時点で入手できるデータは次のとおりです。
- ゲノム
- トランスクリプトアノテーション
- RNAseq
論文からいくつかの方法を見つけました:
- Blastを使用
- SDDdetectorを使用して完全なゲノムのセグメント重複を検出します
- NGSデータに基づいて推定上の最近の分節重複または2倍体ホモ接合生物を検出する DuplicationDetector
- (私はこれを思いついたばかりですが、機能するはずです)読み取りをアセンブリにマップバックします。&は読み取り深度を分析して重複部分を検出します
喜んでアドバイスを提供します。
脊索動物...非常にヘテロ接合...私は尾索動物を感じますか?
いいえ、ナメクジウオ;)
分類群の近くに他のゲノムまたはトランスクリプトームがある場合は、ホモログをクラスター化し、ホモロググループから遺伝子ツリーを推測して重複を検出しようとする場合があります。
@NatWHに感謝します。はい私はゲノム/トランスクリプトームを持っています(統計は私たちのアセンブリよりも良くありませんが、ひどい問題ではないはずです)