質問:
samtools、bamtools、picard、sambamba、biobambamの違いは何ですか?
medbe
2017-06-03 04:50:11 UTC
view on stackexchange narkive permalink

いくつかのグーグル検索の後、表示、マージ、パイルアップなどの機能が重複している複数のツールを見つけました。これらのツールを試す時間がないので、誰かがすでに答えを知っているかどうかを確認します:違いは何ですかそれら?パフォーマンス?特徴?または、他の何か?一般的にどちらが好ましいですか? Samtools?

この質問は、StackExchangeでは推奨されていないさまざまなツールのメリット(またはその他)についての意見の分かれる議論を引き起こす可能性があります。単一の質問、できれば人々の好みから離れようとする質問があれば、それは役に立ちます。
「他の何か」では、ドキュメントの品質を追加できます。これは、採用するツールを決定するときに重要な要素になる可能性があります。
1 回答:
#1
+15
gringer
2017-06-03 06:50:55 UTC
view on stackexchange narkive permalink

明らかな答えは、さまざまな人々がそれらを書いたということです。コンピュータサイエンスのバックグラウンドを持つ人々が既存のツールに不満を感じ、(既存のツールを改善するのではなく)独自の代替ツールを作成することは、バイオインフォマティクスではかなり一般的です。時間の経過とともに、同様の初期目的を持つツールに人気のある機能が実装され(最終的にはバグが修正される)、一般的な方法でどの特定のツールを使用するかはそれほど重要ではなくなります。

ツールの印象は次のとおりです。 :

  1. samtools-元々はHengLi(BWAも書いた)によって書かれました。現在samtoolsに取り組んでいる人々は、 SAM、BAM、およびCRAMのアライメントファイル形式の仕様も維持しているため、新しいファイル形式の機能は最初にsamtoolsに実装される可能性があります。

  2. bamtools-これは、SamtoolsツールキットをミラーリングするためにDerek Barnett、Erik Garrison、Gabor Marth、Michael Strombergによって作成されたようですが、Cの代わりにC ++を使用しています

  3. picard --BAM / SAMファイルを操作するためにBroadInstituteによって作成されたJavaツール。 Javaで記述されていると、他のオペレーティングシステムへの移植が容易になるため、Windowsシステムでの動作が向上する可能性があります。私はpicardがフィルタリングレベル(PCRの重複の削除など)や統計分析に使用されていることに慣れていますが、samtoolsのJava HTSライブラリとリンクしているため、おそらく多くの機能を共有しています。

  4. sambamba -Dプログラミング言語で記述されたGPL2ライセンスのツールキット(おそらくArtemTarasovとPjotr​​Prinsによる)。私はそれを使用していません(そしてそれを使用した人を知りません)が、githubページは「ほぼ5年間、samtoolsに対する主な利点は並列化されたBAM読み取りでした。ついに2017年3月にsamtools 1.4がリリースされ、同等に達しましたこれについて。」

  5. biobambam-ドイツのTischlerによってC ++で記述されています。私もこのツールキットの経験がありません。これにはマルチスレッド機能があるようですが、それ以外は他のツールキットと似ています。

  6. ol>
SAMtools(バージョン1.2)とsambamba(バージョン0.6.3)のソート速度の比較[ここ](https://www.basepairtech.com/blog/sorting-bam-files-samtools-vs-sambamba/)。
古いバージョンのSamtoolsがSambambaよりも遅いことを考えると、パイプライン全体のニーズも考慮する必要がある場合があります。たとえば、一部の古いソフトウェアでは、古いバージョンのSamtoolsを実行する必要があります。これにより、新しいSamtoolsから速度の利点を得ることが難しくなり、同じツールの異なるバージョンをサポートする代わりに、完全に異なるプログラムを使用することを選択することになります。パイプライン。


このQ&Aは英語から自動的に翻訳されました。オリジナルのコンテンツはstackexchangeで入手できます。これは、配布されているcc by-sa 3.0ライセンスに感謝します。
Loading...