正規のkmer、つまりシーケンスの順方向と逆方向の両方の補数が同一として扱われるkmerをカウントする場合、kmerカウントプログラムはどのkmerを正規シーケンスとして使用するかをどのように決定しますか?それらはすべて同じように機能しますか?
調査するために、16個の可能な2merすべてを含む GAGTGCGGAATACCACTCTT
で文字列を作成しました。次に、 kmcを使用して、どのkmerが使用されているかをどのように決定するかを理解しました。以下の filtered
列のkmersのみが表示されました。したがって、KMCの「正規の」kmerはアルファベット順に最初に発生するもののように見えます。
╔================╦=== ==╦====================╦==========╗║可能なKmers║RCs║RCはより早く発生しますか? ║フィルタリングされた║╠================╬=====╬====================╬== ========╣║TT║AA║YES║TA║║TG║CA║YES║GC║║TC║GA║YES║GA║║TA║TA║ ║CC║║GG║CC║YES║CA║║GC║GC║║AT║║GA║TC║║AG║║CT║AG║CG║ ║║║CA║TG║║║║AT║AT║║║║AG║CT║║║║AC║GT║║║= = A║GT║║║= = A ====╩=====╩============ ========╩==========╝
すべてのkmerカウントプログラムで同じ正規のkmerを使用していますか?使用している場合は、説明するドキュメントがありますかこの? クラゲ
または kmc
の論文で何も見つかりませんでした。