send link to app

ShortReadManager


Education
Free

次世代シーケンサーでデータを取得すると、たくさんのリードが手に入ります。でもリードには一定の割合でエラーが含まれているので、注意が必要です。あるゲノム配列を例えば100xのカバレージで読んだ時に、1回しかでてこない31-merは、きっと何か偶発的な理由で、生じたものだとみなすことができます。偶発的な理由とは、例えばシーケンサーの読み取りエラーです。他にも、ゲノム配列とアダプター配列のジャンクション部分も、偶発的に生じ、出現頻度は低くなります。
リード中の底頻度部分を切りとばすと、その後の処理が楽になります。