Kontenut tal-post
Yuqorida qanday qilib sekvens kompaniyadan ma'lumotni yuklab olishni aytgandim. Undan keyingi bosqich, sekvensni filtrlash, nima uchun filtrlash kerak? 1. Past sifatli sekvens; 2. Adapter kontaminatsiyasi. Odatda, Illumina short read sekvens assembly qilishdan oldin filtrlanadi, va bunda biz fastp dasturidan foydalanishimiz mumkin. Yuqorida filtrlash uchun human readable sodda *.pbs kodni yozdim. Fastp dasturining -i and -I funktsiyasi input ma'lumot uchun XX-1_1.fq.gz va XX-1_2.fq.gz uchun mos ravishda. Filterlangan sekvens -o va -O funtksiyalari kiritilgan holda yaratiladi. Bunda filterlangan sekvens original sekvens nomidan farq qilishi uchun odatda XX-1_1-clean.fq.gz, XX-1_2-clean.fq.gz deb yozishimiz mumkin, albatta bu sizni xohishingizga bog'liq. -w funktsiyasi esa bizni Linux serverimizda mavjud bo'sh CPU uchun. Fastp dasturi boshqa dasturlarga qaranganda ancha user-friendly. Filterdan oldingi va keyingi farqni .html va .json link orqali google tog'oda ko'rish mumkin. https://t.me/EvolutionaryGenomics