Elif Bozlak, University of Veterinary Medicine Vienna; Vienna Graduate School of Population Genetics
Evrim Fer, University of Arizona
Özet
2020 BioHackathon’u, var olan varyant tespit etme iş akışlarının COVID-19 için geliştirilmesi veya üretilen büyük miktardaki verinin analiz edilebilmesi için yeni iş akışları oluşturulmasına ev sahipliği yapmıştır. Bunlardan bazıları Galaxy Project, INSaFLU ve nf-core’dur. Bu iş akışları yeni nesil dizileme teknolojisi ile dizilenen genom verisini analiz eder ve anotasyonu yapılmış tek nükleotid polimorfizm (SNP) ve kısa ekle-sil (indel) varyantlarını çıktı olarak verir. Kullandıkları algoritmalara göre farklı avantaj ve dezavantajları vardır. Bu çalışmada Galaxy Project tarafından yayımlanmış SARS-CoV-2 genom varyantlarını INSaFLU iş akışıyla belirlenen varyantlarla karşılaştırmayı, böylece bu iki iş akışının performanslarını değerlendirebilmeyi amaçladık. Sonuç olarak iki iş akışı tarafından ortak olarak bulunan 600’e yakın varyant bulduk. Bu varyantların neredeyse yarısının replikaz poliprotein 1ab’de olduğunu tespit ettik. Ortak olarak bulunan varyantlarda non-synonymous varyantların synonymous varyantlardan fazla olduğu gördük. Çalışmada tespit edilen ortak ve özgün varyantlar ileriki araştırmalarda daha detaylı incelenebilir.