Herkül: Makine Öğrenmesi ile Uzun Okuma Hata Düzeltme Algoritması

Sunan Kişi

Ercüment Çiçek

I am, an assistant professor at the computer engineering department of bilkent university. I am an adj. Faculty member at the computational biology department of school of computer science, carnegie mellon university. I was a lane fellow in computational biology at carnegie mellon university. My advisors were kathryn roeder and ziv bar-joseph. I got my ph.d. in computer science from case western reserve university in 2013. My advisor was gultekin ozsoyoglu.

Özet:

Yeni Nesil Dizileme teknolojileri bir çok değişkende birbirleri arasında farklılık göstermektedir. Kısa parçalı dizileme ya da uzun parçalı dizileme teknolojileri arasında yapılacak bir seçim ise parçaların doğruluk oranı ya da uzunlukları arasında bir tercih gerektirir. Bu çalışmada özgün bir algoritma olan Hercules’i geliştirdik. Hercules, uzun parçalardaki hataların düzeltilmesi için makine öğrenimi tekniğini kullanan ilk algoritmadır. Araştırmacılar genellikle uzun parçalardaki hataların düzeltilmesini kısa parçalar ile yapmaktadırlar. Çizge yapısı ve hizalama temelli güncel düzeltme yöntemleri, dizileme teknolojisinin hata profilini göz ardı etmektedirler. Hata profilini el alan, hafıza ve zaman konusunda elverişli makine öğrenimi teknikleri, hataları daha iyi düzeltme ve daha her iki teknolojiyi daha iyi birleştirme konusunda potansiyele sahiptirler. Sunduğumuz algoritma, her bir uzun parçayı, kullanılan teknolojinin hata profiline uygun bir profile Hidden Markov Model’i şeklinde tasarlamaktadır. Algoritmamız, geçiş ve emisyon olasılıklarını bütün uzun parçalar için öğrenip, değiştirerek uzun parçalardaki hataların düzeltilmesini sağlamaktadır. DNA diziliminden iki adet veri dizisi (CH17-157L1 ve CH17-227A2) ve RNA diziliminden bir adet veri dizisi (human brain cerebellum polyA) kullanarak, Hercules tarafından hataların giderildiği parçaların, diğer algoritmalar kullanılarak hataların düzeltilmesine kıyasla en yüksek haritalama oranına ve uzun parçaların büyük bölümü kısa parçalarla kaplandığı durumlarda en yüksek hatasızlık oranına sahip olduğunu gösterdik.

Tarih: 23 Mayıs 2019 – 17:00

Dil: Türkçe

Leave a Reply