Do we have Big Data in Life Sciences? – Nikolay Oskolkov

Sunan Kişi

Image result for nikolay oskolkov

Nikolay Oskolkov

I am a SciLifeLab bioinformatician from Lund University doing various types of analyses in Computational Biology. Originally from Theoretical Physics (PhD 2007), switched to Biological and Life Sciences 2012, worked in biomedical research now expanding towards evolutionary science and data science

Özet

Yaşam bilimlerinde Yeni Nesil Sekanslama (NGS) verilerinin büyümesi Hesaplamalı Biyoloji ve Biyoinformatik alanlarında yeni fırsatlar oluştırmakla beraber analiz bir dizi sorun oluşturmaktadır. Bu sorunlardan birisi, Makine Öğrenmesi ve Derin Öğrenme gibi büyük ölçekli verilere uygun gelişmiş metodların uygulanmasıdır. Bu webinarda Yapay Sinir Ağları uygulamalarından Tek Hücre Genomiği, Mikroskobik Görüntüleme ve Antik DNA gibi araştırma alanlarına genel bir bakış sunulacaktır.

Tarih: 17 Aralık 2019 – 16:00

Dil: İngilizce

Herkül: Makine Öğrenmesi ile Uzun Okuma Hata Düzeltme Algoritması

Sunan Kişi

Ercüment Çiçek

I am, an assistant professor at the computer engineering department of bilkent university. I am an adj. Faculty member at the computational biology department of school of computer science, carnegie mellon university. I was a lane fellow in computational biology at carnegie mellon university. My advisors were kathryn roeder and ziv bar-joseph. I got my ph.d. in computer science from case western reserve university in 2013. My advisor was gultekin ozsoyoglu.

Özet:

Yeni Nesil Dizileme teknolojileri bir çok değişkende birbirleri arasında farklılık göstermektedir. Kısa parçalı dizileme ya da uzun parçalı dizileme teknolojileri arasında yapılacak bir seçim ise parçaların doğruluk oranı ya da uzunlukları arasında bir tercih gerektirir. Bu çalışmada özgün bir algoritma olan Hercules’i geliştirdik. Hercules, uzun parçalardaki hataların düzeltilmesi için makine öğrenimi tekniğini kullanan ilk algoritmadır. Araştırmacılar genellikle uzun parçalardaki hataların düzeltilmesini kısa parçalar ile yapmaktadırlar. Çizge yapısı ve hizalama temelli güncel düzeltme yöntemleri, dizileme teknolojisinin hata profilini göz ardı etmektedirler. Hata profilini el alan, hafıza ve zaman konusunda elverişli makine öğrenimi teknikleri, hataları daha iyi düzeltme ve daha her iki teknolojiyi daha iyi birleştirme konusunda potansiyele sahiptirler. Sunduğumuz algoritma, her bir uzun parçayı, kullanılan teknolojinin hata profiline uygun bir profile Hidden Markov Model’i şeklinde tasarlamaktadır. Algoritmamız, geçiş ve emisyon olasılıklarını bütün uzun parçalar için öğrenip, değiştirerek uzun parçalardaki hataların düzeltilmesini sağlamaktadır. DNA diziliminden iki adet veri dizisi (CH17-157L1 ve CH17-227A2) ve RNA diziliminden bir adet veri dizisi (human brain cerebellum polyA) kullanarak, Hercules tarafından hataların giderildiği parçaların, diğer algoritmalar kullanılarak hataların düzeltilmesine kıyasla en yüksek haritalama oranına ve uzun parçaların büyük bölümü kısa parçalarla kaplandığı durumlarda en yüksek hatasızlık oranına sahip olduğunu gösterdik.

Tarih: 23 Mayıs 2019 – 17:00

Dil: Türkçe

RSG-Turkey is a member of The International Society for Computational Biology (ISCB) Student Council (SC) Regional Student Groups (RSG). We are a non-profit community composed of early career researchers interested in computational biology and bioinformatics.

Contact: turkey.rsg@gmail.com

Sosyal medyada bizi takip edin!