Genomik Data Science giriş ve Transkripsiyon faktörü üzerine bir örnek

Original article was published on Deep Learning on Medium

Genomik Data Science ve Transkripsiyon Faktörü

Her canlı organizmanın kalbinde genomu vardır. Hücre bir bilgisayarsa, genom dizisi yürüttüğü yazılımdır. DNA’yı hücre tarafından işletilen bir yazılım olarak düşünürsek benzer mantıkla nasıl çalıştığını analiz etmek için kendi bilgisayarlarımızı da kullanabiliriz. DNA sadece bilgi deposu değildir, karmaşık şekilde davranabilen fiziksel bir yapıdır. Genomlar binlerce parçadan oluşan inanılmaz kompleks makinelerdir. Günümüzde bazı genlerin nasıl çalıştığını biliyorsak da birçok genin birlikte nasıl çalıştığı anlaşılamamıştır.

-Genetik DNA’yı sadece bilgi olarak görür, bilgideki paternleri arar, genler ve fiziksel görünüş arasındaki bağıntıları araştırır.

-Genomik ise genomu bir makine olarak görür ve parçalarının birlikte nasıl çalıştığını anlamaya çalışır.

Genomik Data Science

Genomik Data Science kısaca veri biliminde bulunan istatistik,makine öğrenmesi gibi metodların genomik problemlere uygulanmasıdır.

Next generation sequencing sayesinde genomları daha hızlı,ucuz ve başarılı dizileyebilmekteyiz. Örneğin İnsan Genom Projesi 2.7 milyar(geçmişte) dolara gerçekleştirildi günümüzde ise 1000 dolara genomunuzu sekanslayabilirsiniz. Bu nedenle internet üzerinde Petabayt’larca genomik data bulunabilir.

Yaşan bir organizma insanların bu güne kadar ürettiği bütün makinelerden daha karmaşıktır.Bu karmaşıklığı çözmek klasik algoritmaların veya insanın anlama kapasitesinin üzerindedir. Çoğu genetik hastalık ve kanser birden fazla genin etkileşimiyle ortaya çıkmaktadır ve genetik varyasyon bulundurmaktadırlar.

İnanılmaz derecede karmaşıklığa ve veri noktasına sahip datayı analiz etmek için en güçlü silahlardan biri Derin Öğrenmedir, klasik yöntemler genler arasında doğrusal ilişki olduğunu varsayar ki böyle değildir.

Genomik Data Science ile kişiselleştirilmiş ilaç çalışmaları hızlandırılabilir veya canınız sıkıldıysa yere sigara yada sakız atmış insanları tespit etmek için genomlarından yüzlerinin 3 boyutlu versiyonunu oluşturabilirsiniz.

Yaşam ve DNA

Bakteriden balinaya hayat benzer prensiplerle çalışır.Bütün canlılar birbirine yaşam ağacında bağlıdır ve büyük ihtimalle tek bir ortak atadan gelmektedirler.

DNA 4 temel (A,T,G,C) bazın tekrarından oluşan uzun bir polimerdir.Organizmanın nasıl inşa edileceğine dair neredeyse bütün bilgi burada saklanır.

Bu bilginin kendisi ve nasıl işleneceği(epigenetik) zaman içinde değişir, evrimleşir. DNA sonsuza yakın kombinasyonda bilgi taşıyabilir hiç doğmamış insanların veya hiç oluşmamış, hayal gücünüzün sınırlarını zorlayan yeni tür canlıların da kodu burada keşfedilmeyi beklemektedir.

Temel işleyiş

Santral Dogma

DNA yazılımsa proteinler en önemli donanımdır.Proteinler hücre içerisindeki işlerin çoğunu yapan küçük makinelerdir. DNA’daki bilgi ile proteinlere çevirirken mRNA adlı moleküle ihtiyaç duyulur. mRNA Ribozom’a gider ve içerdiği bilgiye göre amino asitler birleştirilerek protein sentezlenir. Ribozomlar organik 3 boyutlu yazıcıdırlar.

DNA-RNA-PROTEİN sentezi

DNA’dan proteine tek yönlü bilgi akışı vardır ve basit bir şekilde çalışmaktadır. Bu fikir ne kadar zarif gözükse de günümüzdeki bilgilerimize göre eksik kalmaktadır.

Dogmanın yıkılışı ve karmaşıklık

Şimdi de genomların gerçekten nasıl çalıştığını inceleyelim.

  • Ökaryot’ların DNA’sı hücre içine sığabilmesi için histon denen proteinlerin etrafına sarılmıştır, sıkıca paketlenen kısımlar okunamazlar ve metilasyona uğramış kısımların okunması zorlaşır. DNA’nın nezaman açılması gerektiğini düzenleyen mekanizmalar tam anlaşılmamıştır.
  • DNA’dan proteine tek yönlü bir bilgi akışı yoktur,proteinler de DNA’ya bağlanarak düzenleyici görev alabilirler.
  • mRNA hangi proteinin sentezleneceği bilgisini taşır fakat ne zaman sentezlenmesi gerektiğini bilemez.
  • Burada Transkripsiyon faktörler devreye girer,Transkripsiyon faktörler DNA’da özel noktalara bağlanırlar ve yakınında bulunan genlerin ekspresyonunu düzenlerler.
  • Aynı genetik bilgiyi taşıyan deri ve sinir hücresinin farklı olmalarını gen ekspresyonlarının düzenlenmesine borçludurlar.

Düzenleme görevine miRNA, siRNA, Riboswitch’lerde katılabilir.

DNA replikasyonu hücreler kaosun sınırında çalışan makinelerdir

NOT : Genom’daki bütün düzenleme mekanizmaları anlaşılmamış olup işleyiş burada anlatılandan daha karışıktır.