Yazının ilk bölümünü BiyoEnformatik Nedir? – 1 başlığı altında okuyabilirsiniz.
Biyoinformatik çalışmalar moleküler biyolojinin ana paradigması üzerine temellendirilmiştir :
Genetik enformasyon : DNA -> protein
DNA _ nükleotidler : G,A,T,C 4 harfli alfabe -> üçlü kodonlar -> genler -> protein
Protein _ amino asitler: gly, glu,ala, vs. 20 harflik alfabe
Protein molekülleri özgün üç boyutlu bir yapı oluşturacak biçimde katlanma vafına sahiptir. Böylelikle enzimatik kataliz, yapısal destek, hareket jenerasyonu, hücreler arası sinyal iletişimi, ışık, basınç vb. kuvvetleri kimyasal sinyallere dönüştürmek gibi biyolojik aktivitelerin gerçekleştirilmesini sağlar. Proten aktiviteleri hücre içinde yaşamsal birimler oluşturulmasının temelidir. Tek ya da çok hücreli bu organizmalar yaşam ortamlarıyla etkileşime geçerek beslenir ve ürerler. Zaman içinde değişen çevresel faktörlerin yarattığı baskı, kısıtlı yaşamsal kaynaklardan daha iyi faydalanmak adına mevcut proteinlerin geliştirilmesini gerektirir. Yaşamsal faaaliyetlerin sürdürülmesini kolaylaştıran bu değişiklikler ise avantajlı olmalarından dolayı kalıtsal (DNA) değişikliklere yol açar.
Kimi zaman kompütasyonal biyoloji, biyoinformatik ile eş anlamlı olarak kullanılsa da, halihazırda biyoinformatik daha çok moleküler biyolojiye odaklıdır. Zaman içinde bu ayrımın ortadan kalkması ise kaçınılmazdır çünkü artık tüm biyolojik faaliyetlerin “moleküler” bir temeli olduğu bilinmektedir.
Bugün biyoinformatik alanında yapılan çalışmalar sadece yaygın kullanım bulan veritabanları ve algoritmalar geliştirilmesiyle sınırlı kalmamış, kısa denebilecek bir sürede hem bu alandaki araştırmalara hem de alansal eğitime yön veren bazı temel prensiplerin de ortaya çıkmasına yol açmıştır. Bu prensipleri genel olarak özetlemek gerekirse :
- Mutasyon, delesyon, insersiyon gibi evrimsel değişikler hep gerçekleşse de protein moleküllerin yapısı neredeyse değişmez biçimde korunur.Amino asit dizinleri çok farklı olsa da (ikili dizilimde 10% dan az amino asit eşleşmesi) yapısal benzerlik gösteren pek çok makro molekül bulunsa da, dizilim benzerliği taşımasına rağmen yapısal benzerlik göstermeyen iki molekül neredeyse yoktur.
- Dinamik programlama temelli algoritmalar , biyolojik dizilimlerde en optimal sonuçları vermektedir. Matematiksel optimizasyon iki dizin arasında yüksek benzerlik durumunda (>30% özdeş) daha güvenilirdir.
- Moleküller arası fiziksel etkileşimler, enerji denklemleri ile tanımlanabilir. Atomlar arasındaki temel fiziksel çekim ve itme kuvvetlerini göz önünde bulunduran metodlar sayesinde, sadece temel enerji denklemleri ile moleküllerin dinamik hareketlerinin modellenmesi mümkündür.
- Proteinlerin biyolojik fonksiyonlarının pek çoğu , amino asit dizini içinde rastlanan lineer parçalar (dizin motifleri) üzerinde kodludur. Toplam dizin analizinde büyük farklılıklar gösterse de benzer fonksiyonlara sahip tüm proteinlerde aynı “motifi” bulmak mümkündür. Diğer fonksiyonlar biyofiziksel ve biyokimyasal özelliklere bağlı olarak oluşturulan üç boyutlu düzenlemeler (3-Dimensional structure) ile sağlanır. Bu yapılanma, farklı dizilimde moleküllerin nasıl benzer aktif mikroortamlar yaratabildiğini gösterir.
- Dizin modellemede probabilistik yaklaşımlar (örneğin Hidden Markov Models), birbiriyle ilişikli dizinlerin sınıflandırılmasında ve bu sınıfların yeni üyelerinin belirlenmesinde çok etkindir.
- Üç boyutlu biyolojik yapıların diziliminde geometrik algoritmaların kullanılması etkin sonuç vermektedir.Bu metodda atomlar arasındaki mesafelerin yanı sıra , incelenen molekülün bilinen fonksiyonu da atomsal iletişimin tarifi için gözönünde bulundurulmaktadır.
- Biyolojik makromoleküllerin üç boyutlu yapısı belirlenirken, gerekli bilginin bir bölümü 70% doğruluk oranı ile sadece lokal dizinden ( 20 aminoasitlik süregelen sıralanmalar) elde edilebilir. Üç boyutlu yapının bütünüyle ortaya konabilmesi için gerekli bilgi dizin içinde mevcut olmakla birlikte molekül içinde uzun mesafeli etkileşimler göz önünde bulundurulmalıdır.
- Yeni bir dizinin, bilinen bir yapıyı alabilme ihtimalinin araştırılması, hangi yapıyı aldığının araştırmaktan daha kolaydır.
Bu dizin, bilinen bu yapıyı alabilir mi?
Bu dizin hangi yapıyı alır? - Konak ve patojen DNA bilgilerindeki varyasonlar ve varyasyon korrelansı, bir hastlıkta hangi proteinlerin rol aldığının ve nasıl bir etkileşime geçtiklerinin belirlenmesinde kullanılabilir.
Geliştirilen ve artık rutin olarak kullanılan algoritmalar ve veritabanlarının yanısıra, mevcut biyoinformatik araçlarının da daha iyi anlaşılabilmesi için bir senaryo düşünelim:
Doktora giden hastamız kendisine bir tür genetik diabet tanısı konduğunu belirtir. Bunun hangi sendrom olduğuna emin olamayan uzman hekim, internete (WWW) girerek diabetle ilintili genetik sendromları araştırmaya karar verir.
- Doktorumuz NCBI (Amerikan Ulusal Biyoteknoloji Enformasyon Merkezi) sitesine girerek bu sendromu araştırabilir. NCBI bünyesinde, biyoloji ve moleküler tıp odaklı birkaç veri tabanı mevcut. http://www.ncbi.nlm.nih.gov
- OMIM (Online Mendelian Inheritance of Man) kaynağında bilinen tüm insan genetik bozukluklarını içeren bilgi, literatürde konuyla ilgili yer almış yayınlara ve bu hastalıkla ilişikli görünen tüm bilinen genleri içeren veritabanlarına otomatik link verecek biçimde yer alıyor. Diabetes kelimesi kullanılarak yapılan bir arama sonucu Diabetes Mellitus, Otozomal Dominant, Tip II bilgisine ulaşmak mümkün. Ayrıca bozukluğun temelinde glukokinaz proteinini kodlayan genin regulasyonunda bir aksama olduğu belirtiliyor ve glukokinaz proteinin dizilimini içeren veritabanlarına da otomatik link veriyor.
- Protein dizini veritabanında “glukokinaz” kelimesi kullanılarak yapılan aramada, insan glukokinaz geni, değişik fizyolojik koşullarda yaratılmış versiyonları ile birlikte bulunuyor. Aynı zamanda DNA dizilimi, protein dizilimi ve ilgili referans linkleri mevcut.
- MEDLINE literatür veritabanı için sunulan link kullanılarak, bu gendeki bir değişikliğin, diabet hastalığı ile ilişkisinin ortaya çıkarıldığı orijinal yayın bulunabiliyor.
- Protein dizini veritabanı kullanılarak, bu genin kodladığı amino aist dizini bulunabiliyor. Bu dizin üzerinden algoritma kullanılarak yapılan protein veritabanları araştırmasında (SWISS_PROT, PIR), tüm ilintili dizinleri bulmak mümkün. Bunun yanısıra, fonksiyon tanımlayan dizin motifleri için oluşturulmuş bilgi bankası kullanılarak bu motiflerin glukokinaz enzimi yapısında bulunup bulunmadığı da araştırılabilir. Bunun sonucunda bu enzimin glukoz ve ATP gibi küçük moleküllere bağlandığı görülür.
- Genetik veri bankası GENBANK kullanılarak protein dizini üzerinden geni kodlayan DNA dizini detaylı olarak elde edilebilir. GENBANK kayıtları bu genin belli bir bölgesinde, gen regulasyonunda değişikliklre yol açan bir DNA insersiyonuna rastlandığı bilgisini de içeriyor.
- Protein dizini girdisi aynı zamanda Protein Veri Bankası üzerinden üç boyutlu protein yapısı veritabanına da bağlanıyor. Bu girdi, glukokinaz proteini yapısında yer alan tüm atomların x-ray kristalografisi ile belirlenmiş koordinatlarını içeriyor. Aynı zamanda belirleyici yapısal özelliklerin resimlendirilmiş bir özeti de mevcut. Yapısal benzerlik ölçümleri yolu ile, benzerlik gösteren başka organizma kökenli proteinlere de link veriliyor. Ayrıca kilit yapısal lokasyonların belirlenmesini sağlayan algoritmalar da mevcut. Böylelikle glukoz ya da ATP bağlanma noktalarını tam olarak belirlemek mümkün.
Bu noktada doktorumuz birkaç mevcut veritabanından yararlanarak hastalık hakkında bilgi toplamakla kalmadığı gibi, aynı zamanda bu hastalıkla ilintili moleküler mekanizmaları da belirlemiş oluyor.Rutin olarak mevcut olmasa da daha sonra doktorumuz başka araçlardan yararlanarak
- DNA analizi testi yaptırarak tanıyı doğrular
- Hastalığın semptomları ve diagnostik genetik testlerin sonuçlarından yola çıkarak uygun bir tedavi formüle eder
- Hastası ile olası uzun vade sonuçları (eğer herhangi bir tedavi uygulanmazsa ne olabileceği, kalıtsal bir hastalık olması sebebi ile doğacak çocuklara aktarım ihitimali, vs.) paylaşır ve yol gösterir.
- Eğer böyle bir çalışma mevcut ise, hastasını bu sendromun genetik temellerinin daha iyi anlaşılması için süregelen bir kilnik deneye dahil olmak üzere davet edebilir.
Bu örneklerden de çıkarılabileceği gibi, biyoinformatik alanında yönlendirici bir takım temel “prensipler” ortaya konmuştur.
Ne gerekiyor?
Hastaların özgün genetik yapılarına uygun genetik tedavi yöntemleri geliştirilmesi ve uygulanması için biyoinfirmatik araçların, öncelikle hasta bakımı ile ilgilenen kilinik bilişimle daha entegre olması gerekmekte.
- Moleküler bilginin, populasyonlara simülasyonu : hastalık süreçlerini ve ilinitli moleküler oyuncuları anlamak için kapsamlı fizyolojik modeller
- Biyomedikal verilerin, klinik genomik uygulamalar için etkin biçimde işlenmesi : yeni biyolojik ve tıbbı araştırma sonuçlarının etkin organizsyonu ve birbiriyle ilintilendirilmesi bilgi ve veri tabanları oluşturmada yeni paradigmalar gerektirmekte
- Veri kirliliği çağında biyomedikal araştırmalara gelişkin destek : hem klinik hem de temel bilimci araştırmacıların yüksek miktarda veri analizlerini daha hızlı ve etkin kılacak uygulamalar geliştirilmeli