"Bakmakla görmek, aşık olmakla sevmek arasındaki fark nedir diye sormuşlar Mevlana’ya..
Cevaplamış: Senin baktığına herkes bakıyor; ama ya görebildiğini herkes görebiliyor mu? Herkes aşık olabiliyor; ama herkes senin gibi sevebiliyor mu? Aralarındaki tek fark sensin… Seni özel kılan görebildiğini ve sevebildiğini bilmektir…"
Tablo 1: PAH (Phenylalanine-4-hydroxylase) proteini ile ilişkili genlerin Excel dosyasında görünümü
Ya Moleküler Biyologları özel kılan nedir? Görebildiğini ve sevebildiğini bilmek desem, bu Excel tablosunu sevebilir misiniz? Ki bu tablonun sayfalarca arttığını bildiğinizde yorumlayamadığınız datalarınızı nasıl seveceksiniz? Baktığınız dataları görmenizi sağlayan biyoinformatik tool'larını kullanmayı öğrenmek ve doğru bir görsel ortaya koyabilmek hem sizi özel kılacak hem de araştırmanızı daha verimli bir hale getirecektir. Bundan dolayıdır ki biyoinformatik bilimi farkı yaratan olmaya devam edecek.
Yukarıdaki Excel tablosunu görselleştirmeye adım adım başlayalım. Öncellikle araştırdığımız genin etkileşimlerini gösteren dataya ihtiyacımız var. Bu dataya ulaşmamızı sağlayan çokça database'ler mevcut. Bu aşamada tercih ettiğim String database'ini kullanalım.
Tablo 2: String database'nin ana sayfası
Yukarıda görüldüğü gibi bir gen ismi girelim ve "GO" yazan yere tıklayalım. Açılan sekmede
- "organism" başlığından istediğimiz organizmaya ait geni seçip (örn. Homo sapiens PAH (Phenylalanine-4-hydroxylase)),
- "continue" diyerek devam edelim.
Tablo 3: Protein-Protein etkileşimleri
Tablo 4: Protein-Protein etkileşimleri
Tablo 3'deki protein-protein etkileşimlerinin "more" başlığına tıklanıldığında arttığını göreceksiniz. Tablo 4'ün görüntüsü için 3 kez etkileşim arttırıldı. Siz de istediğiniz miktarda ağınızı arttırabilirsiniz.
Tablo 5: Info & Parameters
Ayrıca Tablo 5'deki ilk ok ile gösterilen "Active Prediction Methods" başlığındaki özelliklerden etkileşimini görmek istediklerinizi seçebilirsiniz. İkinci ok ile gösterilen "required confidence (score)" en yüksek, yüksek, orta ve düşük güvenirlilikte ağ oluşturabilirsiniz.
Tablo 6: Information
Ek olarak protein-protein etkileşim ağında istediğiniz genin üzerine tıklayarak o gen hakkında bilgi sahibi olabilir, protein yapısını görüntüleyebilirsiniz. Tablo 6 PAH proteininin bilgilerini göstermekte olup, kırmızı ok ile protein yapısını en yakın benzerlikte görüntüleyebilirsiniz. "save" başlığını tıklayarak etkileşimi kaydettiğinizde karşınıza yeni bir sekme açılacak. Bu sekmeden "Text Summary (TXT - simple tab delimited flatfile)" seçilerek data .txt formatında kaydederek bilgisayarınıza indirebilirsiniz. Proteini ise .png formatında açılan sekmeden indirebilirsiniz. Tablo 1'deki data bu yöntemle elde edildi.
String database'inden protein datasını indirdiğimize göre şimdi bu çıktıları Cytoscape' de görselleştirme aşamasına geçebiliriz. Eğer bilgisayarınızda Cytoscape programı yok ise 3.2.1 versiyonunu kendi işletim sisteminize uygun olanına göre indirmenizi öneririm çünkü bu versiyon üzerinden anlatmaya devam edeceğim. Eğer daha eski sürümleri var ise, anlatacağım özelliklerin yerlerini bulmak için biraz kurcalamanız gerekebilir fakat sonucunda birçoğunu bulacaksınızdır. Yine de ben size her durumda programın karşısına geçip tüm özellikleri defalarca denemenizi ve değişiklikleri gözlemlemenizi öneririm. Bilgi uygulandıkça daha kalıcı hale geliyor ne de olsa.
Tablo 7: Cytoscape_v3.2.1
Cytoscape'i çalıştırdıktan sonra karşımıza böyle bir program açılacak. Sırasıyla File -> Import -> Network -> File ve sonrasında String database'inden indirdiğimiz protein datasına ait .txt dosyasını seçin ve açın.
Tablo 8: Import Network From Table
Açtıktan sonra karşınıza çıkan Tablo 8'de;
- Kırmızı ok ile örneği gösterilen çarpı işareti tüm kolonlarda olduğunu göreceksiniz. Çarpı işaretinin üzerine tıklayarak ağ analizinde göstermek istediğiniz datayı yeşil ok ile gösterildiği gibi tik işareti haline dönüştürebilirsiniz. Siz çarpı işaretlerine tıkladıkça tıklanılan kolonun renklendiğini göreceksiniz. Bir üstünde gösterilen "Interaction Definition" başlığı altında istediğiniz özelliği istediğiniz kolona atayabilirsiniz. Kolonları tanımladıktan sonra "ok" dediğinizde Tablo 7'de görülen mavi kısımda ağ analizi görüntülenecektir.
Mavi kısmın solunda kalan beyaz alanda ise Network, Style, Select başlıklarında "Style" seçilerek protein-fonksiyon etkileşimlerini istediğiniz şıklıkta görüntüleyebilirsiniz. Protein node'larının şekli, rengi, font ve şekil büyüklüğü gibi ayrıca edge'lerinde şekil, renk, hedef genlerin okla gösterilmesi gibi birçok özelliği uygulayabilirsiniz. Tablo 9'da Node özellikleri görülmektedir. Hemen yanında olan Edge'e basıldığında edge üzerinde yapabileceğiniz özellikleri görüntüleyebilirsiniz.
Tablo 9: Style
Özellikler tablosunda karşınıza çıkabilecek bazı terimleri açıklamak istiyorum. Mapping Type içinde Passthrough, Discrete, Continuous Mapper yer almakta.
- Passthrough Mapper: Network'ün bu değeri tipik olarak node/edge isimlerini belirtmek için kullanılır. Örnek verecek olursak, passthrough mapper ile tüm node'ların yaygın gen isimlerini etiketleyebilirsiniz.
- Discrete Mapper: Discrete datasının sembolleri görselleştirme sembolleri ile eşleştirilmiştir. Örnek verecek olursak, discrete mapper ile moleküllerin farklı tipleri farklı şekil ve renkler ile node'lar görselleştirilebilir.
- Continuous Mapper: Continuous data görsel semboller ile eşleştirilmiştir.
Tablo 10: Shape
Tablo 10'da node şeklini değiştirmek istediğinizde Mapping Type'ın Discrete Mapping olarak seçildiği durum gösterilmekte. Bu şekilde istediğiniz genin üzerine tıklayarak istediğiniz şekilde görünmesini sağlayabilirsiniz. Burada ben sadece PAH geninin şeklini "diamond" olarak değiştirmeyi tercih ettim. Örnek olarak verilen Shape özelliğindeki gibi diğerlerini de bu şekilde uygulayabilirsiniz. Görselleştirme tamamen sizin ihtiyacınıza göre oluşturulabilir. Belirtmek istediğinize, zevkinize, isteğinize göre.
Ağ analizlerinizi Layout seçenekleriyle de güzelleştirebilir, etkileşimi en iyi şekilde göstereni tercih edebilirsiniz. Kendi adıma söylemeliyim ki her bir layout seçeneğini bu network üzerinde uyguladım ama tablolarım yeterince olduğundan dolayı sizler için bir tanesini ekleyeceğim.
Tablo 11: Layout options
Tablo 11'de Circular Layout gösterilmektedir.
Tablo 12: Cytoscape ile ağ analizi
Sonuç olarak anlaşılması adına oldukça küçük bir network üzerinden çalıştık. Protein-protein etkileşimleri ile birçok hastalık üzerinde araştırmalar yapılmaktadır. Bir genin başka bir gen ile etkileşimi, gen aktivasyonu veya genin baskılanması ile birçok hastalık meydana geldiği bilinmektedir. Daha büyük network'ler ile etkileşim bir Excel dosyasıyla kıyaslandığında daha net görülmekte ve gen üzerinde çalışmalar daha verimli olmaktadır. Pathway analizleri bu yüzden kıymetlidir. Fakat daha da önemli olan bu analizleri doğru bir şekilde yorumlamaktır.
Mevlana'nın sözünü tekrar ederek bitiriyorum. "Seni özel kılan görebildiğini ve sevebildiğini bilmektir…" Daha net, daha güzel, daha kolay bakmanızı sağlayan bu biyoinformatik tool'larıyla görebildiğiniz nice bilinmeyenlerin bilindiği zamanlarda buluşmak üzere...
Bihter
Hiç yorum yok:
Yorum Gönder