Mining
for
Genotype-Phenotype
relations
Saccharomyces using Partial Least Square
in
Pendahuluan
Pesatnya perkembangan data genom menyebabkan kebutuhan akan suatu metode baru
dan perkembangan dari metode sebelumnya meningkat. Metode ini digunakan untuk
mengeksplorasi asosiasi antara Genotif dan Fenotif dari suatu organisme. Kompleksitas dari
interaksi jaringan seluler suatu organisme membuat polymorphisme-nya berasosiasi lemah
dengan variasi sifat-sifat umumnya. Namun, asosiasi Genotif-Fenotif masih dapat dilihat
melalui co-occurrence dari multi gen dan multi fenotif pada suatu individu melalui metode
statistik dan filogenetik.
Salah satu organisme yang banyak digunakan untuk penelitian adalah ragi
Saccharomyces cerevisiae. Hal ini dikarenakan, ragi dalam beberapa penelitian berhasil
menjembatani jarak antara genotif dan fenotif. Beberapa metode pendekatan yang dilakukan
untuk meneliti ini antara lain berbasis pada linkage analysis, population genetic analysis,
correlation analysis, gene knockout genetic interaction networks, dan probabilistic model.
Namun, pendekatan-pendekatan tersebut sangat terbatas, karena tidak melihat hubungan
multivariat antara Genotif dan Fenotif. Serta, tidak memberikan secara serentak efek yang
ditimbulkan lebih dari satu gen pada lebih dari satu fenotif.
Metode
Data
Data yang digunakan dalam penelitian ini terdiri atas data sekuens genom dan data
Fenotif. Data sekuens genom diperoleh dari Saccharomyces Genome Resequencing Project
(SGRP) yang dapat diakses pada Sanger http://www.sanger.ac.uk/Teams/Team118/
sgrp/. Data genom lain yang digunakan adalah reference ragi jenis S288C. Total sebanyak
5791 gen digunakan dalam penelitian ini.
Data Fenotif diperoleh melalui budidaya mikro dari populasi ragi selama paparan 10
perlakuan berbeda, mewakili keragaman alami dan variasi lingkungan buatan. Sepuluh
lingkungan ini dipilih karena sesuai dengan lingkungan ekologi Ragi dan data rasio
pertumbuhan serta efisiensi pertumbuhan diperoleh dari pertumbuhan ragi di lingkungan ini.
Nilai fenotif yang hilang dihitung menggunakan K-nearest neighbor untuk pola fenotif
keseluruhan. Sehingga diperoleh, v = 20 ukuran fenotif yang berbeda untuk n = 36 genom.
Hubungan Genotif-Fenotif
Matrix X dengan n x p dibuat dengan n = 36 baris dan p = 5791 kolom. Baris
menyatakan banyaknya fenotif dan kolom menyatakan genom reference. Pada dasarnya,
konsep ini ingin mencari kombinasi dari kolom X yang mampu menjelaskan variasi dalam
setiap y.
Integrasi Fitur Genotif Eksternal
Ontologi gen dari genom S288C di peroleh dari GO Slim Mapper
http://www.yeastgenome.org/cgi-bin/GO/goSlimMapper.pl yang mana memberikan informasi
fungsi terstruktur mengenai asosiasi Genotif-Fenotif. Ontologi gen ini berbentuk 3 anotasi
fungsi yang berbeda : proses biologi utama dalam gen yang terlibat (45 kategori); aktifitas
molekul/biokimia (25 kategori); dan komponen seluler dengan protein sesuai (25 kategori).
Sebuah gen tunggal mungkin dipetakan ke dalam beberapa istilah Ontologi gen. Selanjutnya
dilakukan intrepetasi dari asosiasi Genotif-Fenotif.
Kesimpulan
Pendekatan multivariat berbasiskan BLAST dan PLS memberikan hasil yang sesuai
dengan filogeni ragi yang diketahui. Sehingga disimpulkan pendekatan ini sangat layak
digunakan untuk analisa asosiasi Genotif-Fenotif. Namun, penelitian lanjutan perlu dilakukan
untuk meningkatkan perhitungan sinyal Genotif dan prosedur seleksi variabel dalam bingkai
kerja PLS.