Anda di halaman 1dari 3

Review

Mining
for
Genotype-Phenotype
relations
Saccharomyces using Partial Least Square

in

Muhammad Syahid Pebriadi


G651140511
Abstrak
Perkembangan data Genom begitu pesat sehingga memunculkan banyaknya penelitian
mengenai data ini. Penelitian menggunakan data Genom dilakukan untuk melihat asosiasi
Genotif dan Fenotif dari suatu organisme. Pendekatan yang sering digunakan untuk
penelitian ini bersifat univariat yang masih banyak batasan. Oleh karena itu dilakukan
pendekatan multivariat yang memberikan keuntungan lebih dibandingkan dengan
pendekatan univariat. Pada penelitian ini diusulkan suatu metodologi berbasis BLAST untuk
ekstraksi informasi dari sekuens Genom dan Soft Thresholding Partial Least Square (STPLS) untuk pemetaan asosiasi Genoti-Fenotif. Penerapan dari metodologi ini menunjukkan
kurang dari 1% dari 5791 gen set reference dapat menjelaskan variasi Fenotif. Gen yang
mempengaruhi fenotif ini berkembang 20% lebih cepat daripada yang tidak mempengaruhi
dan terdistribusi tidak merata atas fungsi seluler. Sehingga dari hasil ini dapat disimpulkan
bahwa BLAST dan PLS berbasis pendekatan multivariat dapat digunakan untuk menganalisa
asosiasi Genotif dan Fenotif dari suatu organisme. Namun, penelitian lanjutan perlu
dilakukan untuk meningkatkan penghitungan sinyal Genotif dan prosedur seleksi variabel
dalam PLS.
Kata Kunci : Data Genom, Multivariat, ST-PLS

Pendahuluan
Pesatnya perkembangan data genom menyebabkan kebutuhan akan suatu metode baru
dan perkembangan dari metode sebelumnya meningkat. Metode ini digunakan untuk
mengeksplorasi asosiasi antara Genotif dan Fenotif dari suatu organisme. Kompleksitas dari
interaksi jaringan seluler suatu organisme membuat polymorphisme-nya berasosiasi lemah
dengan variasi sifat-sifat umumnya. Namun, asosiasi Genotif-Fenotif masih dapat dilihat
melalui co-occurrence dari multi gen dan multi fenotif pada suatu individu melalui metode
statistik dan filogenetik.
Salah satu organisme yang banyak digunakan untuk penelitian adalah ragi
Saccharomyces cerevisiae. Hal ini dikarenakan, ragi dalam beberapa penelitian berhasil
menjembatani jarak antara genotif dan fenotif. Beberapa metode pendekatan yang dilakukan
untuk meneliti ini antara lain berbasis pada linkage analysis, population genetic analysis,
correlation analysis, gene knockout genetic interaction networks, dan probabilistic model.
Namun, pendekatan-pendekatan tersebut sangat terbatas, karena tidak melihat hubungan
multivariat antara Genotif dan Fenotif. Serta, tidak memberikan secara serentak efek yang
ditimbulkan lebih dari satu gen pada lebih dari satu fenotif.

Pendekatan multivariat diharapkan memberikan keuntungan dibandingkan dengan


analisa univariat. Misalnya, meningkatkan sensitifitas untuk mengidentifikasi efek genetik
yang penting dan mendeteksi kontribusi dari variasi genetik. Pendekatan ini dilakukan
sebagai berikut : 1) Menghitung fitur dari sekuens genom dengan memberikan tingkat
kemiripan pada suatu kumpulan sekuens reference, 2) Membandingkan setiap genom dengan
genom reference menggunakan pair-wise alignment. 3) Mendapatkan normalisasi skor setiap
reference yang menunjukkan penambahan apa saja yang ditemukan dalam genom tersebut.
Penghitungan fitur menggunakan metode Partial Least Square (PLS). Pada dasarnya,
PLS mengidentifikasi sub-ruang relevan dalam ruang Genotif yang menjelaskan maksimum
variansi dalam ruang Fenotif. Namun, PLS dalam bentuk aslinya tidak menyertakan
implementasi seleksi fitur. Oleh karena itu, metode ini digabungkan dengan tahapan Soft
Thresholding menjadi algoritma ST-PLS yang mana dapat melakukan pencocokkan model
dan seleksi fitur sekaligus. Pada penelitian ini, dicontohkan penerapan ST-PLS yang
digunakan pada saat dalam penyatuan ruang Genotif berdimensi tinggi dan ruang fenotif
untuk mengungkap asosiasi untuk penelitian selanjutnya.

Metode
Data
Data yang digunakan dalam penelitian ini terdiri atas data sekuens genom dan data
Fenotif. Data sekuens genom diperoleh dari Saccharomyces Genome Resequencing Project
(SGRP) yang dapat diakses pada Sanger http://www.sanger.ac.uk/Teams/Team118/
sgrp/. Data genom lain yang digunakan adalah reference ragi jenis S288C. Total sebanyak
5791 gen digunakan dalam penelitian ini.
Data Fenotif diperoleh melalui budidaya mikro dari populasi ragi selama paparan 10
perlakuan berbeda, mewakili keragaman alami dan variasi lingkungan buatan. Sepuluh
lingkungan ini dipilih karena sesuai dengan lingkungan ekologi Ragi dan data rasio
pertumbuhan serta efisiensi pertumbuhan diperoleh dari pertumbuhan ragi di lingkungan ini.
Nilai fenotif yang hilang dihitung menggunakan K-nearest neighbor untuk pola fenotif
keseluruhan. Sehingga diperoleh, v = 20 ukuran fenotif yang berbeda untuk n = 36 genom.
Hubungan Genotif-Fenotif
Matrix X dengan n x p dibuat dengan n = 36 baris dan p = 5791 kolom. Baris
menyatakan banyaknya fenotif dan kolom menyatakan genom reference. Pada dasarnya,
konsep ini ingin mencari kombinasi dari kolom X yang mampu menjelaskan variasi dalam
setiap y.
Integrasi Fitur Genotif Eksternal
Ontologi gen dari genom S288C di peroleh dari GO Slim Mapper
http://www.yeastgenome.org/cgi-bin/GO/goSlimMapper.pl yang mana memberikan informasi
fungsi terstruktur mengenai asosiasi Genotif-Fenotif. Ontologi gen ini berbentuk 3 anotasi
fungsi yang berbeda : proses biologi utama dalam gen yang terlibat (45 kategori); aktifitas
molekul/biokimia (25 kategori); dan komponen seluler dengan protein sesuai (25 kategori).
Sebuah gen tunggal mungkin dipetakan ke dalam beberapa istilah Ontologi gen. Selanjutnya
dilakukan intrepetasi dari asosiasi Genotif-Fenotif.

Hasil & Pembahasan


Pemetaan Genotif dan Fenotif lebih banyak ditemukan pada saat menggunakan lebih
dari 6 komponen. Ini menunjukkan bahwa beberapa gen berasosiasi dengan Fenotif tertentu
dan gen-gen yang berkontribusi untuk informasi berbeda mengenai Fenotif hanya dapat
dijelaskan dengan mengkombinasikan enam atau lebih arah dalam ruang Genotif.
Kemudian tingkat penyusutan tidak pernah lebih dari 0,8. Hal ini dikarenakan batasan
yang dibuat hanya memerlukan 25 gen terpilih, dan ini juga memberitahukan bahwa gen-gen
yang berasosiasi dapat diidentifikasi tanpa menggunakan level penyusutan yang tinggi.
Banyaknya gen-gen yang berpengaruh meningkat seiring kompleksitas model dan menurun
seiring dengan level penyusutan.
Selanjutnya, untuk mengetahui jenis gen dan variasi genetik apa yang mendefinisikan
struktur utama dari variasi dalam sifat yang berbeda dalam suatu spesies dilakukan analisa
mendalam pada dua ciri lingkungan yang sangat bervariasi antara strain dan memiliki struktur
yang kompleks, yaitu NaCL1_E (NaCl 0,85 M efisiensi) dan Hea1_R(Heat 37C Rate).
Variasi dari efisiensi pertumbuhan selama paparan 0,85 M NaCl dalam strain S. cerevisiae
sebagian besar dikendalikan 47 gen terkait yang sering dikaitkan dengan Fenotif. Sehingga
model ST-PLS yang digunakan sebanyak 10 komponen yang menunjukkan hubungan yang
kompleks antara Genotif dan Fenotif ini.
Variasi laju pertumbuhan dalam S. cerevisiae selama paparan panas 37C sebagian
besar ditentukan oleh 33 gen yang sering dikaitkan dengan Fenotif alami ragi. Sebanyak 7
komponen model digunakan untuk menjelaskan Fenotifnya. Gen-gen yang mendefinisikan
toleransi panas yang rendah dari NCYC110 diperkaya untuk variasi Frame Shift dan gen-gen
yang berhubungan dengan variasi toleransi panas dalam DB-VPG6044 diperkaya untuk
paralog dan variasi jumlah salinan.

Kesimpulan
Pendekatan multivariat berbasiskan BLAST dan PLS memberikan hasil yang sesuai
dengan filogeni ragi yang diketahui. Sehingga disimpulkan pendekatan ini sangat layak
digunakan untuk analisa asosiasi Genotif-Fenotif. Namun, penelitian lanjutan perlu dilakukan
untuk meningkatkan perhitungan sinyal Genotif dan prosedur seleksi variabel dalam bingkai
kerja PLS.

Anda mungkin juga menyukai