Anda di halaman 1dari 1

2.1.

Data
Penelitian ini mengambil data dari berbagai sumber. Data-data yang dikumpulkan terdiri dari data SNP, gen beserta
kromosom, rangkaian rencana kerja manusia, dan frekuensi penggunaan kodon manusia. Setiap data tersebut
didapatkan dari database yang berbeda-beda:

 SNP dari Celera’s Human RefSNP yang dirilis pada November 2001.
 Gen dari Celera’s Genes database yang dirilis pada Desember 2001.
 Rangkaian rencana kerja manusia (human working draft sequence) dari USCS yang dirilis pada Desember
2001.
 Frekuensi penggunaan kodon dari CUTG (Codon Usage Tabulated from GenBank) yang diteliti oleh
Nakamura dkk pada tahun 2000.

Celera’s Human RefSNP berisikan 3,632,212 SNP yang berasal dari CgsSNP (Celera genomic sequence assembly),
dbSNP milik NCBI, HGMD (Human Gene Mutation Database), dan HGBASE (Human Genic Bi-Allelic
Sequences). Penelitian ini meneliti sebanyak 3.580.926 SNP dari RefSNP dimana terdapat 2,438,592 SNP dengan
tanda pada struktur kromosom dan struktur gen, 33.418 gen dengan lokasi peta kromosom, dan 19.312.280 kodon.

2.2. Analisis Data


Untuk mendapatkan dan menganalisa informasi yang dibutuhkan dari data yang disebutkan di atas, digunakan
program komputer yang menggunakan bahasa Perl. Informasi didapatkan dari SNP yang diukur pertama kali.
Panjang kromosom dan ukuran genom diperkirakan melalui posisi dari SNP pertama dan terakhir sebuah kromosom,
dimana perkiraan ukuran genom berada diantara ukuran RefSeq milik NCBI dan UCSC. Kepadatan SNP
ditunjukkan dari jumlah rata-rata SNP dalam sekuens 10 kb.

Panjang gen dihutung melalui selisih dari posisi awal UTR 5’ dan posisi akhir dari UTR 3’ pada database Celera’s
Genes. Total panjang gen sebesar 9.33 x 108 bp atau 31,87% keseluruhan genom, sementara total panjang exon
sebesar 3.50 x 107 bp atau 1,20% keseluruhan genom. Panjang exon dihitung dari tiga kali panjang protein. Panjang
daerah UTR sebesar 1,60 x 107 bp yang didapatkan dari mengurangi panjang exon dari panjang tranksripisinya.

Perkiraan jumlah mutasi yang terjadi pada sekuens koding protein dapat dihitung berdasarkan kode genetik
universal dan terjadi salah satu dari tiga hal berikut:1

1. Substitusi nukleotida acak pada sekuens koding protein acak


2. Substitusi nukleotida acak pada sekuens koding protein dimana frekuensi kodon yang digunakan
berdasarkan database CUTG
3. Substitusi nukleotida pada rasio arah mutasi yang diobservasi pada pseudogen pada sekuens koding protein
dimana frekuensi kodon yang digunakan berdasarkan database CUTG.

Perkiraan jumlah dari mutasi yang terjadi (silent mutation, missense mutation, nonsense mutation) digunakan untuk
mendapatkan rasio antar mutasi. Penelitian ini membandingkan rasio dari CgsSNP milik Celera dengan rasio yang
didapatkan dari teori netral.

Referensi:

1. Li WH.. Molecular Evolution. Chapter 1. Sinauer Associates: Sunderland; 1997.

Anda mungkin juga menyukai