Anda di halaman 1dari 67

Pengertian dan Ruang Lingkup

Bioinformatik
Pengertian:
Aplikasi teknologi informasi dalam
bidang biologi molekuler
Istilah Bioinformatik pertama kali
dikemukakan oleh: Paulien
Hogeweg (1979).
Digunakan dalam bidang genomik
dan genetika khususnya aplikasi
untuk analisis sekuens DNA dalam
jumlah besar
Ruang lingkup:
Saat ini mencakup juga aktifitas
pembuatan dan pemutakhiran
database, algorithme,
komputasional dan teknik statistik,
dan teori untuk memecahkan
persoala-persoalan manajemen
data-data percobaan biologis.
Aktifitas Bioinformatik
Mapping (pemetaan) DNA dan
kromosom
Analisis sekeuens DNA dan Protein
Alligning (penjajaran) sekuens DNA
dan protein yang berbeda untuk
membandingkannya
Pembuatan dan visualisasi model 3
dimensi struktur protein
Tujuan Utama

Meningkatkan pemahaman kita


tentang proses-proses biologis
Fokus Kegiatan

Pengembangan dan aplikasi teknik-


teknik komputasional:
pattern recognition (pengenalan
pola), data mining (penambangan
data), machine learning
algorithms, and visualization
(visualisasi)
Aktifitas penelitian Bioinformatik

sequence alignment (penjajaran


sekuens),
gene finding (pencarian gen),
genome assembly (assembling
genom),
protein structure alignment
(penjajaran struktur protein),
protein structure prediction
(prediksi struktur protein),
Aktifitas penelitian Bioinformatik

prediction of gene expression


(prediksi ekspresi gen)
protein-protein interactions
(interaksi protein-protein),
genome-wide association studies
and (kajian hubungan genom secara
luas)
the modeling of evolution
(modeling evolusi)
Annotation (Anotasi)
Tidak semua sekuen nukleotid bersifat
fungsional = Junk DNA

Perhitungan dalam upaya men-


cari gen untuk menemukan
gen-gen pengkode protein, gen-
gen RNA, and sekuens fungsio-
nal lainnya didalam genom
Junk DNA (DNA sampah)
Sebagian besar DNA di dalam
genom tidak memiliki fungsi
yang jelas.
Bioinformatik membantu
menjembatani antara genomik
dan proteomik dalam
penggunaan sekuens DNA untuk
identifikasi protein.
Anotasi
Proses penandaan gen-gen dan
karakteristik biologis lain pada level
sekuens DNA.
Sistem software pertama: Dr. Owen
White (1995): The Institute for
Genomic Research
Sekuens pertama: Haemophilus
influenzae
Computational evolutionary biology

Kajian asal-usul dan keturunan spesies dan


perubahannya sepanjang waktu.
Menjejaki evolusi populasi organisme dengan
mengukur perubahan DNA dibandingkan:
physical taxonomy or observasi physiologis
Perbandingan keseluruhan genomes,
memungkinkan studi gene duplication,
horizontal gene transfer, dan prediksi factor-
faktor penting dalam spesiasi,
Modeling prediksi populasi masa depan
Pencarian dan pembagian informasi spesies dan
organsime berbasis DNA.
Analisis Ekspresi Gen
Level mRNA melalui berbagai teknik:
microarrays,
expressed cDNA sequence tag (EST)
sequencing,
serial analysis of gene expression
(SAGE) tag sequencing,
massively parallel signature sequencing
(MPSS), or
Aplikasi multiplexin-situ hybridization
Analisis Ekspresi Gen
Bias and Noise
Bioinformatik memisahkan bias
dan nois
Regulasi Gen
Regulasi gen adalah kejadian
orkestra kompleks yang dimulai
dengan sinyal ekstraselluler
seperti hormon, nutrisi (ion-ion)
yang mengarah kepada
peningkatan atau penurunan
aktifitas satu atau beberapa
protein.
Regulasi Gen

Promoter analysis: identifikasi dan studi


motif sequence di sekitar daerag
pengkode suatu gen
Motif tersebut mempengaruhi ke arah
mana proses transkripsi menjadi mRNA.
Data ekspresi digunakan untuk
memperkirakan regulasi gen
Perbandingan dengan data microarray
dapat memperkirakan gen-gen yang
terlibat dalam proses regulasi gen.
Regulasi Gen
Pada organisme sel tungga, dapat
digunakan untuk mempelajari siklus
sel,
Berbagai kondisi stress (heat shock,
starvation, etc.) dapat dipelajari gen-
gen apa saja yang terlibat.
Data Clustering algorithms dapat
memperkirakan gen-gen yang bersifat
co-expressi
Dapat digunakan untuk
memperlkiarkan regulatory elements.
Analysis of protein expression

Protein microarrays (PM) dan high


throughput (HT) mass spectrometry
(HTMS) dapat memperkirakan
protein-protein yang terdapat
dalam sampel biologis.
PM dan HTMS, problem identifikasi
yang kompleks, statistik yang
rumit, serta ketidaksempurnaan
ikatan peptida protein.
Analisis Mutasi Kasus Kanker
affected cells are rearranged in complex or even
unpredictable ways.
Massive sekuensing data are produced
Kompleksitas analisis dan manajemen data
oligonucleotide microarrays to identify
chromosomal gains and losses (called
comparative genomic hybridization), and single
nucleotide polymorphism arrays to detect
known point mutations
Ratusan ribu sisi sepenjaang genome harus
dianalisis, menghasilkan terabytes data per
experiment.
Prediksi struktur protein
Struktur primer protein (primary
structure) dapat ditentukan dari sekuens
asam amino.
Struktur primer protein akan menentukan
fungsi dari protein.
Homologi bisa dipergunakan untuk
memprediksi struktur protein yang belum
diketahui, contoh:hemoglobin pada
manusia dan hemoglobin in legumes
(leghemoglobin) berfungsi dalam
transportasi oksigen, keduanya memiliki
struktur protein yang sama meskipun
sekuens asam aminonya berbeda.
Comparative Genomics
Korespondensi antara beberapa gen
(analisis orthologus) pada organisme
berbeda.
Analisis divergensi dua genome atau
lebih
Level paling bawah point mutations
Segmen kromosomal: duplication,
lateral transfer, inversion,
transposition, deletion and insertion
Software dalam Bioinformatik
BLAST, algoritma untuk penentuan
similaritas sekuens random dengan
sekuens yang lain yang biasanya
terdapat dalam database baik DNA
ataupun protein.
BLAST dapat digunakan untuk
melakukan allignment sekuens.
NCBI : National Center for
Biotechnology Information.
Allignmen/Penjajaran sekuens
(Sequence allignment)
Sequence alignment: penyusunan
sekuens-sekuens baik, DNA, RNA,
atau protein untuk mengidenti-
fikasi daerah-daerah yang sama
yang kemungkinan memiliki
hubungan fungsional, struktural
ataupun evolusi.
Sekuens nucleotide atau amino
acid yang dijajarkan dalam
bentuk baris pada suatu
matriks.
Gaps disisipkan diantara
residues sehingga karakter
yang identik ataupun sama
berada pada kolom yang sama.
Contoh sekuens allignment

DNA/Nukleotid

Asam amino: human zinc finger protein


Key: Single letters: amino acids.

Red: small, hydrophobic, aromatic, not Y. Blue:


acidic.
Magenta: basic.
Green: hydroxyl, amine, amide, basic.
Gray: others.
"*": identical.
":": conserved substitutions (same colour group).
".": semi-conserved substitution (similar shapes).
Kode genetik (kodon), asam amino dan
lambang tiga serta satu huruf
Ala/A GCU, GCC, GCA, GCG Leu/L UUA, UUG, CUU, CUC, CUA,
CUG
Arg/R CGU, CGC, CGA, CGG, Lys/K AAA, AAG
AGA, AGG
Asn/N AAU, AAC Met/M AUG
Asp/D GAU, GAC Phe/F UUU, UUC
Cys/C UGU, UGC Pro/P CCU, CCC, CCA, CCG
Gln/Q CAA, CAG Ser/S UCU, UCC, UCA, UCG, AGU,
AGC
Glu/E GAA, GAG Thr/T ACU, ACC, ACA, ACG
Gly/G GGU, GGC, GGA, GGG Trp/W UGG
His/H CAU, CAC Tyr/Y UAU, UAC
Ile/I AUU, AUC, AUA Val/V GUU, GUC, GUA, GUG
START AUG STOP UAA, UGA, UAG
Jenis allignment

Global alignments: penjajaran


antara sekuens yang dimiliki
secara keseluruhan.
Local alignments: identifikasi
daerah yang sama didalam
sekuens yang panjang yang
biasanya mengalami divergensi.
Global dan lokal allignment
Global allignment
Lebih cocok digunakan untuk:
Allignment dimana set query
memiliki tingkat kesamaan yang
tinggi
Memiliki ukuran yang hampir
sama
Mengunakan:Needleman-Wunsch
algorithm, berbasis dynamic
programming
Local alligment
Lebih cocok untuk sekuens dimana
memiliki banyak ketidaksamaan,
Ada daerah tertentu disepanjang
sekuens yang memiliki kesamaan
didalamnya
Menggunakan Smith-Waterman
algorithm berbasis dynamic
programming
Global dan local allignment

Jika sekuens yang dianalisis


memiliki tingkat kesamaan yang
tinggi maka tidak ada perbedaan
antara local allignment dan
global allignment.
Multiple sequence alignment

Perluasan dari pairwise alignment yang


memungkinkan analisis lebih dari dua
sequences sekaligus.
Digunakan untuk mengidentifikasi
daerah konservatif dari kelompok
sekuens yang diduga berkerabat.
Mengidentifikasi informasi struktural
dan mechanistic sisi active dari
enzymes.
Membantu menyusuna hubungan
evolutionari dalam penyusunan pohon
Homology

Kesamaan karakteristik dari


beberapa organisme dikarenakan
asal-usul yang sama.
Dalam konteks genetika, homologi
mengacu kepada kesamaan sekuens
DNA
Orthologs

Orthologs/ gen orthologous: gen-gen


pada spesies yang berbeda yang sama
karena berasal dari tetua yang sama
Ortologus muncul karena ada
divergensi dalam konteks evolusi.
Divergensi mengarah pada
pembentuka spesies baru
(spesiasi=speciation)
Paralogous
Paralogous (paralog) homologi
antara dua sekuens gen yang
terbentuk karena peristiwa
duplikasi gen (gene duplication).
Suatu gen dalam satu organisme
mengalami duplikasi dan
menempati posisi berbeda pada
genom sel yang sama, maka kedua
kedua gen tersebut bersifat paralog.
Gen-gen Paralog
Contoh-contoh gen paralog:
Myoglobin and hemoglobin
Empat kelas hemoglobin:
(hemoglobin A, hemoglobin A2,
hemoglobin B, dan hemoglobin F).
Fungsi: transportasi oksigen,
hemoglobin F pada fetal memiliki
affiniti lebih kuat dibandingkan
kelas lainnya.
Ohnologous
Ohnologous: gen-gen paralogous
yang berasal dari duplikasi genom
secara keseluruhan (whole-
genome duplication :WGD).
Istilah ohnologus diberikan
sebagai penghargaan terhadap
Susumu Ohno oleh: Ken Wolfe
Xenologs
Homologi yang dihasilkan dari
proses transfer gen horizontal
(mikroba) antara dua organisme.
Xenologs dapat menyebabkan
fungsi kedua gen berbeda, jika
lingkungan organisme akseptor
sangat jauh berbeda.
Kromosom Homolog
Kromosom Homologous : kromosom
non identik yang dapat
berpasangan/bersinapsis selama
meiosis.
Kecuali kromosom kelamin,
kromosom homolog memiliki
kesamaan sekuens yang sangat tinggi
disepanjang kromosomnya.
Mengandung gen-gen yang sama
sekuensnya sehingga memungkinkan
saat meiosis untuk berpasangan.
Gene Finding
Kegiatan identifikasi secara
algorithmik terhadap sekuens DNA
(genomic DNA) yang diduga memiliki
fungsi secara biologis.
Meliputi identifikasi: gen-gen
pengkode protein, dan elemen
fungsional lainnya seperti gen-gen
pengkode RNA (tRNA, rRNA) dan
daerah regulator.
Gene finding
Penentuan fungsi suatu gen dan
produknya harus dibedakan
dengan penentuan sekuens-
sekuens fungsional.
Fungsi suatu gen hanya dapat
ditentukan melalui eksperimen in-
Vivo seperti gene knockout atau
metode lainnya.
Beberapa pendekatan
Pendekatan Ekstrinsik (evidence
based)
Target sekuens dibandingkan dengan
sekuens yang mRNA atau produk
proteinnya telah diketahui.
Tingkat kesamaan yang tinggi dengan
mRNA atau produk protein indikasi
kuat bahwa sekuen target adalah gen
pengkode protein.
Beberapa pendekatan
Dibutuhkan informasi sekuens
mRNA yang sangat besar (organisme
kompleks)
Kelemahan pada organisme yang
kompleks, tidak semua gen
berekspresi pada setiap saat.
Gen-gen yang hanya berekspresi
pada saat fetus tidak bisa dianalisis
secara bebas dengan alasan etika.
Pendekatan Ekstrinsik

RefSeq database: mengandung


sekuens transkrip dan protein dari
berbagai species
Ensembl database memetakan
berbagai data sekuens pada
manusia.
Pendekatan Ab initio

Sekuens fungsional ditentukan


secara sistematis
Penentuan terhadap komponen
sinyal sekuens (promoter) atau
Protein coding sekuens (ORF), serta
stop kodon
Lebih mudah pada sekuens
prokaryot
Pendekatan Ab initio eukaryot lebih
kompleks

Pertama: sekuens promoter dan


regulator lebih kompleks dan baru
sedikit difahami dibandingkan dengan
prokaryot sehingga sulit dikenali.
Kedua, mekanisme splicing yang
disebabkan oleh adanya sekuens
exons, dan introns.
Gene finder untuk pro-
eukaryot
Model untuk pro- eukaryot :
Kompleks probabilistic models, (hidden
Markov models)
GLIMMER, GeneMark : prokaryot
GENSCAN and GENEID: eukaryot
mSplicer, CONTRAST, atau mGene
SLAM, SGP and Twinscan/N-SCAN:genome
comparison
Projector, GeneWise and GeneMapper
Simbol Nukleotid

A Adenosine W A T (Weak interaction)


C Cytosine B G T C (not A) (B comes after A)
G Guanine D G A T (not C) (D comes after C)
T Thymidine H A C T (not G) (H comes after G)
G C A (not T, not U) (V comes
U Uracil V
after U)
R G A (puRine) N A G C T (aNy)
Y T C (pYrimidine) W A T (Weak interaction)
K G T (Ketone) X masked
M A C (aMino group) - gap of indeterminate length
S G C (Strong interaction)
Motif sekuens
Motif sekuens: pola suatu sekuen
nukleotida atau asam amino yang
dianggap memiliki fungsi biologis
penting.
Motif sekuens motif pada protein
harus dibedakan dengan motif
struktural yang dibentuk oleh
penyusunan tiga dimensi asam
amino.
Primer Designing
Primer Designing

Manual
Software based designing
Mendisain Primer Manual
Primer yang ideal :

1.Memiliki panjang sekitar 15-35 nukleotid


2.Memiliki titik didih yang relatif tinggi
3.Sekuens primer hanya hadir satu kali pada
templet DNA
4.Tidak berkomplementer dengan primer
pasangannya
5.Tidak membentuk struktur sekunder
dengan primer pasangannya
6.Memiliki proporsi GC dan AT yang
seimbang
7.Primer pasangannya memiliki titik didih
yang relatif sama
Bioteknologi Tanaman

PCR
Suhu Annealing

Tm = ((G+C) x 4C) + ((A + T) x 2C).

Contoh:
CATAAGTCTGATACTTGCTG

dimana:
jumlah basa C = 4, G = 4, A = 5, T = 7,
maka besarnya Tm adalah:
Tm = ((4+4)x4) + ((5+7)x2) = 32 + 24 = 56C

suhu annealing sekitar 54-58C

Dr. Jamsari, Prog. Studi Pemuliaan Tanaman Jurusan BDP-FPUA


Software based designing

Oligos V. 3.0
Universitas di Helsinki,
Finlandia (Kalendar, 2002 )
Oligos
http://www.ncbi.nlm.nih.gov/tools/primer-blast/
http://www.ncbi.nlm.nih.gov/tools/primer-blast/
http://biotools.umassmed.edu/bioapps/primer3_www.cgi
Primer3: WWW primer tool

Anda mungkin juga menyukai