Sejarah singkat
• Interpretasi • Analisis
• Verifikasi • Modeling
• Biological “insight” • Simulasi
• Visualisasi
Bioinformatics ≠ Medical Informatics
DNA (blueprint)
Phenotype / Morphology
• Pengumpulan informasi
– Literatur
– Anotasi gen:
sekuen, variasi DNA, lokasi, ekspresi, modifikasi, struktur, dll
– Data lain: data klinis, dll
• Akusisi data
– Sekuensing DNA
– Ekspresi gen (realtime RT-PCR)
• Analisa
– Mendapatkan informasi/pengetahuan (hipotesis) baru
– Mendapatkan prediksi/trend dari data
• Interpretasi secara biologi
Aktifitas Bioinformatika (2)
Aplikasi Central Dogma dalam Akusisi Data
Regulasi gen
Sekuen RNA (EST, cDNA sequencing) + (microarray,
realtime/quantitative RT-PCR)
Data acquisition
Result interpretation
• Analisa sekuen:
– Mapping situs restriksi
– Prediksi daerah exon-intron
– Prediksi daerah antigen
– Desain primer PCR & probe
– Prediksi fungsi
– Identifikasi gen
• Analisa struktur
– Struktur sekunder (alpha-helix, beta-sheet)
– Struktur tertier (3-Dimensi)
• Analisa interaksi
– Interaksi antar gen
– Interaksi antar protein/makromolekul
Domain Permasalahan
Studi Bioinformatika
analisa evolusi/phylogenetics
user interface
•
•
• studi populasi
Pentingnya Bioinformatika dalam Biologi Molekuler
hnRNA
(heterogenous nuclear RNA)
splicing
Protein (precursor)
Post-translational modification
Protein (mature)
Kompleksitas Data Biologi Molekuler (3)
random fragmentation
cloning
sequencing
assembling
Kompleksitas Analisa Data (5)
Contoh:
mekanisme molekuler akibat kelainan dari suatu gene dapat
dijelaskan secara kualitatif, namun seberapa besar efek dari
kelainan tersebut sehingga dapat menyebabkan penyakit
genetik harus dijelaskan secara kuantitatif.
Infrastruktur Terjangkau & Labor-Intensive
• Hipotesis
Sebelum eksperimen • Fisibilitas
• Metodologi penelitian
• Troubleshooting
Saat eksperimen
• Verifikasi/identifikasi hasil
“phenotype of interest”
koleksi sampel
Analisa data
sequence: multiple alignment
ekspresi: statistik
assay: modeling/ODE
genotype Æ phenotype
(sequence-based)
Melihat atau mengkonfirmasi hasil/efek/implikasi pada phenotype dari suatu gen/faktor,
misalnya mencari efek/implikasi dari suatu mutasi pada sebuah gen
“sequence of interest”
Analisa sekuen
(prediksi fungsi / simulasi molekuler)
Reverse Genetics
(outcome: phenotype)
hipotesis validasi
Forward Genetics
(outcome: genotype)
Database Bionformatika & Situs NCBI
Database
Data repository
Raw data
Redundant
Direct submision ( “sampah”, inkonsistensi, dll)
Selalu di-update (daily/weekly)
Contoh:
NCBI Genbank (sekuen DNA dan translasinya)
SwissProt (sekuen protein)
PDB (struktur kristal protein dan makromolekul)
dbEST (potongan-potongan sekuen mRNA)
dbGSS (survei sekuen genom)
Trace Archive (data hasil sekuensing DNA)
SAGEMap, GEO (data eksperimen microarray)
Database sekunder
Knowledge repository
Bersumber dari database primer/utama
Data dianotasi oleh kurator (umumnya manual)
Non-redundant
Ada jeda waktu untuk sinkronisasi dengan sumber database primer
Contoh:
NCBI RefSeq (sekuen DNA dan translasinya)
SwissProt (sekuen protein)
Ensembl (sekuen genom eukaryotes)
MMDB (struktur kristal protein dan makromolekul)
Database tertier/spesial
PubMed (http://www.ncbi.nih.gov/pubmed)
Jurnal internasional bidang ilmu alam & kedokteran
Abstrak, Penulis, Jurnal
PubMed Central (http://www.pubmedcentral.nih.gov)
Subset dari PubMed
Full-text
NCBI Bookshelf (http://www.ncbi.nih.gov/books)
NCBI OMIM - Online Mendelian Inheritance in Man
Katalog dari penyakit genetik dan gen manusia (& tikus)
NCBI OMIA (Online Mendelian Inheritance in Animal
Katalog dari penyakit genetik dan gen hewan (selain manusia &
tikus)
Daftar (sebagian kecil) Database Bioinformatika
MitoMAP
EnsEMBL GenomeBrowser
SGD
GenBank dbSNP
TrEMBL EMBL
DDJ dbEST
PlasmoDB
secondary databases
Pubmed
OMIM
NCBI ( www.ncbi.nih.gov )
• Pencarian literatur
• Pencarian gen berdasarkan:
– Informasi tekstual (nama, lokasi, literatur)
– Sekuen lain
– Struktur
• Pencarian data lain:
– OMIM – Online Mendelian Inheritance in Man
– TaxBrowser
– dbSNP – SNP database
– dbGAP – Genotype-Phenotype database
– UniSTS – Sequence Tag Site
• Repositori untuk GenBank & RefSeq
• Repositori untuk full genomic sequences
• Repositori untuk dokumen edukasi
• Bioinformatics tools: Electronic PCR, dll
NCBI Genbank Database
Nomenclature NCBI Refseq
• PubMed
• Protein Æ translasi dari Nucleotide
• CoreNucleotide Æ Genbank + Refseq
• Nucleotide Æ CoreNucleotide + EST + GSS + STS
– EST (Expressed Sequence Tags) – mRNA
– GSS (Genome Survey Sequence) – preliminary genome
– STS (Sequence Tag Site) – sekuen DNA pendek yang hanya muncul di
satu lokasi saja pada genome
• Structure :
– MMDB – Molecular Modeling Database Æ subset dari PDB
– CDD – Conserved Domain Database
– VAST – Vector Alignment Search Tool Æ pencarian struktur berdasarkan
kemiripan pada struktur kueri
Database pada NCBI (2)
• Gene
• Genome Project
• dbGAP Æ database Genotype and Phenotype
• GENSAT (Gene Expression Nervous System Atlas) Æ database
ekspresi gen dari sistem saraf pusat (central nervous system) pada
mouse dengan metode in-situ hybridization dan transgenik
• GEO (Gene Expression Omnibus) Æ database ekspresi gen dari
eksperimen microarray
• HomoloGene Æ data gen-gen homolog yang dianalisa secara
otomatis
• PMC – PubMed Central
• MeSH
Database pada NCBI (4)
• Desain primer
• Studi homologi
• Prediksi struktur sekunder protein
• Prediksi topologi protein
Sekuen DNA:
GATCGCTAGGATCGAGCTAGGATCGCGGATCCGAGAGCTCGAGGGCGCTAGCGCTAGCTCGATCGACTG