INTRODUCTION TO BIOINFORMATIC
Bioinformatika merupakan cabang ilmu dari 2 sudut pandang
- Bioinformatika semua tools bioinformatika yang bisa digunakan untuk
menanngkap/menginterprestasikan, menganalisa pada data biological
- Bidang interdisciplinary yang memanfaatkan ilmu computer, matematika, fisika, dan biologi
Biologist orang yang focus pada collect molecular data : DNA dan protein sequence, gene expression,
etc
Computer scientist yang paham pada bidang (math, statistica, etc). develop tools, softwares,
algorithms, untuk store dan analisis data
Bioinformatika study biogical questions dengan analisis data molekul
SEJARAH BIOINFORMATIKA
1950-1970 : Asal
Analisis protein adalah titik awalnya
Pada awal 1950-an, tidak banyak yang diketahui tentang asam deoksiribonukleat (DNA). Statusnya
sebagai pembawa molekul informasi genetic masih kontroversial pada waltu itu.
Pada tahun 1953 double-helix structure DNA diselesaikan oleh Watson, Crick dan franklin
Pada akhir 1950-an. Selain kemajuan besar dalam penentuan struktur protein melalui kristalografi,
ururta pertama dari protein, insulin, diterbitkan.
Dayhoff : bioinformatika pertama
Margaret Dayhoff (1925-1983) adalah fisikawan Amerika kimiawan yang mempelopori penerapan
komputasi metode untuk bidang biokimia.
Bersama Robert S. Ledley, seorang fisikawan yang juga berusaha untuk membawa sumber daya
komputasi ke biomedis masalah, baik menggabungkan keahlian mereka dan dikembangkan
“COMPROTEIN “ program computer lengkap untuk IB, 7090” diranccang untuk menentukan struktur
prime protein menggunakan data sekuensing peptide Edman dari tahun 1958-1962
Sisilah kehidupan yang dibantu computer
Pada tahun 1963, Zuckerkandl dan Pauling menciptakan istilah “paleogenetika” cabang baru dari
biologi evolusioner yang mencoba menyusun kembali sejarah evolusi protein melalui pewarisan dan
perubahan halus waktu, dan dalam proses yang sama, menyusun kembali urutannya dari “nenek moyang”
mereka. Mengamati perubahan bahasa ibu
Keduanya mengamati bahwa protein ortologi dari organisme vertebrata, seperti hemoglobin,
menunjukkan tingkat kesamaan yang terlalu tinggi selama waktu evolusi yang lama untuk menjadi hasil
dari evolusi atau konvergen
1970-1980 Pergesaran paradigm dari protein ke analisis DNA
Menguraikan bahasa DNA : kode geneitk
Spesifikasi untuk setiap makhluk hidup (lebih tepatnya, 'proteinnya') dikodekan dalam susunan
nukleotida spesifik dari molekul DNA.
Oleh karena itu, jika seseorang dapat mengetahui bagaimana sel menerjemahkan 'bahasa DNA' ke dalam
rangkaian polipeptida, ia dapat memprediksi struktur utama dari setiap protein yang dihasilkan oleh suatu
organisme dengan 'membaca DNA-nya'.
Pada tahun 1968, semua 64 kodon kode genetik diuraikan, DNA sekarang 'dapat dibaca', dan pencapaian
terobosan ini membutuhkan cara sederhana dan terjangkau untuk mendapatkan urutan DNA.
1980-1990 Kemajuan parallel dalam biologi dan ilmu computer
Metode molekuler untuk menargetkan dan memperkuat gen tertentu
Jackson, Symons dan Berg (1972) menggunakan endonuklease restriksi dan DNA ligase untuk
memotong dan menyisipkan DNA virus SV40 sirkular ke dalam DNA lambda, dan kemudian mengubah
Escherichia coli sel dengan konstruksi ini
Ketika molekul DNA yang dimasukkan direplikasi dalam organisme inang, itu juga diperkuat sebagai:
E. coli kultur tumbuh, menghasilkan beberapa juta salinan dari satu sisipan DNA
Eksperimen ini memelopori isolasi dan amplifikasi gen secara independen dari organisme sumbernya
(misalnya, SV40 adalah virus yang menginfeksi primata)
Akses ke computer dan perangkat lunak khusus
Sebelum tahun 1970-an, sebuah 'komputer mini' cukup memiliki dimensi dan berat kulkas rumah
tangga kecil, tidak termasuk terminal dan unit penyimpanan. Batasan ukuran membuat akuisisi komputer
menjadi rumit bagi individu atau kelompok kerja kecil.
Pada tahun 1984, Grup Komputer Genetika Universitas Wisconsin menerbitkan rangkaian perangkat
lunak 'GCG' eponymous, kumpulan 33 alat baris perintah untuk memanipulasi urutan DNA, RNA atau
protein. GCG dirancang untuk bekerja pada komputer mainframe skala kecil (DEC VAX-11). Ini adalah
koleksi perangkat lunak pertama yang dikembangkan untuk analisis urutan.
1990-2000 : genomic, bionformatika strukturan, dan jalan raya informasi
Fajar era genomic
Pada tahun 1995, urutan genom lengkap pertama dari organisme hidup bebas (Haemophilus influenzae)
diurutkan oleh The Institute for Genomic Research (TIGR) yang dipimpin oleh ahli genetika J. Craig
Venter
Namun, titik balik yang memulai era genomik, seperti yang kita ketahui sebenarnya, adalah publikasi
genom manusia pada awal abad ke-21.
Sekuensing seluruh genom membutuhkan jutaan dolar dan tahun untuk mencapai penyelesaian, bahkan
untuk genom bakteri. Sebaliknya, pengurutan genom manusia dengan teknologi 2018 akan menelan
biaya $1000 dan memakan waktu kurang dari seminggu
Bioinformatika online
Pada awal 1990-an Conseil Européen pour la Recherche Nucléaire (CERN) memprakarsai World Wide
Web, sebuah sistem informasi global yang terbuat dari dokumen yang saling terkait. Teknologi ini juga
menyebabkan terciptanya banyak sumber daya bioinformatika yang dapat diakses di seluruh dunia.
Database urutan nukleotida pertama di dunia, EMBL Nucleotide Sequence Data Library (yang
mencakup beberapa database lain seperti SWISS-PROT dan REBASE), tersedia di Web pada tahun 1993
https://www.ncbi.nlm.nih.gov . Database terkenal ada 3 : EMBL, NCBI, DDBJ
Situs web NCBI yang terkenal dibuat tersedia online pada tahun 1994 (termasuk alat BLAST, yang
memungkinkan untuk melakukan penyelarasan berpasangan secara efisien). Kemudian muncul
pembentukan beberapa database utama yang masih digunakan sampai sekarang: Genom (1995), PubMed
(1997) dan Human Genome (1999)
2000-2010 High-throughput bioinformatics
Urutan generasi kedua
Sekuensing DNA didemokratisasi dengan munculnya pengurutan generasi kedua (juga disebut
pengurutan generasi berikutnya atau NGS) yang dimulai dengan teknologi yrosequencing '454'
Teknologi ini memungkinkan pengurutan ribuan hingga jutaan molekul DNA dalam satu mesin berjalan,
sehingga meningkatkan lagi tantangan komputasi lama
Ada begitu banyak alat yang berhubungan dengan urutan. Oleh karena itu penguasaan alat-alat baru
harus dibenarkan dengan peningkatan waktu komputasi atau hasil dengan kualitas yang jauh lebih baik
2010-Hari ini : Prespektif sekarang dan masa depan
Mendefinisikan dengan jelas profesi bioinformatika Evolusi terbaru terkait bioinformatika adalah
munculnya peneliti yang mengkhususkan diri dalam bidang ini: ahli bioinformatika. Bahkan setelah lebih
dari 50 tahun bioinformatika, masih belum ada konsensus pasti tentang apa itu ahli bioinformatika
Apa yang pasti, bagaimanapun, adalah bahwa ada peningkatan yang signifikan dalam (i) alat yang mudah
digunakan, sering tersedia melalui server Web integratif seperti Galaxy, dan (ii) membantu komunitas
seperti SEQanswers dan BioStar. Ada juga kebutuhan eksplosif untuk ahli bioinformatika di pasar kerja
di sektor akademik, swasta dan pemerintah
Jenis database
- Primary database
Kiriman asli oleh eksperimentalis
Konten dikendalikan oleh pengirim
Contoh: GenBank, SNP, GEO
- Derivative database
Dibangun dari data primer
Konten yang dikendalikan oleh pihak ketiga (NCBI)
Contoh: Refseq, TPA, RefSNP, UniGene, protein NCBI, struktur, conserved domain
GenBank : basis data urutan utama NCBI
- Basis data urutan nukleotida aja
- Arsip di alam :
o Historis
o Reflektif dari sudut pandang pengirim (Subjektif)
o Berulang
- Data genbank
o Pengajuan langsung (catatan tradisioal)
o Pengiriman batch (EST, GSS, STS)
o Akun FTP (data genom)
- Tiga database yang berkolaborasi
o Genbank
o DNA Database of Japan (DDJB)
o European Molecular Biology Laboratory (EMBL) database
International Nucleotide Sequence Database Collaboration (INSDC)
Traditional GenBank Record
Accession Ex U07418 stable, reportable, universal. Kalau mau search menggunakan U0
Version (track change in sequence) EX GI (Acess code Internal NCBI)
PRIMARY VS DERIVATE SEQUENCE DATABASE
Primary sequence sequence yang utama.
Refseq : basis data urutan derivative NCBI
- Transkrip dan protein yang dikuratori
o ditinjau
o manusia, tikus, tikus, lalat buah, ikan zebra, genom mikroba arabidopsis (protein), dan
banyak lagi
- Transkrip model dan protein
- Wilayah Genom Terkumpul (contigs)
o gen manusia
o genom tikus
o genom tikus
- Catatan kromosom
o Gen manusia
o mikroba
o organel
PERTEMUAN 3
DNA SEQUENCING
PERTEMUAN 6
Alligment menyusun urutan primer DNA, RNA atau protein untuk mengidentifikasi daerah kesamaan
yang mungkn=in berasal dari fungsional, structural atau hubungan evolusi antara urutan
Fungsi mengetahui alligment :
- Digunakan scara luas dalam bioinformatika
- Protein dan gen memiliki panjang yang berbeda walaupun ada kemiripan karena kesalahan dalam
pengurutan dan variasi genetic antara spesies
- Identifikasi peristiwa evolusi, penyisipan, penghapusan dan penggantian
- Tujuaan untuk “allign” urutan sehingga jumlah mutasi diminalkan
Sequence alligment tell us tentang :
- Fungsi atau aktivitas gen/protein baru
- Struktur atau bentuk protein baru
- Lokasi atau lokasi pilihan protein
- Stabilitas gen atau protein
- Asal gen atau protein
- Asal atau filogeni suatu organel
- Asal atau filogeni suatu organisme