Anda di halaman 1dari 38

Bioinformatika

Pengenalan Bioinformatika

Contents

Sejarah Bioinformatika
Istilah Biologi
Pangkalan Data
Tools Bioinformatika

Definisi
Bioinformatika (bioinformatics) adalah ilmu yang
mempelajari penerapan teknik komputasional untuk
mengelola dan menganalisis informasi biologis.
Bidang ini mencakup penerapan metode-metode
matematika, statistika, informatika, fisika, biologi, dan ilmu
kedokteran untuk memecahkan masalah-masalah biologis,
terutama dengan menggunakan sekuens DNA dan
asam amino serta informasi yang berkaitan dengannya.
Contoh topik utama bidang ini meliputi basis data untuk
mengelola informasi biologis,
penyejajaran sekuens (sequence alignment),
prediksi struktur untuk meramalkan bentuk struktur protein maupun
struktur sekunder RNA,
analisis filogenetik, dan
analisis ekspresi gen.

Pendahuluan
Bioinformatika merupakan ilmu terapan
yang lahir dari perkembangan teknologi
informasi dibidang molekular.
Pembahasan dibidang bioinformatik ini
tidak terlepas dari perkembangan biologi
molekular modern, salah satunya
peningkatan pemahaman manusia dalam
bidang genomic yang terdapat dalam
molekul DNA.

Latar Belakang Bioinformatika


Kemajuan bioteknologi dan teknologi informasi
Dilatarbelakangi oleh ledakan data (data
explosion) observasi biologi sebagai hasil yang
dicapai dari kemajuan bioteknologi. Contohnya
adalah pertumbuhan pesat database DNA pada
GenBank. Genbank adalah database utama
dalam biologi molekuler, yang dikelola oleh
NCBI (National Center for Biotechnology
Information) di AS.

Kemampuan untuk memahami dan memanipulasi kode


genetik DNA ini sangat didukung oleh teknologi informasi
melalui perkembangan hardware dan software.
Baik pihak pabrikan sofware dan harware maupun pihak
ketiga dalam produksi perangkat lunak.
Salah satu contohnya dapat dilihat pada upaya Celera
Genomics, perusahaan bioteknologi Amerika Serikat
yang melakukan pembacaan sekuen genom manusia
yang secara maksimal memanfaatkan teknologi
informasi sehingga bisa melakukan pekerjaannya dalam
waktu yang singkat (hanya beberapa tahun).

Peluang Bioinformatika
Ilmu bioinformatika lahir atas insiatif para ahli ilmu
komputer berdasarkan artificial intelligence.
Mereka berpikir bahwa semua gejala yang ada di alam
ini bisa dibuat secara artificial melalui simulasi dari
gejala-gejala tersebut.
Untuk mewujudkan hal ini diperlukan data-data yang
yang menjadi kunci penentu tindak-tanduk gejala alam
tersebut, yaitu gen yang meliputi DNA atau RNA.
Bioinformatika ini penting untuk manajemen data-data
dari dunia biologi dan kedokteran modern.
Perangkat utama Bioinformatika adalah program
software dan didukung oleh kesediaan internet

Teknologi DNA Rekombinan


Perkembangan teknologi DNA rekombinan
memainkan peranan penting dalam lahirnya
bioinformatika.
Teknologi DNA rekombinan memunculkan suatu
pengetahuan baru dalam rekayasa genetika
organisme yang dikenal dengan bioteknologi.
Perkembangan bioteknologi dari bioteknologi
tradisional ke bioteknologi modern salah
satunya ditandainya dengan kemampuan
manusia dalam melakukan analisis DNA
organisme, sekuensing DNA dan manipulasi
DNA.

Sekuensing DNA
Sekuensing DNA satu organisme, misalnya
suatu virus memiliki kurang lebih 5.000
nukleotida atau molekul DNA atau sekitar 11
gen, yang telah berhasil dibaca secara
menyeluruh pada tahun 1977.
Kemudian sekuen seluruh DNA manusia terdiri
dari 3 milyar nukleotida yang menyusun 100.000
gen dapat dipetakan dalam waktu 3 tahun,
walaupun semua ini belum terlalu lengkap.
Saat ini terdapat milyaran data nukleotida yang
tersimpan dalam database DNA, GenBank di AS
yang didirikan tahun 1982.

Sejarah Bioinformatika
1960an: penerapan bidang-bidang dalam
bioinformatika seperti pembuatan pangkalan
data dan pengembangan algoritma untuk
analisis sekuens biologi.
1960an: Pangkalan data sekuens protein mulai
dikembangkan di Amerika Serikat.
1970an: pangkalan data sekuens DNA
dikembangkan di Amerika Serikat dan Jerman
pada Laboratorium Biologi Molekuler Eropa
(European Molecular Biology Laboratory).

1970an: Penemuan teknik sekuensing DNA menjadi


landasan terjadinya ledakan jumlah sekuens DNA yang
dapat diungkapkan pada 1980an dan 1990an.
Hal ini menjadi salah satu pembuka jalan bagi proyekproyek pengungkapan genom, yang meningkatkan
kebutuhan akan pengelolaan dan analisis sekuens, dan
pada akhirnya menyebabkan lahirnya bioinformatika.
1980an: Bioinformatika pertamakali dikemukakan untuk
mengacu kepada penerapan ilmu komputer dalam
bidang biologi. Tepatnya, istilah Bioinformatika pertama
kali diperkenalkan pada 1979 oleh Paulien Hogeweg.

Perkembangan jaringan internet juga mendukung


berkembangnya bioinformatika.
Pangkalan data bioinformatika yang terhubungkan
melalui internet memudahkan ilmuwan dalam
mengumpulkan hasil sekuensing ke dalam pangkalan
data tersebut serta memperoleh sekuens biologi sebagai
bahan analisis.
Selain itu, penyebaran program-program aplikasi
bioinformatika melalui internet memudahkan ilmuwan
dalam mengakses program-program tersebut dan
kemudian memudahkan pengembangannya.

Kemajuan ilmu Bioinformatika ini lebih


didesak lagi oleh genome project yang
dilaksanakan di seluruh dunia dan
menghasilkan tumpukan informasi gen
dari berbagai makhluk hidup, mulai dari
makhluk hidup tingkat rendah sampai
makhluk hidup tingkat tinggi

Pada tahun 2001, genom manusia yang terdiri


dari 2.91 juta bp (base-pare, pasangan basa)
telah selesai dibaca [2].
Baru-baru ini genom mikroba Plasmodium
penyebab Malaria dan nyamuk Anopheles yang
menjadi vektor mikroba tersebut juga telah
berhasil dibaca [3-4].
Dan masih banyak lagi gen-gen dari makhluk
hidup lainnya yang sudah dan sedang dibaca

Pengorganisasian data yang ada sangat


berguna untuk analisis yang lebih baik.
Pekerja di bidang bioinformatika
memastikan informasi biologis tersedia,
melalui pengawasan kualitas,
pemeriksaan silang, dan standarisasi,
untuk selanjutnya bisa dicari dengan
mudah.

Istilah Biologi

Biologi molekular
Sel
DNA
RNA
Gen
Molekul
Protein
Genom

Biologi molekular
Merupakan salah satu cabang biologi
yang merujuk kepada pengkajian
mengenai kehidupan pada skala molekul.
Ini termasuk penyelidikan tentang
interaksi molekul dalam benda hidup dan
kesannya, terutama tentang interaksi
berbagai sistem dalam sel, termasuk
interaksi DNA, RNA, dan sintesis protein,
dan bagaimana interaksi tersebut diatur.

DNA
Asam deoksiribonukleat, lebih dikenal dengan DNA (
bahasa Inggris: deoxyribonucleic acid), adalah sejenis
asam nukleat yang tergolong biomolekul utama
penyusun berat kering setiap organisme.
Di dalam sel, DNA umumnya terletak di dalam inti sel.
Secara garis besar, peran DNA di dalam sebuah sel
adalah sebagai materi genetik; artinya, DNA menyimpan
cetak biru bagi segala aktivitas sel.
Ini berlaku umum bagi setiap organisme.
Di antara perkecualian yang menonjol adalah beberapa
jenis virus (dan virus tidak termasuk organisme) seperti
HIV (Human Immunodeficiency Virus).

RNA
Asam ribonukleat (
bahasa Inggris:ribonucleic acid,
RNA) senyawa yang
merupakan bahan genetik dan
memainkan peran utama
dalam ekspresi genetik. Dalam
dogma pokok (central dogma)
genetika molekular, RNA
menjadi perantara antara
informasi yang dibawa DNA
dan ekspresi fenotipik yang
diwujudkan dalam bentuk
protein.

Gen
Gen adalah unit pewarisan sifat bagi organisme hidup.
Bentuk fisiknya adalah urutan DNA yang menyandi suatu
protein, polipeptida, atau seuntai RNA yang memiliki
fungsi bagi organisme yang memilikinya.
Gen adalah bagian DNA yang bertugas untuk menentukan
kapan, dimana, seberapa banyak suatu protein diproduksi.
Kelainan yang terjadi pada gen, akan menyebabkan
ketidaknormalan pada fungsi protein, dan pada gilirannya
berkaitan erat dengan mekanisme timbulnya penyakit
pada seseorang.
Karena itu analisa ekspresi gen ini merupakan informasi
penting untuk mengetahui mekanisme timbulnya suatu
penyakit, dan mendesain terapi medis yang tepat bagi
seorang pasien

Gen

Protein

Protein adalah senyawa organik kompleks berbobot molekul tinggi yang


merupakan polimer dari monomer-monomer asam amino yang dihubungkan
satu sama lain dengan ikatan peptida.
Molekul protein mengandung karbon, hidrogen, oksigen, nitrogen dan
kadang kala sulfur serta fosfor.
Protein berperan penting dalam struktur dan fungsi semua sel makhluk
hidup dan virus.
Kebanyakan protein merupakan enzim atau subunit enzim.
Jenis protein lain berperan dalam fungsi struktural atau mekanis, seperti
misalnya protein yang membentuk batang dan sendi sitoskeleton.
Protein terlibat dalam sistem kekebalan (imun) sebagai antibodi, sistem
kendali dalam bentuk hormon, sebagai komponen penyimpanan (dalam biji)
dan juga dalam transportasi hara.
Sebagai salah satu sumber gizi, protein berperan sebagai sumber
asam amino bagi organisme yang tidak mampu membentuk asam amino
tersebut (heterotrof).

Sintesis Protein
Sintesis protein adalah proses pencetakan
protein dalam sel.
Sifat enzim (protein) sebagai pengendali dan
penumbuh karakter makhluk hidup ditentukan
oleh jumlah jenis, dan urutan asam amino yang
menyusunnya.
Jenis dan urutan asam amino ditentukan oleh
ADN (Asam Dioksiribose Nukleat
Sintesis protein meliputi dua langkah, yaitu
transkripsi dan translasi.

Genom

Genom (Ing. genome), dalam genetika, adalah keseluruhan


bahan genetik yang membawa semua informasi pendukung
kehidupan pada suatu makhluk hidup, baik yang merupakan gen
atau bukan.
Pada semua makhluk hidup, genom mencakup semua informasi
genetik yang dibawa DNA, baik di inti sel (nukleus), mitokondria,
maupun plastida.
Virus tertentu memiliki genom dalam bentuk RNA.
Setiap spesies makhluk hidup memiliki paket genom yang berbedabeda, yang menjelaskan mengapa perkawinan silang antara dua
spesies sering menghasilkan keturunan yang mandul (steril).
Istilah ini diperkenalkan oleh Hans Winkler, seorang profesor dari
Universitas Hamburg, Jerman pada tahun 1920, sebagai singkatan (
portmanteau) dari gene dan chromosome.
Kajian yang mempelajari bahan genetik secara keseluruhan ini
dikenal sebagai genomika (genomics).

Pangkalan data
Pada dasarnya data-data gen yang sudah ada ini bisa
menekan banyaknya waktu dan biaya yang diperlukan
untuk menyelesaikan sebuah penelitian.
Sebagai contoh, untuk menciptakan obat untuk penyakit
tertentu, seorang peneliti bisa memulai dengan melihat
karakteristik dan fungsi gen yang sudah ada dalam data,
untuk kemudian dibandingkan dan diteliti lebih lanjut.
Daripada memulai dengan ribuan kemungkinan yang
ada, akan lebih menghemat waktu dan biaya bila peneliti
memulai dengan yang memiliki kemungkinan berhasil
paling tinggi.

Pangkalan data primer

Pangkalan data primer untuk sekuens asam nukleat saat ini adalah
GenBank (Amerika Serikat),
EMBL (the European Molecular Biology Laboratory, Eropa), dan
DDBJ (DNA Data Bank of Japan, Jepang).

Ketiga pangkalan data tersebut bekerja sama dan bertukar data secara
harian untuk menjaga keluasan cakupan masing-masing pangkalan data.
Sumber utama data sekuens asam nukleat adalah submisi (pengumpulan)
langsung dari
peneliti individual,
proyek sekuensing genom, dan
pendaftaran paten.

Selain berisi sekuens asam nukleat, entri dalam pangkalan data sekuens
asam nukleat pada umumnya mengandung informasi tentang
jenis asam nukleat (DNA atau RNA),
nama organisme sumber asam nukleat tersebut, dan
segala sesuatu yang berkaitan dengan sekuens asam nukleat tersebut.

Selain asam nukleat, beberapa contoh pangkalan data


penting yang menyimpan sekuens primer protein adalah
PIR (Protein Information Resource, Amerika Serikat),
Swiss-Prot (Eropa), dan TrEMBL (Eropa).
Ketiga pangkalan data tersebut telah digabungkan
dalam UniProt, yang didanai terutama oleh Amerika
Serikat.
Entri dalam UniProt mengandung informasi tentang
sekuens protein, nama organisme sumber protein,
pustaka yang berkaitan, dan komentar yang pada
umumnya berisi penjelasan mengenai fungsi protein
tersebut.

Pangkalan data primer: Genbank


Genbank, dioperasikan oleh NCBI (National Center for
Biotechnology Information) mengakomodasi semua
publikasi sequences of DNA, dengan annotations
(penjelasan atau catatan), yang secara konstan akan
selalu berkembang dan diperbaharui.
Penjelasan meliputi identifikasi suatu gen, produk gen
(jika diketahui), link informasi lain yang terkait dengan
sumber database lain.
NCBI berisi informasi dari sekuens DNA yang sama
dengan sekuens DNA dalam EMBL (European
Molecular Biology Laboratory) dan DDBJ (DNA Data
Bank of Japan)

Pangkalan data primer: OMIM


OMIM, (Online Mendelian Inheritance in
Manwoman), adalah insiklopedia gengen manusia dan penyakit genetik,
merupakan penghubung untuk entry gen
pada GenBank dan literatur ilmiah pada
PubMed, berisi informasi berbagai gen
manusia komplit dan paling baru.

Pangkalan data primer: PDB


PDB (Protein Data Bank) berisi semua
publisitas yang ada secara eksperimen
telah dideterminasi (oleh x-ray
crystallography dan NMR) sebagai model
structural proteins dan asam nukleat.
Tidak berisi model homologi atau tipe
model teoritis lainnya.

Pangkalan data primer: PubMed


Diskripsi pada Wikipedia sebagai suatu kebebasan
mengakses sititasi database MEDLINE dan abstrak
artikel riset biomedik.
Subjek utama adalah riset di bidang kedokteran, dan
PubMed juga mempublikasi bidang yang terkait dengan
bidang kedokteran, seperti kebidanan dan disipiin
kesehatan lainnya.
Hal ini secara menyeIuruh meliputi keilmuan yang
berhungan dengan ilmu seperti biokemia dan biologi sel.
Situs ini ditawarkan oleh the United States National
Library of Medicine di the National Institutes of Health
sebagai bagian dari the Entrez information retrieval
system.

Pangkalan data primer : UniProt


Knowledgebase
UniProt Knowledgebase (Swiss-Prot and TrEMBL),
dioperasikan oleh SIB (Swiss Institute of Bioinformatics)
dan EBI (European BioinformaticsInstitute), berisi
sebagian besar publikasi yang ada berupa sekuens
protein (bukan DNA atau RNA).
Sekuens dalam Swiss-Prot dijelaskan secara manual
dan menyediakan atau menghubungkan pengguna
dengan semua informasi publisitas yang berisi sekuens
tersebut.
Sequences pada TrEMBL dikoleksi dan dijabarkan
secara otomatis dari sekuens database, dan akan
membuat jalannya menuju Swiss-Prot, tetapi tidak hanya
setelah mereka secara manual menjabarkan Swiss-Prot
standards.

Situs Informasi database DNA,


RNA dan Protein

NCBI: www.ncbi.nlm.nih.gov
EMBL: www.ebi.ac.uk
DDBJ: www.ddbj.nig.ac.jp
SWISSPROT:www.expasy.ch/sprot/sprot_details.html
ENSEMBL: www.ensembl.org
Univeristy California Santa Cruz:
genome.cse.ucsc.edu
MGD the Jackson Lab:
www.informatics.jax.org

Tools Bioinformatika : BLAST


Perangkat bioinformatika yang berkaitan erat dengan
penggunaan pangkalan data sekuens Biologi ialah
BLAST (Basic Local Alignment Search Tool).
Penelusuran BLAST (BLAST search) pada pangkalan
data sekuens memungkinkan ilmuwan untuk mencari
sekuens baik asam nukleat maupun protein yang mirip
dengan sekuens tertentu yang dimilikinya.
Hal ini berguna misalnya untuk menemukan gen sejenis
pada beberapa organisme atau untuk memeriksa
keabsahan hasil sekuensing atau untuk memeriksa
fungsi gen hasil sekuensing.
Algoritma yang mendasari kerja BLAST adalah
penyejajaran sekuens.

Tools Bioinformatika : PDB


PDB (Protein Data Bank, Bank Data Protein)
ialah pangkalan data tunggal yang menyimpan
model struktur tiga dimensi protein dan asam
nukleat hasil penentuan eksperimental (dengan
kristalografi sinar-X, spektroskopi NMR, dan
mikroskopi elektron). PDB menyimpan data
struktur sebagai koordinat tiga dimensi yang
menggambarkan posisi atom-atom dalam
protein atau pun asam nukleat.

Peluang Bioinformatika
Masih banyak kendala dalam bioinformatika, di antaranya
adalah kesulitan untuk menemukan semua gen dari
organisme, mengidentifikasi dan menjelaskan tentang
gen-gen tersebut, kesulitan dalam membandingkan
kemiripan DNA/protein yang ada, dan seterusnya.
Namun semakin canggihnya komputer membuat
bioinformatika patut optimis.
Karena komputer hanya bisa membuat data dan mereka
tidak memberikan jawaban, dunia ini masih memerlukan
banyak orang yang mau dan mampu memberikan
jawaban atas persoalan biologis yang bermanfaat bagi
kehidupan di dunia.

Daftar Pustaka
bioinformatika-q.blogspot.com
http://www.unpad.ac.id
http://id.wikipedia.org