Anda di halaman 1dari 63

Bioinformatika

Monica Dwi Hartanti

MATERI
Latar Belakang Konsep Dasar Biologi Molekuler Teknik Bioinformatika Area Bioinformatika Aplikasi Teknologi Terkait Komputer

Latar Belakang

2000
Peristiwa besar terjadi merubah sejarah manusia Kerjasama Ingris dan Amerika Pertandingan siapa yang pertama menyelesaikan GENOM MANUSIA HUMAN GENOME PROJECT

MASA DEPAN......
Sebuah virus menimbulkan epidemik Ahli genetik dan bioinformatika bekerja Materi genetik virus dibandingkan dengan data dasar materi genetik virus lain yang telah ada

Karakteristik virus lain telah diketahui


Dari program materi genetik komputer akan muncul protein yang dibutuhkan virus untuk bertahan hidup

Ketika protein (sikuens dan struktur) diketahui, terapi /


obat obatan dirancang

Definisi
Gabungan ilmu komputer dan biologi molekuler
Algoritma dan teknik ilmu komputer digunakan untuk menyelesaikan masalah bidang biologi molekuler

Teknologi informasi digunakan pada manajemen

dan analisis data biologi


Penyimpanan dan Analisis dua fungsi terpenting ahli bioinformatika membuat alat

Bioinformatics
7

Definisi
Masa sekarang : masa Teknologi Informasi Penyimpanan data bukan hal baru Informasi sebanyak kamus Dorlan tersimpan dalam setiap sel Bioinformatika mencoba menentukan info mana yang penting secara biologi

Konsep Dasar Biologi Molekuler

DNA dan Gen


DNA : tempat menyimpanan informasi genetik Penampilan manusia diturunkan oleh DNA Gen Unit dasar penurunan sifat
Terdapat gen untuk karakteristik (gen untuk rambut, dll)

Gen berisi informasi berupa sikuens nukleotida Gen : konsep abstrak Gen terbuat dari nukleotida
10

11

Nucleotida (nt)
Setiap nt : Gula pentosa Fosfat

Basa
Basa nt : membedakan satu nt dengan yang lain Ada4 macam basa G(uanine),A(denine),T(hymine),C(ytosine) Informasi : urutan nukleotida Gen dapat tersusun atas beribu-ribu nt Set lengkap instruksi genetik : genom
12

Kromosom
Pita DNA : kromosom Analogi
Huruf nt Kalimat gen Tiap volume kamus/ ensiklopedia - kromosom Seluruh volume Genom

13

Untai Ganda
DNA : untai ganda Setiap pita memiliki informasi komplementer Setiap basa tertentu pada satu pita berikatan dengan basa tertentu lain pada pita yang lain

G-C
A-T Misal :

AATGC
TTACG

satu pita
satu pita
14

Protein
Protein sangat penting pda kehidupan
Asam amino menyusun protein 20 macam asam amino Fungsi protein tergantung pada urutan asam amino

15

Protein
Informasi dibutuhkan untuk membuat asam amino yang disimpan dalam DNA Sikuens DNA menentukan sikuens asam amino Sikuens asam amino menentukan struktur protein Struktur protein menentukan fungsi protein RNA digunakan untuk membawa informasi yang terdapat dalam DNA protein Penyimpanan DNA Transfer informasi RNA RNA : tukang pos!

16

Dogma Sentral

DNA transcription

RNA

Translation Protein
Ribosomes

RNA Polymerase

M.Alroy Mascrenghe

17

M.Alroy Mascrenghe

18

Protein..
Karena ada 20 asam amino : satu nt tidak dapat terdiri dari 1 atau 2 aa 3 kode kodon informasi protein Kodon yang tidak berhubungan dengan protein : kodon stop UAA, UAG, UGA
: U bukan T)

(RNA

Beberapa kodon : kodon awal AUG : metionin

M.Alroy Mascrenghe

19

Struktur Protein
Menunjukkan beragam bentuk : kebalikan dengan struktur DNA uniform X-ray crystallography atau Nuclear Magnetic Resonance (NMR) digunkan untuk mengetahui struktur Struktur terkait fungsi : struktur menentukan fungsi Walaupun protein dibuat sebagai struktur linier rantai aa, mereka melipat menjadi struktur 3 D Jika dibentangkan dan ditinggalkan kembali pada struktur awal (naturalisasi struktur protein) Hanya dalam struktur natural : protein berfungsi baik Bahkan setelah translasi selesai, struktur protein mengalami perubahan

20

Ekspresi Gen
Proses transkripsi DNA dan translasi RNA untuk membuat protein Dimana gen mulai pada kromosom? Bagaimana RNA mengidentifikasi awal gen untuk

membuat protein
Nt tunggal tidak bisa : sering muncul Kombinasi tertentu nt bisa

Sikuens promoter urutan nt : tanda awal dari gen

21

Teknik Bioinformatika

22

Prediksi dan Pengenalan Bentuk / Pola


Dua area utama : Pengenalan Pola
Sikuens atau struktur tertentu telah diketahui sebelumnya dan merupakan karakteristik tertentu dapat berhubungan dengannya

Prediksi
Dari sikuens (tahu) prediksi struktur dan fungsi (belum tahu)
23

Dot plots.
Cara mudah evaluasi kesamaan antar dua sikuens Grafik : satu sikuens di satu sisi, sikuens lain di sisi lainnya COCOK : tandai

24

M.Alroy Mascrenghe

25

Alignments
Kecocokan antara karakter dua / lebih sikuens Misal :
TTACTATA TAGATA

Banyak cara untuk meratakan 2 sikuens tersebut


1.
TTACTATA TAGATA

2.
TTACTATA TAGATA

3.
TTACTATA TAGATA

Pilih yang mana dan berdasarkan apa? Solusi : nilai cocok dan nilai tidak cocok

26

Alignments

27

Gap
Memakai gap dan nilai pinalti untuk gap Tidak semua gap jelek
TTGCAATCT CAA Bagaimana meratakan? ---CAA--Tidak signifikan

28

Matriks Nilai
Untuk perataan sikuens DNA/protein : matriks Jika A dan A : nilai 1 Jika A dan T : nilai -5 Jika A dan C : nilai -1

29

Dynamic Programming
Panjang sikuens bertambah dan perbedaan panjang antara dua sikuens juga bertambah lebih banyak gap yang harus dimasukkan dalam beragam posisi Tidak mungkin melakukan pencarian Ledakan kombinasi muncul terlalu banyak kombinasi yang perlu dicari Dynamic programming : cara menggunakan formulasi spekulasi untuk mencari pola yang paling menentukan

30

Database
Informasi sikuens disimpan dalam database Dapat dimanipulasi dengan mudah db terletak pada tempat yang berbeda Saling bertukar informasi setiap hari : up-to-date dan sinkron Db utama data sikuens
M.Alroy Mascrenghe 31

DB Primer Utama
Nucleic Acid EMBL (Europe) Protein PIR Protein Information Resource MIPS

GenBank (USA)

DDBJ (Japan)

SWISS-PROT University of Geneva, now with EBI TrEMBL A supplement to SWISSPROT NRL-3D

EMBL

Composite DB
Banyak db mana yang dipakai? Kelebihan dan kekurangan Composite db beberapa db sebagai database Pencarian diindex dan lebih efisien sikuens yang sama tidak dicari dua kali pada db yang berbeda

34

Composite DB
OWL memiliki db primer mereka SWISS PROT (prioritas atas) PIR GenBank NRL-3D

35

DB Sekunder
Menyimpan informasi struktur sekunder atau hasil pencarian db primer Compo DB Primary Source

PROSITE PRINTS

SWISS-PROT OWL

36

Pencarian Database
Gen telah disikuens dan diidentifikasi. Diketahui apa yang mereka lakukan Sikuens disimpan pada database Jika menemukan gen baru pada genom manusia, dibandingkan dengan gen yang telah ditemukan (tersimpan pada database) Karena ada banyak databas, tidak dapat dilakukan perataan sikuens untuk setiap sikuens Formulasi spekulasi harus digunakan lagi

37

Area dalam Bioinformatika

M.Alroy Mascrenghe

38

Genomik
Struktur multiseluler setiap tipe sel mengekspresikan gen dengan jalan yang berbeda walaupun setiap sel memiliki genetik yang sama Misal : semua informasi untuk sel hepar untuk menjadi sel hepar juga ada pada sel hidung hanya ekspresi gen yang berdeferensiasi

39

Genomik Menemukan Gen


Gen pada data sikuens jarum dalam tumpukan jerami Jarum berbeda dengan tumpukan jerami tidak berbeda dengan seluruh data sikuens Apakah seluruh data nt yang harus ditemukan dan menandai sebuah set nt sebagai gen ? Satu tantangan bidang bioinformatika

40

Organism

Genome Size (Mb)


bp * 1,000,000

Gene Number

Web Site

Yeast

13.5

6,241

Fruit Flies
Homo Sapiens

180
3,000

13,601
45,000

http://genomewww.stanford.edu /Saccharomyces http://flybase.bio. indiana.edu http://www.ncbi.n lm.nih.gov/genom e/guide

Proteomik
Proteome : jumalh total protein organisme Lebih sulit daripada genomik
4 20 Terbuat dari kemikal sederhana kompleks Dapat duplikasi tidak dapat

Memasuki post era genom Artinya : banyak yang telah dilakukan pada Gen

42

Proteomik..
Hubungan antara RNA dan protein yang dikodenya biasanya sangat berbeda Setelah translasi, protein berubah

Sikuens aa tidak memberikan informasi tentang perubahan post


translasi Protein tidak aktif sampai mereka dikombinasikan menjadi kompleks yang lebih besar atau berpindah pada lokasi tertentu di dalam atau di luar sel Aa hanya petunjuk untuk hal tersebut Protein harus dipelihara lebih hati hati di lab ----- cenderung berubah saat bersentuhan dengan material yang tidak sesuai
43

Prediksi Struktur Protein


Tantangan terbesar bioinformatika, terutama biokimia Tidak ada algoritma yang secara konsisten memprediksi struktur protein

44

Metode Prediksi Struktur


Comparative Modeling
Struktur protein target dibandingkan dengan protein yang berhubungan Protein dengan sikuens yang sma dicari strukturnya

45

Phylogenetics
Sistem taksonomi mencerminkan hubungan evolusi Pohon phylogenetics : sistem yang mencerminkan hubungan evolusi melalui gambar / grafik Pohon yang berakar tempat satu satunya nenek moyang Pohon yang tidak berakar menunjukkan hubungan Rekonstruksi algoritma pohon phylogenetic area penelitian

46

Phylogenetics

47

Aplikasi.

48

Implikasi Medis
Farmakogenomik Tidak semua obat bekerja pada pasien, beberapa menimbulkan kematian Analisis gen sebelum terapi obat tersebut dapat dihindari Obat yang paling sering menimbulkan kematian penggunaan minimal untuk orang dengan gen yang paling cocok (sukarela) Terapi Gen Menggantikan atau menyediakan gen yang defek atau yang hilang Misal : Insulin dan Faktor VII atau Hemofilia

Senjata Biologis (?????)

49

Diagnosis Penyakit
Diagnosis penyakit Identifikasi gen yang menyebabkan penyakit dapat membantu mendeteksi dini penyakit Huntington disease Gejala gerakan seperti menari yang tidak terkontrol, gangguan mental, perubahan personaliti dan kegagalan intelektual Kematian pada 10-15 tahun Gen diidentifikasikan Berisi CAG berulang yang berlebihan Terdeteksi : pasangan dapat dikonseling

50

Desain Obat
Dapat mencapai 15 tahun dan $700 juta Satu tujuan bioinformatika : mengurangi waktu dan biaya Proses
Penemuan
Metode Komputer dapat memperbaiki hal tersebut

Percobaan

51

Penemuan
Identifikasi Target

Identifikasi molekul yang dibutuhkan oleh kuman untuk bertahn hidup Ciptakan molekul lain (obat) yang akan berikatan dengan target Kuman tidak dapat berinteraksi dengan target Biasanya protein

52

Penemuan...
Misal : HIV memproduksi HIV protease protein yang akan memakan protein lain HIV protease memiliki situs aktif yang berikatan dengan molekul lain Obat HIV akan berikatan pada situs aktif tersebut
Teori gampang, praktek ????

53

Penemuan
Lead compounds : molekul yang berikatan dengan situs aktif protein Biasanya metode trial and error Saat ini : dipindahkan dalam komputer

54

Teknologi Terkait Komputer.

55

PERL
Perl kalkulasi bioinformatika mampu memanipulasi simbol karakter Default : bahasa CGI Awal : bahasa draft berkembang menjadi bahasa lengkap IT adalah segalanya, bahkan ada web service support http://bio.perl.org

56

PERL

57

Tempat XML & Web Services


Beragam bahasa penanda telah diciptakan Gene Markup language, dsb untuk mempresentasikan sikuens / data gen Web Services program untuk interaksi program, membuat pusat aplikasi web Jadi memiliki landasan bahasa tersendiri yang independen Protokol seperti SOAP membantu Bioinformatika : beragam database digunakan, landasan yang berbeda, bahasa yang berbeda, dsb Jadi, web services membantu mencapai kemandirian landasan dan interaksi program Sikuens database ada dalam beragam format, landasan SOAP juga membantu menyamakan

58

GRID GRID metode baru Menggunakan banyak komputer untuk memenuhi tugas - tugas komputasi tunggal Bioinformatika landasan ideal berhubungan dengan sejumlah besar data pada perataan dan pencarian E-science dibuat di Inggris ORACLE 10g database GRID pertama

59

Data base dan Mining


Banyak sikuens database dipublikasi DB menyangkut beragam data, teknik mining digunakan untuk mengambil data Banyak literatur artikel dsb pada area ini, data mining pada literatur tidak pada data sikuens ----Topik Disertasi

60

European Molecular Biology Network (EMBnet)


Sistem sentral untuk berbagi, training, dan sentralisasi up to date bio info Beberapa situsEMBnet sites : SQENET
http://www.seqnet.dl.ac.uk

UCL
http://www.biochem.ucl.ac.uk/bsm/dbbrowser/embnet/

EBI European Bioinformatics Institute


www.ebi.ac.uk

61

Kesimpulan

Terima Kasih

63