Anda di halaman 1dari 9

BIOINFORMATIKA

Human Genome Project


By Edwin Widodo

 Human genome project  diawali dari tahun 90an


 Sanger sequencing  sekuen DNA 1000 basa  bisa untuk memastikan sequencing dari PCR
 Klo mau mengakses database human genome  ensemble  basis eropa
o Klo amerika menggunakan NCBI
o UCSC genome  udah diupdate yg 2006 update ada splicing, yg 2013 ada isoform
o Klo isoform 1 itu yg terpanjang
 Klo yg ensamble kodenya bisa berbeda dengan yg diwebsite lain  disesuaikan dengan genome
browser yg digunakan
 Klo mau cari tahu protein  bisa pake uniprot
 Bisa diihat zoom in sampe ke tingkat asam nukleatnya
 Snp 
 Human genome project udah selesai  tapi informasi2 tabahan dan data2 akan terus diupdate
 Unipro gene ugene.net
 A

Genome - Edwin Widodo, S.si Msc, DR


 Secara total gen kita ada 3 miliar / 3 giga  yg berpern hanya 5 % (yg lain tidak diekspresikan
sebagai protein)
 Klo akan tereskpresi  ekson2 akan saling mendekat  intron melekung lalu splicing
dihilangkan
 Evolusi genome  kenapa terjadi perbedaan pada species  terutama terjadi mutasi secara
regular  mungkin juga polimorfisme  sepsies yg baru??  evolusi ini  missal anjing yg liar
udah mulai banyak vairasi2
 CpG 
 Indels  insersion and deletion  delesi  contoh  mirip trus menekuk trus hilang
o Cross link  DNA yg crpss  persialngan  urutannya jadi menyilang
o Recombination  ??
 Chromosom rearrangement  missal manusia dan tikus  kromosomnya banyak yang sama
 tapi posisinya berubah jauh
 Pada bakteri genomenya lebih sederhana
 Pada manusia lebih kompleks

SNPs dan haplotypes - Edwin Widodo, S.si Msc, DR


 Biasanya diucapkan snip
 Snp merupakan jawaban mengapa ada respon yang berbeda trhadap obat dari satu orang ke
orang lain
 Snp  perubahan 1 basa
o Terjadi mutasi pada proporsi signifikan pada populasi yang besar
 Klo terjaid pada bagian yg mengkode protein  bis menghasilkn protein yang berbeda
strukturnya
 Microarray
 Significancy of snp  bisa untuk diagnosis penyakit
o Mencari predisposisi penyakit -penemuan dan perkembangan obat baru
o Melihat respon obat
o investigasi pola migrasi manusia (apakah manusia di barat sama ditimur sama atau
tidak snp nya  dari situ bisa tau pola migrasi)
 screening snp pada beberapa individu
 haplotipe  beberapa snp yang sama terjadi pada daerah yang berdekatan dan berada pada 1
kromosom yg sama, diturunkan secara bersama2  tidak mudah mengalami perubahan?
 Haplotipe  contoh untuk warna mata  beda snp diposisi yg berdekatan fenotip warna
matanya bisa berubah
 Keuntungan sering terjadi
o Tingkat mutasinya rendah  tidak mudah hilang pada generasi berikutnya
o Bisa menjadi genetik marker thp suatu generasi?
 Yg paling utama database nya ada pada NCBI

ENCODE Edwin Widodo, S.si Msc, DR


 ENCODE  Ensiklopedia DNA element?  kelanjutan genome project
 Fase pengembangan ENCODE  optimasi identifikasi --> lalu mencari teknologinya
 Projek bersama dari beberapa institusi  di amerika
 Untuk menentukan dan mengidentifikasi elemen DNA seperti promotor, enhancer, reprosor,
transcription factor binding sites
 Banyak aplikasi2 yg mulai dikembangkan  dipublikasikan di jurnal BIOINFORMATICS
 Aa
PrimerDesign - Edwin Widodo, S.si Msc, DR
 Pembukaan
o Genecard.org; Ugene
o Bisa melihat kekerabatan antar spesies
o Untuk melihat protein 3d  dimasukkan data dari protein data bank
 Primer buat nempel pada gen yg diinginkan baru annealing ekstensi sesuai pasangannya
 Primer  fragmen kecil dari target gen  biasanya sekitar 20 basa  diawal dan diakhir
 Klo kita mendesain suatu primer  dicek dengan blast  klo hanya 1 bagian gen  maka
spesifik  tapi klo mengenali banyak  sebaiknya dihindari
 Next generation sequencing  mengamplifikasi semua genome  juga menggunakan primer
 juga 20 basa  dikombinasi  sehingga semua bisa tertempel dan teramplifikasi
 Sebelum memulai desain primer  harus tau tujuannya
o Untuk PCR? Jenis apa? Real-time?  bisa dilihat peningkatan floresennya
o Degenerate?
o Next generation sequencing?
o SNP?  mutasi satu titik  SNP harus ada didalam primer tersebut (jadi didalam
sekuen primer itu diperkirakan ada SNP nya  lalu diberikan 2 primer (1 primer normal
dan 1 primer yg diperkirakan mutasi)  klo benar ada SNP  yg normal ga nempel yg
mutasi nempel sehingga saat PCR yg normal band nya ga keluar
o Metilasi?  nempel di sekitar 4 basa  gen tidak terekspresi  untuk mendeteksi
diabagian mana ada metilasi
o Microarray?
 Klo mencari gen yg teraktivasi / mRNA  berarti ada di ekson
 Untuk desain primer  tidak perlu hitung2 (udah ada softwarenya)  tapi software itu
tergantung yg membuat  dilihat kriteria
 Missal udah selesai bikin primernya  konsul (consider second opinion)
 Panjang primer jangn terlalu pendek atau panjang  klo terlalu pendek ga spesifik  klo
terlalu panjang primernya belum selesai nempel bisa 2 udah lanjut ke siklus berikutnya 
panjang normal 18-24  tapi optimumnya 20 basa
 Ada perhitungan untuk suhu  ga perlu dipikirkan  ada softwarenya  ga usah dihitung
 Jangan sampai primernya sekuennya mirip diawal sama akhir  bisa nempel dengan diri sendiri
atau nempel dengan primer lain  harus diperhatikan betul sekuennya
 Website untuk mendesain primer 
o software Primer3  paling mudah dipakai dan produk dari NCBI
o NCBI blast  apakah dia spesifik dengan human genome  udah digabung dengna
Primer3
o In-silico PCR  merupakan database komputer  kira2 klo forward primernya seperti
ini, reverse primernya seperti ini  nanti bisa terdeteksi dibagian mana saja
 Klo masukkan bisa nomer bisa sekuennya langsung  klo nomer biasanya ada tulisannya NM
 dimasukkan nomer urutannya  digoogling primer blast  trus diatur dari situ
 Beberapa parameter yg digunakan untuk mendesain parameter 
 Jumlah G/C pada konten primer harus mengandung 50%an (45-55%) karena ikatannya 3 
ikatannya lebih kuat  primer lebih mudah nempel ke gen
 Pengulangan yg banyak dalam priemr
 Hindari hairpin, self dimer (dua primer yg sama saling menempel), cross dimer (primer awal dan
akhir mirip  saling temple)
 Untuk meningkatkan penempelan primer  GC clamp  Gdan C di awal dan akhir primer 
pada 4 basa terakhir diharapkan ada G dan C

Next Gen Sequencing- Edwin Widodo, S.si Msc, DR


 Klo dulu namanya parallel sequencing
 Klo sekarang  massive parallel sequencing (MPS)  2 hari selesai sekuencing seluruh genom

High performance metagenomics annotation - Edwin Widodo, S.si Msc, DR


 Metagenomic -> sampel dari lingkungan  awalnya tidak diketahui  dilihat ada berapa
organism  disequencing semua baru dilihat
 Semua yg ada disitu  missal air danau  langsung di shot gun (dipecah)  langusng
disequencing semua  lalu diurutkn  ada beberapa kelompok bisa dari organisme yg
berbeda  tidak semua sampel diketahui
 TANPA PERLU MEMISAHKAN BERDASARKAN ORGANISME  langsung sequencing  klo next
gen kan sudah jelas berasal dari 1 organisme (manusia)?
 Missal  air dari laut Sargasso??  1,6 miliar pasang basa  ternyata terdiri dari lebih dari
1800 spesies genome
 Agar tidak ada spesies satu dengan lain yg overlapping  ada minimal overlap yg dibutuhkan
untuk memastikan bahwa yg overlap ini benar2 dari 1 spesies
 Blast menggunakan sistem pelabelan  annotation  hasilnya bisa cepat (seperti google)

 A

DNA barcoding - Edwin Widodo, S.si Msc, DR


 Mengguanakn marker genetik pendek untuk mengidentifikasi spesies pada DNA  seperti
disupermarket  1 barcode 1 barang  ini ada potongan genetik yg spesifik untuk satu
spesies
 Miss banyak 

Multiple Alignment – Edwin Widodo, S.si Msc, DR


 Untuk menentukan tingkat kekerabatan
 Berasal dari 2 sekuen yg berbeda  skornya dilihat
 >2 sekuen
 Database scanning  fasta, blast
 Semakin mirip, semakin dekat  semakin tinggi
 Score  berdasarkan alogritma  Gap, bestfit (dipilih 1 yg paling sesuai) , similarity
o Dilihat secara general (dari keseluruhan ada yg mirip nggak)
o Dilihat secara lokal  pada bagian2 tertentu dilihat kesesuaiannya
 Algoritme ini tidak perlu dipelajar  yg penting tau dibalik layar gimana bekerjanya

Pak widodo
 Cara mendesain primer:
o Buka NCBI
o Pada seach ganti all database dengan Gene
o Ketik gen yg diinginkan
o Pilih gen yg homo sapiens
o
 Primer of Return  berapa banyak primer yg dimasukkan ke PCR
 Exon junction space  kita mau exon aja atau ada intronnya juga
 Sequence scanner  klo N  ga kebaca
o Warna merah dan kuning  ga yakin
o Yg biru aja yg bisa dipake buat analisis
o C
 Mau melihat snp
o Masuk bioedit
o New alignment
o File Import  sequence alignment  pilih keempat file contoh pasien
o Seharusnya dicek setiap pasien warna birunya yg mana
o Saat mau dipotong bagian N atau yg tidak mau diinginkan  diblok bagian tersebut 
pilih mode  edit  lalu tekan delete
o Pilih accessory application  CAP config  langsung run application saja
o Klo ada tulisan show  press enter  lalu muncul alignment yf sudah disejajarkan 
nah dari sini muncul bagian yg sudah diurutkan
o Config 0 artinya  basa yg memiliki keseragaman  ada berapa kemiripan  ga perlu
dipake  bisa dihapus  klik kanan pada nama config 0  delete sequence
 Untuk tau SNP nya ini pada exon ini akan mempengaruhi bentukan asam aminonya atau tidak,
maka bisa pake langkah dibawah ini
o File  graphic view
o Residu per row  untuk mengatur berapa basa dalam 1 baris untuk kerapihan saat
disave ke word
o 3 letter translation / 1 letter trasnlation  langsung muncul asam aminonya
o Dari sini bisa tau SNP nya bisa merubah asam amino atau tidak
o Kita bisa atur start kodonnya start codon allowed
o Klo mau disave  file  export as rich text  pilih rtf
o Pas dibuka di word jadinya kacau / jelek  berarti residu per row nya kepanjangan 
dikurangi mungkin 60 aja
 Untuk tau apakah yg kita punya itu merupakan gen target primer yg diinginkan
o Blast  menyamakan data yg kita miliki dengan database
o Buka NCBI  BLAST  nucleotide blast
o Pada bioedit  double click pada nama sequence (dilihat 1 -1 gabisa  di blok
sequennya  copy
o Buka lagi di blast  paste
o Organism  pilih homo sapiens (sesuai dgn yg dipilih)
o Pilih high similar similiar
o Click blast
o Ditunggu lalu akan muncul hasilnya
o Dilihat identical 99%  klo diklik akan muncul sekuennya
o Query adalah data dari database, subject adalah data yg kita masukkan  karena 99%
biasanya ada 1 yg beda
 Swiss model untuk cek strukturnya
o Untuk membuat model  butuh sekuen asam amino  diambil dari gene bank
o Buka NCBI  pilih protein  pilih protein yg diinginkan (missal ACE)
o Pada panel kanan pilih homo sapiens
o Pilih ace protein
o Pilih fasta
o Copy sebagian aja (biar ga lama loadingnya)
o Paste di word
o
o Homologi modeling  memodel berdasarkan sequen homolognya  jadi sequennya
itu dilihat mirip dengan struktur apa yg sudah ada  swiss modeling menggunakan
metode ini
o Search for template  kita cari model template yg paling mirip
o
o Ada 2 score dihasil  score 0-1  mendekati 1 semakin baik  biasanya yg ditampilin
pertama yg paling bagus
o Hasilnya bisa disimpan dengan PDB file
o Tapi hasilnya kan sulit dipahami  dibuka pake software pymol
o Tapi klo pdb file kita tidak bisa melihat score dan template gambarnya  maka lebih
baik didownload semua aja (ada icon download di atas)
o Kita punya 2 simpanan (wild type  yg asli
 Pymol
o Klo S  show  as  pilih cartoon
o Di show 2-2nya
o Klo tidak menyatu bisa di alignment
 Pada pymol yg bagian satunya pilih align (spasi) (nama file dengan tepat),
(nama file satunya)
o Cara menampilkan sequen  bagian bawah ada S  bisa di klik di bagian tertentu
untuk menampilkan sekuennya
o Pake pymol juga bisa untuk menghapus sekuen  blok sekuen  klik kanan  action
 delete atom
 Pertemuan berikutnya  docking 

Docking
 Docking 
 Swissdock  protein dengan molekul kecil
 Buka website swissdock.ch/docking
o Pertama harus punya desain struktur molekul  PDB (pdb ini ada bentukan
strukturnya)  setiap struktur 3d protein ada IDnya  id nya nanti ini dipake atau
diupload terserah  klo di PDB ga ada upload aja
o Kode pDB bisa dibuka pada RSCB
o Dimasukkan  nanti harus ada successfully setup
o Lalu dimasukkn ligannya  bisa dimasukkan IDnya databasenya dari zinc database 
nanti ada gambar struktur (klo javanya update)  klo dicentang kodenya  nanti
diatas kanan  dock 1 ligand  nanti kembali ke swissdock ada tulisan successful
setup
 Zinc database  bisa melakukan mencari prediksi molekul  selalu ada id nya

o Lalu masuk deskripsion  nama dan email  lalu start docking
o Nanti cepat lambatnya bergantung orang yg akses –> krn dipake orang sedunia  bisa
lama hasilnya  bisa overnight  nanti dikirim ke email  nanti muncul kuisioner 
diskip aja pilih here kotak merah  nanti ada situsnya disiman aja  berlaku selama
seminggu
o Nanti hasilnya dalam bentuk PDB  interaksinya bisa dilihat dnegan pymol
 BUKA HEX
o Open reseptor  cari file pdb
o Open ligand
o Nanti ada jarak
o Control  molecule  show hydrogen  dismiss
o Control  docking  nanti ada submenu2nya
 Grid dimention  dilihat interaksinya sebanyak x amstrong?
 ligand range  diputar 180 derajat ligandnya untuk melihat dimana lokasi
optimum perlekatannya
 distance range  awalnya jaraknya 40 amstrong kemudian didekatkan2
 translation stepnya  dari 40 didekatkan tiap 0.8
 klo dibiarkan default adalah jumlah yg optimum
 lalu klik activate
 nanti tunggu 5-10 menitan
 nanti munculnya di hex message
o klo mau simpan yg bagus  save both -> kasih nama
o buka pymol
o ganti cartoon
o klik S untuk sequence
o cari 0000 yg menunjukkan hydrogen berarti ikatan antara 1 protein denga yg lain
o blok sekuen setelah 0000 hingga akhir  klik kanan  action  change color  ganti
warna lain
 unttuk melihat pathway  NCBI  Biosystem  ditulis diabetes misalnya
o nanti ada banyak sekali pathway
 String DB untuk interaction protein
o Klo kita ingin tau protei tertentu berinteraksi dengan apa saja trus ingin tau
pathwaynya
o Bisa memasukkan ribuan prtein secara bersama2
o Misalnya kita punya 10 molekul dengan 2molekul dilihat interaksinya
o Saat keluar bisa dilihat interaksinya
o Klo dipilih analisis  bisa dilihat pathwaynya
 Nanti salah satu pathway diklik nanti dimolekul yg berubah warna menjadi
merah yang terlibat di pathway tersebut
 kita bisa mencocokkan fungsi dengan pathwaynya  jadi yg GO itu nanti
o klo kita ingin tau salah satu protein tersebut berinteraksi dengan apa saja  kita pilih
data setting  kita atur lagi max number iteraction to show
o klo ingin tau maksud garis dan warna  pilih legend
 Buka liplot
o protein dengan molekul  liplot, protein dengan protein  diplot
o nanti bisa tau ikatan hidrogennya dan ikatan lainnya dalam bentuk 2 dimensi
o bisa lihat 3 dimensi dengan pymol tapi
 untuk small molekul biasanya memakai aplikasi autodock, tapi untuk protein2 bisa pakai hex
 Contoh studi kasus Mencari screening ACE inhibitor dari senyawa aktif dari bahan makanan
 missal dari kunyit gingerol dsb  mana diantara ketiga bahan ini bisa menggantikan
captopril sebagai ace inhibitor
o Bisa dengan swiss dock, bisa dengan Hex, atau pyrex
o Download Pyrex
o Download contohnya di website pak widodo  science.lecture.ub.ac.id
o Buka pyrex  kiri bawah ada wina wizard (wina lebih terupdate  tapi sama2 autodoc)
 klik vina wizard  start  lalu kita diminta seleksi ligan  pilih add ligand  kita
masukkan file contoh ada 4 ligan (3 herbal dan 1 captopril)  buka ligan 1 , lalu buka
ligan 2, 3, sampai 4  kemudian masukkan macromolekulnya ACE  Yg besar ACE, yg
kecil2 ligan
o Lalu pilih keempat2nya, lalu pilihACE  forward
o Sekarang docking ACE dengan ligan  setelah kita masukkan forward  kotak itu
menunjukkan grade untuk daerah site Activenya  klo ga tau dimana site activenya 
kotaknya dibesarkan  klo sudah ditentukan site activenya  forward  tunggu 
o Biasanya 1 molekul 1 menit
o Setelah itu akan muncul posisinya dan binding affinitynya 
o Intinya dalam menganalisa  dilihat positioningnya sama atau tidak; klo positioningnya
sama dengan kontrol (captopril)  maka bisa digunakan)  klo posisinya beda maka
tidak berarti
o Setelah itu dilihat binding affinitynya  klo kita mau melihat angkanya pilih yg rscbnya
yg 00 (klo ga salah)
 Epitope mapping
o Buka NCBI  protein  ketik S HBV  dipilih yg kita inginkan  kita ambil fasta nya 
klik fasta nah kita punya sekuennya
o Lalu kita prediksi epitopenya  untuk melihat antigenesitasnya juga dan epitopenya
bisa diprediksi apakah di B cell atau Tcell
o Software prediksi yg paling mudah dan bagus  eidb.org  analysis epitope b cell
o Pilih Bcell tools  klo continous (linier) untuk prediksi berdasarkan sekuen; klo
discontinuous (discotope)  berdasarkan strukturenya
o Baphipred untuk prediksi epitope, kolaskar untuk prediksi antigenisitas
o Klo sulit  pilih yg epitopenya tinggi
o Pada baphipred  predicted  pilih sequence yg paling panjang  copy
o Untuk tau bahwa epitope ini agar tidak mirip dengan protein lain dalam tubuh  pake
blast
o Buka ncbi  pilih blast  pilih human  pilih blastP untuk protein  paste sequence
epitopenya  submit  nanti keluar hasilnya

Anda mungkin juga menyukai