Anda di halaman 1dari 57

Pengantar Bioinformatika

Sejarah singkat

Tahun 1960-an Æ molecular evolution


J Theoretical Biology 1965
Molecules as documents of evolutionary biology
Zukerkandl E, Pauling L
Atlas of Protein Sequences (1965)
Margareth Dayhoff
Tahun 1970-an Æ computational biology
Needleman-Wunsch global alignment
Tahun 1990-an Æ bioinformatics
NCBI (NLM/NIH) (1988)
Human Genome Project (1990)
dst
Bioinformatika / Biologi (Molekuler) Komputasi

Biologi molekuler + Computational Science + Teknologi Informasi


matematika,statistik,ilkom, dll
• Data
• Metode
• Problema
• Algoritma
• Hypothesis • Tools / software
• Teori • Database
• Konektivitas/Internet

• Interpretasi • Analisis
• Verifikasi • Modeling
• Biological “insight” • Simulasi
• Visualisasi
Bioinformatics ≠ Medical Informatics

• Bioinformatika Æ penerapan ilmu komputasi & informatika untuk


memahami mekanisme/cara kerja mahluk hidup pada tingkat
molekuler
Contoh:
– mencari gen yang berperan dalam suatu penyakit
– mencari protein penyebab patogenesis
– mencari dan mendesain obat

• Medical Informatics Æ penerapan teknologi informatika dalam


bidang kedokteran
Contoh:
– penggunaan IT dalam manajemen data pasien / klinis
– diagnosis penyakit (database penyakit, sistem pakar)
– Medical imaging (NMR/MRI, dsb)
Organisasi DNA
Central Dogma of Molecular Biology

DNA (blueprint)

RNA (coding sequences)

Protein (fungsional machinery)


Phenotype / Morphology (1)

Phenotype / Morphology

Gen / Protein Ekspresi Protein

building block regulasi / aransemen

• Variasi sekuen DNA


• Imprinting/Epigenetic
Phenotype / Morphology (2)

• Variasi sekuen DNA dan Epigenetics antara lain dapat


mengakibatkan:
– Perbedaan phenotype / morphology
• Manusia: tinggi / rendah, etc
• Mouse: warna
• Tanaman: berbuah banyak / manis
– Penyakit bawaan / genetik
– Perbedaan respon imun terhadap patogen (host-pathogen interaction)
– Perbedaan respon terhadap obat
– Perbedaan susceptibility terhadap penyakit kompleks / degeneratif:
• Alzheimer
• Kanker
• Jantung
• dsb
Contoh Aktifitas Bioinformatika

• Pengumpulan informasi
– Literatur
– Anotasi gen:
sekuen, variasi DNA, lokasi, ekspresi, modifikasi, struktur, dll
– Data lain: data klinis, dll
• Akusisi data
– Sekuensing DNA
– Ekspresi gen (realtime RT-PCR)
• Analisa
– Mendapatkan informasi/pengetahuan (hipotesis) baru
– Mendapatkan prediksi/trend dari data
• Interpretasi secara biologi
Aktifitas Bioinformatika (2)
Aplikasi Central Dogma dalam Akusisi Data

Sekuen DNA (sequencing)

Regulasi gen
Sekuen RNA (EST, cDNA sequencing) + (microarray,
realtime/quantitative RT-PCR)

Sekuen protein (AA sequencing, MS)

Struktur protein (kristalografi, NMR) + Interaksi antar/inter molekul

Fungsi protein (assay, transgenik)


Knowledge Discovery

Public databases “wet” experiment

Data acquisition

Data management | data manipulation

Visualization | modeling |analysis

Result interpretation

New knowledge | prediction


product
publication “wet” experiment

Major goal: To understand how life works


Analisa Bioinformatika

• Analisa sekuen:
– Mapping situs restriksi
– Prediksi daerah exon-intron
– Prediksi daerah antigen
– Desain primer PCR & probe
– Prediksi fungsi
– Identifikasi gen
• Analisa struktur
– Struktur sekunder (alpha-helix, beta-sheet)
– Struktur tertier (3-Dimensi)
• Analisa interaksi
– Interaksi antar gen
– Interaksi antar protein/makromolekul
Domain Permasalahan

Studi Bioinformatika

Genom & Proteom


Struktur Molekul
• sequence alignment Regulasi dan Network
• pencarian sekuen Gen
DNA sequencing prediksi:
Lainnya
• •

identifikasi gen/protein struktur sekunder


korelasi pola ekspresi
• •

pencarian domain/motif struktur tertier (3D)


mapping data ekspresi Ontologi Gen
• •
• •

gene finding topologi protein


ke data sekuen, struktur Mining literatur
• •

anotasi antigenic determinant


dan biokimia Simulasi metabolic
• •

analisa linkage protein docking


Pencarian gene yg pathway
• •

analisa forensik molecular dynamics


berkaitan dgn penyakit Manajemen data
• •

analisa evolusi/phylogenetics
user interface

• studi populasi
Pentingnya Bioinformatika dalam Biologi Molekuler

• Kuantitas data biologi molekuler


• Kompleksitas data biologi molekuler
• Kompleksitas analisa data
• Ruang lingkup penelitian
• Biologi sebagai ilmu kuantitatif
• Infrastruktur terjangkau & labor-intensive
• Efisiensi eksperimen
• Value-added pada penelitian
Kuantitas Data Molekuler Biologi (1)

• Pertambahan data secara eksponensial akibat perkembangan


teknologi akusisi data / teknologi eksperimental pada biologi
molekuler.
• Contoh:
– perkembangan teknologi sekuensing DNA secara otomatis, sehingga
data pada Genbank rata-rata bertambah 2X setiap 18 bulan.
– eksperimen micro-array dapat menghasilkan 500,000 data ekspresi
per sampel (untuk 100 sampel, akan ada 50,000,000 data yang harus
dianalisa)
• Pertambahan jumlah pemakai pada tiap-tiap database per
tahunnya.
Kuantitas Data Biologi Molekuler (2)

Jumlah data (Februari 2008):


• GenBank: 85,759,586,764 basa (82,853,685 sekuen record)
• Whole Genome Sequence: 108,635,736,141 basa (27,439,206 sekuen record)
Kompleksitas Data Biologi Molekuler

Kompleksitas data biologi molekuler muncul


karena kompleksitas pada struktur molekul yang
ada pada sistem biologi.

kompleksitas struktur gene pada eukaryotes


Kompleksitas Data Biologi Molekuler (2)
Kompleksitas pada proses ekspresi gen eukaryotes:
Central Dogma of Molecular Biology (extended)
DNA
transkripsi

hnRNA
(heterogenous nuclear RNA)

splicing

mRNA (coding sequence) non-coding RNA


(regulatory, fungsional machinery)
translasi

Protein (precursor)

Post-translational modification

Protein (mature)
Kompleksitas Data Biologi Molekuler (3)

Kompleksitas pada struktur protein dan interaksinya dengan


protein/molekul lain
Kompleksitas Analisa Data

Kompleksitas pada pencarian data di database:


– Database tidak akan berguna apabila tidak dilengkapi
dengan tools untuk mencari dan menganalisa data!
– BLAST: Basic Local Alignment Searching Tools adalah
algoritma (dan tools) standar untuk mencari sekuen
DNA maupun protein pada database yang memiliki
kemiripan dengan sekuen kueri, serta menganalisa
apakah kemiripan tersebut signifikan secara biologi
maupun secara statistik.
Kompleksitas Analisa Data (2)

Analogi BLAST: mencari record pasien yang


memiliki nama Rahman:
– Rahman
– Rahmawati
– Rachman
– Rakhman
Kompleksitas Analisa Data (3)

Data yang didapat dari akusisi data tidak


semuanya dapat dipergunakan secara langsung:
– Data harus “dibersihkan” untuk menghilangkan noise
– Data harus dinormalisasi agar dapat dianalisa secara
bersamaan
– Data harus digabungkan agar dapat dipergunakan
untuk analisa, contoh adalah sekuensing de-novo
genome suatu organisme dengan metode shot-gun.
Kompleksitas Analisa Data (4)
• Metode whole-genome shotgun sequencing memecah secara acak suatu
genome menjadi fragmen DNA yang dapat disekuen satu-persatu untuk
kemudian digabungkan kembali menjadi satu untaian DNA yang utuh

• Proses penggabungan kembali (contig assembly) dapat dianalogikan seperti


permainan puzzle yang kompleks

• ~ 1 juta fragmen DNA • < 10,000 potongan


• Reverse-complement • Puzzle memiliki gambar yang mirip pada
tiap sisinya
• Low complexity (A, T, C, G) • Gambar hanya menggunakan warna yang
terbatas
• Fragmen tidak komplit • Tidak semua potongan tersedia (ada yg
hilang)
• Kualitas fragmen tidak merata • Banyak potongan puzzle yang gambarnya
memudar, terkena noda atau rusak
(terpotong, dsb)
• Duplikasi fragmen • Banyak potongan yang hampir sama
• Kontaminasi • Ada potongan dari puzzle lain yang
tercampur
Shotgun Sequencing
1500000 bp

random fragmentation

cloning
sequencing
assembling
Kompleksitas Analisa Data (5)

Kompleksitas pada analisa data yang


membutuhkan algoritma yang lebih advanced
karena sistem biologi merupakan suatu sistem
yang sangat kompleks dan memiliki interaksi
yang sangat kompleks pula.

Contoh analisa kompleks:


– Penggunaan artificial intelligence & machine learning
untuk memprediksi daerah binding pada sekuen DNA
Kompleksitas Analisa Data (6)
Ruang Lingkup Penelitian

Aktifitas rekayasa genetika umumnya


melibatkan personil dari group/lab atau institusi
yang berbeda, karena ruang lingkup kegiatannya
sangat luas.
– Fasilitas komunikasi (email, group-list)
– Shared folders (workgroup/collaboration tools)
untuk berbagi data dan dokumen secara cepat
– Ekpserimen dan analisa bersama, tergantung dari
kompetensi masing-masing personel/lab/institusi
– Semakin berkembang karena perkembangan internet
Biologi Sebagai Ilmu Kuantitatif

Biologi, terutama biologi molekuler, mulai berkembang


menjadi ilmu kuantitatif dengan memadukan statistik
dan matematika terapan untuk keperluan analisa.

Contoh:
mekanisme molekuler akibat kelainan dari suatu gene dapat
dijelaskan secara kualitatif, namun seberapa besar efek dari
kelainan tersebut sehingga dapat menyebabkan penyakit
genetik harus dijelaskan secara kuantitatif.
Infrastruktur Terjangkau & Labor-Intensive

• Infrastruktur paling minimal: komputer dan koneksi ke internet


• Processing power dari komputer saat ini cukup memadai untuk
analisa lokal (analisa dengan menggunakan software yang berjalan
di komputer user)
• Software untuk keperluan analisa bisa didapatkan secara gratis
(opensource atau academic license)
• Analisa dapat dilakukan secara remote, misalnya melalui web
service apabila tidak dapat dilakukan secara lokal (public maupun
registered user, gratis atau komersil)
• Labor-intensive karena membutuhkan keahlian dan ketekunan user
saja
Efisiensi Eksperimen

• Bioinformatika dapat mem-”by-pass” beberapa


eksperimen lab tertentu.
– Pada Human Genome Project, metode shotgun sequencing
memungkinkan peneliti untuk melakukan kloning dengan jumlah
yang lebih sedikit.
• Bioinformatika memungkinkan aktifitas eksperimen in-
silico
• Eksperimen in-silico dapat dipergunakan untuk:
– Memprediksi outcome dari hasil suatu eksperimen
– Menyeleksi target
– Memperkecil kesalahan yang terjadi
Memberikan Nilai Tambah Pada Penelitian

• Penelitian dapat dikembangkan lebih lanjut dengan


melakukan analisa lanjutan dengan data yang sudah
tersedia, atau dengan menggabungkan data lain dari
eksperimen lainnya atau dari data yang sudah
dipublikasikan.

Contoh penggunaan data yang diakusisi sendiri dan data


yang sudah dipublikasikan:
– analisa phylogenetics
– analisa komparatif suatu gene/protein
Waktu Penggunaan Bioinformatika

• Hipotesis
Sebelum eksperimen • Fisibilitas
• Metodologi penelitian

• Troubleshooting
Saat eksperimen
• Verifikasi/identifikasi hasil

Sesudah eksperimen • Analisa data


• Interpretasi hasil
Forward Genetics
phenotype Æ genotype
( sample-based)
Mencari gen atau faktor penyebab/pemicu munculnya suatu phenotype,
misalnya mencari gen atau mutasi penyebab suatu penyakit

“phenotype of interest”
koleksi sampel

Mapping / sequencing DNA


Semi-quantitative (real-time) RT PCR / Microarray
Protein assay

Analisa data
sequence: multiple alignment
ekspresi: statistik
assay: modeling/ODE

Gen / faktor bersangkutan


Reverse Genetics

genotype Æ phenotype
(sequence-based)
Melihat atau mengkonfirmasi hasil/efek/implikasi pada phenotype dari suatu gen/faktor,
misalnya mencari efek/implikasi dari suatu mutasi pada sebuah gen

“sequence of interest”

Analisa sekuen
(prediksi fungsi / simulasi molekuler)

Knock-off/on gene | Protein expression & assay

Analisa phenotype | Analisa hasil


Kombinasi Forward/Reverse Genetics

Reverse Genetics
(outcome: phenotype)

hipotesis validasi

Forward Genetics
(outcome: genotype)
Database Bionformatika & Situs NCBI
Database

• Database primer/utama (primary)


• Database sekunder (secondary)
• Database tertier/special (tertiary)
• Database literatur
Database primer/utama

Data repository
Raw data
Redundant
Direct submision ( “sampah”, inkonsistensi, dll)
Selalu di-update (daily/weekly)
Contoh:
NCBI Genbank (sekuen DNA dan translasinya)
SwissProt (sekuen protein)
PDB (struktur kristal protein dan makromolekul)
dbEST (potongan-potongan sekuen mRNA)
dbGSS (survei sekuen genom)
Trace Archive (data hasil sekuensing DNA)
SAGEMap, GEO (data eksperimen microarray)
Database sekunder

Knowledge repository
Bersumber dari database primer/utama
Data dianotasi oleh kurator (umumnya manual)
Non-redundant
Ada jeda waktu untuk sinkronisasi dengan sumber database primer
Contoh:
NCBI RefSeq (sekuen DNA dan translasinya)
SwissProt (sekuen protein)
Ensembl (sekuen genom eukaryotes)
MMDB (struktur kristal protein dan makromolekul)
Database tertier/spesial

Bersumber dari database primer & sekunder


Mencakup data non-biomolekuler
Kenyamanan end-user
Banyak kurator
Jeda waktu sinkronisasi dengan database
primer/sekunder yang lama
Contoh:
EuPathDB (database patogen eukaryotes, seperti Plasmodium, dsb)
MitoMAP (database mapping genome mitochodria)
Mammalian ncRNA (sekuen ncRNA dari mamalia)
REBASE (database enzim restriksi)
SGD (database jamur/fungi)
Globin Server (protein globin dan penyakit thalassemia)
KEGG (database pathway, dsb)
Database literatur

PubMed (http://www.ncbi.nih.gov/pubmed)
Jurnal internasional bidang ilmu alam & kedokteran
Abstrak, Penulis, Jurnal
PubMed Central (http://www.pubmedcentral.nih.gov)
Subset dari PubMed
Full-text
NCBI Bookshelf (http://www.ncbi.nih.gov/books)
NCBI OMIM - Online Mendelian Inheritance in Man
Katalog dari penyakit genetik dan gen manusia (& tikus)
NCBI OMIA (Online Mendelian Inheritance in Animal
Katalog dari penyakit genetik dan gen hewan (selain manusia &
tikus)
Daftar (sebagian kecil) Database Bioinformatika

MitoMAP
EnsEMBL GenomeBrowser

SGD
GenBank dbSNP
TrEMBL EMBL
DDJ dbEST
PlasmoDB

ProDom SwissProt DSSP


Prosite PDB TIGR
SMD
PFAM primary databases HSSP
InterPro REBASE
PRINTS CATH
Blocks KEGG
SCOP
PFAM

secondary databases

Pubmed

OMIM
NCBI ( www.ncbi.nih.gov )

• Pencarian literatur
• Pencarian gen berdasarkan:
– Informasi tekstual (nama, lokasi, literatur)
– Sekuen lain
– Struktur
• Pencarian data lain:
– OMIM – Online Mendelian Inheritance in Man
– TaxBrowser
– dbSNP – SNP database
– dbGAP – Genotype-Phenotype database
– UniSTS – Sequence Tag Site
• Repositori untuk GenBank & RefSeq
• Repositori untuk full genomic sequences
• Repositori untuk dokumen edukasi
• Bioinformatics tools: Electronic PCR, dll
NCBI Genbank Database
Nomenclature NCBI Refseq

NM_* RefSeq untuk coding sequence (mRNA)

NR_* RefSeq untuk non-coding RNA yang ditranskripkan

NT_* RefSeq untuk genomic contig dari kromosom

NW_* RefSeq untuk alternatif genomic contig dari kromosom

NG_* RefSeq untuk famili/cluster atau pseudo-gene

NC_* RefSeq untuk full/circular genome

NP_* RefSeq untuk sekuen protein

XM_* RefSeq untuk sekuen hypothetical mRNA

XP_* RefSeq untuk sekuen hypothetical protein


ENTREZ

• ENTREZ: interface search/query dari (hampir)


seluruh database di NCBI
• Interkoneksi antar (hampir) seluruh database
• Pencarian dengan Entrez dapat dilengkapi
dengan sistem history
• History dapat digabung untuk mendapatkan
kueri baru
• Entrez dilengkapi dengan tools untuk mengubah
format data
Database pada NCBI (1)

• PubMed
• Protein Æ translasi dari Nucleotide
• CoreNucleotide Æ Genbank + Refseq
• Nucleotide Æ CoreNucleotide + EST + GSS + STS
– EST (Expressed Sequence Tags) – mRNA
– GSS (Genome Survey Sequence) – preliminary genome
– STS (Sequence Tag Site) – sekuen DNA pendek yang hanya muncul di
satu lokasi saja pada genome
• Structure :
– MMDB – Molecular Modeling Database Æ subset dari PDB
– CDD – Conserved Domain Database
– VAST – Vector Alignment Search Tool Æ pencarian struktur berdasarkan
kemiripan pada struktur kueri
Database pada NCBI (2)

• Genome Æ full atau partial annotated genome


dari tiap spesies
• Books Æ database literatur / text-book / etc
• CancerChromosomes Æ data mengenai kanker:
– Cytogenetics
– Klinis
– referensi
• ConservedDomains
• 3D Domains
Database pada NCBI (3)

• Gene
• Genome Project
• dbGAP Æ database Genotype and Phenotype
• GENSAT (Gene Expression Nervous System Atlas) Æ database
ekspresi gen dari sistem saraf pusat (central nervous system) pada
mouse dengan metode in-situ hybridization dan transgenik
• GEO (Gene Expression Omnibus) Æ database ekspresi gen dari
eksperimen microarray
• HomoloGene Æ data gen-gen homolog yang dianalisa secara
otomatis
• PMC – PubMed Central
• MeSH
Database pada NCBI (4)

• OMIA & OMIM – Online Mendelian Inheritance database


• PopSet Æ data populasi dari berbagai studi
• PubChem Æ database struktur kimia biomolekul selain
protein
• SNP (Single Nucleotide Polymorphism) Æ database
variasi pada sekuen dari tiap gen
• Taxonomy
• UniGene Æ data gen yang telah dianotasi dan
diorganisir
• UniSTS Æ data STS yang telah dianotasi
Anotasi Gen

• Kumpulan informasi yang relevan


• Didapat dan diverifikasi dari eksperimen (diambil dari jurnal-jurnal
penelitian) secara manual
• Informasinya antara lain:
– Organisme/sampel
– Organelle
– Lokasi kromosom beserta orientasinya
– Daerah enhancer, promoter, exon-intron
– Transkrip (beserta alternatifnya) dan proteinnya
– Variasi dari gen (SNP)
– Fungsi
– Motif / pattern dari proteinnya
– Korelasi phenotype / penyakit
– Informasi lainnya
Anotasi Gen
Format Genbank
LOCUS DQ372051 370 bp DNA linear PRI 13-FEB-2006
DEFINITION Homo sapiens isolate Nabila 1 control region, partial sequence;
mitochondrial.
ACCESSION DQ372051
VERSION DQ372051.1 GI:87047615
KEYWORDS .
SOURCE mitochondrion Homo sapiens (human)
ORGANISM Homo sapiens
Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi;
Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini;
Hominidae; Homo.
REFERENCE 1 (bases 1 to 370)
AUTHORS Faghfoor,N.F.
TITLE PCR Amplification and Sequencing of Hypervariable Region 1 of the
Mitochondrial DNA Control Region
JOURNAL Unpublished
REFERENCE 2 (bases 1 to 370)
AUTHORS Faghfoor,N.F.
TITLE Direct Submission
JOURNAL Submitted (21-JAN-2006) Biochemistry/Biotechnology, University of
Southern California, Los Angeles, CA, USA
FEATURES Location/Qualifiers
source 1..370
/organism="Homo sapiens"
/organelle="mitochondrion"
/mol_type="genomic DNA"
/isolate="Nabila 1"
/db_xref="taxon:9606"
/collection_date="2005"
misc_feature <1..>370
/note="control region; hypervariable region 1"
ORIGIN
1 ctgttctttc atggggaagc agatttgggt accacccaag tattgactcc cccatcaaca
61 accgctatgt atttcgtaca ttactgccag ccaccatgaa tattgtacgg taccataaat
121 acttgaccac ctgtagtaca taaaaaccca atccacatca aaaccccctc cccatgctta
181 caagcaagta cagcaatcaa ccctcaacta tcacacatca actgcaactc caaagccacc
241 cctcacccac taggatacca acaaacctac ccacccttaa cagtacatag tacataatgc
301 catttaccgt acatagcaca ttacagtcaa atcccttctc gtccccatgg atgacccccc
361 tcagataggg
//
Format FASTA
>reference
MASDSGNQGTLCTLEFAVQMTCQSCVDAVRKSLQGVAGVQDVEVHLEDQMVLVHTTLPSQ
EVQALLEGTGRQAVLKGMGSGQLQNLGAAVAILGGPGTVQGVVRFLQLTPERCLIEGTID
GLEPGLHGLHVHQYGDLTNNCNSCGNHFNPDGASHGGPQDSDRHRGDLGNVRADADGRAI
FRMEDEQLKVWDVIGRSLIIDEGEDDLGRGGHPLSKITGNSGERLACGIIARSAGLFQNP
KQICSCDGLTIWEERGRPIAGKGRKESAQPPAHL
>normal_1
MASDSGNQGTLCTLEFAVQMTCQSCVDAVRKSLQGVAGVQDVEVHLEDQMVLVHTTLPSQ
EVQALLEGTGRQAVLKGMGSGQLQNLGAAVAILGGPGTVQGVVRFLQLTPERCLIEGTID
GLEPGLHGLHVHQYGDLTNNCNSCGNHFNPDGASHGGPQDSDRHRGDLGNVRADADGRAI
FRMEDEQLKVWDVIGRSLIIDEGEDDLGRGGHPLSKITGNSGERLACGIIARSAGLFQNP
KQICSCDGLTIWEERGRPIAGKGRKESAQPPAHL
>normal_2
MASDSGNQGTLCTLEFAVQMTCQSCVDAVRKSLQGVAGVQDVEVHLEDQMVLVHTTLPSQ
EVQALLEGTGRQAVLKGMGSGQLQNLGAAVAILGGPGTVQGVVRFLQLTPERCLIEGTID
GLEPGLHGLHVHQYGDLTNNCNSCGNHFNPDGASHGGPQDSDRHRGDLGNVRADADGRAI
FRMEDEQLKVWDVIGRSLIIDEGEDDLGRGGHPLSKITGNSGERLACGIIARSAGLFQNP
KQICSCDGLTIWEERGRPIAGKGRKESAQPPAHL
>pasien_1
MASDSGNQGTLCTLEFAVQMTCQSCVDAVRKSLQGVAGVQDVEVHLEDQMVLVHTTLPSQ
EVQALLEGTGRQAVLKGMGSGQLQNLGAAVAILGGPGTVQGVVRFLQLTPERCLIEGTID
GLEPGLHGLHVHQYGDLTNNCNSCGNHFNPDGASHGGPQDSDRHRGDLGNVRADADGRAI
FRMEDEQLKVWDVIGRSLIIDEGEDDLGRGGHPLSKITGNSGERLACGIIARSAGLFQNP
KQICSCDGLTIWEERGRPIAGKGRKESAQPPAHL
>pasien_2
MASDSGNQGTLCTLEFAVQMTCQSCVDAVRKSLQGVAGVQDVEVHLEDQMVLVHTTLPSQ
EVQALLEGTGRQAVLKGMGSGQLQNLGAAVAILGGPGTVQGVVRFLQLTPERCLIEGTID
GLEPGLHGLHVHQYGDLTNNCNSCGNHFNPDGASHGGPQDSDRHRGDLGNVRADADGRAI
FRMEDEQLKVWDVIGRSLIIDEGEDDLGRGGHPLSKITGNSGERLACGIIARSAGLFQNP
KQICSCDGLTIWEERGRPIAGKGRKESAQPPAHL
Analisa sekuen dan struktur

• Desain primer
• Studi homologi
• Prediksi struktur sekunder protein
• Prediksi topologi protein

Sekuen DNA:
GATCGCTAGGATCGAGCTAGGATCGCGGATCCGAGAGCTCGAGGGCGCTAGCGCTAGCTCGATCGACTG

Sekuen protein (hasil translasi sekuen di atas):


DR*DRARIADPRARGR*R*LDRL Frame +1
IARIELGSRIRELEGASASSID Frame +2
SLGSS*DRGSESSRALALARST Frame +3
Desain Primer & Probe

Desain primer secara otomatis


Primer3, PerlPrimer
Verifikasi oligonucleotides
NetPrimer, PerlPrimer
Desain degenerate-primer
CODEHOP
Primer harus dicek kembali (BLAST, ...)

Anda mungkin juga menyukai