MEMAHAMI DATA
PADA NCBI DAN PDB
03 GENBANK
FORMAT
04 PDB
NCBI (National Center of
Biotechnology Information)
APA ITU NCBI?
NCBI merupakan server yang memuat data base tentang
informasi kesehatan dan bioteknologi. Data base terus
menerus di update sesuai dengan penemuan-penemuan
terkini yang menyangkut DNA, Protein, Senyawa aktif
dan taksonomi. Disamping data base, ncbi juga
menyediakan berbagai macam software untuk analisis
DNA, protein 3D, pencarian primer, pencarian conserve
domain dan lain sebagainya.
Bethesda
Kebutuhan
Sequence
untuk
file format
Database
Penggambaran Molecular
data yang lebih (structure)
baik file format
Jenis Sequence File Format dalam NCBI
GenBank
Format
FASTA
Format
FASTA FORMAT
FASTA format adalah format
data standar berbasis teks
untuk mewakili baik sekuen
nukleotida maupun sekuen
peptida, di mana pasangan
basa atau asam amino diwakili
menggunakan kode huruf
tunggal
FASTA FORMAT
.fasta .fna
.faa .ffn Dimulai dengan
.fa tanda ‘>’dan diikuti
dengan nama sekuen
serta deskripsi
Header
Sequences
● Dalam 1 file FASTA bisa terdapat beberapa sekuens yang
berbeda
● Tanda ‘>’ menandakan akhir dari satu sekuens dan awal dari
sekuens selanjutnya
Other
Taxon GI
features
CDS Translation
<1..206 Gene
RCSB PDB
Protein data bank mengandung data struktur
tiga dimensi suatu makromolekul seperti protein
dan asam nukleat. Perolehan struktur tiga
dimensi suatu makromolekul umumnya
diperoleh dengan cara kristalografi sinar-X atau
spektroskopi NMR.
Klasifikasi protein
Organisme tempat ekspresi protein
Biological assembly
Bentuk fungsional dari molekul.
Chains (unique protein chains).
Rantai yang berbeda dapat berasal dari organisme
yang berbeda pula.
FASTA format (Terdapat PDB ID, chain ID, sequence)