Anda di halaman 1dari 26

MEMBACA DAN

MEMAHAMI DATA
PADA NCBI DAN PDB

Aulia Fitri Firdausya (11170950000073)


Shovinda Rahmadina (11170950000045)
01 NCBI 02 FASTA
FORMAT

03 GENBANK
FORMAT
04 PDB
NCBI (National Center of
Biotechnology Information)
APA ITU NCBI?
NCBI merupakan server yang memuat data base tentang
informasi kesehatan dan bioteknologi. Data base terus
menerus di update sesuai dengan penemuan-penemuan
terkini yang menyangkut DNA, Protein, Senyawa aktif
dan taksonomi. Disamping data base, ncbi juga
menyediakan berbagai macam software untuk analisis
DNA, protein 3D, pencarian primer, pencarian conserve
domain dan lain sebagainya.
Bethesda

Diresmikan pada 4 November 1988


Oleh Senator Claude Pepper
Divisi dari National Library of Medicine (NLM) di
National Institute of Health (NIH)
MISI NCBI
mempertunjukkan
membuat sistem mengkoordinasi penelitian dengan
memfasilitasi upaya untuk metode pemroses
terotomatisasi untuk
penggunaan mengumpulkan informasi yang berbasis
menyimpan dan
database informasi komputer untuk analisis
menganalisis pengetahuan
tersebut untuk bioteknologi baik struktur dan fungsi
mengenai biologi
komunitas medik secara nasional molekul yang penting
molekuler, biokimia, dan
dan peneliti maupun internasinal secara biologis
genetika
Kenapa harus
menggunakan format Jenis format
file? file

Kebutuhan
Sequence
untuk
file format
Database

Penggambaran Molecular
data yang lebih (structure)
baik file format
Jenis Sequence File Format dalam NCBI
GenBank
Format

FASTA
Format
FASTA FORMAT
FASTA format adalah format
data standar berbasis teks
untuk mewakili baik sekuen
nukleotida maupun sekuen
peptida, di mana pasangan
basa atau asam amino diwakili
menggunakan kode huruf
tunggal
FASTA FORMAT
.fasta .fna
.faa .ffn Dimulai dengan
.fa tanda ‘>’dan diikuti
dengan nama sekuen
serta deskripsi

Data sekuen berupa


urutan asam nukleat
atau asam amino
Version number

Header

Sequences
● Dalam 1 file FASTA bisa terdapat beberapa sekuens yang
berbeda

● Tanda ‘>’ menandakan akhir dari satu sekuens dan awal dari
sekuens selanjutnya

● Tiap sekuens tidak harus memiliki panjang yang sama


The nucleic acid codes are:

A --> adenosine M --> A C (amino)


C --> cytidine S --> G C (strong)
G --> guanine W --> A T (weak)
T --> thymidine B --> G T C
U --> uridine D --> G A T
R --> G A (purine) H --> A C T
Y --> T C (pyrimidine) V --> G C A
K --> G T (keto) N --> A G C T (any)
- gap of indeterminate length
The accepted amino acid codes are:
A ALA alanine P PRO proline
B ASX aspartate or asparagine Q GLN glutamine
C CYS cystine R ARG arginine
D ASP aspartate S SER serine
E GLU glutamate T THR threonine
F PHE phenylalanine U selenocysteine
G GLY glycine V VAL valine
H HIS histidine W TRP tryptophan
I ILE isoleucine Y TYR tyrosine
K LYS lysine Z GLX glutamate or glutamine
L LEU leucine X any
M MET methionine * translation stop
N ASN asparagine - gap of indeterminate length
GENBANK
FORMAT
GenBank format adalah format
berbasis teks untuk menyimpan
data berupa DNA dalam bentuk
karakter sekuens. Format
GenBank merupakan format
pengkodean yang digunakan
oleh U.S NCBI
Panjang Tipe Divisi Tanggal
Nama lokus sekuen molekul GenBank modifikasi

• Locus (nama lokus, panjang


sekuen, tipe molekul, divisi
GenBank, tanggal modifikasi)
• Definition
• Accession
• Version (GI)
• Keywords
• Source (organism)
• Reference (authors, title,
journal, PubMed, direct
submission)
Sources protein_id Complement

Other
Taxon GI
features

CDS Translation

<1..206 Gene
RCSB PDB
Protein data bank mengandung data struktur
tiga dimensi suatu makromolekul seperti protein
dan asam nukleat. Perolehan struktur tiga
dimensi suatu makromolekul umumnya
diperoleh dengan cara kristalografi sinar-X atau
spektroskopi NMR.

Dibentuk tahun 1971 di Laboratorium Nasional Brookhven


Organisasi pengawas: World Wide Protein Data Bank (wwDB)
interactive protein diagram of polymer
web-based domain and sequence, secondary
molecular functional structure, and structure determination details
viewers annotations binding sites

Unique PDB identifier of the entry

Deskripsi dari struktur protein

Klasifikasi protein
Organisme tempat ekspresi protein

Tanggal input dan rilis


Author
Asymmatric unit
Bagian terkecil dari struktur kristal di mana operasi
simetri dapat diterapkan untuk menghasilkan sel
unit lengkap (unit pengulangan kristal).
Berisikan bagian unik dari struktur Kristal.
Digunakan oleh crystallographer untuk memperbaiki
koordinat struktur terhadap data eksperimen.

Biological assembly
Bentuk fungsional dari molekul.
Chains (unique protein chains).
Rantai yang berbeda dapat berasal dari organisme
yang berbeda pula.
FASTA format (Terdapat PDB ID, chain ID, sequence)

PDB format (coordinate


files dalam format PDB
dan asymmetric unit akan
terunduh)

Biological assembly 1 (coordinate files


dalam format PDB dan biological assembly
akan terunduh)
Understanding
Header


Molecule description
Organism Coordinate File
information • Experimental details
• Crystal symmetry
• Macromolecules and
chains
• SEQRES record
PDB • Secondary structure
information
file

• ATOMs and HETATMs


• Chains and residue
numbers
Coordinates • X, Y, Z coordinates
• Temperature factor
Thank You for your attention And Let’s practice!

CREDITS: This presentation template was created by Slidesgo,


including icons by Flaticon, and infographics & images by Freepik

Anda mungkin juga menyukai