3 ORGANISASI BERKAS
DISUSUN OLEH:
1. FAREL FEBRIANO(17101152610365)
4. GUNAWAN(18101152610540)
5. OKTOWERI JAFRI(18101152610185)
Puji syukur kami panjatkan kehadirat Tuhan yang Maha Esa karena atas limpahan rahmat dan
hidayah-Nya lah sehinggga kami bisa menyelesaikan tugas makalah mata kuliah Metode
pengarsipan & akses yang membahas tentang “3 organisasi berkas” ini tepat pada
waktunya dalam bentuk yang sederhana.
Kelompok 7
Daftar isi
Kata Pengantar ...............................................................................................
Daftar isi.........................................................................................................
1.3 Tujuan
1.3 Tujuan
Pola Akses
Pola Akses adalah penentuan akses berdasarkan field tertentu. Selama pola akses,
berkas sequential dapat dipasangkan dengan record-record yang sudah diurut pada berkas,
maka waktu aksesnya sangat baik.
Jadi kita harus menentukan pola akses terlebih dahulu, kemudian baru menentukan organisasi
berkas sequential berdasarkan urutan yang sesuai dengan pola aksesnya, jangan sebaliknya.
Contoh soal:
Suatu Tape dengan Panjang 2400 feet, Density 1600 Bpi dan Panjang Gap ¾ inchi. Jika 1
record berukuran 80 karakter , berapa banyak data yang dapat disimpan jika blocking
factornya 5 record / blok !
Diketahui:
P = 2400 feet
D = 1600 Bpi
IRG = 3/4 inchi
= 0.75 inchi
C = 80 character
BF = 5 record/block
JAWABAN :
· Sebaiknya disimpan dalam Direct Access Storage Device (DASD) seperti magnetic
disk/drum.
PROSES
Pada waktu sebuah record ditulis kedalam berkas relative. fungsi pemetaan R digunakan
untuk menerjemahkan NILAI KEY DARI RECORD menjadi ADDRESS,
dimana record tersebut disimpan. Begitu pula pada waktu akan me-retrieve record dengan
nilai key tertentu, fungsi pemetaan R digunakan terhadap nilai key tersebut, untuk
menerjemahkan nilai key itu menjadi sebuah address dalam penyimpanan sekunder, dimana
record tersebut ditemukan. Organisasi berkas relatif ini tidak menguntungkan bila
penyimpanan sekundernya berupa media SASD, seperti magnetic tape. Berkas relative harus
disimpan didalam media SASD, seperti disk atau Drum. dimungkinkan untuk mengakses
record-record dalam berkas relatif secara consecutive, tetati perlu diketahui bahwa nilai key
tidak terurut secara logic.
Keuntungan :
dapat terjadi apabila terdapat alamat relatif yang sama untuk nilai key yang berbeda.
Pada teknik pencarian tabel kita harus menyediakan ruang memori untuk menyimpan
tabel indexnya, tapi dalam teknik kalkulasi tidak diperlukan lagi hal itu. yang dilakukan
adalah membuat hitungan sedemikian rupa sehingga dengan memasukkan kunci atribut
recordnya, alamatnya sudah dapat diketahui, masalahnya bagaimana membuat hitungan dari
kunci atribut itu sehingga hasilnya dapat lebih efisien dan tidak berbenturan dengan nilainya.
1. Scatter DiagramTechnique
Sebuah metode baru untuk memasukkan dan mengambil informasi yang digambarkan
dalam tabel hash. Metode ini bakal menjadi efisien jika lebih banyak bagian yang sering
dilihat . Jumlah yang diharapkan dari kemungkinan untuk mencari entri, diperkirakan secara
teoritis dan diverifikasi oleh percobaan Monte Carlo, adalah kurang dari untuk metode
sebanding lain jika tabel hampir penuh.
2. Randomizing Teqhnique
Sebuah metode yang digunakan untuk pengambilan data dan informasi secara random
(acak).
3. Key-To-Address Tranformation Methods
Teknik yang digunakan dalam teori mengkoreksi kesalahan kode. hal ini diterapkan
untuk dapat menyelesaikan masalah dalam menangani file besar. dalam pendekatan baru, file
menangani masalah yang digambarkan dengan desain khusus untuk menampilkan kelayakan.
Merupakan struktur yang menggunakan fungsi hash untuk efisien peta pengdentifikasi
tertentu atau kunci/key (misalkan nama-nama orang) untuk dihubungkan nilai (misalkan
nomor telepon mereka). funsi dari hash digunakan untuk mengubah kunci ke indeks (hash)
dari array elemen (dalam slot/ember) dimana nilai yang sesuai akan dicari. dalam banyak
situasi, hash table technique atau yang sering disebut teknik tabel hash ternyata lebih efisien
daripada pohon pencarian atau struktur lookup. Biasanya banyak digunakan diberbagai jenis
komputer perangkat lunak terutama untuk array asosiatif, pengideksan database, cache dan
set.
Keuntungan utamanya dalah kecepatannya. keuntungan ini lebih jelas ketika jumlah
entri yang besar (ribuan atau lebih). tabel hash dapat sangat efisien ketika jumlah
maksimum entri dapat diprediksi dari sebelumnya, sehingga ember array dapat
dialokasikan sekali dengan ukuran optimal dan tidak pernah diubah ukurannya.
Jika himpunan pasangan kunci-nilai adalah tetap dan dikenal lebih dulu sehingga
insersi serta penghapusan tidak diijinkan. yang dapat mengurangi biaya rata-rata
lookup pilihan hati-hati dari fungsi hash, ember ukuran meja dan struktur data
internal. Secara khusus, ada kemungkinan dapat menyusun fungsi hash yang
tabrakan (bebas ) atau bahkan sempurna.
Kelemahan menggunakan teknik tabel hash:
Untuk aplikasi pengolahan string tertentu, seperti spell-checking. tebel hash mungkin
kurang efisien. jika setiap tombol diwakili oleh sejumlah kecil bit yang cukup, maka
bukan sebuah tabel hash yang dapat menggunakan tombol langsung sebagai indeks ke
array nilai.
Meskipun rata-rata biaya per operasi adalah konstan dan cukup kecil dengan biaya
operasi tunggal dapat cukup tinggi. secara khusus, jiak tabel hash menggunakan
ukuran dinamis, penyisipan atau penghapusan operasi yang memerlukan waktu
sebanding dengan jumlah entri. hal ini dapat dilkatakan kelemahan yang serius secara
realtime atau interaktif.
Tabel hash biasanya, dalam pameran umumnya miskin pemukiman referensi artinya
data yang akan deakses didistribusikan tampaknya secara acak di memori. hal ini
dikarenakan tabel hash menyebabkan pola akses berupa lompat-lompatm ini dapat
memicu cache mikroprosesor yang menyebabkan penundaan yang lama.
Tabel hash menjadi sangat tidak efisien bila ada banyak tabrakan.
6. Hashing
Hashing merupakan teknik mengindeks pada menajemen database dimana nilai kunci
(yang mengindentifikasikan record) dimanipulasi secara numerik untuk menghitung langsung
lokasi record yang berkaitan atau titik tolak untuk mencari record yang terkait.
Teknik mengindeks pada menajemen database dimana nilai kunci (yang
mengindentifikasikan record) dimanipulasi secara numerik untuk menghitung langsung lokasi
record yang berkaitan atau titik tolak untuk mencari record yang terkait.
Keuntungan Hashing :
Kelemahan Hashing :
Nilai key = alamat sebenarnya dimana record tersimpan. Pada saat penyimpanan dan
pemakaian record, harus diketahui dan diberikan pemakai.
Untuk teknik pengalamatan mutlak ini kita tidak perlu mempermasalahkan kunci
atribut karena kita diminta lansung menuliskan dimana alamat record yang akan kita
masukkan . jika kita menggunakan hard disk atau macnetic drum, ada dua cara dalam
menentukan alamat memorinya, yaitu:
•Cylinder Addressing
• Sector Addressing
Jika kita menggunakan Cylinder Addressing , maka kita harus menetapkan nomor-nomor dari
silinder (Sylinder), permukaan (Surface), dan Record. Sedangkan bila kita menggunakan
Secto Addresing, maka kita harus menetapkan nomor-nomor dari sektor (Sector), lintasan
(Track), dan permukaan (Surface). teknik ini mudah dalam pemetaan (pemberian alamat
memorinya).
Keuntungan :
Kelemahan :
Keuntungan :
3) Nilai key adalah Address Space Independent, dimana reorganisasi berkas tak akan
mempengaruhi nilai key, yang berubah adalah alamat direktori.
Kelemahan :
- Dalam pencarian tabel adalah sebuah table atau direktori dari nilai key dan address.
Teknik ini dilakukan dengan cara, mengambil seluruh kunci atribut dan alamat memori yang
ada dan dimasukkan ke dalam tabel tersendiri. jadi tabel misalnya disebut dengan tabel index
hanya berisi kunci atribut misalkan NIM yang telah disorting/urut dan alamat memorinya.
Sewaktu dilakukan pencarian data, tabel yang pertama dibaca adalah tabel yang diberi nama
tabel index. setelah ditemukan atribur kuncinya, maka data alamat yang ada disana digunakan
untuk meraih alamat record dari data(berkas,file atau tabel) yang sebenarnya. pencarian yang
dilakukan di tabel index akan lebih cepat dilakukan dengan teknik pencarian melaui binary
search daripada dilakukan dengan cara sequential.
Contoh :
Agar dua buah kunci yang berbeda tidak mempunyai nilai relative address yang sama.
· Division Remainder ;
· Mid Square ;
· Folding ;
Mudah dalam perhitungan, baik bila panjang nilai key = panjang address.
Open Addressing ;
Separate Overflow ;
Proses pencarian secara sequential dari home address sampai lokasi yang kosong.
Menggunakan double hashing. Memakai fungsi hash kedua terhadap hasil dari
fungsi hash pertama. bisa di primary area atau separate overflow area.
1. Division Remainder
2. Mid Square
3. Folding
4. Division Remainder
Nomor relatif dari suatu nilai key merupakan sisa dari hasil pembagian nilai key tersebut
denga suatu bilangan.
0,8 = 4000
max record
max = 4000
0,8
= 5000
= 987654321
5000 + 3
= 2086
Mid Square
Nilai key dikuadratkan kemudian beberapa digit diambil dari tengah. Alamt relatif, diambil
mulai dari digit .........
· Setiap bagian (kecuali bagian terakhir) mempunyai digit sama dengan digit alamat
relative.
· Hasil penjumlahan adalah alamat relatif (digit tertinggi dibuang bila diperlukan).
· Tidak mengurangi jumlah collision tetapi mengurangi waktu akses untuk meretrieve.
Bucket Addressing
STRUKTUR POHON
Sebuah pohon (tree) adalah struktur dari sekumpulan elemen, dengan salah satu
elemennya merupakan akarnya atau root, dan sisanya yang lain merupakan bagian-bagian
pohon yang terorganisasi dalam susunan berhirarki, dengan root sebagai puncaknya.
Contoh umum dimana struktur pohon sering ditemukan adalah pada penyusunan
silsilah keluarga, hirarki suatu organisasi, daftar isi suatu buku dan lain sebagainya.
Akar pohon (root) adalah Handoko.
Secara rekursif suatu struktur pohon dapat didefinisikan sebagai berikut:
Sebuah simpul tunggal adalah sebuah pohon.
Bila terdapat simpul n, dan beberapa sub-pohon T1,T2,...,Tk, yang tidak saling
berhubungan, yang masing-masing akarnya adalah n1,n2,..., nk, dari simpul/sub pohon ini
dapat dibuat sebuah pohon baru dengan n sebagai akar dari simpul-simpul n1,n2,...,nk.
POHON BINER
Pohon Biner adalah Binary Tree atau Pohon Biner adalah sebuah tree yang setiap
nodenya maksimal hanya memiliki dua anak.
Salah satu tipe pohon yang paling banyak dipelajari adalah pohon biner.
Pohon Biner adalah pohon yang setiap simpulnya memiliki paling
banyak dua buah cabang/anak.
Contoh:
Pada contoh gambar tersebut, indeksnya disusun berdasarkan binary search tree.
Indeksnya digunakan untuk melayani sebuah permintaan untuk mengakses sebuah record
tertentu, sedangkan berkas data sekeunsial digunakan untuk mendukung akses sekuensial
terhadap seluruh kumpulan record-record.
Keterangan:
1. Blok Indeks dan Data (Dinamik)
Pada pendekatan ini berkas indeks dan berkas data diorganisasikan dalam blok.
Berkas indeks mempunyai struktur tree, sedangkan berkas data mempunyai struktur
sekuensial dengan ruang bebas yang didistribusikan antar populasi record.
Untuk cara pertama, kita menyusun data dengan lebih memperhatikan ke data yang
bersifat logik, bukan fisik. Jadi, data dan index diorganisasikan ke dalam blok-blok. Blok-
blok index diorganisasi secara sequential (consecutive) dan bertingkat-tingkat (misal setiap
blok hanya berisi 4 record index yang berisi key field dan pointer).
Setiap tingkat akan menuju ke blok data (misal setiap blok hanya berisi 4 record data)
di tingkat selanjutnya dan seterusnya menuju ke blok data yg akan mendapatkan record yg
dicari secara direct.
Bila dilakukan penyisipan data dan blok tertentu (tempat data baru itu) sudah penuh
(tidak ada tempat kosong/ padding lagi), maka akan dilakukan reorganisasi blok dengan
membentuk blok baru. Tentu, mungkin saja perubahan ini akan berdampak pada isi blok
index-nya.
Bila dilakukan penyisipan data dan track tertentu (tempat data baru itu) sudah penuh
(tidak ada tempat kosong/ padding lagi), maka akan dilakukan reorganisasi track dengan
membentuk track baru.Tentu, track baru itu di luar prime data file-nya, yaitu di overflow data
area-nya
.Contohnya ;
Pada gambar tersebut ada N blok data dan 3 tingkat dari indeks. Setiap entry pada
indeks mempunyai bentuk (nilai key terendah, pointer), dimana pointer menunjuk pada blok
yang lain, dengan nilai key-nya sebagai nilai key terendah. Setiap tingkat dari blok indeks
menunjuk seluruh blok, kecuali blok indeks pada tingkat terendah yang menunjuk ke blok
data.
Jika sebuah permintaan untuk mengakses record tertentu, misal kita ingin mengakses
dengan nilai key BAT, indeks dengan tingkat tertinggi (dalam hal ini blok indeks 3-1) yang
pertama yang akan dicari pada contoh ini, pointer dari AARDVARK menunjuk blok indeks
2-1. Pointer yang ditunjuk pada kotak tersebut adalah pointer yang berisikan AARDVARK,
yang akan menunjuk ke blok indeks 1-1. Pointer berikutnya yang akan ditunjuk adalah
pointer yang berisi BABOON, yang selanjutnya akan menunjuk blok data 2. Blok data ini
akan mencari untuk record dengan key tujuan, yaitu BAT, dimana pada blok ini record
tersebut ditemukan.
Contohnya :
Diketahui:
Jawab:
y = (B) / (V + P)
y = (4096) / (25 + 8)
y = 124,12
sebuah berkas (file) harus dapat diakses secara langsung (direct) dari berbagai kunci
atribut (key field) yang ditentukan.
Ada banyak cara untuk mengorganisasi berkas semacam ini, yaitu dengan cara:
(1) Inversion
Yaitu dengan cara yang mirip dengan organisasi relative yang satu tabel index-nya berisi key
field yang terurut dan sebuah pointer yang menunjuk ke alamat di mana data disimpan.
Bedanya, karena di sini dibutuhkan banyak kunci, maka di tabel tersebut disimpan pula
kunci-kunci atribut lainnya yang dibutuhkan.
(2) Multi-list
Yaitu dengan cara yang hampir sama dengan cara pertama, yaitu dibuat tabel index yang
terurut key field-nya dan penunjuk ke nomor record (pertama) datanya, hanya di setiap record
ditambahkan pointer (penunjuk) ke record-record berikutnya sesuai urutan key field yang
ditentukannya. Tentu penunjuk itu akan berubah datanya bila akses dilakukan dengan key
field lainnya.
Organisasi berkas yang memperbolehkan record diakses oleh lebih dari satu key field disebut
organisasi berkas dengan banyak key.
Ada 2 teknik dasar untuk pemberian hubungan antara sebuah indeks dan data record
dari berkas, yaitu :
Inversion
Multi-list
Banyak sistem informasi interaktif memerlukan dukungan dari berkas banyak key.
Contoh :
Sebuah sistem perbankan yang mempunyai beberapa pemakai (user), seperti kasir, pegawai
kredit, manajer cabang, pegawai bank, nasabah dan lain-lain. Semuanya memerlukan akses
data yang sama dengan format record :
Adanya pemakai yang berbeda memerlukan akses record-record ini dalam cara yang berbeda.
Satu pendekatan yang dapat mendukung semua jenis akses adalah dipunyainya banyak berkas
yang berbeda. Setiap berkas diorganisasi untuk melayani satu jenis keperluan.
File account yang organisasinya indeks Untuk melayani kasir, pegawai bank dan
sequential dengan nilai key ID nasabah.
File account yang organisasinya sequential Untuk melayani pegawai kredit.
dengan record diurut menurut
OVERDRAW LIMIT
File account yang organisasinya relatif Untuk melayani pegawai kredit.
dengan nilai key SOCNO
PENUTUP
KESIMPULAN
Dari data diatas maka dapat disimpulkan bahwa dari ketiga organisasi berkas tersebut saling
berkaitan.Organisasi berkas indeks sequential adalah berkas / file yang disusun sedemikian
rupa sehingga dapat diakses secara sequential maupun secara direct (langsung) atau
kombinasi keduanya, direct dan sequential. Penyimpanan ataupun penulisan character demi
character yang ada didalam external memory, harus diatur sedemikian rupa sehingga
komputer bisa dengan mudah menemukan kembali data-data yang tersimpan didalamnya.
Aturan inilah yang kemudian dikenal sebagai organisasi file.
SARAN
Agar kita dapat menggunakan komputer dengan nyaman dan sistem penyimpanan file dengan
sistematika yang seragam. Maka media penyimpanan logis yang tepat yaitu dengan