Anda di halaman 1dari 26

BAB 13

Disaster Recovery Plan

1
Sasaran
Memahami konsep Business Continuity Planning
(perencanaan kontinuitas layanan TI).
Memahami strategi pemulihan layanan TI dalam Disaster
Recovery Plan (rencana penanggulangan bencana).

2
Business Continuity Plan (BCP)
Kontinuitas layanan TI perusahaan harus dijaga dari gangguan:
Bencana alam
Ulah manusia (disengaja atau tidak)
Kerusakan.
Dibutuhkan perencanaan untuk mencegah, menangani, dan
menanggulangi gangguan
Policy dan prosedur penanganan bencana.
Strategi pemulihan layanan.
Strategi minimasi dampak bencana.

3
Fase Penanganan Bencana
Pemulihan
Layanan Vital

Evaluasi Restorasi
insiden Notifikasi Kerusakan Layanan

Perbaikan
Kerusakan

Tidak semua insiden berstatus bencana


Ditentukan oleh hasil evaluasi.
Pemulihan layanan menggunakan fasilitas alternatif/cadangan atau
secara manual.
Perbaikan dapat berupa pemindahan lokasi layanan.

4
Tahapan BC Planning
Tahapan perencanaan:
1. Penyusunan policy rencana darurat.
2. Analisa dampak bisnis (dari gangguan).
3. Identifikasi mekanisme pencegahan.
4. Pengembangan strategi pemulihan layanan.
5. Penyusunan prosedur penanganan situasi darurat.
6. Uji coba, pelatihan, dan latihan prosedur darurat.
7. Re-evaluasi rencana penanganan situasi darurat.

5
Proses Pengembangan BCP
1. Penyusunan Policy
Identifikasi peraturan perundangan yang mempersyaratkan
perencanaan situasi darurat.
Penyusunan kebijakan penanganan situasi darurat.
Mendapatkan persetujuan.
Mensosialisasikan policy.

6
Proses Pengembangan BCP
2. Analisa Dampak terhadap bisnis
Identifikasi sumber daya TI vital.
Identifikasi dampak gangguan dan batas lamanya gangguan.
Menyusun prioritas pemulihan sumber daya TI.
3. Identifikasi mekanisme pencegahan
Implementasi mekanisme pencegahan.
Pemeliharaan mekanisme pencegahan.

7
Proses Pengembangan BCP
4. Pengembangan strategi pemulihan layanan
Identifikasi metoda pemulihan.
Integrasi metoda dalam rancangan arsitektur TI.
5. Pengembangan rencana penanganan situasi darurat
Dokumentasi strategi pemulihan layanan.

8
Proses Pengembangan BCP
6. Uji-coba, pelatihan, dan latihan prosedur darurat
Pengembangan target uji-coba dan kriteria keberhasilan.
Perbaikan berdasarkan pengalaman/ permasalahan.
Pelatihan personil.
7. Reevaluasi rencana penanggulangan situasi darurat
Review dan update.

9
BCP Policy
Terutama berisi:
Peran dan tanggung-jawab dalam organisasi penanggulangan
bencana
Kepala: koordinator penanggulangan bencana.
Ruang lingkup: bagian dalam organisasi dan kategori
komponen infrastruktur.
Kebutuhan sumber daya.
Kebutuhan pelatihan personil.
Jadwal uji-coba dan latihan.
Jadwal reevaluasi rencana penanggulang-an bencana.

10
Klasifikasi Insiden
Policy juga mengatur insiden apa yang masuk kategori bencana
(mengaktifkan BCP).
Menerapkan klasifikasi insiden:
1. Negligible (biasa): tidak menyebabkan kerusakan (listrik mati,
aplikasi crash, dsb.)
2. Minor (kecil): kerusakan yang tidak berdampak kerugian.
3. Major (besar): kerusakan yang berdampak kerugian pada bisnis.
4. Crisis (krisis): kerusakan yang berdampak kerugian besar,
mengancam kelangsungan bisnis, dan dapat mengganggu sistem
lain (pihak ketiga).

11
Klasifikasi Insiden
Kategori insiden biasanya dikaitkan dengan lamanya gangguan
(mulai dari kejadian sampai resolusi):

Kategori Level Lama gangguan Tindakan


Krisis 7 24 jam Aktifkan BCP
6 12 jam Aktifkan BCP
Mayor 5 6 jam Antisipasi BCP
4 4 jam Perbaiki/restorasi
3 2 jam Perbaiki
Minor 2 1 jam Perbaiki
1 0.5 jam Perbaiki
Biasa 0 Catat (log) & monitor

12
Analisa Dampak Bencana
Langkah I: Identifikasi sumber daya TI vital:
Melibatkan berbagai pihak (user, pengelola proses bisnis,
pengelola aplikasi, dsb.), tahapan:
Ranking proses bisnis berdasarkan nilai strategisnya.
Identifikasi komponen infrastruktur yang mendukung proses-
proses bisnis strategis (server, akses ke WAN, dsb.)

13
Analisa Dampak Bencana
Langkah II: Klasifikasi layanan TI berdasarkan toleransi
terhadap lamanya gangguan
1) Critical: Layanan tidak dapat dijalankan tanpa fasilitas yang
identik, apalagi manual. Biaya interupsi sangat mahal.
2) Vital: Layanan dapat diganti dengan proses manual tapi
tidak bisa lama (max. 5 hari).
3) Sensitive: Layanan dapat diganti dengan proses manual
dengan biaya yang tidak terlalu tinggi (tambahan staf, dsb.)
4) Non-sensitive: Layanan dapat dihentikan dengan kerugian
kecil.

14
Analisa Dampak Bencana
Gangguan pada layanan tidak vital dapat berdampak pada
layanan vital.
Toleransi terhadap lamanya gangguan layanan TI dipetakan ke
toleransi komponen infrastruktur pendukungnya
Langkah III: Menyusun prioritas (urutan) dalam
pemulihan/perbaikan komponen infrastruktur berdasarkan
toleransi komponen-komponen infrastruktur vital.

15
Mekanisme Pencegahan
Mekanisme untuk mencegah atau meminimasi gangguan, misal
penggunaan:
UPS (uninterrupted power supply).
Generator set.
AC dengan kapasitas berlebih.
Fire hydrant atau suppressor.
Detektor asap/api.
Sensor kelembapan/air.
Penyimpanan media tahan api dan kedap air.
Tombol emergency shut down.
Tempat penyimpanan media off-site.
Backup rutin dan sering.

16
Biaya Pencegahan
Tingkat pencegahan yang ideal: minimasi (biaya pencegahan &
penanggulangan) + (kerugian akibat gangguan).
Biaya

minimum

Biaya pemulihan
/pencegahan

Waktu
17
Contoh Biaya vs. Waktu
RPO (recovery point objective): target titik waktu dimana
transaksi-transaksi terbaru dapat diselamatkan.
RTO (recovery time objective): target waktu pemulihan layanan
dari gangguan.

gangguan
RPO RTO

waktu
tape mirroring 1 jam 24 jam
backup
disk 2 jam
backup

18
Strategi Pemulihan Layanan
Penjadwalan backup data dan file penting:
Misal metoda child-parent-grand parent (harian: 7 versi,
mingguan: 4 versi, bulanan: 12 versi, tahunan: 1 versi).
Penyimpanan backup di lokasi terpisah, kriteria
Terpisah secara geografis (bebas bencana)
Memiliki fasilitas keamanan (access control)
Memiliki fasilitas penyimpanan bebas gangguan
Biaya dan waktu untuk mengakses dapat diterima.

19
Strategi Pemulihan Layanan
Pemulihan layanan di lokasi alternatif/ cadangan
Mirror (dual) site:
Fasilitas identik dengan replikasi data real-time. Siap mengambil alih setiap
saat. Biasanya dimiliki dan dioperasikan oleh perusahaan.
Hot site:
Fasilitas cadangan yang dilengkapi dengan hardware, infrastruktur, dan
staf. Proses migrasi sistem dimulai begitu BCP diaktifkan.

20
Strategi Pemulihan Layanan
Warm site:
Beberapa sarana sudah tersedia (biasanya merupakan lokasi
layanan lain). Perlu penyiapan untuk mengambil alih layanan.
Cold site:
Hanya fasilitas bangunan dengan infrastruktur dasar (listrik, AC,
dsb.) Perlu instalasi peralatan untuk mengambil alih layanan.
Mobile site:
Fasilitas portable yang dapat di-setup dimana saja. Biasanya
dimiliki pihak ketiga.

21
Situs Alternatif
Karakteristik:

Site Cost Hardware Communi- Setup time Location


cations
Cold site Low None None Long Fixed
Warm Medium Partial Partial/Full Medium Fixed
site
Hot site Medium/ Full Full Short Fixed
High
Mobile High Dependent Dependent Dependent Not Fixed
site
Mirror High Full Full None Fixed
site

22
Strategi Pemulihan Layanan
Strategi pengadaan perlengkapan pengganti
Kontrak perjanjian (SLA) dengan vendor.
Termasuk layanan prioritas dalam keadaan darurat.
Beli dan simpan cadangan di gudang.
Investasi besar dan ada resiko teknologi kadaluwarsa.
Kontrak perjanjian dengan pihak ketiga untuk
meminjam fasilitas.
Fasilitas perusahaan lain dengan teknologi serupa atau compatible.

23
Tabulasi Biaya

Biaya (juta Rp)


Strategi Vendor Hardware Software Travel/ Labor/ Testing Supply
Shipping Contractor
Lokasi Cold site
Cadangan Warm site
Hot site
Mobile site
Mirror site
Penyimpan- Komersial
an Offsite Internal
Peralatan SLA
Cadangan Cadangan
Pinjam

24
Peran dan Tanggung-jawab
Daftar kontak resmi:

25
Dokumen BCP

26

Anda mungkin juga menyukai