Teknologi Infrastruktur
Sasaran
Memahami konsep Manajemen Ketersediaan (Availability Management) menurut IT Infrastructure Library. Mengenal teknik-teknik Manajemen Ketersediaan layanan TI.
Ketersediaan
Ketergantungan bisnis modern pada TI menuntut
ketersediaan layanan TI yang tinggi. Fleksibilitas bisnis berkat teknologi internet menuntut ketersediaan layanan TI setiap saat. Availability Management berorientasi kepada kebutuhan bisnis dan pengguna akan ketersediaan layanan TI.
Ketersediaan
Availability: kemampuan untuk menjalankan fungsi
Ketersediaan
Faktor-faktor pendukung ketersediaan: Keandalan (reliability)
Keandalan komponen dan adanya mekanisme
penanggulangan gangguan. Kemudahan pemeliharaan (maintainability) Pemeliharaan untuk mencegah terjadinya gangguan. Termasuk deteksi tanda-tanda kerusakan. Kemudahan perbaikan (servicability) Adanya perjanjian/kontrak dukungan perbaikan dengan vendor atau pihak ketiga.
Peta Ketergantungan
Availability Management
Tujuan: Mendukung pencapaian tujuan bisnis dengan
mengoptimasi pengerahan infrastruktur, layanan, dan SDM dalam menyediakan dan mempertahankan tingkat ketersediaan secara efisien.
Aktivitas utama:
Identifikasi persyaratan ketersediaan bisnis. Menselaraskannya dengan kemampuan infrastruktur, layanan, dan SDM: identifikasi opsi-opsi penyempurnaan dan biayanya. Mengukur/monitor realisasi ketersediaan layanan TI.
Ruang Lingkup
Lingkup Availability Management:
Semua layanan TI yang dikenai SLA atau SLR
(Service Level Agreement & Requirement) Layanan TI vital (tanpa SLA formal sekalipun). Layanan pendukung layanan-layanan diatas yang disediakan oleh unit kerja internal maupun vendor. Hal-hal lain yang memiliki dampak pada ketersediaan layanan-layanan diatas, seperti training, keahlian SDM, SOP, dan tools.
ketersediaan berdampak besar pada kepuasan bisnis dan pengguna. Menuntut adanya proses, prosedur, dan mekanisme penanggulangan gangguan.
Prinsip 3: Manajemen Ketersediaan yang
efektif menuntut pemahaman tentang fungsi layanan TI dalam proses-proses bisnis. Dapat memahami sumber gangguan dengan lebih baik dari pola utilisasi komponen-komponen sistem.
10
11
C
Availability Management
kevitalan layanan
A: Biaya Ketersediaan
Biaya investasi TI meningkat dengan dinaikannya
tingkat ketersediaan.
13
ketersediaan yang melebihi tingkat ketersediaan optimal infrastruktur dapat melambungkan biaya.
Biaya redesign infrastruktur (termasuk dukungan teknis).
14
Biaya Ketersediaan
Prinsip: merencanakan ketersediaan sejak awal
(dilibatkan dalam perancangan sistem) akan lebih murah. Availability Management mengusulkan opsi-opsi pemenuhan persyaratan ketersediaan beserta biayanya.
Tidak semua masalah ketersediaan adalah
masalah teknologi. Faktor prosedur operasional dan pemeliharaan mungkin sangat berpengaruh.
15
Biaya Ketidak-tersediaan
Mengetahui biaya kerugian akibat ketidaktersediaan penting dalam memutuskan tingkat investasi TI untuk memenuhi persyaratan ketersediaan. Perkiraan dampak ketidak-tersediaan: 1. Jumlah layanan/transaksi bisnis yang terkena dampak.
Mudah dihitung tapi kurang bermanfaat. 2. Perkiraan nilai kerugian moneter akibat terhentinya layanan bisnis. Kerugian tangible dan intangible.
16
Biaya Ketidak-tersediaan
Biaya Tangible Penurunan produktivitas pengguna Penurunan produktivitas staf TI Kehilangan pendapatan Biaya lembur dukungan teknis Pasokan yang tidak terpakai Denda atau penalti Biaya Intangible Kehilangan kepercayaan konsumen Kehilangan konsumen Kehilangan peluang bisnis Jatuhnya reputasi perusahaan Kehilangan kepercayaan pengguna Kerusakan moril staf TI
B: Perencanaan Ketersediaan
Ketersediaan umumnya adalah salah satu
komponen utama SLA. Availability Management merumuskan: Kriteria layanan-layanan TI yang vital. Kriteria ketidak-tersediaan (downtime). Dampak ketidak-tersediaan pada bisnis. Kebutuhan ketersediaan kuantitatif: batas toleransi bisnis terhadap downtime. Jam-buka layanan yang diinginkan. Prioritas waktu layanan (jam-jam sibuk, dsb.) Kebutuhan spesifik lainnya (jika ada).
18
Perencanaan Ketersediaan
Evaluasi biaya untuk memenuhi kebutuhan akan
ketersediaan:
Kuantifikasi dampak ketidak-tersediaan (nilai
kerugian bisnis). Identifikasi persyaratan ketersediaan, keandalan, dan kemudahan perawatan komponen-komponen yang terlibat. Identifikasi kemudahan perbaikan komponenkomponen dari vendor eksternal. Kalkulasi total biaya untuk memenuhi kebutuhan diatas. Negosiasikan tingkat ketersediaan dengan biaya dan potensi kerugian yang berimbang.
19
C: Rancangan Proaktif
Tujuan:
20
Perancangan Infrastruktur
Availability Management merumuskan: Spesifikasi keandalan dan serviceability komponen
infrastruktur (hardware & software). Baik yang menjadi tanggung-jawab internal maupun pihak eksternal (vendor). Lokasi dan cara pengukuran ketersediaan. Usulan perbaikan struktur dan prosedur pengelolaan sistem. Validasi rancangan akhir mengenai terpenuhinya persyaratan minimum ketersediaan. Analisa dengan model atau melalui testing/benchmarking.
21
Analisis Infrastruktur
Analisa SPOF (single point of failure) dengan CFIA
(component failure impact analysis) Tabulasi layanan dan komponen-komponen infrastruktur atau CI (configuration item). Tandai ketergantungan layanan terhadap tiap CI: Kosong jika tidak tergantung pada CI tsb. X jika tergantung sepenuhnya pada CI tsb. A jika tergantung tapi dapat dialihkan ke CI lain. B jika dapat dialihkan ke CI lain tapi harus ada kegiatan perbaikan (recovery).
22
CI dengan banyak X adalah komponen kritis. Layanan dengan banyak X adalah layanan kompleks: potensi keandalannya rendah.
CFIA
23
CFIA
Teknik lain: orientasi pada jumlah user yang terkena
dampak.
CI VBF # Users
Power
Application Server Aplikasi ERP Disk 1 Disk 2 Utility X
Semua
Semua Semua Pembayaran Pemesanan Pelaporan
1000
1000 1000 50 100 25
Kode CI-CI lain yang tergantung padanya. Kerusakan pada CI akan berdampak pada CI-CI lain tsb. Semakin banyak semakin kritis CI tsb.
24
CFIA Lanjut
kolom-kolom tambahan: Probabilitas kerusakan (dari statistik MTBF) atau dengan label kualitatif: rendah/sedang/tinggi. Perkiraan waktu perbaikan: Dari data perbaikan masa lalu, atau Dari hasil uji-coba prosedur perbaikan.
25
OR gate
resulting events
basic events 26
D: Rancangan Reaktif
Elemen kunci: Manajemen Insiden yang mapan
Prosedur eskalasi yang ketat. Definisi peran dan tanggung-jawab dari tim
penanggulangan gangguan yang jelas. Adanya prosedur komunikasi yang jelas jika terjadi gangguan besar. Fasilitas manajemen sistem Tools untuk mendeteksi, mendiagnosa, dan memulihkan dampak gangguan sistem. Prosedur pengumpulan data (log) untuk diagnosa yang efisien.
27
Rancangan Reaktif
elemen kunci:
Identifikasi kebutuhan backup & recovery
Untuk data, software, maupun hardware (spare).
28
Base product & components Paling mendasar: komponen-komponen yang memenuhi persyaratan keandalan. 2. Effective service management processes Terselenggaranya Availability Management, Manajemen Insiden/Problem, dan Manajemen Perubahan.
1.
29
30
penurunan. Waktu perbaikan kerusakan yang melebihi batas toleransi. Permintaan pengguna/bisnis untuk meningkatkan ketersediaan. Gangguan ketersediaan akibat pertumbuhan/pengembangan bisnis. Bagian dari rencana strategis TI.
31
pengguna/bisnis) dan tingkat ketersediaan ideal menurut SLA. Aktivitas-aktivitas perbaikan yang sedang dilaksanakan dengan pertimbangan biaya/manfaat masing-masing. Perubahan tingkat layanan beserta alasannya, dan opsi-opsi untuk memenuhinya beserta biayanya. Rencana kegiatan analisa pencarian penyebab gangguan-gangguan ketersediaan atau SOA (system outage analysis). Sosialisasi tentang potensi teknologi baru atau versi baru (upgrade) dalam memperbaiki tingkat ketersediaan layanan TI.
32
data dari log-log proses (termasuk aktifitas dukungan teknis) untuk mencari penyebab gangguan. Pelaksanaanya melibatkan administrator sistem & jaringan, staf dukungan teknis, user/ operator, analis sistem, vendor, manajemen bisnis. Hasilnya dilaporkan beserta rekomendasi langkahlangkah perbaikan.
33
34