11 Manajemen Ketersediaan

Manajemen Ketersediaan Layanan TI
Teknologi Infrastruktur
Sasaran
Memahami konsep Manajemen Ketersediaan (Availability Management) menurut IT Infrastructure Library. Mengenal teknik-teknik Manajemen Ketersediaan layanan TI.
Ketersediaan
Ketergantungan bisnis modern pada TI menuntut
ketersediaan layanan TI yang tinggi. Fleksibilitas bisnis berkat teknologi internet menuntut ketersediaan layanan TI setiap saat. Availability Management berorientasi kepada kebutuhan bisnis dan pengguna akan ketersediaan layanan TI.
Ketersediaan
Availability: kemampuan untuk menjalankan fungsi
pada saat dibutuhkan atau dalam suatu periode waktu.

Ketersediaan layanan TI tergantung pada: Ketersediaan komponen pendukung. Ketahanan terhadap gangguan. Kualitas pemeliharaan dan dukungan teknis. Kualitas proses-proses dan prosedur pengelolaan. Keamanan, integritas, dan ketersediaan data.
Ketersediaan
Faktor-faktor pendukung ketersediaan: Keandalan (reliability)
Keandalan komponen dan adanya mekanisme
penanggulangan gangguan. Kemudahan pemeliharaan (maintainability) Pemeliharaan untuk mencegah terjadinya gangguan. Termasuk deteksi tanda-tanda kerusakan. Kemudahan perbaikan (servicability) Adanya perjanjian/kontrak dukungan perbaikan dengan vendor atau pihak ketiga.
Peta Ketergantungan
Availability Management
Tujuan: Mendukung pencapaian tujuan bisnis dengan
mengoptimasi pengerahan infrastruktur, layanan, dan SDM dalam menyediakan dan mempertahankan tingkat ketersediaan secara efisien.
Aktivitas utama:

Identifikasi persyaratan ketersediaan bisnis. Menselaraskannya dengan kemampuan infrastruktur, layanan, dan SDM: identifikasi opsi-opsi penyempurnaan dan biayanya. Mengukur/monitor realisasi ketersediaan layanan TI.
Ruang Lingkup
Lingkup Availability Management:
Semua layanan TI yang dikenai SLA atau SLR
(Service Level Agreement & Requirement) Layanan TI vital (tanpa SLA formal sekalipun). Layanan pendukung layanan-layanan diatas yang disediakan oleh unit kerja internal maupun vendor. Hal-hal lain yang memiliki dampak pada ketersediaan layanan-layanan diatas, seperti training, keahlian SDM, SOP, dan tools.
Prinsip Manajemen Ketersediaan
Prinsip 1: Ketersediaan adalah inti dari
(persepsi) kepuasan pengguna dan bisnis.
Prinsip Manajemen Ketersediaan

Prinsip 2: Kecepatan menanggulangi gangguan
ketersediaan berdampak besar pada kepuasan bisnis dan pengguna. Menuntut adanya proses, prosedur, dan mekanisme penanggulangan gangguan.
Prinsip 3: Manajemen Ketersediaan yang
efektif menuntut pemahaman tentang fungsi layanan TI dalam proses-proses bisnis. Dapat memahami sumber gangguan dengan lebih baik dari pola utilisasi komponen-komponen sistem.
10
Proses Manajemen Ketersediaan
11
Peran Manajemen Ketersediaan

Sebagai penanggung-jawab dan pengambil
keputusan yang berhubungan dengan tingkat ketersediaan.

Capacity Management
Kerawanan kapasitas akibat gangguan SLA final
C
Availability Management
Service Level Management
Rencana kapasitas Kerugian akibat ketidak-tersediaan
Usulan SLA Usulan mekanisme minimasi dampak gangguan
IT Financial Pembiayaan perbaikManagement an ketersediaan
Service Continuity Management Hasil analisa
kevitalan layanan
Peran AM sering di-bypass

12
A: Biaya Ketersediaan
Biaya investasi TI meningkat dengan dinaikannya
tingkat ketersediaan.
13
Tingkat Ketersediaan Optimal

Idealnya: disesuaikan
dengan kebutuhan dan biayanya setimpal dengan potensi kerugian.

Kebutuhan akan
ketersediaan yang melebihi tingkat ketersediaan optimal infrastruktur dapat melambungkan biaya.
Biaya redesign infrastruktur (termasuk dukungan teknis).
14
Biaya Ketersediaan
Prinsip: merencanakan ketersediaan sejak awal
(dilibatkan dalam perancangan sistem) akan lebih murah. Availability Management mengusulkan opsi-opsi pemenuhan persyaratan ketersediaan beserta biayanya.
Tidak semua masalah ketersediaan adalah
masalah teknologi. Faktor prosedur operasional dan pemeliharaan mungkin sangat berpengaruh.
15
Biaya Ketidak-tersediaan
Mengetahui biaya kerugian akibat ketidaktersediaan penting dalam memutuskan tingkat investasi TI untuk memenuhi persyaratan ketersediaan. Perkiraan dampak ketidak-tersediaan: 1. Jumlah layanan/transaksi bisnis yang terkena dampak.
Mudah dihitung tapi kurang bermanfaat. 2. Perkiraan nilai kerugian moneter akibat terhentinya layanan bisnis. Kerugian tangible dan intangible.
16
Biaya Ketidak-tersediaan
Biaya Tangible Penurunan produktivitas pengguna Penurunan produktivitas staf TI Kehilangan pendapatan Biaya lembur dukungan teknis Pasokan yang tidak terpakai Denda atau penalti Biaya Intangible Kehilangan kepercayaan konsumen Kehilangan konsumen Kehilangan peluang bisnis Jatuhnya reputasi perusahaan Kehilangan kepercayaan pengguna Kerusakan moril staf TI
Permasalahan: Banyaknya faktor yang harus masuk dalam
perhitungan. Sulit mengkuantifikasi biaya intangible. Data sulit diperoleh.

17
B: Perencanaan Ketersediaan
Ketersediaan umumnya adalah salah satu
komponen utama SLA. Availability Management merumuskan: Kriteria layanan-layanan TI yang vital. Kriteria ketidak-tersediaan (downtime). Dampak ketidak-tersediaan pada bisnis. Kebutuhan ketersediaan kuantitatif: batas toleransi bisnis terhadap downtime. Jam-buka layanan yang diinginkan. Prioritas waktu layanan (jam-jam sibuk, dsb.) Kebutuhan spesifik lainnya (jika ada).
18
Perencanaan Ketersediaan
Evaluasi biaya untuk memenuhi kebutuhan akan
ketersediaan:
Kuantifikasi dampak ketidak-tersediaan (nilai
kerugian bisnis). Identifikasi persyaratan ketersediaan, keandalan, dan kemudahan perawatan komponen-komponen yang terlibat. Identifikasi kemudahan perbaikan komponenkomponen dari vendor eksternal. Kalkulasi total biaya untuk memenuhi kebutuhan diatas. Negosiasikan tingkat ketersediaan dengan biaya dan potensi kerugian yang berimbang.
19
C: Rancangan Proaktif
Tujuan:
menghindari terjadinya ketidaktersediaan layanan TI yang berdampak kerugian.

Prinsip: kegiatan
yang tidak terencana (darurat) akan lebih besar biayanya.
20
Perancangan Infrastruktur
Availability Management merumuskan: Spesifikasi keandalan dan serviceability komponen
infrastruktur (hardware & software). Baik yang menjadi tanggung-jawab internal maupun pihak eksternal (vendor). Lokasi dan cara pengukuran ketersediaan. Usulan perbaikan struktur dan prosedur pengelolaan sistem. Validasi rancangan akhir mengenai terpenuhinya persyaratan minimum ketersediaan. Analisa dengan model atau melalui testing/benchmarking.
21
Analisis Infrastruktur
Analisa SPOF (single point of failure) dengan CFIA
(component failure impact analysis) Tabulasi layanan dan komponen-komponen infrastruktur atau CI (configuration item). Tandai ketergantungan layanan terhadap tiap CI: Kosong jika tidak tergantung pada CI tsb. X jika tergantung sepenuhnya pada CI tsb. A jika tergantung tapi dapat dialihkan ke CI lain. B jika dapat dialihkan ke CI lain tapi harus ada kegiatan perbaikan (recovery).
22
CI dengan banyak X adalah komponen kritis. Layanan dengan banyak X adalah layanan kompleks: potensi keandalannya rendah.
CFIA
CI yang kritis harus:
23
Memiliki cadangan atau alternatif. Memiliki prosedur pemulihan (recovery).
CFIA
Teknik lain: orientasi pada jumlah user yang terkena
dampak.
CI VBF # Users
Power
Application Server Aplikasi ERP Disk 1 Disk 2 Utility X
Semua
Semua Semua Pembayaran Pemesanan Pelaporan
1000
1000 1000 50 100 25
VBF: vital business function (proses bisnis vital)
Dapat ditambahkan kolom:
Kode CI-CI lain yang tergantung padanya. Kerusakan pada CI akan berdampak pada CI-CI lain tsb. Semakin banyak semakin kritis CI tsb.
24
CFIA Lanjut
kolom-kolom tambahan: Probabilitas kerusakan (dari statistik MTBF) atau dengan label kualitatif: rendah/sedang/tinggi. Perkiraan waktu perbaikan: Dari data perbaikan masa lalu, atau Dari hasil uji-coba prosedur perbaikan.
25
Fault Tree Analysis

Struktur rantai penyebab ketidak-tersediaan layanan TI Untuk mengidentifikasi mekanisme pencegahan.
conditional event conditional gate
OR gate
resulting events
basic events 26
D: Rancangan Reaktif
Elemen kunci: Manajemen Insiden yang mapan
Prosedur eskalasi yang ketat. Definisi peran dan tanggung-jawab dari tim
penanggulangan gangguan yang jelas. Adanya prosedur komunikasi yang jelas jika terjadi gangguan besar. Fasilitas manajemen sistem Tools untuk mendeteksi, mendiagnosa, dan memulihkan dampak gangguan sistem. Prosedur pengumpulan data (log) untuk diagnosa yang efisien.
27
Rancangan Reaktif
elemen kunci:
Identifikasi kebutuhan backup & recovery
Untuk data, software, maupun hardware (spare).
Pengembangan dan testing prosedur backup &
recovery. Waktu pemulihan (recovery) yang sesuai target dan predictable.
28
Tingkatan Investasi Ketersediaan
Base product & components Paling mendasar: komponen-komponen yang memenuhi persyaratan keandalan. 2. Effective service management processes Terselenggaranya Availability Management, Manajemen Insiden/Problem, dan Manajemen Perubahan.
1.
29
Tingkatan Investasi Ketersediaan

System management Mekanisme monitoring, deteksi, dan pemulihan gangguan otomatis. 4. High availability design Eliminasi SPOF (titik rawan), penyediaan komponen alternatif/cadangan, dan mekanisme untuk mempersingkat downtime akibat kerusakan. 5. Full redundancy Fasilitas dual/mirror site.
3.
30
Rencana Peningkatan Ketersediaan

Alasan peningkatan ketersediaan:
Seringnya pelanggaran SLA ketersediaan. Seringnya terjadi gangguan (downtime). Hasil pengukuran ketersediaan menunjukkan trend
penurunan. Waktu perbaikan kerusakan yang melebihi batas toleransi. Permintaan pengguna/bisnis untuk meningkatkan ketersediaan. Gangguan ketersediaan akibat pertumbuhan/pengembangan bisnis. Bagian dari rencana strategis TI.
31
Rencana Peningkatan Ketersediaan

Garis besar isi rencana: Tingkat ketersediaan aktual saat ini (dalam bahasa
pengguna/bisnis) dan tingkat ketersediaan ideal menurut SLA. Aktivitas-aktivitas perbaikan yang sedang dilaksanakan dengan pertimbangan biaya/manfaat masing-masing. Perubahan tingkat layanan beserta alasannya, dan opsi-opsi untuk memenuhinya beserta biayanya. Rencana kegiatan analisa pencarian penyebab gangguan-gangguan ketersediaan atau SOA (system outage analysis). Sosialisasi tentang potensi teknologi baru atau versi baru (upgrade) dalam memperbaiki tingkat ketersediaan layanan TI.
32
System Outage Analysis

SOA: kegiatan analisa dengan melibatkan berbagai
data dari log-log proses (termasuk aktifitas dukungan teknis) untuk mencari penyebab gangguan. Pelaksanaanya melibatkan administrator sistem & jaringan, staf dukungan teknis, user/ operator, analis sistem, vendor, manajemen bisnis. Hasilnya dilaporkan beserta rekomendasi langkahlangkah perbaikan.
33
System Outage Analysis

Struktur kegiatan SOA:
34

11 Manajemen Ketersediaan

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

11 Manajemen Ketersediaan

Diunggah oleh

Hak Cipta:

Format Tersedia

Manajemen Ketersediaan Layanan TI

pada saat dibutuhkan atau dalam suatu periode waktu.

Prinsip Manajemen Ketersediaan

Prinsip 1: Ketersediaan adalah inti dari

(persepsi) kepuasan pengguna dan bisnis.

Prinsip Manajemen Ketersediaan

Proses Manajemen Ketersediaan

Peran Manajemen Ketersediaan

keputusan yang berhubungan dengan tingkat ketersediaan.

Service Level Management

Rencana kapasitas Kerugian akibat ketidak-tersediaan

Usulan SLA Usulan mekanisme minimasi dampak gangguan

IT Financial Pembiayaan perbaikManagement an ketersediaan

Service Continuity Management Hasil analisa

Peran AM sering di-bypass

Tingkat Ketersediaan Optimal

dengan kebutuhan dan biayanya setimpal dengan potensi kerugian.

Permasalahan: Banyaknya faktor yang harus masuk dalam

perhitungan. Sulit mengkuantifikasi biaya intangible. Data sulit diperoleh.

menghindari terjadinya ketidaktersediaan layanan TI yang berdampak kerugian.

yang tidak terencana (darurat) akan lebih besar biayanya.

CI yang kritis harus:

Memiliki cadangan atau alternatif. Memiliki prosedur pemulihan (recovery).

VBF: vital business function (proses bisnis vital)

Dapat ditambahkan kolom:

Fault Tree Analysis

conditional event conditional gate

Pengembangan dan testing prosedur backup &

recovery. Waktu pemulihan (recovery) yang sesuai target dan predictable.

Tingkatan Investasi Ketersediaan

Tingkatan Investasi Ketersediaan

Rencana Peningkatan Ketersediaan

Rencana Peningkatan Ketersediaan

System Outage Analysis

System Outage Analysis

Anda mungkin juga menyukai