Anda di halaman 1dari 34

Manajemen Ketersediaan Layanan TI

Teknologi Infrastruktur

Sasaran

Memahami konsep Manajemen Ketersediaan (Availability Management) menurut IT Infrastructure Library. Mengenal teknik-teknik Manajemen Ketersediaan layanan TI.

Ketersediaan
Ketergantungan bisnis modern pada TI menuntut

ketersediaan layanan TI yang tinggi. Fleksibilitas bisnis berkat teknologi internet menuntut ketersediaan layanan TI setiap saat. Availability Management berorientasi kepada kebutuhan bisnis dan pengguna akan ketersediaan layanan TI.

Ketersediaan
Availability: kemampuan untuk menjalankan fungsi

pada saat dibutuhkan atau dalam suatu periode waktu.


Ketersediaan layanan TI tergantung pada: Ketersediaan komponen pendukung. Ketahanan terhadap gangguan. Kualitas pemeliharaan dan dukungan teknis. Kualitas proses-proses dan prosedur pengelolaan. Keamanan, integritas, dan ketersediaan data.

Ketersediaan
Faktor-faktor pendukung ketersediaan: Keandalan (reliability)
Keandalan komponen dan adanya mekanisme

penanggulangan gangguan. Kemudahan pemeliharaan (maintainability) Pemeliharaan untuk mencegah terjadinya gangguan. Termasuk deteksi tanda-tanda kerusakan. Kemudahan perbaikan (servicability) Adanya perjanjian/kontrak dukungan perbaikan dengan vendor atau pihak ketiga.

Peta Ketergantungan

Availability Management
Tujuan: Mendukung pencapaian tujuan bisnis dengan

mengoptimasi pengerahan infrastruktur, layanan, dan SDM dalam menyediakan dan mempertahankan tingkat ketersediaan secara efisien.
Aktivitas utama:

Identifikasi persyaratan ketersediaan bisnis. Menselaraskannya dengan kemampuan infrastruktur, layanan, dan SDM: identifikasi opsi-opsi penyempurnaan dan biayanya. Mengukur/monitor realisasi ketersediaan layanan TI.

Ruang Lingkup
Lingkup Availability Management:
Semua layanan TI yang dikenai SLA atau SLR

(Service Level Agreement & Requirement) Layanan TI vital (tanpa SLA formal sekalipun). Layanan pendukung layanan-layanan diatas yang disediakan oleh unit kerja internal maupun vendor. Hal-hal lain yang memiliki dampak pada ketersediaan layanan-layanan diatas, seperti training, keahlian SDM, SOP, dan tools.

Prinsip Manajemen Ketersediaan

Prinsip 1: Ketersediaan adalah inti dari

(persepsi) kepuasan pengguna dan bisnis.

Prinsip Manajemen Ketersediaan


Prinsip 2: Kecepatan menanggulangi gangguan

ketersediaan berdampak besar pada kepuasan bisnis dan pengguna. Menuntut adanya proses, prosedur, dan mekanisme penanggulangan gangguan.
Prinsip 3: Manajemen Ketersediaan yang

efektif menuntut pemahaman tentang fungsi layanan TI dalam proses-proses bisnis. Dapat memahami sumber gangguan dengan lebih baik dari pola utilisasi komponen-komponen sistem.

10

Proses Manajemen Ketersediaan

11

Peran Manajemen Ketersediaan


Sebagai penanggung-jawab dan pengambil

keputusan yang berhubungan dengan tingkat ketersediaan.


Capacity Management
Kerawanan kapasitas akibat gangguan SLA final

C
Availability Management

Service Level Management

Rencana kapasitas Kerugian akibat ketidak-tersediaan

Usulan SLA Usulan mekanisme minimasi dampak gangguan

IT Financial Pembiayaan perbaikManagement an ketersediaan

Service Continuity Management Hasil analisa

kevitalan layanan

Peran AM sering di-bypass


12

A: Biaya Ketersediaan
Biaya investasi TI meningkat dengan dinaikannya

tingkat ketersediaan.

13

Tingkat Ketersediaan Optimal


Idealnya: disesuaikan

dengan kebutuhan dan biayanya setimpal dengan potensi kerugian.


Kebutuhan akan

ketersediaan yang melebihi tingkat ketersediaan optimal infrastruktur dapat melambungkan biaya.
Biaya redesign infrastruktur (termasuk dukungan teknis).
14

Biaya Ketersediaan
Prinsip: merencanakan ketersediaan sejak awal

(dilibatkan dalam perancangan sistem) akan lebih murah. Availability Management mengusulkan opsi-opsi pemenuhan persyaratan ketersediaan beserta biayanya.
Tidak semua masalah ketersediaan adalah

masalah teknologi. Faktor prosedur operasional dan pemeliharaan mungkin sangat berpengaruh.

15

Biaya Ketidak-tersediaan

Mengetahui biaya kerugian akibat ketidaktersediaan penting dalam memutuskan tingkat investasi TI untuk memenuhi persyaratan ketersediaan. Perkiraan dampak ketidak-tersediaan: 1. Jumlah layanan/transaksi bisnis yang terkena dampak.
Mudah dihitung tapi kurang bermanfaat. 2. Perkiraan nilai kerugian moneter akibat terhentinya layanan bisnis. Kerugian tangible dan intangible.

16

Biaya Ketidak-tersediaan
Biaya Tangible Penurunan produktivitas pengguna Penurunan produktivitas staf TI Kehilangan pendapatan Biaya lembur dukungan teknis Pasokan yang tidak terpakai Denda atau penalti Biaya Intangible Kehilangan kepercayaan konsumen Kehilangan konsumen Kehilangan peluang bisnis Jatuhnya reputasi perusahaan Kehilangan kepercayaan pengguna Kerusakan moril staf TI

Permasalahan: Banyaknya faktor yang harus masuk dalam

perhitungan. Sulit mengkuantifikasi biaya intangible. Data sulit diperoleh.


17

B: Perencanaan Ketersediaan
Ketersediaan umumnya adalah salah satu

komponen utama SLA. Availability Management merumuskan: Kriteria layanan-layanan TI yang vital. Kriteria ketidak-tersediaan (downtime). Dampak ketidak-tersediaan pada bisnis. Kebutuhan ketersediaan kuantitatif: batas toleransi bisnis terhadap downtime. Jam-buka layanan yang diinginkan. Prioritas waktu layanan (jam-jam sibuk, dsb.) Kebutuhan spesifik lainnya (jika ada).
18

Perencanaan Ketersediaan
Evaluasi biaya untuk memenuhi kebutuhan akan

ketersediaan:
Kuantifikasi dampak ketidak-tersediaan (nilai

kerugian bisnis). Identifikasi persyaratan ketersediaan, keandalan, dan kemudahan perawatan komponen-komponen yang terlibat. Identifikasi kemudahan perbaikan komponenkomponen dari vendor eksternal. Kalkulasi total biaya untuk memenuhi kebutuhan diatas. Negosiasikan tingkat ketersediaan dengan biaya dan potensi kerugian yang berimbang.

19

C: Rancangan Proaktif
Tujuan:

menghindari terjadinya ketidaktersediaan layanan TI yang berdampak kerugian.


Prinsip: kegiatan

yang tidak terencana (darurat) akan lebih besar biayanya.

20

Perancangan Infrastruktur
Availability Management merumuskan: Spesifikasi keandalan dan serviceability komponen

infrastruktur (hardware & software). Baik yang menjadi tanggung-jawab internal maupun pihak eksternal (vendor). Lokasi dan cara pengukuran ketersediaan. Usulan perbaikan struktur dan prosedur pengelolaan sistem. Validasi rancangan akhir mengenai terpenuhinya persyaratan minimum ketersediaan. Analisa dengan model atau melalui testing/benchmarking.

21

Analisis Infrastruktur
Analisa SPOF (single point of failure) dengan CFIA

(component failure impact analysis) Tabulasi layanan dan komponen-komponen infrastruktur atau CI (configuration item). Tandai ketergantungan layanan terhadap tiap CI: Kosong jika tidak tergantung pada CI tsb. X jika tergantung sepenuhnya pada CI tsb. A jika tergantung tapi dapat dialihkan ke CI lain. B jika dapat dialihkan ke CI lain tapi harus ada kegiatan perbaikan (recovery).

22

CI dengan banyak X adalah komponen kritis. Layanan dengan banyak X adalah layanan kompleks: potensi keandalannya rendah.

CFIA

CI yang kritis harus:

23

Memiliki cadangan atau alternatif. Memiliki prosedur pemulihan (recovery).

CFIA
Teknik lain: orientasi pada jumlah user yang terkena

dampak.
CI VBF # Users

Power
Application Server Aplikasi ERP Disk 1 Disk 2 Utility X

Semua
Semua Semua Pembayaran Pemesanan Pelaporan

1000
1000 1000 50 100 25

VBF: vital business function (proses bisnis vital)

Dapat ditambahkan kolom:

Kode CI-CI lain yang tergantung padanya. Kerusakan pada CI akan berdampak pada CI-CI lain tsb. Semakin banyak semakin kritis CI tsb.

24

CFIA Lanjut
kolom-kolom tambahan: Probabilitas kerusakan (dari statistik MTBF) atau dengan label kualitatif: rendah/sedang/tinggi. Perkiraan waktu perbaikan: Dari data perbaikan masa lalu, atau Dari hasil uji-coba prosedur perbaikan.

25

Fault Tree Analysis


Struktur rantai penyebab ketidak-tersediaan layanan TI Untuk mengidentifikasi mekanisme pencegahan.

conditional event conditional gate

OR gate

resulting events

basic events 26

D: Rancangan Reaktif
Elemen kunci: Manajemen Insiden yang mapan
Prosedur eskalasi yang ketat. Definisi peran dan tanggung-jawab dari tim

penanggulangan gangguan yang jelas. Adanya prosedur komunikasi yang jelas jika terjadi gangguan besar. Fasilitas manajemen sistem Tools untuk mendeteksi, mendiagnosa, dan memulihkan dampak gangguan sistem. Prosedur pengumpulan data (log) untuk diagnosa yang efisien.
27

Rancangan Reaktif
elemen kunci:
Identifikasi kebutuhan backup & recovery
Untuk data, software, maupun hardware (spare).

Pengembangan dan testing prosedur backup &

recovery. Waktu pemulihan (recovery) yang sesuai target dan predictable.

28

Tingkatan Investasi Ketersediaan

Base product & components Paling mendasar: komponen-komponen yang memenuhi persyaratan keandalan. 2. Effective service management processes Terselenggaranya Availability Management, Manajemen Insiden/Problem, dan Manajemen Perubahan.
1.
29

Tingkatan Investasi Ketersediaan


System management Mekanisme monitoring, deteksi, dan pemulihan gangguan otomatis. 4. High availability design Eliminasi SPOF (titik rawan), penyediaan komponen alternatif/cadangan, dan mekanisme untuk mempersingkat downtime akibat kerusakan. 5. Full redundancy Fasilitas dual/mirror site.
3.

30

Rencana Peningkatan Ketersediaan


Alasan peningkatan ketersediaan:
Seringnya pelanggaran SLA ketersediaan. Seringnya terjadi gangguan (downtime). Hasil pengukuran ketersediaan menunjukkan trend

penurunan. Waktu perbaikan kerusakan yang melebihi batas toleransi. Permintaan pengguna/bisnis untuk meningkatkan ketersediaan. Gangguan ketersediaan akibat pertumbuhan/pengembangan bisnis. Bagian dari rencana strategis TI.

31

Rencana Peningkatan Ketersediaan


Garis besar isi rencana: Tingkat ketersediaan aktual saat ini (dalam bahasa

pengguna/bisnis) dan tingkat ketersediaan ideal menurut SLA. Aktivitas-aktivitas perbaikan yang sedang dilaksanakan dengan pertimbangan biaya/manfaat masing-masing. Perubahan tingkat layanan beserta alasannya, dan opsi-opsi untuk memenuhinya beserta biayanya. Rencana kegiatan analisa pencarian penyebab gangguan-gangguan ketersediaan atau SOA (system outage analysis). Sosialisasi tentang potensi teknologi baru atau versi baru (upgrade) dalam memperbaiki tingkat ketersediaan layanan TI.

32

System Outage Analysis


SOA: kegiatan analisa dengan melibatkan berbagai

data dari log-log proses (termasuk aktifitas dukungan teknis) untuk mencari penyebab gangguan. Pelaksanaanya melibatkan administrator sistem & jaringan, staf dukungan teknis, user/ operator, analis sistem, vendor, manajemen bisnis. Hasilnya dilaporkan beserta rekomendasi langkahlangkah perbaikan.

33

System Outage Analysis


Struktur kegiatan SOA:

34

Anda mungkin juga menyukai