Anda di halaman 1dari 34

Manajemen

Ketersediaan Layanan
TI
Teknologi Infrastruktur

Sasaran
Memahami konsep Manajemen

Ketersediaan (Availability Management)


menurut IT Infrastructure Library.
Mengenal teknik-teknik Manajemen
Ketersediaan layanan TI.

Ketersediaan
Ketergantungan bisnis modern pada TI

menuntut ketersediaan layanan TI yang


tinggi.
Fleksibilitas bisnis berkat teknologi internet
menuntut ketersediaan layanan TI setiap
saat.
Availability Management berorientasi kepada
kebutuhan bisnis dan pengguna akan
ketersediaan layanan TI.

Ketersediaan
Availability: kemampuan untuk menjalankan

fungsi pada saat dibutuhkan atau dalam


suatu periode waktu.

Ketersediaan layanan TI tergantung pada:


Ketersediaan komponen pendukung.
Ketahanan terhadap gangguan.
Kualitas pemeliharaan dan dukungan teknis.
Kualitas proses-proses dan prosedur

pengelolaan.
Keamanan, integritas, dan ketersediaan data.

Ketersediaan
Faktor-faktor pendukung ketersediaan:
Keandalan (reliability)
Keandalan komponen dan adanya

mekanisme penanggulangan gangguan.


Kemudahan pemeliharaan (maintainability)
Pemeliharaan untuk mencegah terjadinya
gangguan. Termasuk deteksi tanda-tanda
kerusakan.
Kemudahan perbaikan (servicability)
Adanya perjanjian/kontrak dukungan
perbaikan dengan vendor atau pihak ketiga.

Peta Ketergantungan

Availability Management
Tujuan:
Mendukung pencapaian tujuan bisnis dengan

mengoptimasi pengerahan infrastruktur,


layanan, dan SDM dalam menyediakan dan
mempertahankan tingkat ketersediaan
secara efisien.

Aktivitas utama:

Identifikasi persyaratan ketersediaan bisnis.


Menselaraskannya dengan kemampuan
infrastruktur, layanan, dan SDM: identifikasi
opsi-opsi penyempurnaan dan biayanya.
Mengukur/monitor realisasi ketersediaan
layanan TI.

Ruang Lingkup
Lingkup Availability Management:
Semua layanan TI yang dikenai SLA atau SLR

(Service Level Agreement & Requirement)


Layanan TI vital (tanpa SLA formal sekalipun).
Layanan pendukung layanan-layanan diatas
yang disediakan oleh unit kerja internal
maupun vendor.
Hal-hal lain yang memiliki dampak pada
ketersediaan layanan-layanan diatas, seperti
training, keahlian SDM, SOP, dan tools.

Prinsip Manajemen
Ketersediaan

Prinsip 1: Ketersediaan adalah inti dari

(persepsi) kepuasan pengguna dan bisnis.

Prinsip Manajemen
Ketersediaan
Prinsip 2: Kecepatan menanggulangi

gangguan ketersediaan berdampak besar


pada kepuasan bisnis dan pengguna.
Menuntut adanya proses, prosedur, dan
mekanisme penanggulangan gangguan.
Prinsip 3: Manajemen Ketersediaan yang

efektif menuntut pemahaman tentang fungsi


layanan TI dalam proses-proses bisnis.
Dapat memahami sumber gangguan
dengan lebih baik dari pola utilisasi
komponen-komponen sistem.

10

Proses Manajemen
Ketersediaan

11

Peran Manajemen
Ketersediaan
Sebagai penanggung-jawab dan pengambil

keputusan yang berhubungan dengan tingkat


ketersediaan.
Capacity
Management

Kerawanan kapasitas
akibat gangguan

Rencana kapasitas
Kerugian akibat
ketidak-tersediaan

SLA final

B
Availability
Management

Usulan SLA

IT Financial
perbaikManagement Pembiayaan
an ketersediaan

Usulan mekanisme
minimasi dampak gangguan

Service Continuity
Management
Hasil analisa

kevitalan layanan

Peran AM sering di-bypass


12

Service Level
Management

A: Biaya Ketersediaan
Biaya investasi TI meningkat dengan

dinaikannya tingkat ketersediaan.

13

Tingkat Ketersediaan Optimal


Idealnya: disesuaikan

dengan kebutuhan
dan biayanya
setimpal dengan
potensi kerugian.

Kebutuhan akan

ketersediaan yang
melebihi tingkat
ketersediaan optimal
infrastruktur dapat
melambungkan
biaya.
Biaya redesign infrastruktur
(termasuk dukungan teknis).

14

Biaya Ketersediaan
Prinsip: merencanakan ketersediaan sejak

awal (dilibatkan dalam perancangan sistem)


akan lebih murah.
Availability Management mengusulkan opsiopsi pemenuhan persyaratan ketersediaan
beserta biayanya.

Tidak semua masalah ketersediaan adalah

masalah teknologi.
Faktor prosedur operasional dan
pemeliharaan mungkin sangat berpengaruh.

15

Biaya Ketidak-tersediaan
Mengetahui biaya kerugian akibat ketidak-

tersediaan penting dalam memutuskan


tingkat investasi TI untuk memenuhi
persyaratan ketersediaan.

Perkiraan dampak ketidak-tersediaan:

1. Jumlah layanan/transaksi bisnis yang

terkena dampak.
Mudah dihitung tapi kurang bermanfaat.
2. Perkiraan nilai kerugian moneter akibat
terhentinya layanan bisnis.
Kerugian tangible dan intangible.
16

Biaya Ketidak-tersediaan
Biaya Tangible
Penurunan produktivitas pengguna
Penurunan produktivitas staf TI
Kehilangan pendapatan
Biaya lembur dukungan teknis
Pasokan yang tidak terpakai
Denda atau penalti

Biaya Intangible
Kehilangan kepercayaan konsumen
Kehilangan konsumen
Kehilangan peluang bisnis
Jatuhnya reputasi perusahaan
Kehilangan kepercayaan pengguna
Kerusakan moril staf TI

Permasalahan:
Banyaknya faktor yang harus masuk dalam

perhitungan.
Sulit mengkuantifikasi biaya intangible.
Data sulit diperoleh.

17

B: Perencanaan Ketersediaan
Ketersediaan umumnya adalah salah satu

komponen utama SLA.


Availability Management merumuskan:
Kriteria layanan-layanan TI yang vital.
Kriteria ketidak-tersediaan (downtime).
Dampak ketidak-tersediaan pada bisnis.
Kebutuhan ketersediaan kuantitatif: batas
toleransi bisnis terhadap downtime.
Jam-buka layanan yang diinginkan.
Prioritas waktu layanan (jam-jam sibuk, dsb.)
Kebutuhan spesifik lainnya (jika ada).
18

Perencanaan Ketersediaan
Evaluasi biaya untuk memenuhi kebutuhan

akan ketersediaan:

Kuantifikasi dampak ketidak-tersediaan (nilai

kerugian bisnis).
Identifikasi persyaratan ketersediaan,
keandalan, dan kemudahan perawatan
komponen-komponen yang terlibat.
Identifikasi kemudahan perbaikan komponenkomponen dari vendor eksternal.
Kalkulasi total biaya untuk memenuhi
kebutuhan diatas.
Negosiasikan tingkat ketersediaan dengan
biaya dan potensi kerugian yang berimbang.
19

C: Rancangan Proaktif
Tujuan:

menghindari
terjadinya
ketidaktersediaan
layanan TI yang
berdampak
kerugian.

Prinsip: kegiatan

yang tidak
terencana
(darurat) akan
lebih besar
biayanya.

20

Perancangan Infrastruktur
Availability Management merumuskan:
Spesifikasi keandalan dan serviceability

komponen infrastruktur (hardware & software).


Baik yang menjadi tanggung-jawab internal
maupun pihak eksternal (vendor).
Lokasi dan cara pengukuran ketersediaan.
Usulan perbaikan struktur dan prosedur
pengelolaan sistem.
Validasi rancangan akhir mengenai
terpenuhinya persyaratan minimum
ketersediaan.
Analisa dengan model atau melalui
testing/benchmarking.

21

Analisis Infrastruktur
Analisa SPOF (single point of failure) dengan CFIA

(component failure impact analysis)


Tabulasi layanan dan komponen-komponen
infrastruktur atau CI (configuration item).
Tandai ketergantungan layanan terhadap tiap CI:
Kosong jika tidak tergantung pada CI tsb.
X jika tergantung sepenuhnya pada CI tsb.
A jika tergantung tapi dapat dialihkan ke CI lain.
B jika dapat dialihkan ke CI lain tapi harus ada
kegiatan perbaikan (recovery).

22

CI dengan banyak X adalah komponen kritis.


Layanan dengan banyak X adalah layanan
kompleks: potensi keandalannya rendah.

CFIA

CI yang kritis harus:

23

Memiliki cadangan atau alternatif.


Memiliki prosedur pemulihan (recovery).

CFIA
Teknik lain: orientasi pada jumlah user yang

terkena dampak.
CI

VBF

# Users

Power

Semua

1000

Application Server

Semua

1000

Aplikasi ERP

Semua

1000

Disk 1

Pembayaran

50

Disk 2

Pemesanan

100

Utility X

Pelaporan

VBF: vital
business
function
(proses
bisnis vital)

25

Dapat ditambahkan kolom:

24

Kode CI-CI lain yang tergantung padanya.


Kerusakan pada CI akan berdampak pada
CI-CI lain tsb.
Semakin banyak semakin kritis CI tsb.

CFIA Lanjut
kolom-kolom tambahan:
Probabilitas kerusakan (dari statistik
MTBF) atau dengan label kualitatif:
rendah/sedang/tinggi.
Perkiraan waktu perbaikan:
Dari data perbaikan masa lalu, atau
Dari hasil uji-coba prosedur perbaikan.

25

Fault Tree Analysis


Struktur rantai penyebab ketidak-tersediaan

layanan TI
Untuk mengidentifikasi mekanisme pencegahan.
conditional event
conditional gate

OR gate

basic events
26

resulting events

D: Rancangan Reaktif
Elemen kunci:
Manajemen Insiden yang mapan
Prosedur eskalasi yang ketat.
Definisi peran dan tanggung-jawab dari tim

penanggulangan gangguan yang jelas.


Adanya prosedur komunikasi yang jelas jika
terjadi gangguan besar.
Fasilitas manajemen sistem
Tools untuk mendeteksi, mendiagnosa, dan
memulihkan dampak gangguan sistem.
Prosedur pengumpulan data (log) untuk
diagnosa yang efisien.
27

Rancangan Reaktif
elemen kunci:
Identifikasi kebutuhan backup & recovery
Untuk data, software, maupun hardware

(spare).
Pengembangan dan testing prosedur backup
& recovery.
Waktu pemulihan (recovery) yang sesuai
target dan predictable.

28

Tingkatan Investasi
Ketersediaan

1. Base product & components


Paling mendasar: komponen-komponen yang

29

memenuhi persyaratan keandalan.


2. Effective service management processes
Terselenggaranya Availability Management,
Manajemen Insiden/Problem, dan Manajemen
Perubahan.

Tingkatan Investasi
Ketersediaan
3. System management
Mekanisme monitoring, deteksi, dan

pemulihan gangguan otomatis.


4. High availability design
Eliminasi SPOF (titik rawan), penyediaan
komponen alternatif/cadangan, dan
mekanisme untuk mempersingkat
downtime akibat kerusakan.
5. Full redundancy
Fasilitas dual/mirror site.

30

Rencana Peningkatan
Ketersediaan
Alasan peningkatan ketersediaan:
Seringnya pelanggaran SLA ketersediaan.
Seringnya terjadi gangguan (downtime).
Hasil pengukuran ketersediaan menunjukkan

trend penurunan.
Waktu perbaikan kerusakan yang melebihi
batas toleransi.
Permintaan pengguna/bisnis untuk
meningkatkan ketersediaan.
Gangguan ketersediaan akibat
pertumbuhan/pengembangan bisnis.
Bagian dari rencana strategis TI.
31

Rencana Peningkatan
Ketersediaan

Garis besar isi rencana:


Tingkat ketersediaan aktual saat ini (dalam

bahasa pengguna/bisnis) dan tingkat


ketersediaan ideal menurut SLA.
Aktivitas-aktivitas perbaikan yang sedang
dilaksanakan dengan pertimbangan
biaya/manfaat masing-masing.
Perubahan tingkat layanan beserta alasannya,
dan opsi-opsi untuk memenuhinya beserta
biayanya.
Rencana kegiatan analisa pencarian penyebab
gangguan-gangguan ketersediaan atau SOA
(system outage analysis).
Sosialisasi tentang potensi teknologi baru atau
versi baru (upgrade) dalam memperbaiki
tingkat ketersediaan layanan TI.

32

System Outage Analysis


SOA: kegiatan analisa dengan melibatkan

berbagai data dari log-log proses (termasuk


aktifitas dukungan teknis) untuk mencari
penyebab gangguan.
Pelaksanaanya melibatkan administrator
sistem & jaringan, staf dukungan teknis, user/
operator, analis sistem, vendor, manajemen
bisnis.
Hasilnya dilaporkan beserta rekomendasi
langkah-langkah perbaikan.

33

System Outage Analysis


Struktur kegiatan SOA:

34

Anda mungkin juga menyukai