Apa CIO tidak tertarik dalam melindungi aplikasi dan infrastruktur yang memberikan
misionaris teknologi informasi penting (TI) ser bisnis keburukan di seluruh perusahaan?
Setelah semua, Senior manajemen memiliki tanggung jawab fidusia untuk melindungi
aset perusahaan. Tidak melindungi mereka bisa lebih mahal daripada investasi dalam
perlindungan, dan perusahaan berasal keunggulan kompetitif dari yang disiapkan
untuk mengontrol dan mengelola krisis. Akibatnya, krisis manajemen menghadapkan
kemungkinan pemadaman, menilai bagaimana outage mengganggu bisnis proses, dan
menentukan bagaimana bisnis bisa terus beroperasi. Gangguan dari TI layanan bisnis dapat
disebabkan oleh kegagalan server tunggal, badai musim dingin, hilangnya listrik untuk
wilayah umum, atau tidak dapat diaksesnya lengkap dari fasilitas untuk jangka waktu.
sementara ini kertas berfokus terutama pada aspek IT, lengkap perlindungan bisnis jauh
melampaui. Oleh karena itu bijaksana untuk memperpanjang ketersediaan tinggi tradisional
(HA) atau pemulihan bencana (DR) layanan infrastruktur TI untuk integrasi yang lebih baik
dengan manusia dan bisnis aspek.
Kami pertama memberikan gambaran tentang negara-of-the-art arsitektur untuk terus
menerus ketersediaan, sebentar meliputi konsep tradisional seperti ketersediaan tinggi (HA)
pengelompokan pada platform didistribusikan dan pada mainframe. Kami menjelaskan
bagaimana HA dapat dicapai dalam lingkungan berdasarkan Sun Microsystems J2EEe, yang
berbeda dari pengelompokan klasik pendekatan, dan kami membahas bagaimana pemulihan
bencana (DR) memiliki menjadi perpanjangan dari HA. Makalah ini kemudian menyajikan
aspek manajemen pelayanan, termasuk penggunaan dan orkestrasi dari proses berbasis
manajemen (ITILt) sistem tugas dalam skenario DR, di mana tantangan utama adalah untuk
memastikan tingkat yang tepat dari redundansi dalam integrasi dan berorientasi layanan
pengelolaan heterogen lanskap teknologi informasi.
PENGANTAR
Apa CIO tidak tertarik dalam melindungi aplikasi dan infrastruktur yang memberikan
misionaris teknologi informasi penting (TI) ser bisnis keburukan di seluruh perusahaan?
Setelah semua, Senior manajemen memiliki tanggung jawab fidusia untuk melindungi
aset perusahaan. Tidak melindungi mereka bisa lebih mahal daripada investasi dalam
perlindungan, dan perusahaan berasal keunggulan kompetitif dari yang disiapkan untuk
mengontrol dan mengelola krisis. Akibatnya, krisis manajemen menghadapkan kemungkinan
pemadaman, menilai bagaimana outage mengganggu bisnis proses, dan menentukan
bagaimana bisnis bisa terus beroperasi. Gangguan dari TI layanan bisnis dapat disebabkan
oleh kegagalan server tunggal, badai musim dingin, hilangnya listrik untuk wilayah umum,
atau tidak dapat diaksesnya lengkap dari fasilitas untuk jangka waktu. sementara ini kertas
berfokus terutama pada aspek IT, lengkap perlindungan bisnis jauh melampaui. Oleh karena
itu bijaksana untuk memperpanjang ketersediaan tinggi tradisional (HA) atau pemulihan
bencana (DR) layanan infrastruktur TI untuk integrasi yang lebih baik dengan manusia dan
bisnis aspek.
Ketersediaan tinggi dan pemulihan bencana Secara tradisional, kita membedakan antara HA
dan DR, meskipun tidak ada yang jelas perbedaan antara mereka (Gambar 1). Ada dua cara
untuk mempertimbangkan
pemisahan antara HA dan DR: dari sudut pandang
dampak pemadaman atau situs kendala.
HA berkaitan dengan dampak pemadaman lebih kecil daripada DR
(misalnya, kegagalan server tunggal), sedangkan bencana yang padam lebih besar dengan
kritis lebih besar dampak bisnis. Di bidang HA, pemulihan menggunakan kemampuan
backup dapat otomatis karena situasi kegagalan adalah, untuk sebagian besar, baik dipahami,
dan perilaku pemulihan yang diinginkan dapat dijelaskan dalam kebijakan manajemen HA.
Di Sebaliknya, bencana biasanya out-of-lingkup-situasi tions, dan karena pemulihan lebih
kompleks dan kurang otomatis dan biasanya waktu yang diperlukan untuk recovery kurang
ketat. Namun demikian, delineasi antara HA dan DR adalah pelanggan khusus dan
tergantung pada dampak terhadap bisnis, biaya, dan kemampuan. Dari titik situs-kendala
pandang, dapat dikatakan bahwa DR tumbuh dari kemampuan HA, seperti clustering, tetapi
di samping itu, replikasi data untuk jarak metropolitan dan global serta situs manajemen
ditambahkan. Cluster HA dapat membentang di situs atau tetap lokal, dan DR solusi tidak
memerlukan cluster HA dan mungkin hanya menyalin data antara situs.
Manajemen redundansi IT harus menemani-modate kedua sudut pandang. Pelanggan ingin
mengelola dampak baik pemadaman kecil dan lebih besar dengan cara yang koheren,
meskipun pemantauan dan pemulihan pemadaman yang berbeda mungkin memerlukan
berbeda yang mendasari teknologi IT. Juga lebih tinggi dampak pemadaman, yang lebih
penting adalah bagi pelanggan untuk memiliki alat yang dapat membantu mereka menjadi
siap-alat seperti pengujian berkala dari semua recovery otomatis atau semi-otomatis dan
failover prosedur dalam kasus pemadaman direncanakan. quences berkala, manajemen TI
redundansi harus selaras dan terintegrasi dengan perusahaan IT umum tugas manajemen,
seperti insiden dan masalah pengelolaan.
Masalah umum kompleksitas
Membuat lanskap TI sangat tersedia atau siap pulih dari bencana memiliki utama trade-off:
pengenalan kompleksitas yang lebih tinggi. Ada berbagai aspek realitas ini. Salah satu aspek
kompleksitas adalah bahwa hal itu meningkatkan sebagai IT redundansi dan manajemen
daripadanya meningkat. Alasan untuk ini adalah bahwa ketika aset TI menjadi tidak dapat
digunakan selama outage, pemulihan bisa dicapai hanya jika titik tunggal kegagalan yang
dihilangkan dengan penambahan beberapa bentuk redundansi. Berbagai teknik yang tersedia
untuk memberikan redundansi yang dapat menutupi kegagalan atau pulih dari itu. Ini
termasuk, misalnya, penggunaan produk klaster HA dengan server yang berlebihan dan
konfigurasi aplikasi. Redundansi data dapat disediakan melalui backup dan restore atau lebih
teknologi replikasi canggih dibangun ke hardware penyimpanan, sistem operasi (OS), dan
aplikasi middleware. Contohnya termasuk IBM TotalStorage * Metro Cermin dan IBM DB2
* HADR *.
Untuk infrastruktur IT yang handal, redundansi juga memiliki yang akan diberikan untuk
topologi jaringan. Tergantung pada tujuan bisnis (tetapi juga karena perjanjian tingkat
layanan), IT Pusat mungkin geografis dalam dis- metropolitan tances, dengan replikasi data
opsional ke situs ketiga terletak pada jarak global. Selain biaya terukur membangun IT
redundansi, kompleksitas menjalankan roda manajemen yang diinginkan Tujuan pemulihan
menjadi tantangan kritis utama. Selain itu, aplikasi sering mencakup beberapa servers dan OS
platform, sedangkan banyak TI yang ada solusi yang platform sentris atau sumber dayaspecif- IT ic. Akibatnya, pelanggan sering awalnya membutuhkan layanan persembahan
untuk menginstal dan mengatur HA dan DR mereka solusi. Banyak manajer klaster HA
membutuhkan scripting tambahan (yaitu, menulis kode). Tambahan ada banyak lagi cara
kompleksitas diperkenalkan, termasuk berapa banyak korban dengan fungsi yang tumpang
tindih ada di satu ruang. Studi industri telah menunjukkan bahwa substansial Bagian akar
penyebab pemadaman melacak kembali ke kesalahan manusia, dan kesalahan manusia dapat
dipetakan ke kompleksitas umum yang terlibat dalam pengelolaan perusahaan- lebar topologi
IT. Sebagai hasil dari hubungan ini, pelanggan telah melaporkan bahwa com- tambahan
memerlukan serialisasi dari pengolahan overlappermintaan ping. Pada contoh akun perbankan,
beberapa transfer uang dari rekening tunggal yang
diproses oleh benang yang berbeda harus serial
melalui transaksi.
Dalam kebanyakan kasus, strategi HA untuk stateful sebuah
aplikasi yang terdiri dari satu contoh
Gambar
10
Pada bagian ini, kita mulai dengan melihat solusi DR
untuk lanskap didistribusikan dan kemudian menjelaskan bagaimana DR
ditangani melalui IBM PDB * (geografis
Tersebar Sysplex Paralel).
11
Untuk UNIX dan Microsoft Windows ** server, ada
pendekatan solusi yang berbeda. Untuk clustering,
ada dua alternatif: membentang cluster dan
klaster global. Sebuah cluster membentang adalah cluster HA
yang biasanya mencakup dua lokasi. Karena signifikan
perbaikan konektivitas (dalam jaringan dan
Penggunaan serat gelap), sekarang sering mungkin untuk
mengkonfigurasi setup DR yang dipisahkan hingga
300 km seolah-olah mereka setup lokal. Namun,
untuk jarak yang lebih, teknologi pengelompokan harus
ditingkatkan untuk memenuhi persyaratan DR. Lebih lanjutlebih, cluster memiliki untuk mengotomatisasi replikasi data yang
tion. Hari ini, pendekatan berbasis storage-sebagian besar
digunakan untuk jarak jauh. Namun, naskah antarmuka
biasanya digunakan untuk mengontrol replikasi berbasis storagetion melalui clustering. Kerugian adalah bahwa hal itu
menjadi sangat kompleks dan bahwa deteksi kesalahan
memiliki keterbatasan.
Pendekatan kedua untuk solusi klaster DR adalah untuk
menggunakan cluster global yang: Berbeda dengan cluster membentang
setup, biasanya dua kelompok yang terpisah dikonfigurasi,
masing-masing terletak di lokasi yang berbeda, tetapi aplikasi
berjalan pada satu situs saja. manajemen Sistem SEBUAH
menghubungkan kedua klaster Lokal Dan bertindak sebagai
arbiter, memutuskan mana Dari klaster menjalankan
aplikasi. Data replikasi ANTARA Lokal
klaster can dikontrol through klaster
menjalankan Aplikasi ATAU through arbiter.
Kami has mengamati bahwa mayoritas penyiapan hari Penyanyi
Adalah cluster yang membentang. Asumsi Yang mendasari Dari
biasa, Rekan-node HA Cluster bahwa node-tosimpul communication, bandwidth, Dan respon
Waktu TIDAK tergantung PADA PILIHAN simpul; ini
asumsi TIDAK Lagi Benar hearts pengaturan DR DENGAN
jarak pagar Geografis Yang Luas. mengelompok Yang merekonstruksi dunia
Cile Penyanyi DENGAN harga SISTEM MANAJEMEN di
pengelompokan Selain, SEMENTARA klaster membentang mendorong
Batas Hubungan communication mereka Dan DENGAN demikian
Waktu Dan keandalan DetEksi pemadaman. Namun,
KARENA TIDAK ADA SISTEM MANAJEMEN kedua
diperlukan, klaster membentang LEBIH Mudah untuk review mengatur Dan
mempertahankan. Selain ITU, Banyak Penawaran OS built-in
Metode Data menyimpan untuk review persisten Berlebihan Dan
Jumlah: Tersedia di doa LOKASI.
12
Data replikasi
Ada different Metode untuk review MEMBUAT Data Berharga
kebal Terhadap pemadaman gede. Sebagian gede Metode melibatkan
Data duplikasi ditambah DENGAN beberapa Logika Yang dibangun
Ke hearts Aplikasi. Logika Penyanyi dirancang untuk review menghindari Data Yang
inkonsistensi Dan Mengelola Kegagalan Aplikasi
(Such as inviting participation, DENGAN Database Aplikasi, log ATAU jurnal
memungkinkan Transaksi Yang belum selesai Harus dibersihkan di
Yang Terjadi Kecelakaan; JIKA log diduplikasi Bersama
Data DENGAN nyata Dan Urutan tulis Yang diawetkan,
isi database yang can be Dari Pulih
Data duplikasi).
Mencari Google Artikel beberapa Metode duplikasi data, data yang akan
Hilang hearts SEBUAH pemadaman; hilangnya ditoleransi dinyatakan sebagai
Titik Pemulihan tujuan (RPO). Di here kitd Fokus PADA
Metode Yang memungkinkan Kecil Ke nol RPOs, Yaitu,
Data replikasi (termasuk Cadangan periodik
Metode).
replikasi Data can be dikelompokkan Menjadi Berbasis OS,
-Aplikasi Penyimpanan Berbasis Berbasis, ATAU. Kami Jelas TIDAK Melihat hal
keuntungan Dari Satu differences yang lain.
Linux ** Didistribusikan direplikasi Blok Perangkat
(DRBD) Adalah contoh Dari replikasi data yang Berbasis OS
pelaksanaan. OS mengurus mereplikasi
SETIAP menulis disk yang Operasi over IP Dari Satu simpul Ke
lain. Tergantung PADA jarak pagar Geografis Dan
Bandwidth Yang Jumlah: Tersedia, dilakukan Penyanyi replikasi
serentak ATAU asynchronous. Di bekas
KASUS, operasi tulis PADA simpul Utama Adalah
Selesai Hanya JIKA Simpul sekunder has berkomitmen
Data Ke disk; hearts KASUS terakhir di, sekunder
Simpul diperbolehkan tertinggal.
replikasi Berbasis penyimpanan also can be sinkron
ATAU asynchronous. Selain ITU, Banyak penyimpanan sistemik
tems, termasuk IBM System Storage DS * 8000,
offers Kelompok konsistensi; Yaitu, JIKA replikasi
Satu disk yang Tertentu Gagal, Maka SEMUA disk yang hearts
mengandung Kelompok konsistensi dilindungi Dari
LEBIH lanjut menulis untuk review memastikan konsistensi data. Itu
Pengelolaan Lingkungan replikasi Penyanyi Adalah
Semakin disederhanakan Oleh manajemen penyimpanan
Produk seperti Jumlah Productivity Center untuk review
Replikasi.
13
Contoh replikasi data yang Aplikasi Berbasis Adalah
DB2 HADR, Yang memerlukan pengaturan 2-node. Satu
Simpul bertindak sebagai primer, Dan Semua Klien DB2 Adalah
terhubung. Perbarui Ke Meja Lokal di
Simpul Utama direplikasi Ke sekunder, sehingga
Perencanaan Lingkungan tersebut, mengingat business Prioritas, mitigasi Risiko, Dan mencakup biaya.
Perencanaan untuk review memungkinkan beberapa situs penyusutan dan
LOKASI terpisah Tepat untuk review DR, penyimpanan
replikasi, Konfigurasi redundansi IT (such as inviting participation,
klaster HA), Dan otomatisasi data center.
Pemantauan Dan uji dikonfigurasi redun- IT
Dancy, Yang meliputi Simulasi pemadaman.
Hal Penyanyi itub Penghasilan kena pajak perubahan Harus
has diterapkan PADA Konfigurasi Awal.
Koordinasi DENGAN Proses hearts HAL Kejadian
menilai apakah Insiden ATAU set Insiden Adalah
Bencana ATAU mungkin ditangani sebagai pemadaman Yang biasa
Dalam Insiden Dan masalah manajemen
proses.
Koordinasi different Langkah Pemulihan untuk review
mengintegrasikan SEMUA Konfigurasi Yang diperlukan, alat, platBentuk, Dan orang-orangutan. INI termasuk Bantuan untuk review mengidentifikasi
Titik Yang Tepat PADA Waktunya untuk review memicu failovers situs (such as inviting
participation,
persetujuan) Dan aktivasi non-IT-Berlangganan
Langkah-Langkah Pemulihan (such as inviting participation, Evakuasi orang).
Gambar 5 menggambarkan Proses kelangsungan Bisnis
activities Dan Interaksi mereka DENGAN Proses lainnya.
IT Infrastructure Library *** Proses (ITIL ****)
menggambarkan praktik Terbaik Dan Harus digunakan sebagai
Pedoman. Meskipun pelanggan MENERIMA Bimbingan,
mereka also Membutuhkan fleksibilitas untuk review melaksanakan Berharga
variasi.
Mengidentifikasi Kebutuhan kelangsungan Bisnis
Perusahaan biasanya Mulai DENGAN Dampak Bisnis
analisis untuk review memenuhi Syarat konsekuensi Bisnis
berada di Luar LAYANAN. Langkah Pertama ini tidak mengusulkan
SETIAP Implementasi Pemulihan; ITU Hanyalah SEBUAH
artikulasi Bisnis butuhkan sebagai masukan untuk review
Langkah berikutnya di mana IT Berlangganan Kondisi
dipertimbangkan. Kualifikasi Dari con Bisnis
Urutan dilakukan through telkom-telkom berikut:
Mengidentifikasi proses-Mencari Google Artikel Bisnis Penting Suatu
Prioritas pemahaman TENTANG Bisnis yang BERBEDA,
Solusi potensial can be Seimbang Sesuai.
Memperkirakan Dampak Dari Kerugian ATAU kerusakan-Penyanyi
analisis membantu untuk review mengartikulasikan tujuan Pemulihan
(RTO Dan RPO) Dan Kursus kemungkinan Pemulihan.
Memperkirakan Risiko Dan kerentanan-Penyanyi
analisis membantu untuk review memutuskan TENTANG LOKASI TI,
Keamanan, Dan pemisahan cadangan Sistem.
Mengidentifikasi proses menerjemahkan TI Yang mendukung Kritis
bisnis-Penyanyi diperlukan untuk review mendefinisikan ITactivities Pemulihan Berlangganan untuk review SETIAP Bisnis.
Penghasilan kena pajak Langkah Proses Penyanyi, ADA Keterangan TENTANG SEMUA IT
proses menerjemahkan Yang mendukung Bisnis Penting DENGAN
tujuan Yang diinginkan Dan Prioritas. Selanjutnya,
Potensi penyebab pemadaman Dan Skenario-Skenario mitigasi Risiko
ios can be diartikulasikan.
Creates Dan mempertahankan Pengembangan strategi kelangsungan Pelayanan
Sebagai penyempurnaan Dari Kebutuhan Bisnis
analisis, Langkah Penyanyi diterjemahkan persyaratan tersebut Ke
persyaratan Infrastruktur TI. Garis Strategi
OPSI Teknis untuk review mengkonfigurasi redundansi IT
berdasarkan RTO Dan RPO gol.
Creates Dan mempertahankan Rencana ceh LAYANAN IT
Rencana ceh LAYANAN TI Adalah Implementasi
Dari Pengembangan strategi Yang dijelaskan, alat mendefinisikan Dan
Produk Yang akan digunakan. INI menentukan PETA jalan ketika
untuk review menginstal, mengkonfigurasi, Dan Menguji alat Yang BERBEDA.
Siapkan kemampuan kelangsungan Pelayanan TI
Langkah INI mencakup Pelaksanaan IT
LAYANAN Rencana ceh. INI biasanya menghasilkan
serangkaian permintaan Negara untuk review perubahan untuk review dimasukkan hearts
perubahan Sales manager Dan Proses manajemen Rilis.
Melaksanakan Rencana ceh LAYANAN IT
Pelaksanaan Rencana LAYANAN IT ceh Membutuhkan
melakukan Pengawasan apakah Konfigurasi IT
Terus mendukung RTO diterapkan Dan RPO
tujuan, Pengujian untuk review kesiapan DR, Dan MEMBUAT PENGGUNAAN
Sumber Daya TI Cadangan JIKA Terjadi Bencana.
Pelaksanaan Rencana melibatkan Proses berikut
tangga:
Mengidentifikasi situasi Berpotensi mendeteksi
Bencana (Penyanyi biasanya merupakan Bagian Dari Insiden tersebut Dan
Proses manajemen masalah).
Menjalankan persetujuan manajemen Eksekutif potensial
permintaan Negara untuk review menyetujui Peralihan untuk review kedua
situs.
Mengkoordinasikan Langkah-Langkah Pemulihan (sebagai standar hearts
Pekerjaan Pemulihan Mengalir).
Memonitor apakah Konfigurasi TI Masih
mendukung RTO Dan RPO Konfigurasi.
Memonitor apakah RTO Dan RPO has
dicapai Penghasilan kena pajak Pemulihan Selesai.
Gambar
pendekatan bottom-up
Kami mengusulkan PETA jalan berikut sebagai sampel untuk review
mencapai Solusi kelangsungan Bisnis:
Terus using Produk platform Spesifik di
Lingkungan berkerumun untuk review Operasi otomatis