Disusun Oleh :
Kelompok 12
Sistem informasi yang efektif menyediakan pengguna dengan informasi yang akurat,
tepat waktu, dan relevan. Informasi yang akurat bebas dari kesalahan. Informasi tepat
waktu ketika tersedia bagi pengambil keputusan saat dibutuhkan. Informasi menjadi relevan
ketika berguna dan sesuai untuk jenis pekerjaan dan keputusan yang memerlukannya.
Anda mungkin terkejut mengetahui bahwa banyak bisnis tidak memiliki informasi
yang tepat waktu, akurat, atau relevan karena data dalam sistem informasi mereka telah
buruk terorganisir dan terpelihara. Itu sebabnya manajemen data sangat penting. Untuk
memahami masalahnya, mari kita lihat bagaimana sistem informasi mengatur data dalam
file komputer dan metode tradisional manajemen file.
Sistem komputer mengatur data dalam hierarki yang dimulai dengan bit dan byte
dan berlanjut ke bidang, catatan, file, dan basis data. Sedikit mewakili unit data terkecil yang
dapat ditangani oleh komputer. Sekelompok bit, yang disebut byte, mewakili satu karakter,
yang dapat berupa huruf, angka, atau simbol lain. Pengelompokan karakter menjadi kata,
kelompok kata, atau angka lengkap (seperti nama atau usia seseorang) disebut field.
Sekelompok bidang terkait, seperti nama siswa, mata kuliah yang diambil, tanggal, dan
kelas, terdiri dari catatan; sekelompok record dengan tipe yang sama disebut file.
Sistem komputer mengatur data dalam hierarki yang dimulai dengan bit, yang
mewakili 0 atau 1. Bit dapat dikelompokkan untuk membentuk byte untuk mewakili satu
karakter, angka, atau simbol. Byte dapat dikelompokkan untuk membentuk field, dan field
terkait dapat dikelompokkan untuk membentuk record. Catatan terkait dapat berupa
dikumpulkan untuk membentuk file, dan file terkait dapat diatur ke dalam database.
Misalnya, catatan pada Gambar 6. 1 dapat berupa file kursus siswa. Sekelompok file
terkait membentuk database. File kursus siswa yang diilustrasikan pada Gambar 6. 1 dapat
dikelompokkan dengan file tentang sejarah pribadi siswa dan latar belakang keuangan untuk
membuat database siswa.
Setiap aplikasi, tentu saja, membutuhkan file dan program komputernya sendiri
untuk beroperasi. Misalnya, area fungsional sumber daya manusia mungkin memiliki file
induk kepegawaian, file penggajian, file asuransi kesehatan, file pensiun, file milis, dan
seterusnya, hingga puluhan, mungkin ratusan, file dan program telah ada. Di perusahaan
secara keseluruhan, proses ini menyebabkan beberapa file induk dibuat, dipelihara, dan
dioperasikan oleh divisi atau departemen terpisah. Karena proses ini berlangsung selama 5
atau 10 tahun, organisasi dibebani dengan ratusan program dan aplikasi yang sangat sulit
untuk dipelihara dan mengelola. Masalah yang dihasilkan adalah redundansi dan
inkonsistensi data, ketergantungan program-data, tidak fleksibel, keamanan data yang
buruk, dan ketidakmampuan untuk berbagi data antar aplikasi.
Redundansi data adalah adanya duplikasi data dalam beberapa file data sehingga
data yang sama disimpan di lebih dari satu tempat atau lokasi. Redun dancy data terjadi
ketika kelompok yang berbeda dalam suatu organisasi secara independen mengumpulkan
bagian data yang sama dan menyimpannya secara independen satu sama lain. Data redun
dancy memboroskan sumber daya penyimpanan dan juga menyebabkan inkonsistensi data,
di mana atribut yang sama mungkin memiliki nilai yang berbeda. Misalnya, dalam kasus
entitas COURSE yang diilustrasikan pada Gambar 6. 1 , Tanggal dapat diperbarui di beberapa
sistem tetapi tidak di sistem lain. Atribut yang sama, Student_ID, mungkin juga memiliki
nama yang berbeda di sistem yang berbeda di seluruh organisasi. Beberapa sistem mungkin
menggunakan Student_ID dan yang lain mungkin menggunakan ID, misalnya.
Ketergantungan Program-Data
Kurangnya Fleksibilitas
Sistem file tradisional dapat mengirimkan laporan terjadwal rutin setelah upaya
pemrograman yang ekstensif, tetapi tidak dapat mengirimkan laporan ad hoc atau
menanggapi kebutuhan informasi yang tidak diantisipasi secara tepat waktu. Informasi yang
dibutuhkan oleh permintaan adhoc ada di suatu tempat di sistem tetapi mungkin terlalu
mahal untuk diambil. Beberapa programmer mungkin harus bekerja selama berminggu-
minggu untuk mengumpulkan item data yang diperlukan dalam file baru.
Keamanan Buruk
Karena hanya ada sedikit kendali atau pengelolaan data, akses dan penyebaran
informasi mungkin tidak terkendali. Manajemen mungkin tidak memiliki cara untuk
mengetahui siapa yang mengakses atau bahkan membuat perubahan pada data organisasi.
Karena potongan informasi dalam file yang berbeda dan bagian organisasi yang
berbeda tidak dapat dihubungkan satu sama lain, hampir tidak mungkin informasi dibagikan
atau diakses pada waktu yang tepat. Informasi tidak dapat mengalir secara bebas melintasi
area fungsional yang berbeda atau bagian yang berbeda dari organisasi. Jika pengguna
menemukan nilai yang berbeda dari bagian informasi yang sama dalam dua sistem yang
berbeda, mereka mungkin tidak ingin menggunakan sistem ini karena mereka tidak dapat
mempercayai keakuratan data mereka.
6.3 APA ALAT UTAMA DAN TEKNOLOGI UNTUK MENGAKSES INFORMASI DARI DATABASES
UNTUK MENINGKATKAN BISNIS KINERJA DAN PENGAMBILAN KEPUTUSAN?
Bisnis menggunakan database mereka untuk melacak transaksi dasar, seperti
membayar pemasok, memproses pesanan, melacak pelanggan, dan membayar karyawan.
Tetapi mereka juga membutuhkan database untuk menyediakan informasi yang akan
membantu perusahaan menjalankan bisnis dengan lebih efisien, dan membantu manajer
dan karyawan membuat keputusan yang lebih baik.
TANTANGAN DATA BESAR
Sebagian besar data yang dikumpulkan oleh organisasi dulunya adalah data transaksi
yang dapat mudah masuk ke dalam baris dan kolom sistem manajemen database relasional.
Kita sekarang menyaksikan ledakan data dari lalu lintas Web, pesan email, dan konten
media sosial (tweet, pesan status), serta data yang dihasilkan mesin dari sensor (digunakan
dalam pengukur pintar, sensor manufaktur, dan meteran listrik) atau dari sistem
perdagangan elektronik. Data ini mungkin tidak terstruktur atau semi-terstruktur dan
dengan demikian tidak cocok untuk database relasional produk yang mengatur data dalam
bentuk kolom dan baris.
INFRASTRUKTUR KECERDASAN BISNIS
Misalkan kita menginginkan informasi yang ringkas dan andal tentang operasi saat
ini, tren, dan perubahan di seluruh perusahaan. Jika kita bekerja di perusahaan besar
perusahaan, data yang kita butuhkan mungkin harus disatukan dari yang terpisah sistem,
seperti penjualan, manufaktur, dan akuntansi, dan bahkan dari eksternal sumber, seperti
data demografis atau pesaing.
Data Warehouse dan Data Mart
Alat tradisional untuk menganalisis data perusahaan selama dua dekade terakhir
telah pernah menjadi gudang data. Sebuah gudang data adalah database yang menyimpan
arus dan data historis yang berpotensi menarik bagi pengambil keputusan di seluruh
perusahaan. Data berasal dari banyak sistem transaksi operasional inti, seperti sistem untuk
penjualan, akun pelanggan, dan manufaktur, dan mungkin termasuk data dari transaksi situs
Web.
hadoop
DBMS relasional dan produk gudang data tidak cocok untuk mengatur dan
menganalisis data besar atau data yang tidak mudah masuk ke dalam kolom dan baris
digunakan dalam model data mereka. Untuk menangani data tidak terstruktur dan semi
terstruktur dalam jumlah besar, serta data terstruktur, organisasi menggunakan Hadoop.
Hadoop adalah kerangka kerja perangkat lunak sumber terbuka yang dikelola oleh Apache
Yayasan Perangkat Lunak yang memungkinkan pemrosesan paralel terdistribusi dalam
jumlah besar jumlah data di seluruh komputer murah.
Komputasi Dalam Memori
Cara lain untuk memfasilitasi analisis data besar adalah dengan menggunakan
komputasi dalam memori, yang bergantung terutama pada memori utama komputer (RAM)
untuk penyimpanan data. (DBMS konvensional menggunakan sistem penyimpanan disk.)
Pengguna mengakses data yang disimpan di memori utama sistem, sehingga menghilangkan
kemacetan dari pengambilan dan membaca data dalam basis data tradisional berbasis disk
dan memperpendek secara dramatis waktu respons kueri. Pemrosesan dalam memori
memungkinkan set yang sangat besar data, sebesar ukuran data mart atau gudang data
kecil, untuk disimpan sepenuhnya dalam ingatan.
Platform Analitik
Vendor database komersial telah mengembangkan analitik berkecepatan tinggi
khusus platform menggunakan teknologi relasional dan non-relasional yang dioptimalkan
untuk menganalisis kumpulan data besar.
ALAT ANALITIS: HUBUNGAN, POLA, TREN
Setelah data ditangkap dan diatur menggunakan intelijen bisnis teknologi yang baru
saja kami jelaskan, mereka tersedia untuk analisis lebih lanjut menggunakan perangkat
lunak untuk kueri dan pelaporan basis data, data multidimensi analisis (OLAP), dan
penambangan data.
Pemrosesan Analitik Online (OLAP)
OLAP mendukung analisis data multidimensi, memungkinkan pengguna untuk
melihat data yang sama dengan cara yang berbeda menggunakan beberapa dimensi. Setiap
aspek informasi—produk, harga, biaya, wilayah, atau periode waktu—mewakili dimensi
yang berbeda.
Penambangan Data
Pola dan aturan digunakan untuk memandu pengambilan keputusan dan
memperkirakan dampak dari keputusan tersebut. Jenis informasi yang dapat diperoleh dari
data mining meliputi asosiasi, urutan, klasifikasi, cluster, dan perkiraan.
• Asosiasi adalah kejadian yang terkait dengan satu peristiwa.
• Dalam urutan, peristiwa terkait dari waktu ke waktu. Kita mungkin menemukan, misalnya,
bahwa jika rumah dibeli, kulkas baru akan dibeli dalam waktu dua minggu 65 persen dari
waktu, dan oven akan dibeli dalam waktu satu bulan dari pembelian rumah 45 persen dari
waktu.
• Klasifikasi mengenali pola yang menggambarkan kelompok yang item milik dengan
memeriksa item yang ada yang telah diklasifikasikan dan dengan menyimpulkan
seperangkat aturan.
• Pengelompokan bekerja dengan cara yang mirip dengan klasifikasi ketika tidak ada
kelompok yang belum didefinisikan. Alat penambangan data dapat menemukan
pengelompokan yang berbeda di dalam data, seperti menemukan grup afinitas untuk kartu
bank atau mempartisi database ke dalam kelompok pelanggan berdasarkan demografi dan
jenis pribadi investasi.
• Meskipun aplikasi ini melibatkan prediksi, peramalan menggunakan prediksi dengan cara
yang berbeda.
Penambangan Teks dan Penambangan Web
Data tidak terstruktur, sebagian besar dalam bentuk file teks, diyakini bertanggung
jawab atas over 80 persen dari informasi organisasi yang berguna dan merupakan salah satu
sumber utama data besar yang ingin dianalisis oleh perusahaan. Email, memo, transkrip
pusat panggilan, survey tanggapan, kasus hukum, deskripsi paten, dan laporan layanan
semuanya berharga untuk menemukan pola dan tren yang akan membantu karyawan
membuat bisnis yang lebih baik keputusan. Web adalah sumber lain yang kaya dari data
besar tidak terstruktur untuk diungkapkan pola, tren, dan wawasan tentang perilaku
pelanggan.
DATABAS DAN WEB
Banyak perusahaan sekarang menggunakan Web untuk membuat beberapa
informasi dalam database internal mereka yang tersedia untuk pelanggan dan bisnis mitra.
Permintaan perangkat lunak browser Web pengguna data dari database organisasi,
menggunakan perintah HTML untuk berkomunikasi dengan server Web. DBMS adalah
server aplikasi yang berjalan pada komputernya sendiri. script adalah program ringkas yang
menggunakan spesifikasi Common Gateway Interface (CGI) untuk memproses data di server
Web.
5. Berikan beberapa contoh masalah yang akan terjadi di American Water jika datanya
tidak “bersih”?
Jawab: Jika data tidak bersih, itu membuat gudang data jauh lebih besar dari yang
diperlukan. Misalnya, jenis bahan tertentu mungkin memiliki dua hingga tiga
deskripsi data yang berbeda. Perbandingan dan konsolidasi data lebih sulit dilakukan
jika terdapat lebih dari satu deskripsi dan definisi dari setiap item data. Ini dapat
membingungkan pengguna dan menyebabkan masalah akurasi data yang rendah.