Anda di halaman 1dari 25

TUGAS RINGKASAN MATERI KULIAH

MANAJEMEN BASIS DATA DAN INFORMASI

Di susun untuk Memenuhi Tugas Mata Kuliah Sistem Informasi Manajemen


Dosen Pengampu :
Deden Iwan Kusuma, Drs., M.Si. Ak., CA.

KELOMPOK 5
1. LUTFI RUFAIDA (3120 31492)
2. SUYATNI UTAMI (3120 31507)
3. YULI MAHRUN NISAA (3120 31512)

STIE YKPN YOGYAKARTA


2020

1
Manajemen Basis Data dan Informasi

Rumusan Masalah:
1. Apa masalah dalam mengelola sumber data dalam lingkungan file tradisional?
2. Apa saja kapabilitas utama dari sistem manajemen basis data (DBMS) dan
mengapa DBMS relasional begitu kuat? Relasional, teknologi utama,
administrasi data
3. Apa alat dan teknologi utama untuk mengakses informasi dari database untuk
meningkatkan kinerja bisnis dan pengambilan keputusan?
4. Mengapa kebijakan informasi, administrasi data, dan jaminan kualitas data
penting untuk mengelola sumber daya data perusahaan?
Tujuan pembelajaran :
1. Untuk mengetahui masalah dalam pengelolaan sumber data dalam lingkungan
file tradisional.
2. Untuk mengetahui kapabilitas utama dari system manajemen basis data
(DBMS) dan alasan mengapa DBMS begitu kuat.
3. Untuk mengetahui alat dan teknologi utama untuk mengakses informasi dari
database untuk meningkatkan kinerja bisnis dan pengambilan keputusan.
4. Untuk mengetahui pentingnya pengelolaan sumber data perusahaan dengan
mempertimbangkan kebijakan informasi, administrasi data dan jaminan
kualitas data.

6.1 Mengorganisasikan Data dalam Lingkungan File Tradisional


Sistem informasi yang efektif menyediakan pengguna informais yang akurat,
tepat waktu, dan relevan. Informasi yang akurat berarti bebas dari kesalahan.
Informasi yang tepat waktu berarti informasi tersedia saat diperlukan oleh
pengambil keputusan. Informasi yang relevan ialah yang memberikan manfaat
dan sesuai dengan keputusan yang akan dibuat. Oleh karena itu, pengelolaan data
menjadi sangat penting.

A. Istilah Dan Konsep dalam Pengorganisasian File


Sistem computer mengorganisasikan data berdasarkan suatu hierarki yang
dimulai dari bit kemudian byte, kemudian berlanjut ke field, record, file, dan
database. (Gambar 6.1)
Satu bit mewakili unit data terkecil yang dapat disimpan oleh komputer.
Sekelompok bit disebut byte, yang mewakili satu buah karakter tunggal, dapat
berupa huruf, angka, ataupun symbol lainnya. Sekelompok karakter yang
membentuk kata, beberapa kata ataupun serial angka (seperti nama atau usia
seseorang) disebut field. Sekelompok field yang saling berhubungan disebut
record, sekumpulan record dengan jenis yang sama disebut file. Sekelompok file
yang saling berhubungan dinamakan database.
Suatu record menggambarkan suatu entitas (entity), yang dapat berupa
orang, tempat, barang, ataupun peristiwa yang dapat kita simpan dan kelola

2
sebagai informasi. Setiap karakteristik atau penggambaran kualitas suatu entitas
khusus disebut atribut (attribute).
Sebagai contoh, record pada Gambar 6.1 dapat mewakili file mata
pelajaran yang diambil oleh siswa, File yang berisi mata pelajaran yang diambil
oleh siswa dapat dikelompokkan ke dalam riwayat pribadi siswa dan latar
belakang keuangan untuk mencipatkan database siswa. Nomor induk siswa, mata
pelajaran, tanggal, dan niali adalah atribut dari entitas MATA PELAJARAN.
Nilai tertentu yang dapat dimiliki atribut ditemukan dalam field dari record yang
menggambarkan entitas MATA PELAJARAN.

B. Masalah-Masalah dalam Lingkungan Data Tradisional


Mayoritas pada organisasi, system cenderung berkembang sendiri di luar
rencana perusahaan. Gambar 6.2 mengilustrasikan pendekatan tradisional
dalam pemrosesan informasi. Area fungsional sumber daya manusia mungkin
memiliki master file karyawan yang berisi file penggajian, file asuransi medis,
file tunjangan pensiun, file untuk daftar surel, dan sebagainya. Hal tersebut
dapat menyebabkan penggandaan master file.

3
Masalah-masalah yang dihasilkan adalah penggandaan data dan inkonsintensi
program data, ketergantungan program data, tidak fleksibel, kualitas data yang
buruk, dan tidak dapat membagikan data ke berbagai aplikasi.
a. Redundasi dan Inkonsistensi Data
Redudansi data (data redundancy) adalah kehadiran data ganda pada
beberapa file data yang tersimpan di beberapa tempat. Contoh redundasi
dalam kehidupan sehari-hari adalah di satu keluarga menduplikat kunci rumah
sejumlah anggota keluarga, sehingga maisng-maisng anggota keluarga dapat
memegang kunci satu-satu. Atau dalam menyimpan file komputer di beberapa
lokasi yatitu misal di Local Disk (D:) dan di Document. Redudansi data terjadi
ketika kelompok-kelompok yang berbeda secara independen mengumpulkan
data yang sama dan menyimpannya masing-masing. Penyimpanan data yang
berulang-ulang ini akan menyebabkan Inkonsistensi data (data
inconsistency) dimana atribut-atribut yang sama memiliki nilai-nilai yang
berbeda. Sebagai contoh penjualan, persediaan, dan sistem manufaktur
perusahaan ritel pakaian mungkin menggunakan kode yang berbeda-beda
dalam mewakili ukuran pakaian. Suatu sistem mungkin menggunakan suatu
ukuran pakaian menggunakan “extra large”, sementara sistem lainnya
mencantumkan kode “XL” untuk tujuan yang sama. Ketidaksamaan tersebut
akan menyebabkan sulitnya perusahaan dalam menciptakan hubungan
pelanggan, manajemen rantai pasokan, ataupun sistem perusahaan untuk
mengintegrasikan sumber-sumber data yang berbeda.

4
b. Ketergantungan Program-Data
Ketergantungan Program-Data (program-data dependence) mengacu pada
satu paket data yang tersimpan pada file dan diperlukan oleh program-program
tertentu untuk memperbarui dan mengelola file-file tertentu sehingga program
tersebut perlu mengubah data-data tersebut. Contohnya adalah ketika kita akan
membeli suatu barang di Shopee, apabila kita belum membuat akun dan
mengisi data diri, kita tidak dapat melakukan pembelian.

c. Kurangnya Fleksibilitas
Sistem file tradisional dapat mengirimkan laporan rutin sesuai jadwal setelah
dilakukan pemrograman secara ekstensif, namun tidak dapat mengirimkan
laporan khusus atau tidak merespon kebutuhan informasi yang tidak
diantisipasi tepat waktu. Informasi yang dibutuhkan oleh permintaan khusus
tersimpan di suatu tempat dalam suatu system, tetapi terlalu mahal untuk
dicari.

d. Sistem Keamanan yang Buruk


Sistem keamanan yang buruk pada sistem file tradisional disebabkan karena
longgarnya pengendalian atau pengelolaan terhadap data, akses, dan
penyebaran informasi yang tidak terkendali yang membuat manajemen tidak
memiliki cara untuk mengetahui siapa yang mengakses ataupun mengubah
data organisasi. Contoh : ketika akan mengubah data ataupun mengkases
dilakukan pengawasan dengan harus memasukkan kata sandi, atau
menggunakan akun (email beserta password). Misalnya pada web
www.academia.edu ketika mau mendownload atau mengkases harus
memasukaan akun yang tersambung dengan google mail, atau facebook.

e. Kurangnya Ketersediaan dan Pendistribusian Data


Karena bagian-bagian informasi yang terdapat pada file-file yang berbeda dan
bagian-bagian organisasi tidak dapat dihubungkan satu sama lain maka data
tidak bisa didistribusikan dan di informasikan pada waktu yang tepat.

6.2 Pendekatan Database untuk Pengelolaan Data


Teknologi database banyak menyelesaikan masalah-masalah pada organisasi
yang menggunakan sistem file tradisional. Database adalah sekumpulan data
yang diorganisasikan untuk melayani berbagai aplikasi secara efisien dengan
memusatkan data dan mengurangi penggandaan data. Contohnya suatu
perusahaan pada sistem-sistem informasi dan file yang berbeda untuk data
pribadi, penggajian, dan tunjangan, perusahaan dapat menciptakan database
sumber daya manusia tunggal.

A. Sistem Manajemen Database


Sistem manajemen database (database management system - DBMS) adalah
perangkat lunak yang memungkinkan suatu organisasi memusatkan data,

5
mengelola data secara efisien, dan menyediakan akses terhadap data yang
disimpan oleh program aplikasi. Contohnya bagian penggajian membutuhkan
data seperti nama karyawan, nomor jaminan sosial, gaji bruto, dan gaji neto.
DBMS dapat menyelesaikan masalah-masalah pada lingkungan file tradisional
dengan mengurangi redudansi dan inkonsistensi data dengan
meminimalisasikan file-file yang terisolasi yang berisi data yang sama
sehingga data dapat dikelola oleh perusahaan secara mudah.

a. Bagaimana DBMS Menyelesaikan Masalah-Masalah pada Lingkungan


File Tradisional
DBMS menyelesaikan masalah masalah pada lingkungan file tradisional
dengan mengurangi redudansi dan inkonsistensi data dengan meminimalisasi
file-file yang terisolasi yang berisi data yang sama.

b. DBMS Relasional
DBMS relasional menampilkan data menjadi tabel dua dimensi (yang disebut
relasi). Tabel dapat juga dianggap sebagai file. Setiap tabel berisi data pada
sebuah entitas berikut atributnya.

6
Gambar diatas adalah cara DBMS relasional mengorganisasikan data
pemasok dan suku cadang. Database tersebut memiliki tabel yang terpisah
untuk entitas pemasok dan sebuah tabel untuk entitas barang. Setiap elemen
individu pada data untuk setiap entitas disimpan sebagai field yang terpisah,
dan setiap field mewakili suatu atribut untuk entitas tersebut. Field pada
database ini juga disebut kolom.
Informasi aktual/lengkap mengenai seorang pemasok yang berbaris
sepanjang suatu tabel disebut baris. Baris disebut juga record (karena
mewakili satu informasi lengkap mengenai seseorang), atau dalam istilah yang
sangat teknis disebut tuples.
Setiap tabel pada database relasional memiliki satu buah field yang
ditunjuk sebagai kunci primer (primary key). Kunci primer (primary key)/
Field kunci (key field) merupakan pemberi identitas yang unik untuk setiap
informasi dalam satu baris/ record pada sebuah tabel yang sama halnya dengan
kunci primer, mereka tidak dapat diduplikasi. Ketika field Supplier_Number
muncul di tabel PART, ia disebut kunci asing (foreign key) yang merupakan
field penting untuk mencari data suku cadang berdasarkan pemasok tertentu.

c. Operasi DBMS Relasional


Tabel database rasional dapat dikombinasikan dengan mudah untuk
mengirimkan data yang diperlukan pengguna, yang disediakan oleh dua tabel
yang saling berbagi elemen data. Sebagai contoh, jika ingin mencari nama
pemasok yang memasok suku cadang nomor 137 dan 150. Kita perlu
informasi dari 2 tabel: tabel SUPPLIER dan tabel PART. Dua file ini memiliki
satu data yang saling berbagi yaitu: Nomor_Pemasok.
Terdapat tiga operasi dasar dalam database relasional yaitu :

7
1. Operasi select menampilkan suatu bagian berisi seluruh rekaman pada suatu
file berdasarkan kriteria yang ditentukan. Sebagai contoh, kita ingin
menampilkan record (baris) pada tabel PART di mana Part_Number -nya
adalah 137 dan 150.
2. Operasi join mengombinasikan tabel-tabel yang memiliki keterkaitan untuk
menyediakan informasi yang lebih lengkap kepada pengguna ketimbang
satu tabel saja. Sebagai contoh, kita ingin menggabungkan bagian tabel
PART dan tabel SUPPLIER yang telah diringkas secara sementara.
3. Operasi project menampilkan kolom-kolom dari suatu tabel
berdasarkan kriteria tertentu, yang memungkinkan pengguna untuk
menampilkan tabel baru yang berisi informasi-informasiyang benar
dibutuhkan. Contohnya, kita ingin menampilkan tabel baru tersebut kolom-
kolom tertentu yaitu: Part_Number, Part_Name, Supplier_Number, dan
Supplier_Name.

d. Database Non-Relasional dan Database pada Sistem Cloud Computing


Sistem manajemen database non-relasional (non-relational daabase
management system) atau yang bisa disebut dengan “NoSQL” menggunakan
model data yang lebih fleksibel dan dirancang untuk mengelola data berukuran
besar yang didistribusikan pada banyak perangkat serta mempermudah dalam
meningkatkan atau menurunkan skalabilitas. Ada beberapa jenis database
NoSQL, masing-masing memiliki fitur teknis dan perlakuan yang berbeda.
Database Oracle NoSQL salah satu contohnya adalah SimpleDB buatan
Amazon, salah satu layanan yang beroperasi pada sistem cloud computing.
Amazon dan penyedia layanan cloud computing lainnya juga menyediakan
DBMS Relational Database Service (RDS) menawarkan MySQL, SQL
Server, ataupun Oracle Database sebagai mesin pencari database.

Layanan manajemen data berbasis cloud computing memiliki daya tarik


tersendiri bagi organisasi kecil dan menengah yang baru memulai bisnisnya
dengan menawarkan harga yang terjangkau, ketimbang produk database

8
dalam perusahaan. Sebagai tambahan bagi layanan pengelolaan data berbasis
public cloud computing, perusahaan saat ini juga memiliki pilihan untuk
menggunakan database berbasis private cloud computing. Sebagai contoh,
Sabre Holdings, perusahaan perangkat (SaaS) terbesar di dunia untuk industri
penerbangan.

B. Kapabilitas Sistem Manajemen Database


DBMS memiliki kapabilitas definisi data (data definition) untuk
menspesifikan struktur konten database, digunakan untuk membuat tabel
database dan untuk mendefinisikan karakteristik field pada setiap tabel.
Informasi tentang database ini akan didokumentasikan dalam kamus data.
Kamus data (data dictionary) adalah file manual ataupun otomatis yang
menyimpan definisi-definisi elemen data berikut karakteristik mereka.
Pada Microsoft Acces memiliki kemampuan kamus data yang belum
sempurna, yang menampilkan informasi seperti nama, deskripsi, ukuran, tipe,
format, dan properti lainnya pada tiap filed sebuah tabel. Bagi perusahaan
besar diharapkan dapat menangkap informasi tambahan seperti penggunaan,
kepemilikan, otorisasi, keamanan, dan lain-lain.
a. Meminta Data dan Melaporkan
DBMS menyertakan perangkat untuk mengakses dan memanipulasi
informasi pada database. DBMS memiliki bahasa manipulasi data yang
digunakan untuk menambah, mengubah, menghapus, dan mengambil data
pada database. Bahasa ini mengandung perintah untuk mengekstrak /
menyaring data dari database untuk memenuhi kebutuhan informasi dan
mengembangkan aplikasi. Bahasa manipulasi data yang paling mutakhir
saat ini adalah Structured Query Languange atau SQL. Gambar dibawah
ini menggambarkan query SQL yang akan menghasilkan tabel pada
gambar “tiga operasi dasar pada DBMS relasional”.

9
Pada Microsoft Acces, menemukan fitur-fitur yang yang memungkinkan
pengguna untuk menciptakan rangkaian permintaan informasi dengan
mengidentifikasi tabel dan field yang diinginkan berikut hasilnya.
Kemudian memilih baris pada database yang memenuhi kriteria yang
diperlukan. Tindakan ini kemudian diterjemahkan ke dalam perintah
Bahasa SQL. Gambar berikut mengilustrasikan bagaimana query yang
sama seperti query SQL untuk memilih PART dan SUPPLIER yang akan
digabungkan.

C. Merancang Database
Sebelum merancang database, harus memahami hubungan antardata, jenis
data yang dikelola, bagaimana data tersebut akan digunakan, dan bagaimana
organisasi perlu diubah untuk mengelola data dari prespektif lengkap seluruh
perusahaan. Database memerlukan:
1. Rancangan konseptual atau logis.
2. Rancangan fisik menunjukkan bagaimana database dirancang lewat akses
langsung perangkat penyimpanan.

10
a. Normalisasi dan Diagram Relasi Entitas
Rancangan konseptual suatu database menggambarkan bagaimana
elemen-elemen data pada database dikelompokkan. Proses tersebut
mengidentifikasi hubungan antara elemen-elemen data dan cara paling
efisien dalam mengelompokkan elemen-elemen data untuk menjawab
kebutuhan informasi suatu organisasi bisnis. Untuk menggunakan model
database secara rasional secara efektif, kelompok data yang rumit harus
disederhanakan untuk meminimalisasi elemen-elemen data yang ganda
serta hubungan-hubungan jamak yang janggal. Proses menciptakan
struktur data yang ringkas, stabil, serta fleksibel dan adaptif dari
kelompok-kelompok data yang rumit dinamakan normalisasi
(normalization). Gambar 6.9 dan 6.10 mengilustrasikan proses tersebut.

11
Dalam model bisnis yang dispesifikasikan di sini, suatu perintah
dapat memiliki lebih dari satu bagian, akan tetapi setiap bagian hanya
disediakan oleh satu pemasok. Jika kita membangun relasi yang dinamakan
PESANAN berikut seluruh field di dalamnya. Kita harus mengulang nama
dan alamat pemasok untuk setiap barang yang ada di pesanan, meskipun
pesanan tersebut untuk barang-barang dari satu pemasok yang sama.
Hubungan itu memuat apa yang disebut kelompok data yang berulang karena
bisa saja terdapat banyak barang pada suatu pesanan yang ditujukkan pada
satu pemasok saja. Cara yang lebih efisien untuk menyusun data tersebut
adalah dengan memperinci PESANAN menjadi relasi-relasi yang lebih kecil,
di mana tiap relasi menjelaskan suatu entitas tunggal yang utuh.
Sistem database relasional berupaya untuk menerapkan aturan
referensial terintegrasi (referential integrity) yang menjamin hubungan
antartabel tetap konsisten. Ketika suatu tabel memiliki kunci asing yang
mengacu pada tabel lainnya, anda tidak diperkenankan menambah apa pun
sampai terdapat record yang sesuai pada tabel yang berhubungan.
Perancang database mendokumentasikan model datanya dengan
sebuah diagram relasi entitas (entity-relationship diagram), seperti yang
diilustrasikan di gambar 6.11. Diagram ini mengilustrasikan relasi antara
entitas PEMASOK, SUKU CADANG, LINI_BARANG, dan PESANAN.
Kotaknya mewakili entitas. Garis yang menghubungkan tiap kotak mewakili
hubungan. Sebuah garis yang menghubungkan dua entitas yang diakhiri
dengan dua buah garis pendek menunjukkan hubungan tunggal. Sebuah garis
yang menghubungkan dua entitas yang diakhiri tanda kaki burung dengan
garis pendek diatasnya mengindikasikan hubungan satu kebanyak. Gambar

12
6.11 menunjukkan suatu PESANAN dapat berisi banyak LINI-BARANG.
(sebuah SUKU CADANG dipesan beberapa kali dan muncul banyak kali
sebagai lini barang dalam suatu pesanan). Setiap suku cadang hanya dapat
memiliki satu pemasok, namun banyak suku cadang yang bisa disediakan
oleh pemasok.

Jika organisasi bisnis tidak dapat mengimplementasikan datanya dengan


tepat, sistem tersebut tidak akan mampu melayani bisnis tersebut dengan
baik. Sistem perusahaan tersebut tidak akan efektif karena bekerja dengan
data yang tidak akurat, tidak lengkap, serta sulit diperoleh. Sebagai contoh,
Famous Footwear, perusahaan ritel alas kaki dengan 800 gerai di 49 negara,
tidak dapat masuk untuk mencapai tujuannya untuk menjadi tren mode
sepatu yang tepat, toko yang tepat dengan harga yang tepat. Karena
database-nya tidak dirancang dengan baik untuk disesuaikan dengan
perubahan persediaan toko yang terjadi dengan cepat.

6.3 Alat dan Teknologi Utama untuk Mengakses Informasi dari Database untuk
Meningkatkan Kinerja Bisnis dan Pengambilan Keputusan.
Organisasi bisnis menggunakan database mereka untuk memantau transaksi dasar
seperti membayar pemasok. Akan tetapi, mereka juga membutuhkan database
untuk menyediakan informasi guna menjalankan bisnisnya dengan lebih efisien,
serta membantu manajer dan karyawan membuat keputusan yang lebih baik.
A. Tantangan dalam Menghadapi Besarnya Volume Data
Data besar (big data) menggambarkan rangkaian data dengan volume sangat
besar yang melampaui kemampuan DBMS dalam mengelola, menyimpan, dan
menganalisis data tersebut.
Data besar tidak mengacu pada jumlah yang spesifik, namun umumnya
mengacu pada data dalam kisaran petabyte dan Exabyte. Data besar dihasilkan
dalam jumlah yang jauh lebih besar dan lebih cepat, ketimbang data
tradisional. Sebagai contoh, meskipun “tweets” dibatasi sampai dengan 140
karakter, namun twitter menghasilkan data lebih besar dari 8 terabyte setiap
harinya. Organisasi besar tertarik dengan data besar karena mereka dapat
melihat pola yang lebih berbentuk dan anomali-anomali yang lebih menarik
ketimbang data kecil yang berpotensi memberikan wawasan baru tentang
perilaku pelanggan, pola cuaca, aktivitas pasar saham, dan fenomena lainnya.
B. Infrastruktur Intelijen Bisnis
Infrastruktur dari intelijen bisnis terkini memiliki rangakaian perangkat untuk
memperoleh informasi-informasi yang diperlukan dari berbagai jenis data

13
yang berbeda pada organisasi bisnis masa kini, termasuk data berkapasitas
besar yang semi-terstruktur maupun tidak terstruktur.

1. Data Warehouse dan Data Mart


Gudang data (data warehouse) adalah suatu database yang
menyimpan data penting saat ini dan data historis untuk manajer dalam
keseluruhan perusahaan. Gudang data harus didesain secara hati-hati oleh
spesialis dan teknikal bisnis untuk memastikan bahwa gudang data dapat
menyediakan informasi yang tepat dalam pengambilan keputusan.
Perusahaan mungkin perlu mengubah proses bisnisnya kepada keuntungan
dari informasi yang ada di gudang. Perusahaan dapat membangun gudang
data perusahaan dimana gudang data pusat melayani keseluruhan
organisasi, atau dapat menciptakan gudang yang lebih kecil dan
terdesentralisasi yang disebut dengan data mart (pasar data).
Keuntungan dari gudang data (data warehouse), gudang data tidak
hanya menawarkan informasi yang lebih nyata, tetapi juga mempermudah
para pembuat keputusan untuk mendapatkan informasi. Gudang data
bahkan mencakup kemampuan untuk menyusun dan menyusun ulang data.
Data Mart adalah bagian dari data warehouse yang diringkas atau
dikhususkan untuk penanganan jenis-jenis data tertentu pada database
yang terpisah untuk kelompok pengguna yang telah ditentukan. Sebagai
contoh, perusahaan bisa saja mengembangkan data mart bagi divisi
penjualan dan pemasaran untuk mengurusi informasi pelanggan.
Perusahan penjual buku Barnes & Noble biasanya menggunakan rangkaian
data mart untuk data yang dihasilkan oleh titik penjualannya (gerainya),
pada toko-toko ritel yang terdapat di kampus, dan yang terakhir untuk
penjualan secara online.

2. Hadoop
Untuk menangani data berkapasitas besar yang semi-terstruktur
ataupun tidak sama sekali, perusahaan menggunakan Hadoop. Hadoop
adalah kerangka kerja open-source yang dikelola oleh Apache Software
Foundation yang memungkinkan pendistribusian proses data berkapasitas
besar secara parallel pada komputer-komputer berbiaya terjangkau.
Hadoop memecah masalah data besar tersebut menjadi bagian-bagian
yang lebih kecil, kemudian mendistribusikannya ke ribuan titik
pemrosesan computer yang berbiaya terjangkau, lalu mengkombinasikan
menjadi rangkaian data yang lebih kecil untuk mempermudah proses
analisis.
Hadoop terdiri atas beberapa layanan pokok: Hadoop Distributed
File System (HDFS) untuk penyimpanan file data dan MapReduce untuk
pemrosesan data parallel dengan kinerja tinggi. Hadoop dapat menangani
jenis data apapun dengan kapasitas besar, termasuk data transaksi
terstruktur, data dengan struktur yang agak longgar seperti masukan dari

14
Facebook dan Twitter, data-data yang kompleks seperti log file pada
server Web, data audio dan video yang tidak terstruktur. Perusahaan
menggunakan Hadoop untuk menganalisis data dengan volume yang
sangat besar serta memfragmentasi area untuk data yang terstruktur
maupun yang tidak terstruktur sebelum disimpan ke dalam data
warehouse. Yahoo menggunakan Hadoop untuk menelusur perilaku dari
pengguna sehingga dapat memodifikasi tampilan laman pembukaan untuk
menyesuaikan dengan kepentingan mereka.

3. Komputasi Dalam Memori


Memfasilitasi analisis data yang besar adalah dengan
menggunakan komputasi dalam memori (in memory computing), yang
sangat mengandalkan pada memori utama dari computer (computer’s
main memory-RAM) untuk data penyimpanan (DBMS yang konvensional
menggunakan sistem penyimpanan disk). Para pengguna akan mengakses
data yang disimpan dalam memori sistem utama, yang dapat
menghilangkan kemacetan dari mengambil dan membaca data dalam
suatu database tradisional, berdasarkan pada disk dan secara dramatis atau
mempersingkat waktu tunggu atas permintaan. Pada pemrosesan dalam
memori akan memungkinkan bagi serangkaian data yang sangat besar,
sebesar ukuran data mart atau data warehouse yang kecil, untuk
meletakkan seluruhnya dalam memori.
Kemajuan dalam teknologi perangkat keras komputer modern
yang memungkinkan pemrosesan dalam memori, seperti prosesor luar
biasa yang berkecepatan tinggi, pemrosesan multicore dan akan
menurunkan harga dari memori komputer. Teknologi-teknologi ini dapat
membantu perusahaan untuk mengoptimalkan penggunaan dari memori
dan mempercepat kinerja pemrosesan, sementara itu juga dapat
menurunkan biayanya.
Produk-produk komersial terkemuka bagi komputasi dalam
memori meliputi High Perfomance Analytics Appliance (HANA) dari
SAP dan Oracle Exalytics. Masing-masing menyediakan serangkaian
komponen perangkat lunak yang terintegrasi, meliputi perangkat lunak
database dalam memori dan perangkat lunak analitis yang terspesialisasi
yang menjalankan perangkat keras untuk pekerjaan komputasi dalam
memori.

4. Platform Analitis
Platform analitis (analytic platformas) berkecepatan tinggi yang
terspesialisasi dengan menggunakan baik teknologi terkait maupun yang
tidak terkait yang dioptimalkan untuk menganalisis kumpulan data yang
besar. Platform analitis ini, seperti IBM Netezza dan Oracle Exadata,
menampilkan sistem perangkat keras dan perangkat lunak yang telah
dikonfigurasi sebelumnya, secara spesifik dirancang untuk pemrosesan

15
permintaan dan analitis. Sebagai contoh, IBM Netezza menampilkan
database yang terintegrasi secara ketat, server dan komponen-komponen
penyimpanan yang menangani pertanyaan analitis yang rumit 10 hingga
100 kali lebih cepat daripada sistem tradisional. Platform analitis juga
memasukkan sistem dalam memori dan NoSQL sistem manajemen
database non-relasional.

Gambar komponen-komponen dari data warehouse

Gambar diatas mengilustrasikan infrastruktur intelijen bisnis


kontemporer dengan menggunakan teknologi yang data saat ini dan data
historis akan diekstrak dari sistem operasional yang banyak seiring
dengan data web, data yang dihasilkan oleh mesin, data audio/visual yang
tidak terstruktur dan data dari sumber eksternal yang telah
direstrukturisasi dan diorganisasikan ulang untuk pelaporan dan analitis.
Cluster Hadoop melakukan proses data yang besar sebelumnya untuk
digunakan dalam data warehouse, data mart atau platform analitis atau
untuk permintaan langsung oleh para pengguna power output meliputi
laporan dan dashboard yang sama halnya dengan hasil query.

C. Perangkat Analitis : Hubungan, Pola, Tren


Organisasi-organisasi meng-instal peralatan analisis data dan data warehouse
agar penggunaan informasi yang disimpan di database semakin baik dan dapat
mengambil keuntungan dari teknologi database yang dihubungkan ke jaringan
dunia luas (World Wide Web).

1. Analisis Data Multidimensional / OLAP


Terkadang manajer perlu menganalisis data dengan suatu cara yang
tidak dapat diwakili oleh model database tradisional. Untuk menyediakan

16
tipe informasi ini, perusahaan dapat menggunakan database
multidimensional khusus atau suatu alat yang dapat menciptakan tampilan-
tampilan multidimensional dari data dalam database yang saling
berhubungan (relational database). Analisis multidimensional
memudahkan pengguna untuk menampilkan data yang sama melalui cara
yang berbeda dengan menggunakan banyak dimensi. Istilah lain untuk
analisis data multidimensional adalah online analytical processing
(OLAP).
Gambar Multidimensional Data Model (Data Cube)

Gambar di atas memperlihatkan suatu model multidimensional


yang dapat diciptakan untuk mewakili produk, wilayah, penjualan actual
dan penjualan yang diproyeksikan. Suatu matriks, mengenai penjualan
secara actual dapat ditumpuk pada bagian atas dari matriks penjualan yang
diproyeksikan, untuk membentuk sebuah kubus dengan 6 sisi. Perusahaan
akan menggunakan database multidimensional yang terspesialisasi lainnya
atau sebuah alat bantu yang dapat menciptakan sudut pandang
multidimensional atas data dalam database relasional.

2. Penggalian Data (Data Mining)


Sistem data warehouse menyediakan alat pertanyaan ad hoc
(tujuan tertentu) dan terstandarisasi, alat analisis, dan fasilitas pelaporan
dalam grafik, termasuk alat untuk OLAP dan penggalian data. Data
mining menggunakan berbagai macam teknik untuk mencari pola-pola
dan hubungan-hubungan tersembunyi dalam kolam data yang luas dan
menarik peraturan-peraturan darinya yang dapat digunakan untuk
memprediksi perilaku masa depan dan memandu pengambilan keputusan.
Penggalian data seringkali digunakan untuk menyediakan informasi untuk
target pemasaran yang pesan-pesan individu dapat diciptakan berdasarkan
kepentingan individual, dan ada banyak aplikasi penggalian data lainnya
dalam pekerjaan bisnis dan khusus. Sistem ini dapat menunjukkan pola-
pola atau kecenderungan analisis tingkat tinggi, tetapi juga dapat mencari
ke dalam untuk menyediakan rincian-rincian saat dibutuhkan.
Data mining merupakan alat yang bertenaga dan menguntungkan,
tetapi juga menempatkan tantangan kedalam proteksi dalam kepentingan

17
individual. Teknologi penggalian data dapat mengkombinasikan
informasi dari berbagai sumber untuk menciptakan image data yang rinci
mengenai masing-masing dari kita-pendapatan kita, kebiasaan kita, hobi
kita, keluarga kita, dan kepentingan politik kita. Tipe dari informasi yang
dapat diperoleh dari data mining, meliputi asosiasi, urutan, klasifikasi,
cluster dan peramalan.
 Asosiasi merupakan kejadian yang dikaitkan dengan suatu peristiwa
tunggal. Sebagai contoh, penelitian mengenai pola pembelian di
supermarket akan mengungkapkan bahwa, ketika keripik jagung
dibeli, maka minuman cola akan dibeli sebanyak 65 persen, tetapi
ketika terdapat promosi, maka cola yang dibeli meningkat menjadi
85 persen. Informasi ini dapat membantu para manajer untuk
menganbil keputusan yang lebih baik, karena mereka telah
mempelajari manfaat dari suatu promosi.
 Dalam sekuen, maka peristiwa-peristiwa akan dikaitkan berdasarkan
waktu. Kita dapat, menemukan contohnya, jika sebuah rumah dibeli,
terdapat 65 persen, kemungkinan sebuah kulkas baru akan dibeli juga
dalam dua minggu dan 45 persen kemungkinan sebuah oven akan
dibeli dalam waktu sebulan setelah rumah itu dibeli.
 Klasifikasi membahas pola-pola yang menggambarkan kelompok,
yang mana suatu barang yang dimiliki dengan memeriksa barang
yang ada, yang telah diklasifikasikan dan dengan menarik
kesimpulan dari serangkaian aturan. Sebagai contoh, bisnis seperti
kartu kredit atau perusahaan telepon akan khawatir kehilangan para
pelanggannya yang loyal. Klasifikasi dapat membantu untuk
menemukan ciri-ciri dari para pelanggan yang memiliki
kecenderungan untuk berhenti dan dapat menyediakan suatu model
untuk membantu para manajer dalam memprediksikan siapakah para
pelanggan tersebut sehingga para manajer dapat merancang
kampanye-kampanye khusus untuk mempertahankan para pelanggan.
 Pengklasteran (clustering) bekerja dengan cara yang sama, seperti
klasifikasi ketika tidak ada kelompok yang masih belum
didefinisikan. Alat bantu data mining dapat menemukan
pengelompokan yang berbeda di dalam data, seperti menemukan
daya tarik kelompok atas kartu bank atau membagi suatu database ke
dalam kelompok dari para pelanggan yang didasarkan pada
demografis dan tipe dari investasi pribadi.
 Meskipun penerapan-penerapan tersebut melibatkan prediksi, tetapi
peramalan menggunakan prediksi dalam cara yang berbeda.
Peramalan menggunakan serangkaian nilai yang ada untuk
meramalkan berapa besar dari nilai lainnya. Sebagai contoh,
peramalan akan menemukan pola-pola dalam data untuk membantu
para manajer dalam mengemasi nilai masa yang akan datang dari
variabel-variabel yang terus menerus seperti angka penjualan.

18
Tabel Bagaimana bisnis menggunakan data mining
Organisasi Aplikasi Penggalian Data
Disco S.A Rantai supermarket menggunakan penggalian data
untuk menganalisis pola pembelian oleh lebih dari 1,5
juta konsumen yang berpartisipasi dalam program
pembelian di lebih dari 200 toko.
Perusahaan Katalog perusahaan demikian pula katalog penjualan
Lilian Vernon adalah untuk menentukan produk terbaik yang dijual.
Dengan menganalisis data, ditemukan bahwa banyak
yang mengunjungi web lewat katalog tulisan. Lilian
Vernon sekarang menempatkan produknya secara
dominan di website yang telah ada.
Red Robin Freenwood, menggunakan penggalian data untuk
Restoran menganalisis 86 restoran yang ada di lebih dari 100
lokasi. Dengan menganalisis harganya, biaya, dan
kualitas semua makanannya. Red Robin dapat
mengidentifikasikan semua menu dengan marjin
keuntungan yang tinggi.
Samsung Analisis data adalah untuk mengidentifikasi pesaing.
Elektronik Ditemukan bahwa monitor computer terjual dan
Amerika pesaing bertanggung jawab atas 40 persen kerugian
yang dialami.

3. Teks Mining dan Web Mining


Perangkat teks mining (penelusuran text) tersedia untuk
membantu bisnis dalam menganalisis data yang tidak terstruktur. Alat-
alat bantu ini dapat mengekstrak elemen-elemen kunci dari rangkaian
data yang besar yang tidak terstruktur, menemukan pola dan hubungan,
dan meringkas informasi.
Perangkat lunak analisis sentimen (sentiment analysis) dapat
melakukan penelusuran atas komentar teks dalam pesan surel, blog,
percakapan dalam media sosial, atau bentuk survei untuk mendeteksi
opini yang menyenangkan dan yang tidak menyenangkan mengenai topik
bahasan tertentu.
Contoh: pialang diskon Charles Schwab menggunakan perangkat
lunak Attensity Analyze untuk menganalisis ratusan ribu interaksi
pelanggannya tiap bulan. Perangkat lunak ini dapat menganalisis ratusan
ribu dapat menganalisis catatan, surel, tanggapan survei, dan diskusi
online dari layanan pelanggan Schwab unuk menemukan tanda-tanda
ketidakpuasan yang menyebabkan pelanggan berhenti menggunakan jasa
dari perusahaan. Attensity dapat secara otomatis mengidentifikasi
berbagai macam “suara” yang digunakan oleh pelanggan untuk
mengekspresikan umpan balik mereka (seperti suara positif, negatif, atau
sesuai dengan kondisi) untuk menunjukkan dengan tepat keinginan dari

19
seseorang untuk membeli, berhenti membeli, atau reaksi terhadap suatu
produk tertentu atau pesan yang disampaikan melalui pemasaran. Schwab
menggunakan informasi ini untuk mengambil tindakan korektif, seperti
meningkatkan komunikasi pialang secara lansung dengan pelanggan dan
mencoba untuk memecahkan permasalahan dengan segera yang membuat
pelanggan tidak puas.
Web merupakan sumber utama lainnya dari data besar yang tidak
terstruktur untuk mengungkapkan pola, kecenderungan, dan wawasan
dalam perilaku konsumen. Penemuan serta analisis pola dan informasi
yang bermanfaat dari World Wide Web disebut dengan web mining
(penelusuran web). Bisnis akan beralih kepada web mining untuk
membantu mereka dalam memahami perilaku konsumen, melakukan
evaluasi atas keefektifan situs web tertentu, atau kuantitas dari
keberhasilan suatu kampanye pemasaran.
Misal: para pemasar menggunakan Google Trend dan Google
Insight untuk layanan Search, yang menelusuri popularitas dari berbagai
jenis kata dan frase yang digunakan dalam query pencari dari Google,
untuk mempelajari apa yang diminati oleh orang-orang , dan apakah
mereka tertarik untuk membeli.
Web mining terdiri atas tiga bagian:
a. Web content mining, merupakan suatu proses untuk mengekstrak
pengetahuan dari konten dalam laman web, meliputi teks, gambar,
audio, dan data video.
b. Web structure mining, memeriksa data yang terkait dengan struktur
dari situs web tertentu. Contohnya: tautan yang menunjuk pada suatu
dokumen mengindikasikan popularitas dari dokumen tersebut,
sementara itu tautan keluar dari suatu dokumen mengindikasikan
pengayaan atau mungkin variasi dari topik yang tercakup dalam
dokumen.
c. Web usage mining, menelaah data interaksi pengguna yang dicatat
oleh server web kapanpun pemintaan dari sumber daya situs web
tersebut diterima.

4. Database dan Web (Jaringan)


Banyak perusahaan yang menggunakan web untuk membuat
beberapa informasi dalam database internal mereka disediakan bagi
pelanggan dan rekan bisnis. Misalnya seorang pelanggan dengan browser
web ingin mencari database peritel secara online untuk informasi
penetapan harga. Gambar berikut ini mengilustrasikan bagaimana
pelanggan mengakses database internal dari peritel tersebut melalui web.
Pengguna mengakses situs web peritel melalui internet dengan
menggunakan perangkat lunak browser web pada komputer PC kliennya.

20
Keuntungan menggunakan web untuk mengakses database
internal organisasi. (1) perangkat lunak browser web jauh lebih mudah
untuk digunakan daripada perangkat query yang dimiliki. (2) tampilan
web membutuhkan sedikit perubahan atau tidak sama sekali terhadap
database internal. Dibutuhkan biaya yang lebih rendah untuk
menambahkan antar muka web di depan sistem yang diwariskan
daripada merancang kembali dan membangun kembali sistem untuk
meningkatkan akses pengguna.
Mengakses database korporat melalui web menciptakan efisiensi,
peluang, dan model bisnis yang baru. Contohnya ThomasNet.com
menyediakan direktori online terkini dengan lebih dari 650.000 pemasok
produk industri, seperti bahan kimia, logam, plastik, karet, dan peralatan
otomotif. Sebelumnya disebut Thomas Register, perusahaan biasa
mengirimkan katalog kertas besar dengan informasi itu. Sekarang
mereka menyediakan informasi itu kepada pelanggan secara online
melalui situs webnya.

6.4 Kebijakan Informasi, Administrasi Data, dan Penjaminan Kualitas Data.


Menyiapkan database merupakan permulaan untuk memastikan bahwa data bisnis
tetap akurat, andal, dan tersedia bagi mereka yang membutuhkannya, bisnis
memerlukan kebijakan dan prosedur khusus untuk pengelolaan data.
A. Membangun Kebijakan Informasi
Setiap bisnis baik besar maupun kecil, membutuhkan kebijakan
informasi. Data perusahaan adalah sumber daya yang penting dan tidak ingin
orang lain melakukan apa pun yang mereka inginkan. Maka perlu memiliki
aturan tentang bagaimana data akan diatur dan dipelihara, dan siapa yang
diizinkan untuk melihat data atau mengubahnya. Kebijakan informasi
menetapkan aturan organisasi untuk berbagi, menyebarkan, memperoleh,
membakukan, mengklasifikasikan dan menginventarisasi informasi. Kebijakan
informasi menjabarkan prosedur dan akuntabilitas khusus, mengidentifikasi
pengguna dan unit organisasi mana yang dapat berbagi informasi, di mana
informasi dapat didistribusikan dan siapa yang bertanggung jawab untuk
memperbarui dan memelihara informasi.
Misalnya, kebijakan informasi tipikal akan menetapkan bahwa hanya
anggota terpilih dari departemen penggajian dan sumber daya manusia yang

21
berhak mengubah dan melihat data karyawan yang sensitif, seperti gaji
karyawan atau nomor jaminan sosial, dan bahwa departemen ini bertanggung
jawab untuk membuat memastikan bahwa data karyawan tersebut akurat. Jika
berada dalam bisnis kecil, kebijakan informasi akan dibuat dan diterapkan oleh
pemilik atau manajer. Dalam organisasi besar, pengelolaan dan perencanaan
informasi sebagai sumber daya perusahaan sering kali memerlukan fungsi
administrasi data formal.
Administrasi data bertanggung jawab atas kebijakan dan prosedur
khusus di mana data dapat dikelola sebagai sumber daya organisasi. Tanggung
jawab ini mencakup pengembangan kebijakan informasi, perencanaan data,
pengawasan desain database logis dan pengembangan kamus data, dan
pemantauan bagaimana spesialis sistem informasi dan kelompok pengguna
akhir menggunakan data. Tata kelola data yang digunakan untuk
menggambarkan banyak dari aktivitas ini. Dipromosikan oleh IBM, tata kelola
data berkaitan dengan kebijakan dan proses untuk mengelola ketersediaan,
kegunaan, integritas, dan keamanan data yang digunakan di perusahaan,
dengan penekanan khusus pada peningkatan privasi, keamanan, kualitas data,
dan kepatuhan terhadap peraturan pemerintah. Sebuah organisasi besar juga
akan memiliki desain database dan grup manajemen di dalam divisi sistem
informasi perusahaan yang bertanggung jawab untuk menentukan dan
mengatur struktur dan konten database, serta memelihara database. Dalam
kerjasama erat dengan pengguna, kelompok desain menetapkan database fisik,
hubungan logis antar elemen, dan aturan akses dan prosedur keamanan. Fungsi-
fungsi yang dilakukannya disebut administrasi database.

22
Gambar contoh administrasi database My SQL Query
B. Memastikan Kualitas Data
Kebijakan database dan informasi yang dirancang dengan baik akan
sangat membantu dalam memastikan bahwa bisnis memiliki informasi yang
dibutuhkan. Namun, langkah tambahan harus diambil untuk memastikan bahwa
data dalam database organisasi akurat dan tetap dapat diandalkan. Data yang
tidak akurat, tidak tepat waktu, atau tidak konsisten dengan sumber informasi
lain dapat menyebabkan keputusan yang salah, penarikan produk, dan kerugian
finansial. Gartner Inc. melaporkan bahwa lebih dari 25 persen data penting
dalam database perusahaan besar Fortune 1000 tidak akurat atau tidak lengkap,
termasuk kode produk dan deskripsi produk yang buruk, deskripsi inventaris
yang salah, data keuangan yang salah, informasi pemasok yang salah, dan data
karyawan yang salah. Studi Keputusan Sirius tentang "Dampak Data Buruk
pada Pembuatan Permintaan" menemukan bahwa 10 hingga 25 persen catatan
pelanggan dan prospek mengandung kesalahan data kritis. Mengoreksi
kesalahan ini di sumbernya dan mengikuti praktik terbaik untuk
mempromosikan kualitas data meningkatkan produktivitas proses penjualan
dan menghasilkan peningkatan pendapatan sebesar 66 persen.
Beberapa masalah kualitas data ini disebabkan oleh data yang berlebihan
dan tidak konsisten yang dihasilkan oleh beberapa sistem. Misalnya, sistem
pemesanan penjualan dan sistem manajemen inventaris dapat menyimpan data
tentang produk organisasi. Namun, sistem pemesanan penjualan mungkin
menggunakan istilah Nomor Barang dan sistem inventaris mungkin memanggil
atribut yang sama Nomor Produk. Sistem penjualan, inventaris, atau
manufaktur dari pengecer pakaian mungkin menggunakan kode yang berbeda
untuk merepresentasikan nilai untuk suatu atribut.
Satu sistem mungkin merepresentasikan ukuran pakaian sebagai "ekstra
besar", sedangkan sistem lain mungkin menggunakan kode "XL" untuk tujuan
yang sama. Selama proses desain untuk database gudang, data yang
mendeskripsikan entitas, seperti pelanggan, produk, atau pesanan, harus diberi

23
nama dan didefinisikan secara konsisten untuk semua area bisnis menggunakan
database. Ini kemungkinan besar karena nama dipertahankan beberapa kali
dalam database. Nama pelanggan, produk, atau pesanan mungkin salah eja
karena tidak dipindai dengan benar ke dalam sistem. Karena
ketidakkonsistenan ini, database akan memperlakukan sebagai orang yang
berbeda. Kami sering menerima surat berlebihan yang dialamatkan ke Laudon,
Lavdon, Lauden, atau Landon. Jika database dirancang dengan benar dan
standar data seluruh perusahaan ditetapkan, elemen data duplikat atau tidak
konsisten harus minimal.
Namun, sebagian besar masalah kualitas data, seperti nama yang salah
eja, nomor yang dialihkan, atau kode yang salah atau hilang, berasal dari
kesalahan selama input data. Insiden kesalahan tersebut meningkat saat
perusahaan memindahkan bisnis mereka ke Web dan memungkinkan
pelanggan dan pemasok memasukkan data ke situs Web mereka yang secara
langsung memperbarui sistem internal. Sebelum database baru tersedia,
organisasi perlu mengidentifikasi dan memperbaiki data yang salah dan
menetapkan rutinitas yang lebih baik untuk mengedit data setelah database
mereka beroperasi.
Analisis kualitas data sering kali diawali dengan audit kualitas data, yaitu
survei terstruktur terhadap akurasi dan tingkat kelengkapan data dalam suatu
sistem informasi. Audit kualitas data dapat dilakukan dengan survei seluruh file
data, survei sampel dari file data, atau survei pengguna akhir untuk persepsi
mereka tentang kualitas data.

Gambar : contoh Scrubbing data menggunakan software Data Quality Service


(DQS) pada SQL Server
Pembersihan data, juga dikenal sebagai scrubbing data, terdiri dari
aktivitas untuk mendeteksi dan mengoreksi data dalam database yang salah,
tidak lengkap, tidak diformat dengan benar, atau berlebihan. Pembersihan data
tidak hanya mengoreksi kesalahan tetapi juga menegakkan konsistensi di antara

24
kumpulan data berbeda yang berasal dari sistem informasi terpisah. Perangkat
lunak pembersih data khusus tersedia untuk secara otomatis mensurvei file data,
memperbaiki kesalahan dalam data, dan mengintegrasikan data dalam format
seluruh perusahaan yang konsisten. Masalah kualitas data bukan hanya masalah
bisnis. Mereka juga menimbulkan masalah serius bagi individu, mempengaruhi
kondisi keuangan dan bahkan pekerjaan mereka.
Misalnya, data yang tidak akurat atau kadaluwarsa tentang riwayat kredit
konsumen yang dikelola oleh biro kredit dapat mencegah individu yang layak
kredit untuk mendapatkan pinjaman atau menurunkan peluang mereka untuk
menemukan atau mempertahankan pekerjaan. Sesi Interaktif tentang
Manajemen menggambarkan pengalaman American Water dengan mengelola
data sebagai sumber daya. Saat membaca kasus ini, cobalah untuk
mengidentifikasi kebijakan, prosedur, dan teknologi yang diperlukan untuk
meningkatkan manajemen data di perusahaan ini.

Sumber ringkasan materi kuliah:

1. Laudon, Kenneth C. dan Laudon, Jane P. (2017) Management Information


Systems: Managing the Digital Firm, ed. 15.
2. Winarno, Wing Wahyu, (2017). Sistem Informasi Manajemen, ed 3. UPP STIM
YKPN

25

Anda mungkin juga menyukai