Anda di halaman 1dari 38

MAKALAH

“Managing Data to Improve Business Performance”

Disusun untuk memenuhi tugas


Mata Kuliah : Teknologi Informasi untuk Manajemen dan Akuntansi
Dosen Pengampu : Dr. Nasrizal, SE., M.Si., Ak., CA

Oleh:
Kelompok 6
1. Annisa Rezki Susanti (2010247509)
2. Neni Afriyani (2010247415)
3. Roy Al-Amin (2010247518)

PROGRAM MAGISTER AKUNTANSI


FAKULTAS EKONOMI DAN BISNIS
UNIVERSITAS RIAU
2021

1
DAFTAR ISI

DAFTAR ISI i
KATA PENGANTAR ii

BAB I PENDAHULUAN
1.1 Latar Belakang 1

BAB II PEMBAHASAN
Coca Cola Manages at the Point That Makes a Difference 2
2.1 Database Management Systems 6

2.2 Data Warehouse and Big Data Analytics 18


2.3 Data and Text Mining 25
2.4 Business Intelligence 28
2.5 Electronic Records Management 33

DAFTAR PUSTAKA 36

2
BAB I
PENDAHULUAN
1.1 Latar Belakang
Analytics membedakan bisnis di abad ke-21. Transaksional, sosial, seluler,
cloud, web, dan sensor data menawarkan potensi yang sangat besar. Tetapi tanpa alat
untuk menganalisis tipe dan volume data ini, tidak akan ada banyak perbedaan antara
bisnis di abad ke-20 dan bisnis saat ini, kecuali untuk akses seluler. Data berkualitas
tinggi dan keahlian manusia sangat penting untuk nilai analitik (Gambar 3.1).
Keahlian manusia diperlukan karena hanya analitik tidak dapat menjelaskan
alasan tren atau hubungan, tahu tindakan apa yang harus diambil; atau berikan
konteks yang memadai untuk menentukan apa yang diwakili oleh angka-angka dan
bagaimana cara menginterpretasikan. Basis data, gudang data, data besar, dan bisnis
teknologi intelijen (BI) berinteraksi untuk menciptakan ekosistem biz-tech. Analisis
data besar dan penemuan BI wawasan atau hubungan kepentingan yang sebaliknya
mungkin belum diakui.

Keahlian
manusia Tren atau hubungan
Konteks untuk
memahami apa yang
diwakili angka dan
bagaimana
Data menafsirkannya
analytic Tindakan apa yang
s harus diambil

Data
berkualitas
tinggi

Gambar 3.1 Analisis data, dan keahlian manusia dan data berkualitas tinggi,
diperlukan untuk mendapatkan informasi yang dapat ditindaklanjuti.

3
BAB II
PEMBAHASAN

A. Coca Cola Manages at the Point That Makes a Difference


Tantangan Manajemen Data Coca-Cola's
The Coca-Cola Company adalah perusahaan Fortune 100 dengan lebih dari $ 48
miliar dalam pendapatan penjualan dan laba $ 9 miliar (Gambar 3.2). Pemimpin
pasar mengelola dan menganalisis beberapa petabyte (Pb) data yang dihasilkan atau
dikumpulkan lebih dari 500 merk dan konsumen di 206 negara. Dimana untuk
keterangan Petabyte (Pb) 1,000 terabyte, Terabytes (Tb) 1 million Gigabytes (Gb).

Gambar 3.2 The Coca-Cola Company Overview

 Centralized database menyimpan data di satu lokasi yang dapat diakses dari
mana saja. Pencarian bisa cepat karena mesin pencari tidak perlu memeriksa
beberapa lokasi terdistribusi untuk menemukan data yang responsif.
 Data warehouses yang mengintegrasikan data dari database di seluruh
perusahaan disebut data warehouses perusahaan (Enterprise Data Warehouses
-EDW).

4
5
Gambar 3.4 Centralized Data Architecture.

Gambar 3.5 Data Dari Transaksi Online Dan Offline Disimpan Dalam Basis Data.
Data Tentang Entitas Seperti Pelanggan, Produk, Pesanan, Dan Karyawan Disimpan
Dengan Cara Yang Terorganisasi.

6
Semua data distandarisasi melalui serangkaian master data management
(MDM), sebagaimana dibahas dalam Bab 2. Sebuah enterprise data warehouse
(EDW) menghasilkan satu tampilan dari semua data ritel multisaluran. EDW
menciptakan pandangan tepercaya tentang pelanggan, penjualan, dan transaksi,
memungkinkan Coca-Cola merespons dengan cepat dan akurat terhadap perubahan
dalam kondisi pasar. Pendekatan Coca-Cola terhadap Model Data dan Keputusan Big
Data diperlakukan sebagai aset strategis.
Data besar memainkan peran kunci dalam memastikan bahwa jus jeruk
rasanya di tahun yang sama dan tersedia di mana saja di dunia. Jeruk yang digunakan
oleh Coca-Cola memiliki puncak musim pertumbuhan hanya tiga bulan.
Memproduksi jus jeruk dengan rasa konsisten sepanjang tahun meskipun kualitas
pasokan jeruk yang tidak konsisten adalah kompleks. Untuk menghadapi
kompleksitas, model keputusan jus jeruk dikembangkan, Black Book model. Model
keputusan mengkuantifikasi hubungan antar variabel, yang mengurangi
ketidakpastian.
Black Book menggabungkan data erperinci tentang 600 rasa yang membentuk
oranye, cuaca, preferensi pelanggan, hasil panen yang diharapkan, tekanan biaya,
preferensi konsumen regional, dan tingkat keasaman atau kemanisan.
Pertanyaan :
1. Mengapa Coca-Cola Company memiliki petabyte data?
2. Mengapa penting bagi Coca-Cola untuk dapat memproses data POS
(Point-of-sale) dalam waktu dekat secara langsung?
3. Bagaimana Coca-Cola berupaya menciptakan pengalaman pelanggan yang
menguntungkan?
4. Apa pentingnya memiliki pandangan tepercaya tentang data?
5. Apa manfaat dari model keputusan?
6. Apa Black Book Model itu?
7. Jelaskan manfaat strategis dari Black Book Model.

7
2.1 DATABASE MANAGEMENT SYSTEMS
Data adalah kekuatan pendorong di balik setiap bisnis yang sukses. operasi,
perencanaan, kontrol, dan semua fungsi manajemen lainnya sangat bergantung pada
proses informasi, bukan data mentah. Dan, tidak ada yang mau menunggu kritis bisnis
laporan atau jawaban spesifik atas pertanyaan mereka. Teknologi manajemen data
yang membuat pengguna mendapat informasi dan mendukung berbagai tuntutan
bisnis adalah sebagai berikut:
• Database menyimpan data yang dihasilkan oleh aplikasi bisnis, sensor, operasi, dan
sistem pemrosesan transaksi (TPS). Data dalam database sangat lincah.
Perusahaan menengah dan besar biasanya memiliki banyak database dari berbagai
jenis.
• Gudang data (data warehouse) mengintegrasikan data dari beberapa database dan
silo data, dan mengatur mereka untuk analisis yang kompleks, penemuan pengetahuan,
dan untuk mendukung pengambilan keputusan. Misalnya, data diekstraksi dari
database, diproses untuk menstandardisasi formatnya, dan kemudian dimuat ke
gudang data pada waktu tertentu, seperti mingguan. Dengan demikian, data dalam
gudang data bersifat non-volatil—dan siap untuk dianalisis.
• Data mart adalah gudang data skala kecil yang mendukung satu fungsi atau satu
departemen. Perusahaan yang tidak mampu berinvestasi dalam pergudangan data
dapat dimulai dengan satu atau lebih data mart.
• Intelijen bisnis (BI) alat dan teknik memproses data dan melakukan statistik
analisis untuk wawasan dan penemuan—yaitu, untuk menemukan hubungan yang
bermakna dalam data, tetap mendapat informasi secara real time, mendeteksi tren, dan
mengidentifikasi peluang dan risiko.
Teknik pemrosesan data, kekuatan pemrosesan, dan kinerja perusahaan kemampuan
manajemen telah mengalami kemajuan revolusioner dalam beberapa tahun terakhir
untuk alasan yang sudah Anda ketahui—data besar, mobilitas, dan komputasi awan.
Dekade terakhir, bagaimanapun, telah melihat munculnya pendekatan baru, pertama
di pergudangan data dan, baru-baru ini, untuk pemrosesan transaksi.
Sistem manajemen basis data (DBMS) terintegrasi dengan sistem pengumpulan
data seperti TPS dan aplikasi bisnis; menyimpan data dengan cara yang terorganisir;
dan menyediakan fasilitas untuk mengakses dan mengelola data tersebut. Selama 25

8
tahun terakhir, database relasionaltelah menjadi model database standar yang
diadopsi oleh sebagian besar perusahaan. Database relasional menyimpan data dalam
tabel yang terdiri dari kolom dan baris, mirip dengan format spreadsheet, seperti yang
ditunjukkan pada Gambar 3.6.
Sistem manajemen relasional (RDBMS) menyediakan akses ke data menggunakan
bahasa deklaratif—bahasa kueri terstruktur (SQL). Bahasa deklaratif
menyederhanakan akses data dengan mengharuskan pengguna hanya menentukan
data apa yang mereka inginkan akses tanpa mendefinisikan bagaimana akses akan
dicapai.
SELECT column_name(s)
FROM table_name
WHERE condition

Gambar 3.6 Ilustrasi Format Data Terstruktur Data Numerik Dan Alfanumerik
Disusun Dalam Baris Dan Kolom Yang Sudah Ditentukan Serupa Dengan Yang Ada
Dalam Spreadsheet Excel.

9
Gambar 3.7 Sebuah Contoh Dari SQL Untuk Mengakses Informasi Karyawan
Berdasarkan Tanggal Penerimaan.

Fungsi DBMS
Diperlukan tampilan data yang akurat dan konsisten di seluruh perusahaan
sehingga seseorang dapat membuat keputusan yang terinformasi dan dapat
ditindaklanjuti yang mendukung strategi bisnis. Fungsi yang dilakukan oleh DBMS
untuk membantu membuat tampilan seperti itu adalah:
• Pemfilteran dan pembuatan profil data: Memproses dan menyimpan data secara
efisien. Memeriksa data untuk kesalahan, inkonsistensi, redundansi, dan tidak lengkap
informasi.
• Integritas dan pemeliharaan data: Perbaiki, standarkan, dan verifikasi
konsistensinya dan integritas data.
• Sinkronisasi data: Mengintegrasikan, mencocokkan, atau menautkan data dari
sumber yang berbeda.
• Keamanan data: Periksa dan kendalikan integritas data dari waktu ke waktu.
• Akses data: Memberikan akses resmi ke data baik secara terencana maupun ad hoc
cara dalam waktu yang dapat diterima.
Perangkat keras komputasi saat ini mampu memecahkan kumpulan data yang
sangat besar yang tidak mungkin untuk dikelola beberapa tahun yang lalu dan
membuatnya tersedia sesuai permintaan melalui jaringan kabel atau nirkabel.
Pemrosesan Transaksi Online dan Pemrosesan Analitik Online
Ketika sebagian besar transaksi bisnis terjadi—misalnya, suatu barang dijual atau
dikembalikan, pesanan dikirim atau dibatalkan, pembayaran atau deposit dilakukan—
perubahan dilakukan langsung ke database. Perubahan online ini adalah penambahan,
pembaruan, atau penghapusan.
DBMS mencatat dan memproses transaksi dalam database, dan mendukung
pertanyaan dan pelaporan. Mengingat fungsinya, DBMS disebut sebagai:on line
sistem pemrosesan transaksi (OLTP). OLTP adalah desain database yang rusak
menurunkan informasi yang kompleks menjadi tabel data yang lebih sederhana untuk
mencapai keseimbangan antara efisiensi pemrosesan transaksi dan efisiensi kueri.
Proses database OLTP jutaan transaksi per detik. Namun, database tidak dapat
dioptimalkan untuk penambangan data, komplekssistem pemrosesan analitik online

10
(OLAP), dan keputusan mendukung. Keterbatasan ini menyebabkan pengenalan
teknologi data warehouse.
Gudang data dan data mart dioptimalkan untuk OLAP, penambangan data, BI,
dan pendukung keputusan. OLAP adalah istilah yang digunakan untuk
menggambarkan analisis data yang kompleks dari gudang data. Singkatnya, database
dioptimalkan untuk sangat cepat pemrosesan transaksi dan pemrosesan kueri. Gudang
data dioptimalkan untuk analisis.
Salah satu pendorong utama perubahan di pasar manajemen data
adalahpeningkatan jumlah data yang akan dikelola. Perusahaan membutuhkan DBMS
yang kuat dan solusi pergudangan data, analitik, dan pelaporan. Empat vendor yang
mendominasi pasar ini—Oracle, IBM, Microsoft, dan Teradata—terus merespons
untuk mengembangkan kebutuhan manajemen data dengan perangkat lunak yang
lebih cerdas dan canggih, dan perangkat keras. Teknologi perangkat keras canggih
memungkinkan penskalaan menjadi jauh lebih tinggi volume data dan beban kerja
dari sebelumnya mungkin, atau dapat menangani spesifik beban kerja.
Database relasional tujuan umum yang lebih lama DBMS tidak memiliki
skalabilitas atau fleksibilitas untuk beban kerja khusus atau sangat besar, tetapi sangat
baik dalam apa yang mereka lakukan.

Peringkat Vendor DBMS


DBMS perusahaan dengan peringkat tertinggi pada pertengahan 2014 adalah Oracle's
MySQL, SQL Server Microsoft, PostgreSQL, DB2 IBM, dan Database Teradata.
Paling berjalan di beberapa sistem operasi (OS).
• MySQL, yang diakuisisi oleh Oracle pada Januari 2010, mendukung ratusan
ribuan situs web komersial dan sejumlah besar perusahaan internal
aplikasi.
• Kemudahan penggunaan, ketersediaan, dan integrasi sistem operasi Windows SQL
Server menjadikannya pilihan yang mudah bagi perusahaan yang memilih produk
Microsoft untuk perusahaan mereka.
• PostgreSQL adalah database open source yang paling canggih, sering digunakan
oleh aplikasi game online dan Skype, Yahoo!, dan MySpace.
• DB2 banyak digunakan di pusat data dan berjalan di Linux, UNIX, Windows, dan
mainframe.

11
Tren Menuju Sistem NoSQL
RDBMS masih merupakan mesin basis data yang dominan, tetapi tren ke arah Tanpa
SQL (kependekan dari "tidak hanya SQL") sistem sudah jelas. Sistem NoSQL
meningkat popularitasnya sebesar 50 persen dari 2013 hingga 2014. Meskipun
NoSQL telah ada untuk sebagai selama DBMS relasional, istilah itu sendiri tidak
diperkenalkan sampai 2009. Itu adalah ketika banyak sistem baru dikembangkan
untuk mengatasi perkembangan persyaratan untuk DBMS—yaitu, menangani data
besar, skalabilitas, dan kesalahan toleransi untuk aplikasi Web besar.Skalabilitas
berarti sistem dapat meningkat dalam ukuran untuk menangani pertumbuhan data atau
beban peningkatan jumlah bersamaan pengguna. Dengan kata lain, sistem yang dapat
diskalakan secara efisien memenuhi tuntutan kinerja tinggi komputasi.Toleransi
kesalahan berarti tidak ada kegagalan tunggal yang mengakibatkan setiap kehilangan
layanan.
Sistem NoSQL adalah kelompok sistem basis data yang heterogen sehingga
upaya untuk mengklasifikasikannya tidak terlalu membantu. Namun, keuntungan
umum mereka apakah ini:
 Performa lebih tinggi
 Distribusi data yang mudah pada node yang berbeda, yang memungkinkan
skalabilitas dan toleransi kesalahan
 Fleksibilitas yang lebih besar
 Administrasi yang lebih sederhana
Mulai tahun 2010 dan berlanjut hingga tahun 2014, Microsoft telah
mengerjakan penulisan ulang pertama dari eksekusi kueri SQL Server sejak Versi 7
dirilis di 1998. Tujuannya adalah untuk menawarkan kecepatan seperti NoSQL tanpa
mengorbankan kemampuan sebuah basis data relasional. Dengan sebagian besar
penawaran NoSQL, sebagian besar biaya tidak terletak pada perolehan database,
melainkan dalam mengimplementasikannya. Data perlu dipilih dan dimigrasi
(dipindahkan) ke database baru. Microsoft berharap untuk mengurangi biaya ini
dengan menawarkan solusi migrasi

Arsitektur Database Terpusat


Basis data terpusat menyimpan semua file terkait di lokasi pusat—saat Anda
membaca kasus pembuka Coca-Cola. Selama beberapa dekade, platform basis data

12
utama terdiri dari: file database terpusat pada komputer mainframe besar. Manfaat
dari terpusat konfigurasi database meliputi:
1. Kontrol kualitas data yang lebih baik. Konsistensi data lebih mudah ketika
data disimpan di satu lokasi fisik karena penambahan, pembaruan, dan
penghapusan data dapat dilakukan dilakukan secara terawasi dan teratur.
2. Keamanan TI yang lebih baik. Data diakses melalui komputer host terpusat, di
mana: mereka dapat dilindungi dengan lebih mudah dari akses atau modifikasi
yang tidak sah.
Kerugian utama dari database terpusat, seperti semua sistem terpusat, adalah
penundaan transmisi saat pengguna tersebar secara geografis. Perangkat keras yang
lebih kuat dan jaringan mengkompensasi kerugian ini.

Arsitektur Database Terdistribusi


Sistem basis data terdistribusi memungkinkan aplikasi di komputer dan ponsel
untuk mengakses data dari database lokal dan remote, seperti yang digambarkan pada
Gambar 3.10. Didistribusikan database menggunakan arsitektur klien/server untuk
memproses permintaan informasi. Komputer dan perangkat seluler yang mengakses
server disebut klien. Basis data disimpan pada server yang berada di pusat data
perusahaan, awan pribadi, atau awan publik.

13
Sampah masuk sampah keluar
Pengumpulan data adalah proses yang sangat kompleks yang dapat
menimbulkan masalah mengenai kualitas data yang dikumpulkan. Oleh karena itu,
terlepas dari bagaimana datanya dikumpulkan, mereka perlu divalidasi sehingga
pengguna tahu bahwa mereka dapat mempercayainya. Klasik ekspresi yang
meringkas situasinya adalah "sampah masuk, sampah keluar" (GIGO) dan “sampah
masuk, injil keluar” yang berpotensi lebih berisiko. Dalam kasus terakhir, kualitas
buruk data dipercaya dan digunakan sebagai dasar perencanaan. Anda telah
menemukan data perlindungan, seperti pemeriksaan integritas, untuk membantu
meningkatkan kualitas data saat Anda mengisi sebuah formulir online. Misalnya,
formulir tidak akan menerima alamat email yang tidak diformat dengan benar.

Biaya dan Konsekuensi Data Kotor


Data kotor—yaitu, data berkualitas buruk—tidak memiliki integritas dan tidak
dapat dipercaya. Terlalu sering manajer dan pekerja informasi sebenarnya dibatasi
oleh data yang tidak dapat dipercaya karena tidak lengkap, di luar konteks,
ketinggalan zaman, tidak akurat, tidak dapat diakses, atau sangat berlebihan sehingga
membutuhkan waktu berminggu-minggu untuk menganalisisnya. Dalam situasi
seperti itu, pengambil keputusan dihadapkan dengan terlalu banyaknya
ketidakpastian untuk dibuatkeputusan bisnis yang cerdas.
Formula untuk menentukan biaya poor quality data sebagai berikut:

Contoh biaya tersebut antara lain:


• Bisnis yang hilang. Bisnis hilang ketika peluang penjualan terlewatkan, pesanan
dikembalikan karena barang yang dikirim salah, atau kesalahan membuat frustrasi dan
mengusir pelanggan.
• Waktu yang dihabiskan untuk mencegah kesalahan. Jika data tidak dapat
dipercaya, maka karyawan perlu menghabiskan lebih banyak waktu dan upaya untuk
memverifikasi informasi untuk menghindari kesalahan.

14
• Waktu yang dihabiskan untuk memperbaiki kesalahan. Staf database perlu
memproses koreksi ke basis data. Misalnya, biaya mengoreksi kesalahan di Urent
Korporasi diperkirakan sebagai berikut:
A) Dua anggota staf basis data menghabiskan 25 persen dari pemrosesan hari kerja
mereka dan memverifikasi koreksi data setiap hari: 2 orang * 25% dari 8 jam/hari 4
jam/hari mengoreksi kesalahan.
B) Gaji per jam adalah $50 per jam berdasarkan tingkat pembayaran dan tunjangan:
$50/jam * 4 jam/hari $200/hari mengoreksi kesalahan
C) 250 hari kerja per tahun:
$200/hari * 250 hari $50,000/tahun untuk memperbaiki kesalahan.
Biaya data berkualitas buruk yang tersebar di seluruh perusahaan,
mempengaruhi sistem dari pengiriman dan penerimaan ke akuntansi dan layanan
pelanggan. Kesalahan data biasanya muncul dari fungsi atau departemen yang
menghasilkan atau membuat data—dan bukan di dalam departemen TI. Ketika semua
biaya dipertimbangkan, langkah untuk menemukan dan memperbaiki penyebab
kesalahan data menjadi jelas. Dalam waktu anggaran menurun, beberapa organisasi
mungkin tidak memiliki sumber daya untuk proyek semacam itu dan bahkan mungkin
tidak menyadari masalahnya. Orang lain mungkin menghabiskan sebagian besar
waktu mereka memperbaiki masalah, sehingga membuat mereka tidak punya waktu
untuk menghindari masalah.
Data yang buruk merugikan bisnis AS ratusan miliar dolar setahun dan
mempengaruhi kemampuan mereka untuk keluar dari iklim ekonomi yang sulit. Data
yang kedaluwarsa, data yang hilang, dan format data yang tidak konsisten dapat
menyebabkan hilangnya pelanggan, penjualan, dan pendapatan; misalokasi sumber
daya; dan stategi penetapan harga yang salah.
Untuk perusahaan tertentu, sulit untuk menghitung biaya penuh dari kualitas
data yang buruk dan efek jangka panjangnya. Bagian dari kesulitannya adalah waktu
tunda antara kesalahan dan ketika terdeteksi. Kesalahan bisa sangat sulit untuk
diperbaiki, terutama ketika sistem meluas di seluruh perusahaan. Kekhawatiran lain
adalah bahwa dampak dari kesalahan bisa tidak terduga atau serius.

Kepemilikan Data dan Politik Organisasi


Terlepas dari kebutuhan akan data berkualitas tinggi, politik organisasi, dan
masalah teknis membuat itu sulit untuk dicapai. Sumber masalahnya adalah

15
kepemilikan data—bahwa adalah, siapa yang memiliki atau bertanggung jawab atas
data tersebut. Masalah kepemilikan data muncul ketika tidak ada kebijakan yang
mendefinisikan tanggung jawab dan akuntabilitas untuk mengelola data. Format data
yang tidak konsisten dari berbagai departemen menciptakan serangkaian masalah
tambahan ketika organisasi mencoba menggabungkan aplikasi individu ke dalam
system terintegrasi perusahaan.
Kecenderungan untuk mendelegasikan tanggung jawab kualitas data kepada
tim teknis yang tidak memiliki kendali atas kualitas data, berbeda dengan pengguna
bisnis yang memiliki kontrol seperti itu, adalah jebakan umum lain yang menghalangi
akumulasi kualitas tinggi data.
Mereka yang mengelola bisnis atau bagian dari bisnis ditugaskan untuk
mencoba untuk meningkatkan kinerja bisnis dan mempertahankan pelanggan.
Kompensasi terkait dengan meningkatkan profitabilitas, mendorong pertumbuhan
pendapatan, dan meningkatkan kualitas pelanggan melayani. Indikator kinerja utama
(KPI) ini dipantau secara ketat oleh: manajer senior yang ingin menemukan dan
menghilangkan cacat yang merugikan kinerja. Dia aneh bahwa begitu sedikit manajer
meluangkan waktu untuk memahami bagaimana kinerja dipengaruhi oleh kualitas
data yang buruk. Dua contoh membuat kasus yang kuat untuk investasi dalam data
berkualitas tinggi.
Bank ritel: Untuk eksekutif bank ritel, manajemen risiko adalah nomor satu isu.
Mengabaikan risiko berkontribusi pada krisis jasa keuangan 2008. Terlepas dari
strategi manajemen risiko, banyak bank masih mengalami kerugian besar. Bagian dari
masalah di banyak bank adalah bahwa IS mereka memungkinkan mereka untuk
memantau risiko hanya ditingkat produk—hipotek, pinjaman, atau kartu kredit.
Manajemen risiko tingkat produk IS memantau eksposur risiko pelanggan untuk
hipotek, atau untuk pinjaman, atau untuk kredit kartu, dan sebagainya—tetapi tidak
untuk pelanggan untuk semua produk. Dengan IS tingkat produk, bank tidak dapat
melihat eksposur risiko penuh dari pelanggan. Keterbatasan ini dibungkam risiko
tingkat produk memiliki implikasi serius bagi kinerja bisnis karena: pelanggan
berisiko buruk tidak dapat diidentifikasi dengan mudah, dan data pelanggan di
berbagai IS mungkin berbeda. Misalnya, pertimbangkan apa yang terjadi ketika setiap
manajemen risiko tingkat produk IS memasukkan data ke IS pemasaran. Pemasaran
mungkin menawarkan pelanggan berisiko buruk insentif untuk mengambil kartu
kredit atau pinjaman lain yang tidak dapat mereka bayar kembali. Dan karena bank

16
juga tidak dapat mengidentifikasi pelanggan terbaiknya, mereka mungkin diabaikan
dan dibujuk oleh penawaran yang lebih baik yang ditawarkan oleh pesaing. Skenario
ini menggambarkan bagaimana kepemilikan data dan manajemen kualitas data sangat
penting untuk manajemen risiko. Cacat data dan data yang tidak lengkap dapat
dengan cepat memicu pemasaran yang tidak akurat dan kerugian yang meningkat.
Satu bank ritel yang menghadapi masalah ini kehilangan 16 persen bisnis hipoteknya
dalam waktu 18 bulan sementara kerugian dalam bisnis kartu kreditnya meningkat
(Ferguson, 2012).
Manufaktur.Banyak produsen berada di bawah belas kasihan pelanggan yang kuat
dasar—pengecer besar. Produsen ingin menyelaraskan proses mereka dengan proses
pelanggan ritel besar untuk membuat mereka senang. Penyelarasan ini memungkinkan
untuk pengecer untuk memesan secara terpusat untuk semua toko atau memesan
secara lokal dari produsen tertentu. Mendukung pemesanan pusat dan lokal
mempersulit perencanaan produksi berjalan. Misalnya, setiap situs manufaktur harus
mengumpulkan data pesanan dari pemesanan pusat dan sistem pemesanan lokal untuk
mendapatkan gambaran lengkap tentang apa yang harus manufaktur di setiap situs.
Tanpa data yang akurat dan terkini, pesanan mungkin tidak terisi, atau produsen
mungkin memiliki persediaan berlebih. Salah satu pabrikan yang mencoba
mempertahankan pengecer utamanya senang dengan menerapkan pemesanan pusat
dan lokal tidak dapat memproses pesanan dengan benar di setiap lokasi produksi.
Tidak ada kepemilikan data dan kurangnya kontrol tentang bagaimana data pesanan
mengalir di seluruh operasi bisnis memiliki dampak negatif.
Proses bisnis yang saling bertentangan dan menduplikasi di setiap lokasi manufaktur
menyebabkan data kesalahan, yang menyebabkan kesalahan dalam pembuatan,
pengepakan, dan pengiriman. Pelanggan sangat tidak puas. Kedua contoh ini
mewakili konsekuensi dari kurangnya kepemilikan data dan kualitas data. Memahami
dampak data yang salah kelola membuat kepemilikan data dan data yang akurat
menjadi prioritas yang lebih tinggi. Kepatuhan terhadap berbagai peraturan federal
dan negara bagian bergantung pada kekuatan batu data dan metrik tepercaya yang
digunakan untuk pelaporan peraturan. Kepemilikan data, kualitas data, dan data yang
dikelola secara formal menjadi agenda utama CFO dan CEO yang ditahan
bertanggung jawab secara pribadi jika perusahaan mereka ditemukan melanggar
peraturan.

17
SIKLUS HIDUP DATA DAN PRINSIP DATA
Siklus hidup data adalah model yang menggambarkan cara perjalanan data
melalui suatu organisasi, seperti yang ditunjukkan pada Gambar 3.11. Siklus hidup
data dimulai dengan penyimpanan dalam database, untuk dimuat ke gudang data
untuk dianalisis, lalu dilaporkan ke pengetahuan pekerja atau digunakan dalam
aplikasi bisnis. Manajemen rantai pasokan (SCM), pelanggan manajemen hubungan
(CRM), dan e-commerce adalah aplikasi perusahaan yang memerlukan data yang up-
to-date dan mudah diakses agar dapat berfungsi dengan baik. Tiga prinsip data umum
terkait dengan perspektif siklus hidup data dan bantuan untuk memandu keputusan
investasi TI:
1. Prinsip nilai data yang semakin berkurang. Nilai data berkurang seiring
bertambahnya usia. Ini adalah prinsip yang sederhana, Sebagian besar organisasi tidak
dapat beroperasi pada kinerja puncak dengan titik buta (kurangnya ketersediaan data)
selama 30 hari atau lebih lama. Lembaga jasa keuangan global mengandalkan data
hampir real-time untuk kinerja puncak

Gambar 3.11: siklus data


2. Prinsip penggunaan data 90/90. Menurut prinsip penggunaan data 90/90,
mayoritas data yang tersimpan, setinggi 90 persen, jarang diakses setelah 90 hari
(kecuali untuk tujuan audit). Artinya, sekitar 90 persen data kehilangan sebagian besar
nilainya setelah 3 bulan.
3. Prinsip data dalam konteks. Kemampuan untuk menangkap, memproses,
memformat, dan mendistribusikan data dalam waktu dekat atau lebih cepat
membutuhkan investasi besar dalam data arsitektur (Bab 2) dan infrastruktur untuk
menghubungkan sistem POS jarak jauh ke data penyimpanan, sistem analisis data,
dan aplikasi pelaporan. Investasi dapat dibenarkan pada prinsip bahwa data harus

18
diintegrasikan, diproses, dianalisis, dan diformat menjadi "informasi yang dapat
ditindaklanjuti".
DATA UTAMA DAN DATA MASTER PENGELOLAAN
Ketika data menjadi lebih kompleks dan volumenya meledak, kinerja basis
data menurunkan. Salah satu solusinya adalah penggunaan data master dan
manajemen data induk (MDM), seperti yang diperkenalkan di Bab 2. Proses MDM
mengintegrasikan data dari berbagai sumber atau aplikasi perusahaan untuk membuat
tampilan pelanggan yang lebih lengkap (bersatu), produk, atau entitas lain. Gambar
3.12 menunjukkan bagaimana data master berfungsi sebagai lapisan antara data
transaksional dalam database dan data analitik di gudang data. Meskipun vendor dapat
mengklaim bahwa solusi MDM mereka menciptakan "satu versi" kebenarannya,
klaim ini mungkin tidak benar. Pada kenyataannya, MDM tidak dapat membuat satu
pun versi data terpadu karena membangun pandangan yang sepenuhnya terpadu dari
semua data master sama sekali tidak mungkin.
File Referensi Master dan Entitas Data
Secara realistis, MDM mengkonsolidasikan data dari berbagai sumber data
menjadi referensi utama file, yang kemudian memasukkan data kembali ke aplikasi,
sehingga menciptakan akurasi dan data yang konsisten di seluruh perusahaan. Dalam
IT at Work 3.1, peserta dalam rantai pasokan layanan kesehatan pada dasarnya
mengembangkan file referensi utama dari data utamanya entitas.
Entitas data adalah sesuatu yang nyata atau abstrak yang diinginkan oleh
perusahaan mengumpulkan dan menyimpan data. Entitas data master adalah entitas
utama perusahaan, seperti: sebagai pelanggan, produk, pemasok, karyawan, dan aset.
Setiap departemen memiliki kebutuhan data master yang berbeda. Pemasaran,
misalnya adalah berkaitan dengan harga produk, merek, dan kemasan produk,
sedangkan produksi berkaitan dengan biaya dan jadwal produk. File referensi master
pelanggan dapat memasukkan data ke semua sistem perusahaan yang memiliki
komponen hubungan pelanggan, sehingga memberikan gambaran yang lebih terpadu
tentang pelanggan. Demikian pula, master produk file referensi dapat memberi makan
data ke semua sistem produksi dalam perusahaan.
MDM menyertakan alat untuk membersihkan dan mengaudit elemen data
master sebagai: serta alat untuk mengintegrasikan dan menyinkronkan data agar lebih
mudah diakses. MDM menawarkan solusi bagi para manajer yang frustrasi dengan
betapa terfragmentasinya dan tersebarnya sumber data mereka.

19
3.12 Sebuah perusahaan memiliki transaksional, master, dan data analitis.

2.2 DATA WAREHOUSE AND BIG DATA ANALYTICS


Four V’s of Data Analytics
1. Ragam/Variety : Lingkungan analitik telah berkembang dari menarik data dari
sistem perusahaan untuk memasukkan data besar dan sumber tidak terstruktur.
2. Volume: Volume besar data terstruktur dan tidak terstruktur dianalisis.
3. Kecepatan/Velocity : Kecepatan akses ke laporan yang diambil dari data
menentukan perbedaan antara analitik yang efektif dan tidak efektif.
4. Kebenaran/Veracity : Memvalidasi data dan mengekstraksi wawasan yang dapat
dipercaya oleh manajer dan pekerja adalah faktor kunci dari analisis yang sukses.
Kepercayaan pada analitik menjadi semakin sulit dengan ledakan sumber data.

Big Data dapat memiliki dampak dramatis pada keberhasilan perusahaan mana
pun, atau mereka dapat menjadi pengeluaran besar dengan kontribusi rendah. Namun,
kesuksesan tidak dicapai dengan teknologi saja. Banyak perusahaan mengumpulkan
dan menangkap sejumlah besar data, tetapi menghabiskan sedikit upaya untuk
memastikan kebenaran dan nilai data yang diambil pada tahap transaksional atau titik
asal. Penekanan ke arah ini tidak hanya akan meningkatkan kepercayaan pada
kumpulan data, tetapi juga secara signifikan mengurangi upaya analitik dan
meningkatkan kualitas pengambilan keputusan. Sukses juga tergantung pada

20
kepastian bahwa kita menghindari asumsi yang tidak valid, yang dapat dilakukan
dengan menguji asumsi selama analisis.
Keahlian Manusia Dan Penghargaan Diperlukan
Keahlian dan penilaian manusia diperlukan untuk menginterpretasikan output analitik.
Data tidak berharga jika Anda tidak dapat menganalisis, menafsirkan, memahami, dan
menerapkan hasilnya dalam konteks. Hal ini memunculkan beberapa tantangan:
 Data perlu disiapkan untuk analisis. Misalnya, data yang tidak lengkap atau
digandakan perlu diperbaiki.
 Data kotor menurunkan nilai analitik. “Kebersihan” data sangat penting untuk
penambangan data dan proyek analisis. Analis telah mengeluh bahwa analitik
data seperti pekerjaan kebersihan karena mereka menghabiskan begitu banyak
waktu pada proses manual yang rawan kesalahan untuk membersihkan data.
Volume data yang besar dan variasi berarti lebih banyak data yang kotor dan
lebih sulit ditangani.
 Data harus dimasukkan ke dalam konteks yang bermakna. Jika analisis atau
kumpulan data salah digunakan, hasilnya akan menjadi tidak masuk akal, seperti
pada contoh Super Bowl pemenang dan kinerja pasar saham. Dinyatakan secara
terbalik, manajer membutuhkan konteks untuk memahami bagaimana
menafsirkan data tradisional dan besar.
Data Perusahaan Gudang dan Data Mart
Gudang data menyimpan data dari berbagai sistem sumber dan database di
seluruh sebuah perusahaan untuk menjalankan kueri analitik terhadap kumpulan data
besar yang dikumpulkan selama periode waktu yang lama. Gudang adalah sumber
utama data yang dibersihkan untuk analisis, pelaporan, dan BI. Seringkali data
diringkas dengan cara yang memungkinkan tanggapan cepat untuk pertanyaan.
Misalnya, hasil kueri dapat mengungkapkan perubahan pelanggan perilaku dan
mendorong keputusan untuk mengembangkan kembali strategi periklanan. Gudang
data yang mengumpulkan data dari sumber dan database yang berbeda di seluruh
perusahaan disebut gudang data perusahaan (EDW). Tech Note 3.2 merangkum
karakteristik utama dari dua jenis penyimpanan data. Tingginya biaya gudang data
dapat membuatnya terlalu mahal bagi perusahaan untuk melaksanakan.
Data mart adalah versi yang lebih murah dan diperkecil yang dapat
diimplementasikan dalam waktu yang jauh lebih singkat, misalnya dalam waktu
kurang dari 90 hari. Layanan data mart departemen atau fungsi tertentu, seperti

21
keuangan, pemasaran, atau operasi. Sejak mereka menyimpan jumlah data yang lebih
kecil, lebih cepat, lebih mudah digunakan, dan bernavigasi.
Ringkasan Perbedaan Antara Database dan Data Warehouse
Database adalah:
• Dirancang dan dioptimalkan untuk memastikan bahwa setiap transaksi dicatat dan
disimpan segera.
• Lincah karena data terus diperbarui, ditambahkan, atau diedit.
• sistem OLTP.
Warehouse adalah:
• Dirancang dan dioptimalkan untuk analisis dan respons cepat terhadap pertanyaan.
• Tidak mudah menguap. Stabilitas ini penting untuk dapat menganalisis data dan
buat perbandingan. Saat data disimpan, data tersebut mungkin tidak akan pernah
diubah atau dihapus untuk melakukan analisis tren atau membuat perbandingan
dengan data yang lebih baru.
• sistem OLAP.
• Berorientasi subjek, yang berarti bahwa data yang diambil diatur untuk memiliki
data serupa yang dihubungkan bersama.

Prosedur untuk Mempersiapkan Data EDW untuk Analisis


Pertimbangkan database bank. Setiap setoran, penarikan, pembayaran
pinjaman, atau lainnya transaksi menambah atau mengubah data. Volatilitas yang
disebabkan oleh transaksi konstan pemrosesan membuat analisis data menjadi sulit—
dan tuntutan untuk memproses jutaan transaksi per detik mengkonsumsi kekuatan
pemrosesan database. Sebaliknya, data di gudang relatif stabil, sesuai kebutuhan
untuk analisis. Oleh karena itu, pilih data dipindahkan dari database ke gudang.
Secara khusus, datanya adalah:
1. Diekstrak dari database yang ditunjuk.
2. Berubah dengan menstandarisasi format, membersihkan data, mengintegrasikannya.
3. Sarat ke dalam gudang data.
Ketiga prosedur ini—ekstrak, ubah, dan muat—disebut oleh mereka inisialETL. Di
gudang, data adalahhanya baca; yaitu, mereka tidak ubah sampai ETL berikutnya.
Tiga teknologi yang terlibat dalam menyiapkan data mentah untuk analitik termasuk
ETL, mengubah pengambilan data (CDC),dan deduplikasi data (“deduplikasi
data”). CDC proses menangkap perubahan yang dibuat pada sumber data dan

22
kemudian menerapkan perubahan tersebut seluruh penyimpanan data perusahaan
untuk menjaga sinkronisasi data. CDC meminimalkan sumber daya yang diperlukan
untuk proses ETL dengan hanya menangani perubahan data. Deduping proses
menghapus duplikat dan menstandardisasi format data, yang membantu
meminimalkan penyimpanan dan sinkronisasi data.
Membangun Data Gudang
Gambar 3.15 diagram proses membangun dan menggunakan data warehouse.
Organisasi data disimpan dalam sistem operasional (sisi kiri gambar). Tidak semua
data ditransfer ke gudang data. Seringkali, hanya data ringkasan yang ditransfer.
Gudang mengatur data dalam berbagai cara—berdasarkan subjek, fungsional
daerah, vendor, dan produk. Seperti yang ditunjukkan, arsitektur gudang data
mendefinisikan aliran data yang dimulai saat data ditangkap oleh sistem transaksi;
sumber data disimpan dalam database transaksional (operasional); Proses ETL
memindahkan data dari database ke gudang data atau data mart, di mana data tersedia
untuk akses, laporan, dan analisis.

Gambar 3.15 : Database, Data warehouse and marts, and BI architecture

Dukungan Waktu Nyata Dari Data Aktif Gudang


Teknologi gudang data awal terutama mendukung aplikasi strategis yang tidak
memerlukan waktu respons instan, interaksi pelanggan langsung, atau integrasi
dengan sistem operasional. ETL mungkin dilakukan sekali seminggu atau sekali per
bulan. Namun, permintaan informasi untuk mendukung interaksi pelanggan secara
real time dan operasi mengarah ke pergudangan dan analitik data waktu nyata—

23
dikenal sebagaiaktif gudang data/active data warehouse(ADW). Peningkatan
besar-besaran dalam daya komputasi, kecepatan pemrosesan, dan memori
memungkinkan ADW. ADW tidak dirancang untuk mendukung eksekutif.
pengambilan keputusan strategis, melainkan untuk mendukung operasi. Misalnya,
pengiriman perusahaan seperti DHL menggunakan armada truk yang besar untuk
memindahkan jutaan paket.
Setiap hari dan sepanjang hari, manajer operasional membuat ribuan
keputusan yang mempengaruhi intinya, seperti: "Apakah kita perlu empat truk untuk
perjalanan ini?" “Dengan dua pengemudi tertunda oleh cuaca buruk, apakah kita perlu
membawa bantuan ekstra?” Pergudangan data tradisional tidak cocok untuk dukungan
operasional langsung, tetapi pergudangan data aktif adalah. Misalnya, perusahaan
dengan ADW dapat:
• Berinteraksi dengan pelanggan untuk memberikan layanan pelanggan yang unggul.
• Menanggapi acara bisnis dalam waktu dekat.
• Bagikan data status terkini di antara pedagang, vendor, pelanggan, dan rekanan.
Berikut adalah beberapa contoh bagaimana dua perusahaan menggunakan
ADW:
Modal Satu. Capital One menggunakan ADW-nya untuk melacak "profitabilitas"
setiap pelanggan skor" untuk menentukan tingkat layanan pelanggan untuk
menyediakan orang itu. Biaya lebih tinggi layanan pribadi hanya diberikan kepada
mereka dengan skor tinggi. Misalnya, ketika seorang pelanggan menelepon Capital
One, dia diminta untuk memasukkan nomor kartu kredit, yang dikaitkan dengan skor
profitabilitas. Pelanggan berpenghasilan rendah mendapatkan unit respons suara
hanya; pelanggan dengan laba tinggi terhubung ke perwakilan layanan pelanggan
langsung (CSR) karena perusahaan ingin meminimalkan risiko kehilangan pelanggan
tersebut.
Kota Wisata. Jika Anda menggunakan Travelocity, ADW menemukan penawaran
perjalanan terbaik khusus untuk Anda. Tujuannya adalah untuk menggunakan “data
hari ini” alih-alih “data kemarin data hari ini.” ADW biro perjalanan online
menganalisis riwayat pencarian dan tujuan Anda bunga; kemudian memprediksi
penawaran perjalanan yang kemungkinan besar akan Anda beli.
Penawaran relevan dan tepat waktu untuk meningkatkan pengalaman Anda,
yang membantu menutup penjualan di pasar yang sangat kompetitif. Misalnya, ketika
pelanggan mencari penerbangan dan hotel di Las Vegas, Travelocity mengakui

24
minat—pelanggan ingin pergi ke Vegas. ADW mencari penerbangan dengan harga
terbaik dari semua operator, membuat beberapa penawaran paket, dan menyajikannya
secara real time kepada pelanggan. Saat pelanggan melihat penawaran yang
dipersonalisasi yang sudah mereka minati, ADW membantu menghasilkan
pengalaman pelanggan yang lebih baik. Pengalaman berbasis data waktu nyata
meningkatkan tingkat konversi dan penjualan.
Konten gudang data dapat dikirimkan ke pengambil keputusan di seluruh
perusahaan melalui cloud atau intranet milik perusahaan. Pengguna dapat melihat,
menanyakan, dan menganalisis data dan menghasilkan laporan menggunakan browser
Web. Ini sangat metode pengiriman data yang ekonomis dan efektif.

Data Warehousing Mendukung Tindakan serta Keputusan


Banyak organisasi membangun gudang data karena mereka frustrasi dengan
ketidakkonsistenan data yang tidak dapat mendukung keputusan atau tindakan. Dilihat
dari perspektif ini, gudang data adalah investasi infrastruktur yang dilakukan
perusahaan untuk mendukung operasi yang sedang berlangsung dan yang akan datang,
seperti:
• Pemasaran dan penjualan. Membuat orang mendapat informasi tentang status
produk, pemasaran efektivitas program, dan profitabilitas lini produk; dan
memungkinkan mereka untuk mengambil tindakan cerdas untuk memaksimalkan
profitabilitas per pelanggan.
• Harga dan kontrak. Menghitung biaya secara akurat untuk mengoptimalkan
penetapan harga suatu kontrak. Tanpa data biaya yang akurat, harga mungkin di
bawah atau terlalu dekat dengan biaya; atau harga mungkin tidak kompetitif karena
terlalu tinggi.
• Peramalan. Memperkirakan permintaan pelanggan untuk produk dan layanan.
• Penjualan. Menghitung profitabilitas penjualan dan produktivitas untuk semua
wilayah dan wilayah; menganalisis hasil berdasarkan geografi, produk, grup
penjualan, atau individu.
• Keuangan. Menyediakan data waktu nyata untuk persyaratan kredit yang optimal,
analisis portofolio, dan tindakan yang mengurangi risiko atau beban piutang tak
tertagih.

25
Analisis Data Besar Dan Penemuan Data
Analisis data membantu pengguna menemukan wawasan. Wawasan ini
dikombinasikan dengan manusia keahlian memungkinkan orang untuk mengenali
hubungan yang bermakna dengan lebih cepat atau mudah; dan lebih jauh lagi,
menyadari implikasi strategis dari situasi ini. Bayangkan mencoba untuk memahami
data cepat dan luas yang dihasilkan oleh kampanye media sosial di Facebook atau
dengan sensor yang dipasang pada mesin atau objek. Sensor berbiaya rendah
membuatnya memungkinkan untuk memantau semua jenis hal fisik—sementara
analitik memungkinkan untuk memahami data tersebut untuk mengambil tindakan
secara real time. Misalnya, data sensor dapat dianalisis secara real time:
• Untuk memantau dan mengatur suhu dan kondisi iklim yang mudah rusak
makanan saat mereka diangkut dari pertanian ke supermarket.
• Untuk mengendus tanda-tanda pembusukan buah-buahan dan sayuran mentah dan
mendeteksi risikonya dariE. coli kontaminasi.
• Untuk melacak kondisi mesin yang beroperasi dan memprediksi kemungkinannya
dari kegagalan.
• Untuk melacak keausan mesin dan menentukan kapan pemeliharaan preventif data
sensor yang dihasilkan mesin menjadi proporsi yang lebih besar dari Big Data.

figure 3.16 mesin data yang


dihasilkan dari objek fisik
menjadi bagian yang jauh
lebih besar dari big data
dan analitik.

(Gambar 3.16), menurut laporan penelitian IDC (Lohr, 2012b). Diprediksi bahwa data
ini akan meningkat menjadi 42 persen dari semua data pada tahun 2020, mewakili
peningkatan yang signifikan meningkat dari 11 persen pada tahun 2005.
Nilai menganalisis data mesin diakui oleh General Electric (GE) Company,
perusahaan industri terbesar di Amerika Serikat. Sejak 2011 GE telah menempatkan

26
sensor pada segala hal mulai dari turbin gas hingga tempat tidur rumah sakit. Misi GE
adalah merancang perangkat lunak untuk mengumpulkan data, dan algoritme untuk
menganalisisnya guna mengoptimalkan biaya penghematan dan keuntungan
produktivitas. Di seluruh industri yang dicakupnya, GE memperkirakan efisiensi
peluang akan memangkas biaya sebanyak $150 miliar (Lohr, 2012a).
Upaya reformasi kesehatan federal telah mendorong organisasi perawatan
kesehatan data besar dan analitik. Organisasi-organisasi ini berencana untuk
menggunakan analitik data besar untuk mendukung manajemen siklus pendapatan,
pemanfaatan sumber daya, pencegahan penipuan, kesehatan manajemen, dan
peningkatan kualitas.eded.

Hadoop dan MapReduce


Volume data yang besar melebihi kapasitas pemrosesan database konvensional
infrastruktur. Platform pemrosesan yang banyak digunakan adalah Apache
hadoop(hadoop.apache.org/). Itu tidak menempatkan kondisi pada struktur data yang
dapat diproses. Hadoop mendistribusikan masalah komputasi di sejumlah server.
Hadoop mengimplementasikan Peta Kurangi dalam dua tahap:
1. Tahap peta: MapReduce memecah dataset besar menjadi subset yang lebih kecil;
kemudian mendistribusikan himpunan bagian di antara beberapa server tempat
mereka diproses sebagian.
2. Mengurangi tahap: Hasil parsial dari tahap peta kemudian digabungkan kembali
dan tersedia untuk alat analitik.
Untuk menyimpan data, Hadoop memiliki sistem file terdistribusi sendiri,
Sistem File HaDoop (HDFS), yang berfungsi dalam tiga tahap:
• Memuat data ke HDFS.
• Melakukan operasi MapReduce.
• Mengambil hasil dari HDFS.

2.3 DATA AND TEXT MINING


Saat Anda membaca, DBMS mendukung kueri untuk mengekstrak data atau
mendapatkan jawaban dari database. Tetapi untuk melakukan kueri, Anda harus
terlebih dahulu mengetahui apa yang harus diminta atau yang ingin kamu jawab.
Dalam penambangan data dan penambangan teks, itu adalah kebalikannya. Data dan

27
penambangan teks digunakan untuk menemukan pengetahuan yang tidak Anda
ketahui ada di database.
Analisis bisnis menggambarkan seluruh fungsi penerapan teknologi,
algoritma, keahlian manusia, dan penilaian. Penambangan data dan teks adalah
analitik khusus teknik.

Menciptakan Nilai Bisnis


Perusahaan berinvestasi dalam alat penambangan data untuk menambah nilai
bisnis. Nilai bisnis turun menjadi tiga kategori. Berikut adalah kasus singkat yang
menggambarkan jenis nilai bisnis yang diciptakan oleh data and text mining.
1. Dengan menggunakan analisis pola, Perusahaan Argo, produsen peralatan
pertanian berbasis di Georgia, mampu mengoptimalkan opsi konfigurasi produk untuk
pertanian mesin dan permintaan pelanggan waktu nyata untuk menentukan
konfigurasi dasar yang optimal untuk mesinnya. Akibatnya, Argo mengurangi variasi
produk hingga 61 persen dan memangkas hari persediaan sebesar 81 persen sambil
tetap mempertahankan tingkat layanannya.
2. Pengecer besar Walmart ingin pembeli onlinenya menemukan siapa mereka
mencari lebih cepat. Walmart menganalisis data clickstream dari 45 juta bulanannya
pembeli online; kemudian menggabungkan data tersebut dengan produk dan terkait
kategori skor popularitas. Skor popularitas telah dihasilkan oleh penambangan teks
aliran media sosial pengecer. Pelajaran yang dipetik dari analisis diintegrasikan ke
mesin pencari Polaris yang digunakan oleh pelanggan di situs web perusahaan. Polaris
telah menghasilkan peningkatan 10 hingga 15 persen dalam pembelanja online yang
menyelesaikan pembelian, yang sama dengan sekitar $ 1 miliar dalam penjualan
online tambahan.
3. McDonald's operasi toko roti menggantikan peralatan manual dengan kecepatan
tinggi analisis foto untuk memeriksa ribuan roti per menit untuk warna, ukuran, dan
distribusi benih wijen. Secara otomatis, oven dan proses pemanggangan langsung
menyesuaikan untuk membuat roti yang seragam dan mengurangi ribuan pon limbah
setiap tahun. Perusahaan produk makanan lain juga menggunakan analisis foto untuk
menyortir setiap bahasa Prancis benih yang dihasilkan untuk mengoptimalkan kualitas.
4. Asuransi Tak Terbatas menemukan wawasan baru yang diterapkan untuk
meningkatkan kinerja dari operasi penipuannya. Perusahaan asuransi mengirim teks
laporan adjuster bertahun-tahun untuk mencari pendorong utama klaim palsu.

28
Akibatnya, perusahaan mengurangi penipuan sebesar 75 persen, dan menghilangkan
pemasaran kepada pelanggan dengan kemungkinan tinggi klaim penipuan.

Text Mining perangkat lunak memungkinkan pengguna untuk menganalisis data dari
berbagai dimensi atau sudut, kategorikan, dan temukan korelasi atau pola di antara
bidang-bidang dalam data gudang. Hingga 75 persen data organisasi adalah pengolah
kata yang tidak terstruktur dokumen, media sosial, pesan teks, audio, video, gambar
dan diagram, faks dan memo, pusat panggilan atau catatan klaim, dan sebagainya.
Text mining luas kategori yang melibatkan penafsiran kata dan konsep dalam
konteks. Setiap pelanggan menjadi advokat atau musuh merek dengan bebas
mengekspresikan pendapat dan sikap yang menjangkau jutaan pelanggan saat ini atau
calon pelanggan lainnya di media sosial. Teks mining membantu perusahaan
memanfaatkan ledakan opini pelanggan yang diungkapkan on line. Komentar sosial
dan media sosial sedang ditambang untuk analisis sentimen atau untuk memahami
maksud konsumen. Perusahaan yang inovatif tahu bahwa mereka bisa lebih berhasil
dalam memenuhi kebutuhan pelanggan mereka, jika mereka memahami mereka
dengan lebih baik. Alat dan teknik untuk menganalisis teks, dokumen, dan konten
tidak terstruktur lainnya tersedia dari beberapa vendor.

Prosedur Analisis Teks


Dengan analitik teks, informasi diekstraksi dari berbagai jenis dalam jumlah
besar dari informasi tekstual. Langkah-langkah dasar yang terlibat dalam analisis teks
meliputi:
1. Eksplorasi. Pertama, dokumen dieksplorasi. Ini mungkin terjadi dalam bentuk
sederhana jumlah kata dalam kumpulan dokumen, atau dengan membuat area topik
secara manual untuk mengkategorikan dokumen setelah membaca sampel dari mereka.
Misalnya, apa itu? jenis masalah utama (kerusakan rem atau mesin) yang telah
diidentifikasi baru-baru ini klaim garansi mobil? Tantangan dari upaya eksplorasi
salah eja atau kata-kata singkatan, akronim, atau bahasa gaul.
2. Pra-pemrosesan. Sebelum analisis atau kategorisasi konten otomatis, teks
mungkin perlu diproses sebelumnya untuk membakukannya sejauh mungkin. Seperti
dalam analisis tradisional, hingga 80 persen waktu prapemrosesan dapat dihabiskan
untuk persiapan dan standarisasi data. Kata-kata yang salah eja, singkatan, dan bahasa
gaul mungkin perlu untuk diubah menjadi istilah yang konsisten. Misalnya, BTW

29
akan distandarisasi ke "omong-omong" dan "kirim pesan suara" dapat ditandai
sebagai "lvm."
3. Pengkategorian dan Pemodelan. Konten kemudian siap untuk dikategorikan.
Pengkategorian pesan atau dokumen dari informasi yang terkandung di dalamnya
dapat dicapai dengan menggunakan model statistik dan aturan bisnis. Seperti model
tradisional pengembangan, sampel dokumen diperiksa untuk melatih model.
Tambahan dokumen kemudian diproses untuk memvalidasi akurasi dan presisi model,
dan akhirnya dokumen baru dievaluasi menggunakan model akhir (skor). Model
kemudian dapat dimasukkan ke dalam produksi untuk pemrosesan otomatis baru
dokumen saat mereka tiba.

2.4 INTELIJEN BISNIS


Quicken Loans, Inc. adalah pemberi pinjaman hipotek online terbesar dan
terbesar kedua secara keseluruhan pemberi pinjaman ritel di Amerika Serikat.
Perusahaan yang berbasis di Detroit ini menutup lebih dari $70 miliar dalam bentuk
pinjaman rumah pada tahun 2012, yang lebih dari dua kali lipat angka $30 miliar pada
tahun 2011. Pada tahun 2013 Quicken Loans melanjutkan pertumbuhan eksplosifnya,
menutup sebuah perusahaan mencatat $80 miliar dalam volume pinjaman rumah.
Perusahaan juga meningkatkan layanan pinjamannya kemampuan untuk menjadi
penyedia hipotek terbesar ke-11 di negara ini, dengan lebih banyak lagi dari $138
miliar pinjaman rumah dalam portofolionya.
Pada tahun 2014 Fortune Majalah memberi peringkat Quicken Loans sebagai
salah satu dari 5 tempat teratas untuk bekerja secara nasional, yang menandai tahun
ke-11 berturut-turut itu berada di peringkat 30 besar Studi budaya tempat kerja
benchmark Fortune. Untuk tahun keempat berturut-turut, perusahaan bernama oleh JD
Power sebagai yang tertinggi dalam kepuasan pelanggan di antara semua pemberi
pinjaman pinjaman rumah di Amerika. Salah satu faktor kunci keberhasilan adalah BI.
Pada 2013 Data Warehousing Institute (TDWI).
Penghargaan Praktik Terbaik yang mengakui perusahaan untuk BI dan data
kelas dunia mereka solusi pergudangan, manajer Quicken menjelaskan: Pertumbuhan
ini dapat dikaitkan dengan keberhasilan platform pinjaman online kami. Platform
pinjaman kami yang skalabel dan didorong oleh teknologi telah memungkinkan kami
untuk menangani lonjakan besar dalam aplikasi pinjaman sambil menjaga waktu
penutupan untuk sebagian besar pinjaman kami pada 30 hari atau kurang. (TDWI,

30
2013) Menggunakan BI, perusahaan telah meningkatkan kecepatan dari aplikasi
pinjaman untuk menutup, yang memungkinkan untuk memenuhi kebutuhan klien
secara menyeluruh dan secepat mungkin. Lebih hampir satu dekade, manajemen
kinerja telah berkembang dari proses manual pembuatan laporan ke dasbor berbasis
BI dan peringatan yang ditentukan pengguna yang memungkinkan bisnis pemimpin
untuk secara proaktif menangani hambatan dan mengidentifikasi peluang untuk
pertumbuhan dan perbaikan.
Bidang BI dimulai pada akhir 1980-an dan telah menjadi kunci persaingan
keuntungan di seluruh industri dan di perusahaan dari semua ukuran. Apa yang
dimulai sebagai alat untuk mendukung departemen penjualan, pemasaran, dan
layanan pelanggan telah berkembang secara luas menjadi platform strategis seluruh
perusahaan. Sedangkan sistem BI digunakan dalam operasional manajemen divisi dan
proses bisnis, mereka juga digunakan untuk mendukung pengambilan keputusan
strategis perusahaan. Perubahan dramatis yang telah berlaku selama beberapa tahun
terakhir adalah pertumbuhan permintaan untuk intelijen operasional di seluruh banyak
sistem dan bisnis—meningkatkan jumlah orang yang membutuhkan akses untuk
meningkatkan jumlah data. Kondisi bisnis yang kompleks dan kompetitif tidak
meninggalkan banyak kelonggaran untuk kesalahan.

Keuntungan Bisnis Dari BI


BI menyediakan data di momen berharga kepada pembuat keputusan—
memungkinkannya untuk mengekstrak fakta penting dari data perusahaan secara real
time atau mendekati real time. Solusi BI dengan dasbor yang dirancang dengan baik,
misalnya, memberi pengecer lebih baik visibilitas ke dalam inventaris untuk membuat
keputusan yang lebih baik tentang apa yang harus dipesan, berapa banyak, dan kapan
untuk mencegah kehabisan stok atau meminimalkan persediaan yang ada di gudang
rak.
Perusahaan menggunakan solusi BI untuk menentukan pertanyaan apa yang
harus ditanyakan dan ditemukan jawaban untuk mereka. Alat BI mengintegrasikan
dan mengkonsolidasikan data dari berbagai internal dan sumber eksternal dan
kemudian memprosesnya menjadi informasi untuk membuat keputusan yang cerdas.
BI menjawab pertanyaan seperti ini: Produk mana yang memiliki penjualan berulang
tertinggi? harga dalam enam bulan terakhir? Apakah suka pelanggan di Facebook
berhubungan dengan pembelian produk? Bagaimana tren penjualan dibagi

31
berdasarkan grup produk selama lima tahun terakhir? bertahun-tahun? Seperti apa
penjualan harian di setiap wilayah penjualan saya?
Menurut TDWI, BI “menyatukan data, teknologi, analitik, dan pengetahuan
manusia” untuk mengoptimalkan keputusan bisnis dan pada akhirnya mendorong
kesuksesan perusahaan. Program BI biasanya menggabungkan gudang data
perusahaan dan platform BI atau seperangkat alat untuk mengubah data menjadi
informasi bisnis yang dapat digunakan dan ditindaklanjuti” (TDWI, 2014). Selama
bertahun-tahun, para manajer mengandalkan analisis bisnis untuk membuat informasi
yang lebih baik keputusan. Berbagai survei dan studi sepakat tentang pentingnya BI
yang semakin meningkat dalam menganalisis kinerja masa lalu dan mengidentifikasi
peluang untuk meningkatkan masa depan pertunjukan

Tantangan Umum: Pemilihan Data dan Kualitas


Perusahaan tidak dapat menganalisis semua data mereka—dan banyak dari
mereka tidak akan menambahkan nilai. Oleh karena itu, tantangan tanpa akhir adalah
bagaimana menentukan data mana yang akan digunakan untuk BI dari apa yang
tampak seperti opsi tak terbatas (Schroeder, 2013). Salah satu tujuan dari Strategi BI
adalah menyediakan kerangka kerja untuk memilih data yang paling relevan tanpa
membatasi pilihan untuk mengintegrasikan sumber data baru.Informasi yang
berlebihan adalah jurusan masalah bagi eksekutif dan karyawan. Tantangan umum
lainnya adalah kualitas data, khususnya yang berkaitan dengan informasi online,
karena sumber dan keakuratannya mungkin tidak dapat diverifikasi.

Menyeluruhkan Bisnis Strategi Dengan BI Strategi


Laporan dan dasbord adalah alat pengiriman, tetapi mungkin tidak
memberikan bisnis intelijen. Untuk mendapatkan nilai terbaik dari BI, CIO perlu
bekerja dengan CFO dan pemimpin bisnis lainnya untuk membuat program tata kelola
BI yang misinya adalah untuk mencapai hal-hal berikut (Acebo et al., 2013):
1. Mengartikulasikan strategi bisnis dengan jelas.
2. Mendekonstruksi strategi bisnis menjadi serangkaian tujuan dan sasaran spesifik—
NStarget.
3. Identifikasi indikator kinerja utama (KPI) yang akan digunakan untuk mengukur
kemajuan menuju setiap target.
4. Prioritaskan daftar KPI.

32
5. Buat rencana untuk mencapai tujuan dan sasaran berdasarkan prioritas.
6. Perkirakan biaya yang diperlukan untuk mengimplementasikan rencana BI.
7. Menilai dan memperbarui prioritas berdasarkan hasil bisnis dan perubahan bisnis
strategi.
Setelah menyelesaikan aktivitas ini, analis BI dapat mengidentifikasi data
yang akan digunakan di BI dan sistem sumber. Ini adalah sebuahpendekatan
pengembangan berbasis bisnis itu dimulai dengan strategi bisnis dan bekerja
mundur untuk mengidentifikasi sumber data dan data yang perlu diperoleh dan
dianalisis.
Bisnis menginginkan KPI yang dapat dimanfaatkan oleh pengguna
departemen dan pengelolaan. Selain itu, pengguna menginginkan akses waktu nyata
ke data ini sehingga mereka dapat memantau proses dengan latensi sekecil mungkin
dan mengambil tindakan korektif setiap kali KPI menyimpang dari nilai targetnya.
Untuk menghubungkan strategis dan operasional perspektif, pengguna harus dapat
menelusuri dari sangat terkonsolidasi atau diringkas angka ke dalam nomor rinci dari
mana mereka berasal untuk melakukan analisis mendalam.

Arsitektur BI dan Analitik


Arsitektur BI sedang mengalami kemajuan teknologi dalam menanggapi data
besar dan tuntutan kinerja pengguna akhir (Watson, 2012). Vendor BI menghadapi
tantangan sosial, sensor, dan tipe data baru lainnya yang harus dikelola dan dianalisis.
Salah satu kemajuan teknologi yang dapat membantu menangani big data adalah BI
dalam awan. Gambar 3.19 mencantumkan faktor-faktor kunci yang berkontribusi
terhadap peningkatan penggunaan BI. Dia dapat di-host di cloud publik atau pribadi.
Dengan cloud publik, penyedia layanan menghosting data dan/atau perangkat lunak
yang diakses melalui koneksi Internet. Untuk cloud pribadi, perusahaan menghosting
data dan perangkat lunaknya sendiri, tetapi menggunakan berbasis cloud teknologi.
Untuk BI berbasis cloud, opsi populer yang ditawarkan oleh semakin banyak alat BI
vendor adalah perangkat lunak sebagai layanan (SaaS). MicroStrategy menawarkan
MicroStrategy Cloud, yang menyediakan penyebaran cepat dengan pengurangan
risiko dan biaya proyek.
Pendekatan ini menarik bagi perusahaan kecil dan menengah yang memiliki
staf TI yang terbatas dan ingin hati-hati mengontrol biaya. Potensi kerugiannya
termasuk respons yang lebih lambat waktu, risiko keamanan, dan risiko cadangan.

33
4 faktor yang mempengaruhi tingginya pemanfaatan BI

Figure 3.19 Empat Faktor yang Berkontribusi Terhadap Peningkatan Penggunaan BI.

Analisis Kompetitif dalam Praktik: CarMax


CarMax, Inc. adalah pengecer mobil bekas terbesar di negara ini dan selama
satu dekade telah tetap menjadi salah satuHARTA BENDA Majalah 100 Perusahaan
Terbaik untuk Bekerja. CarMax adalah pengecer tercepat dalam sejarah AS yang
mencapai pendapatan $1 miliar. Pada tahun 2013 perusahaan memiliki pendapatan
$11 miliar, mewakili peningkatan 9,6 persen di atas hasil tahun sebelumnya.
Perusahaan berkembang pesat karena pelanggannya yang menarik penawaran—harga
tanpa tawar-menawar dan jaminan kualitas yang didukung oleh inspeksi 125 poin
yang menjadi tolok ukur industri—dan pembiayaan mobil. Pada tahun 2014 CarMax
direkrut untuk lebih dari 1.200 posisi karyawan di lokasi di seluruh negeri sebagai
tanggapan untuk melanjutkan pertumbuhan. CarMax saat ini mengoperasikan 131
toko mobil bekas di 64 pasar.
CarMax terus meningkatkan dan menyempurnakan sistem informasinya, yang
diyakini sebagai keunggulan kompetitif inti. TI CarMax meliputi:
• IS berpemilik yang menangkap, menganalisis, menafsirkan, dan mendistribusikan
data tentang mobil yang dijual dan dibeli CarMax.
• Aplikasi analitik data yang melacak setiap pembelian; jumlah test drive dan aplikasi
kredit per mobil; preferensi warna di setiap demografi dan wilayah.
• Teknologi toko eksklusif yang menyediakan manajemen dengan data waktu nyata
tentang setiap aspek operasi toko, seperti manajemen persediaan, penetapan harga,
transfer kendaraan, lelang grosir, dan produktivitas konsultan penjualan.

34
• Sistem manajemen inventaris canggih yang membantu manajemen mengantisipasi
kebutuhan persediaan masa depan dan mengelola harga. Di seluruh CarMax, analitik
digunakan sebagai aset strategis dan wawasan yang diperoleh dari analitik tersedia
untuk semua orang yang membutuhkannya.

2.5 ELECTRONIC RECORDS MANAGEMENT


Semua organisasi membuat dan mempertahankan catatan bisnis. Sebuah
catatan adalah dokumentasi dari peristiwa bisnis, tindakan, keputusan, atau transaksi.
Contohnya adalah kontrak, penelitian dan pengembangan, dokumen sumber akuntansi,
memo, komunikasi pelanggan/klien, keputusan perekrutan dan promosi, notulen rapat,
posting sosial, teks, email, konten situs web, catatan basis data, dan file kertas dan
elektronik. Bisnis dokumen seperti spreadsheet, pesan email, dan dokumen pengolah
kata adalah jenis catatan. Sebagian besar catatan disimpan dalam format elektronik
dan dipelihara sepanjang siklus hidupnya—dari pembuatan hingga pengarsipan akhir
atau penghancuran.

Sistem Manajemen Catatan Elektronik (ERM).


Sistem ERM terdiri dari perangkat keras dan perangkat lunak yang mengelola
dan mengarsipkan dokumen elektronik dan dokumen kertas gambar; lalu indeks dan
simpan mereka sesuai kebijakan perusahaan. Misalnya, perusahaan mungkin
diwajibkan oleh hukum untuk menyimpan dokumen keuangan setidaknya selama
tujuh tahun, desain produk untuk banyak dekade, dan pesan email tentang promosi
pemasaran selama setahun. Utama Alat ERM adalah perangkat lunak alur kerja, alat
pembuat, pemindai, dan basis data. Sistem ERM memiliki kemampuan query dan
pencarian sehingga dokumen dapat diidentifikasi dan diakses seperti data dalam
database. Sistem ini berkisar dari yang dirancang untuk mendukung kelompok kerja
kecil hingga perusahaan berfitur lengkap dan berkemampuan Web sistem.

Tugas Hukum untuk Mempertahankan Catatan Bisnis


Perusahaan harus siap untuk menanggapi audit, investigasi federal, gugatan,
atau tindakan hukum lainnya terhadap mereka. Jenis tuntutan hukum terhadap
perusahaan termasuk pelanggaran paten, kelalaian keamanan produk, pencurian
kekayaan intelektual, pelanggaran kontrak, pemutusan hubungan kerja yang salah,
pelecehan, diskriminasi, dan banyak lagi.

35
Karena manajemen senior harus memastikan bahwa perusahaan mereka
mematuhi tugas hukum dan peraturan, mengelola catatan elektronik (e-records)
adalah strategis masalah bagi organisasi baik di sektor publik maupun swasta.
Keberhasilan ERM sangat tergantung pada kemitraan dari banyak pemain kunci, yaitu,
manajemen senior, pengguna, manajer arsip, arsiparis, administrator, dan yang paling
penting, IT personil. Dikelola dengan benar, catatan adalah aset strategis. Tidak
dikelola dengan benar atau dihancurkan, mereka menjadi kewajiban.

Praktik Terbaik ERM


Sistem ERM yang efektif menangkap semua data dan dokumen bisnis pada
awalnya titik sentuh—pusat data, laptop, ruang surat, di lokasi pelanggan, atau kantor
jarak jauh. Catatan memasuki perusahaan dalam berbagai cara—dari formulir online,
kode batang, sensor, situs web, situs sosial, mesin fotokopi, email, dan banyak lagi.
Selain menangkap seluruh dokumen secara keseluruhan, data penting dari dalam
dokumen dapat ditangkap dan disimpan di pusat, repositori dicari. Dengan cara ini,
data dapat diakses untuk mendukung keputusan bisnis yang terinformasi dan tepat
waktu.
Dalam beberapa tahun terakhir, organisasi seperti Association for Information
dan Manajemen Gambar (AIIM; ww.aiim.org), Arsip dan Arsip Nasional
Administration (NARA), dan ARMA International (sebelumnya Association of
Manajer dan Administrator Arsip; www.arma.org) telah membuat dan menerbitkan
standar industri untuk manajemen dokumen dan catatan. Banyak praktik terbaik
artikel, dan tautan ke sumber informasi berharga tentang dokumen dan catatan
manajemen, tersedia di situs web mereka. IT at Work 3.5 menggambarkan ARMA
prinsip-prinsip pencatatan yang diterima secara umum.
Manfaat ERM
Departemen atau perusahaan yang karyawannya menghabiskan sebagian besar
waktunya untuk mengajukan atau mengambil dokumen atau menyimpan catatan
kertas dapat mengurangi biaya secara signifikan dengan ERM. Sistem ini
meminimalkan inefisiensi dan frustrasi yang terkait dengan mengelola dokumen
kertas dan alur kerja. Namun, mereka tidak membuat kantor tanpa kertas seperti yang
telah diperkirakan. ERM dapat membantu bisnis menjadi lebih efisien dan produktif
dengan:

36
• Memungkinkan perusahaan untuk mengakses dan menggunakan konten yang ada di
dokumen.
• Memotong biaya tenaga kerja dengan mengotomatisasi proses bisnis.
• Mengurangi waktu dan upaya yang diperlukan untuk menemukan informasi bisnis
kebutuhan untuk mendukung pengambilan keputusan.
• Meningkatkan keamanan konten, sehingga mengurangi risiko intelektual pencurian
properti.
• Meminimalkan biaya yang terkait dengan pencetakan, penyimpanan, dan pencarian
isi.
Saat alur kerja digital, produktivitas meningkat, biaya menurun, kepatuhan
kewajiban lebih mudah diverifikasi, dan komputasi hijau menjadi mungkin.
Komputasi hijau adalah inisiatif untuk melestarikan sumber daya alam kita yang
berharga dengan mengurangi efek penggunaan komputer kita terhadap lingkungan.
Kamu bisa baca tentang komputasi hijau dan topik terkait untuk mengurangi jejak
karbon, keberlanjutan, dan tanggung jawab etika dan sosial.

37
DAFTAR PUSTAKA
Turban, E., Volonino, Linda., Information Technology for Management:
Transforming Organizations in the Digital Economy. John Wiley & Sons, 7th
Edition, 2010. (TLMW)

38

Anda mungkin juga menyukai