Anda di halaman 1dari 35

CHAPTER 6 : Business Intelligence, Data Science, and Data Analytics

Disusun Oleh :

202250011 - Rio Martin

202250022 – Benaya Lay

Bustika

202250030 – Vinsen Antonius

202250031 – Cindy Florencia

202250057 - Andrew Miki S

202250204 – Yosef Wijaya

Program Studi S1 Akuntansi

Trisakti School Of

Management 2024
6.1 Business Intelligence and Data Science ( Kecerdasan Bisnis dan Ilmu Data )

4 Fase Pengambilan Keputusan :


1. Fase Intelijen ( Intelligence Phases ) → Mengidentifikasi masalah atau peluang.
Mengumpulkan informasi. Menetapkan tujuan dan kriteria penilaian.
2. Fase Desain ( Design Phases ) → Menentukan berbagai tindakan untuk memecahkan
masalah atau mengeksploitasi peluang. Menganalisis alternatif yang layak. Mengevaluasi
setiap alternatif terhadap kriteria yang ditetapkan pada tahap intelegensi.
3. Fase Pilihan ( Choice Phases ) → Pilih tindakan alternatif.
4. Fase Tinjauan ( Review Phases ) ( kadang-kadang disebut tahap monitor, kontrol, atau
implementasi ) → Memantau dan mengontrol pilihan untuk memastikan eksekusi yang
tepat.

Rasionalitas terikat ( Bounded Rationality ) adalah gagasan bahwa rasionalitas dibatasi oleh
kemudahan keputusan, keterbatasan kognitif pikiran dan waktu yang tersedia untuk membuat
keputusan.

Memuaskan ( Satisficing ) adalah strategi pengambilan keputusan yang melibatkan pencarian


melalui alternatif yang tersedia sampai solusi yang dapat diterima ditemukan. Ini adalah gabungan
dari kata "memuaskan" dan "cukup"
Mengoptimalkan ( Optimizing ) adalah proses menemukan alternatif yang paling hemat biaya
atau menghasilkan kinerja terbaik yang dapat dicapai di bawah kendala yang diberikan dengan
memaksimalkan efek yang diinginkan dan meminimalkan efek yang tidak diinginkan.

Analitik data ( Data Analytics ) adalah salah satu cara agar pembuat keputusan dapat lebih mudah
mengoptimalkan keputusan mereka dengan mengurangi volume data yang sangat besar menjadi
data yang andal, akurat, dan tepat waktu dalam jumlah yang dapat dikelola yang disajikan
dengan cara yang mudah dipahami.

Data Driven Decision-Making with Data Analytics ( Pengambilan Keputusan Berbasis Data
dengan Analisis Data )
Ada tiga tingkat analitik data yang bervariasi dalam kompleksitas dan nilai tambah. Ketiga level
tersebut adalah analitik data deskriptif, prediktif, dan preskriptif.

1. Analitik data deskriptif ( Descriptive ) tujuannya yaitu membuat ringkasan data historis
untuk menghasilkan informasi yang berguna dan mungkin menyiapkan data untuk analisis
yang lebih canggih di masa mendatang.
2. Analitik data prediktif ( Predictive ) adalah proses menggunakan metode dan teknik
analisis data untuk memodelkan dan membuat prediksi tentang peristiwa yang tidak
diketahui dari data.
3. Analisis data preskriptif ( Prescriptive ) didedikasikan untuk menemukan tindakan terbaik
di antara berbagai pilihan dengan parameter yang diketahui

Kecerdasan bisnis ( BI /
Business Intelligence ) adalah serangkaian praktik terbaik, perangkat lunak, infrastruktur, dan alat
untuk memperoleh dan mengubah data mentah yang sangat terstruktur menjadi wawasan yang
dapat ditindaklanjuti untuk membantu manajer di semua tingkat organisasi membuat keputusan
bisnis yang tepat.

Ilmu data ( Data Science ) adalah bidang multidisiplin yang menggunakan keahlian domain,
metode ilmiah, keterampilan pemrograman, algoritme, dan statistik untuk mengekstraksi
pengetahuan dan wawasan dari kumpulan data besar terstruktur, semi-terstruktur, dan tidak
terstruktur untuk memprediksi perilaku masa depan dan menentukan tindakan.

Dari Figure tersebut menjelaskan :


● Tidak diketahui ( Unknown ) adalah sesuatu yang tidak kita ketahui, dan kita tidak
menyadari bahwa kita tidak mengetahuinya.
● Diketahui ( Known ) adalah sesuatu yang kita ketahui, dan kita tahu bahwa kita
mengetahuinya.
Traditional and Modern Business Intelligence (BI) (Kecerdasan Bisnis Tradisional dan Modern
(BI))
Dasbor ( Dashboard ) adalah antarmuka pengguna grafis yang menyediakan tampilan sekilas KPI
yang relevan untuk organisasi atau departemen.

Mashup data ( Data Mashup ) adalah integrasi dua atau lebih kumpulan data dari berbagai sistem
bisnis dan sumber eksternal tanpa bergantung pada langkah tengah ETL (ekstrak, ubah, dan muat)
ke gudang data atau bantuan dari TI.

Visualisasi data ( Data Visualization ) adalah proses merepresentasikan bisnis abstrak atau data
ilmiah sebagai gambar, diagram, grafik, atau animasi yang dapat membantu memahami makna
data.

BI modern ( Modern BI ) memungkinkan pengguna untuk membuat laporan dan analisis


produk dengan cepat dan berbagi data dengan pengguna lain untuk membuat keputusan dan
mengoptimalkan hasil bisnis.
Analitik swalayan ( Self Services Analytics ) adalah bentuk BI yang memungkinkan dan
mendorong manajer dan pengguna lain untuk melakukan kueri dan menghasilkan laporan
dengan dukungan TI nominal.

Embedded BI adalah integrasi alat dan kemampuan analitik swalayan dalam aplikasi perangkat
lunak bisnis yang umum digunakan.

Adding Value with Traditional and Modern BI ( Menambah Nilai dengan BI Tradisional
dan Modern )
Perusahaan dan seluruh sektor industri menggunakan visualisasi data dan interaktivitas BI untuk
meningkatkan kecepatan dan kualitas pengambilan keputusan—sering kali dengan tampilan
seluler - dengan cara berikut :

1. Quick Detection and Decisions in Stock Markets ( Deteksi dan Keputusan Cepat di
Pasar Saham )
Perusahaan Wall Street, pedagang, manajer kekayaan, analis risiko, dan regulator
mengandalkan kemampuan mereka untuk memproses dan memanfaatkan anomali pasar
secara real time. Institusi keuangan tidak hanya membutuhkan visualisasi data, tetapi
eksekutif dan investor mereka juga mengharapkan kualitas dan kegembiraan visual untuk
memahami data keuangan yang kering, seperti solusi interpretasi visual real-time yang
mencerminkan peluang, risiko, dan perubahan pasar.
2. Prompt Disaster Response by the Insurance Industry ( Tanggapan Bencana yang
Cepat oleh Industri Asuransi )
Keefektifan tanggapan perusahaan asuransi terhadap badai dahsyat atau peristiwa bencana
lainnya bergantung pada kemampuannya menggabungkan data dalam jumlah besar untuk
sepenuhnya memahami dampaknya.

Pratt dan Fruhlinger (2019) menjelaskan bagaimana beberapa organisasi mendapat manfaat dari
penggunaan BI:
1. HelloFresh
Solusi BI menghemat waktu kerja tim analitik pemasaran 10–20 jam per hari dengan
mengotomatiskan proses pelaporan dan memberdayakan tim pemasaran yang lebih besar
untuk mengembangkan kampanye pemasaran digital individual regional berdasarkan
analisis agregat perilaku pelanggan.

2. REI
Meningkatkan tingkat keanggotaan dan kepuasan anggotanya dengan menganalisis tingkat
akuisisi, retensi, dan aktivasi dalam basis data keanggotaan koperasi mereka. Mereka
juga
meningkatkan metode pengiriman, manajemen siklus hidup anggota, dan penawaran
kategori produk dengan menganalisis segmentasi pelanggan.
3. Chipotle
Memiliki sumber data berbeda yang menghalangi tim untuk melihat tampilan terpadu
restorannya. Platform BI modern baru memungkinkan mereka membuat tampilan operasi
terpusat untuk melacak operasi restoran di tingkat nasional. Hal ini menghasilkan akses
staf yang lebih baik ke data dan kecepatan pengiriman laporan untuk proyek strategis
meningkat tiga kali lipat dari triwulan ke bulan dan menghemat ribuan jam kerja.
4. Sistem Sekolah Columbus Ohio ( Columbus Ohio School System )
Menggunakan alat BI untuk memeriksa berbagai titik data mulai dari tingkat kehadiran
siswa hingga kinerja siswa untuk meningkatkan pembelajaran siswa dan tingkat
kelulusan SMA.

Finding and Hiring BI Professionals ( Menemukan dan Mempekerjakan Profesional BI )


Profesional BI meliputi analis BI, pengembang BI, manajer BI, konsultan BI, dan analis bisnis.
Misalnya, seorang analis BI menghasilkan intelijen keuangan dan pasar dengan menanyakan
repositori data dan menghasilkan laporan periode. Mereka juga merancang metode untuk
mengidentifikasi pola dan tren data dalam sumber data yang tersedia. Perusahaan tipikal di
berbagai sektor industri yang mempekerjakan analis BI termasuk Amazon, Boeing, Asuransi
USAA, Walt Disney Co., Banco Santander, dan Sprint Nextel Corp.

Software to Support BI Professionals ( Perangkat Lunak untuk Mendukung Profesional BI )


Trustmarque dan Tableau (2020) menjelaskan tujuh atribut utama perangkat lunak BI modern
sebagai :
1. Kecepatan ( Speed )
Anda dapat mengajukan dan menjawab pertanyaan secara real-time bahkan saat bekerja
dengan kumpulan data yang sangat besar dan beragam.
2. Visualisasi ( Visualization )
BI modern memungkinkan analitik layanan mandiri sehingga pengguna dapat mengajukan
lebih banyak pertanyaan, menelusuri data, dan menghasilkan dasbor yang dapat dibagikan.
3. Sumber kebenaran tunggal ( Single Source of Truth )
Volume data yang sangat besar dari sumber yang berbeda dapat dengan mudah
digabungkan memadukan sumber data yang berbeda secara real-time tanpa biaya integrasi
di muka.
4. Kolaborasi waktu nyata ( Real-Time Collaboration )
Data selalu aktif. Pengguna dapat memfilter, menyortir, mendiskusikan, mengubah, dan
berbagi data secara instan.
5. Tata kelola yang komprehensif ( Comprehensive Governance )
Memandang tata kelola data sebagai langkah penting dalam menciptakan lingkungan yang
aman dan tepercaya untuk analitik layanan mandiri yang menghasilkan dasbor dan laporan
yang akurat, tersedia, dan teraudit.
6. Skalabilitas ( Scalability )
Mulai dari yang kecil dan skala sesuai kebutuhan. BI modern mendukung semua tahapan
evolusi analitis organisasi.
7. Mobilitas ( Mobility )
Kompatibel dengan smartphone dan tablet untuk memungkinkan pengguna melihat,
berinteraksi, dan berbagi analitik terlepas dari perangkat dan lokasi.

Analitik buatan adalah penggunaan pembelajaran mesin dan AI pada alat BI untuk
mengotomatiskan persiapan data dan membantu pengguna menemukan dan berbagi wawasan.
Pembelajaran mesin adalah algoritme ilmiah yang mengidentifikasi pola dalam data besar untuk
dipelajari data dan menciptakan wawasan berdasarkan data.

Diharapkan hingga akhir tahun 2020, tugas pengelolaan data manual akan berkurang sebesar 45
persen atau lebih dari separuh sistem bisnis besar baru akan menggunakan data konteks dengan
nyata untuk meningkatkan pengambilan keputusan.
Menurut Gartner Magic Quadrant 2020 untuk BI dan Analytics (Gartner, 2020a), pemimpin saat
ini di bidang BI dan platform analisis data deskriptif adalah:
 Microsoft Power BI menawarkan data yang mudah digunakan persiapan, penemuan
data berbasis visual, dasbor interaktif, dan analisis tambahan.Ini tersedia di tempat
sebagai penawaran SaaS dan menawarkan fungsionalitas AI/pembelajaran mesin dengan
wawasan yang sadar konteks.
 Tableau memungkinkan pengguna bisnis mengakses, mempersiapkan, menganalisis dan
menyajikan hasil kueri data.Ini telah menambah analitik dan data kemampuan tata kelola
bersama dengan kueri bahasa alami dan wawasan otomatis.
 Qlik menawarkan pengguna di semua tingkatan untuk menjalankan Qlik Associative.
Mesin-mesin inferensi yang terintegrasi untuk menggantikan pendekatan berbasis kueri,
yang memisahkan data dari konteksnya.Dengan menggunakan mesin inferensi, pengguna
dapat memasukkan input sebanyak-banyaknya tentang informasi yang mereka miliki,
dan perangkat lunak tidak hanya mencari informasi yang diberikan tetapi juga akan
membuat asosiasi dengan semua data relevan lainnya.
 Thoughtspot memiliki antarmuka berbasis pencarian yang mendukung pertanyaan
kompleks dengan analitik yang ditingkatkan, termasuk crowdsourcing yang digerakkan
oleh AI, rekomendasi dan pemantauan otonom terhadap metrik bisnis.Ini juga memiliki
database opsi kueri untuk database Snowflake.

Konsultan visualisasi data menanggapi permintaan


Di banyak organisasi, data tidak memenuhi empat V. Misalnya, banyak organisasi masih
beroperasi berdasarkan data yang disembunyikan dan tidak dapat mengintegrasikan data dari
sumber yang berbeda secara cepat atau akses mudah, terlalu banyak data “kotor” atau mereka tidak
memiliki personel yang memiliki keterampilan untuk memanfaatkan itu untuk kekuatan penuh
analisis data.Untuk memenuhi kebutuhan ini, visualisasi data perusahaan konsultan/jasa
menjembatani kesenjangan antara organisasi dan struktur data dan kurangnya keterampilan
analisis data tingkat tinggi.Misalnya, xFusion teknologi menyediakan rangkaian lengkap layanan
dan solusi IT dan mengatasi tiga hambatan dengan lancar yang menghalangi realisasi efektif
visualisasi data: integrasi, interoperabilitas dan wawasan.Info-Matrix, sebuah usaha kecil milik
perempuan swasta, menyediakan data BI end-to-end, alat dan layanan analitik.

Ilmu data
Seringkali BI saja tidak cukup.Daripada hanya menggambarkan status utama data terstruktur
saat ini, ilmu data melampaui fungsi pelaporan BI dengan menggunakan metode ilmiah dan
pemodelan data untuk memprediksi perilaku di masa depan dan menentukan tindakan untuk
mengoptimalkan proses berdasarkan data tidak terstruktur, semi-terstruktur, dan
terstruktur.Biasanya, data historis digunakan untuk membangun model matematika berdasarkan
tren hal-hal penting. Dalam ilmu data, model tersebut kemudian digunakan pada data saat ini
untuk memprediksi apa yang akan terjadi selanjutnya dan menentukan tindakan yang harus
diambil untuk mendapatkan hasil yang optimal.Tujuan dari ilmu data adalah untuk menemukan
pola dan tren dalam kumpulan data besar yang mengarah pada solusi praktis untuk berpusat pada
data di masalah kehidupan nyata. Untuk melakukan hal ini, ilmuwan data menggabungkan
pemikiran kritis dan metode ilmiah dengan berbagai metode dan teknik data yang
memungkinkan mereka dengan mudah memahami dan memperoleh data nyata dan makna dari
data tersebut.

TAHAP 1—TANGKAP DATA


 Memahami kebutuhan bisnis-memahami KPI mana yang menjadi bisnis ingin fokus dan
mengoptimalkan.Dapatkan pengetahuan dan pemahaman domain.
 Mengumpulkan, memasukkan, dan mengekstrak-gunakan alat dan bahasa pemrograman
yang disukai seperti Python, R, SQL, NoSQL dan NewSQL untuk mengimpor data dari
berbagai sumber.

TAHAP 2—SIMPAN DATA


 Data bersih-jika data tidak mudah dibaca atau telah disusupi sebagai tahap awal langkah-
langkah yang harus diambil untuk “membersihkan” data yaitu, menangani data yang
hilang, outlier, data kategorikal, standarisasi konvensi penamaan, dll. sebelum dimasukkan
ke dalamnya model.
 Memastikan keamanan dan integritas data baik dalam spreadsheet Excel, gudang data
dan/atau di set yang berbeda dan memungkinkan aksesibilitas ke orang yang berwewenang.

TAHAP 3—DATA MODEL


 Buat model-pilih algoritma yang akan digunakan dan isi dengan algoritma yang sudah
disiapkan data.Menggunakan model dasar, bandingkan kinerja model yang berbeda yang
menentangnya.Tetap sederhana.Jika regresi logistik menawarkan akurasi 90%, tidak ada
perlu menggunakan jaringan saraf yang jauh lebih kompleks, hanya untuk memperbaikinya
91%.
 Evaluasi kinerja model-apa kesesuaian model tersebut?bandingkan model dengan KPI
yang diidentifikasi pada Langkah 1.Pastikan semuanya kendala bisnis terpenuhi.

TAHAP 4—ANALISIS DATA


 Melakukan analisis data eksplorasi.
 Melakukan analisis data statistik konfirmatori (deskriptif, prediktif, dan preskriptif) dan
melakukan tes visualisasi untuk menemukan pola dalam data yang mendasarinya.

TAHAP 5—KOMUNIKASI INFORMASI


 Gunakan metode dan teknik intelijen bisnis untuk melaporkan hasilnya pada pemangku
kepentingan.
 Mendistribusikan laporan visualisasi data dan dashboard.
 Dapatkan validasi tentang kinerja model di berbagai jenis bisnis dan situasi dari seluruh
pemangku kepentingan proyek.
 Kelola ekspektasi pemangku kepentingan.

TAHAP 6—MENYEBARKAN MODEL DATA


 Berkolaborasi dengan ilmuwan data, insinyur data, pengembang perangkat lunak, dan
sebagainya tentang sifat proyek.
 Pastikan tidak ada konflik dengan aplikasi lain yang saling bergantung.
 Menguji model di lingkungan produksi dunia nyata.Jika semua KPI bereaksi baik, dan
semua kendala bisnis lainnya terkendali dengan baik, kami melanjutkan ke langkah
berikutnya, jika tidak, identifikasi masalah dan ulangi langkah sebelumnya lagi.
 Mendapatkan dukungan bisnis.Ini adalah titik pemeriksaan terakhir.Pekerjaan
pengembangan inti tujuan dan dukungan serta pemeliharaan ikut berperan.Proyek ini
berhasil, dan hasilnya adalah model yang berfungsi untuk meningkatkan efisiensi bisnis
atau daya saing.

TAHAP 7—ULAI PROSES


 Mengoperasikan dan mengoptimalkan model data seiring dengan menurunnya perubahan
dalam bisnis efektivitas model saat ini.
 Pantau KPI secara terus-menerus—mungkin melalui dasbor visualisasi.
 Jika performa model menurun, latih kembali model tersebut menggunakan data yang
diperbarui.

Sepanjang siklus hidupnya, ilmu data menggabungkan pengetahuan dari banyak disiplin ilmu
STEM termasuk matematika, statistika dan pemrograman komputer dan melengkapinya dengan
domain pengetahuan tentang topik yang menarik untuk digunakan ilmiah yang didukung secara
metode algoritmik.Masing-masing dibahas dalam Bagian 6.4.

Menambah nilai dengan ilmu data


Wawasan yang diperoleh melalui pendekatan ilmu data kemudian dapat membawa perubahan pada
keputusan bisnis yang berdampak pada pendapatan, kemampuan bersaing, inovasi dan kreativitas,
efisiensi operasional dan meningkatkan pengalaman pelanggan.Organisasi yang menggunakan
data sains untuk menemukan wawasan di penyimpanan data mereka untuk membantu pengambilan
keputusan perusahaan meliputi:
 Netflix—penambangan data mengungkap pola menonton film untuk memahami apa
yang mendorong pengguna tertarik dan menggunakan hasil yang dihasilkan secara
algoritmik untuk memutuskan topik untuk seri asli Netflix di masa mendatang.
 Target—mengidentifikasi segmen pelanggan utama dalam basis pelanggannya dan
menganalisisnya perilaku belanja unik dari setiap segmen untuk membantu mereka
memandu konten pesan pada audiens pasar yang berbeda.
 Procter and Gamble—menggunakan model deret waktu untuk memahami permintaan
konsumen di masa depan dan membantu merencanakan tingkat produksi yang optimal di
seluruh rangkaian produk mereka.

Metode dan teknik ilmu data juga mengembangkan “produk data” seperti yang dibuat oleh
mesin rekomendasi yang memanfaatkan data pengguna untuk membuat saran yang
dipersonalisasi seperti item untuk membeli yang disajikan oleh Amazon, saran film dari Roku dan
tips musik dari Pandora.
Data Produk adalah fungsi teknis yang merangkum suatu algoritma dan dirancang untuk itu yang
terintegrasi langsung ke dalam aplikasi inti.

Misalnya, ilmu data diusulkan untuk mendorong industri otomotif di dunia di masa depan karena
banyaknya data besar yang dihasilkan oleh sensor seiring dengan perkembangan kendaraan yang
lebih otonom dan “produsen mobil tradisional akan bermitra dengan perusahaan non-otomotif
teknologi seperti Google, Apple, Uber, dan Lyft untuk memanfaatkan kekuatan mereka dan
meminimalkannya kelemahan bawaannya untuk menentukan arah pengembangan fitur
kendaraan”Sektor industri dan tugas bisnis lain yang dapat diterapkan oleh ilmu data termasuk:
 Penerbangan, pemantauan 'kesehatan' pesawat secara real-time dengan memprediksi
kinerja minyak, bahan bakar, lepas landas dan mekanika pesawat secara umum.
 Pemasaran, menghasilkan kupon di tempat penjualan berdasarkan profil pelanggan dan
perolehannya wawasan berharga tentang perilaku pelanggan, termasuk konten apa yang
ingin mereka baca di halaman web atau produk apa yang paling mungkin mereka beli
melalui produk yang dihasilkan secara ilmiah model data dan algoritma.
 Layanan Keuangan, memperbarui portofolio risiko keuangan dalam hitungan
menit.Menilai risiko kredit melalui pemodelan data menggunakan pembelajaran mesin dan
alat kuantitatif.
 Layanan Kesehatan, algoritme komputer sudah lebih baik daripada dokter manusia dalam
menganalisis gambar medis seperti CT atau PET scan dan MRI untuk mengidentifikasi
kelainan dengan lebih akurat.Kemampuan yang lebih besar untuk mengklasifikasikan
dan mengobati kanker dan efek pengobatan.Menggunakan deteksi pola algoritma untuk
mengidentifikasi asma dan COPD dengan mencatat dan menganalisis pasien bernapas dan
memberikan umpan balik secara real-time melalui aplikasi smartphone.
 Energi, peramalan harga dan permintaan listrik.Model canggih memantau ketersediaan
pabrik, tren historis, musiman dan cuaca.
 Manufaktur, memprediksi kegagalan mesin melalui pemantauan dan prediksi aplikasi
pemeliharaan untuk mengurangi waktu henti dan meminimalkan pemborosan.
 Rantai Pasokan, mengidentifikasi peluang perbaikan di seluruh rantai pasokan dan
pengadaan hingga manajemen ketersediaan di dalam toko.
 Manajemen Risiko, mendeteksi penipuan atau gangguan data sebelum mempengaruhi
operasi dan menganalisis risiko untuk peramalan investasi keuangan yang akurat.
 Algoritma, perhotelan dan pariwisata yang banyak digunakan dalam pengelolaan
pendapatan, sistem di mana data tentang cuaca, popularitas penerbangan, kamar hotel
atau restoran atau bahkan preferensi selancar atau ski memengaruhi harga dan
ketersediaan secara real-time.
 Perangkat lunak, law Legal AI dapat membaca dan memindai dokumen peradilan untuk
menemukan penyimpangan dan preseden.
 Perangkat pintar dan kota, pengenalan gambar melalui kamera jarak jauh digunakan di
perangkat pintar, perangkat pengawasan dan pemantauan rumah dan analisis kota.
Membangun tim ilmu data
Setiap organisasi membutuhkan orang-orang yang dapat menganalisis dan menemukan wawasan
dalam data yang diambil dari berbagai sumber, termasuk transaksi pelanggan, aliran klik, sensor
IoT, media sosial, file log, dan plot GPS. Organisasi besar memiliki tim sains data tersendiri,
sedangkan di perusahaan kecil mungkin hanya ada satu orang yang memiliki keterampilan analitik
data yang diperlukan yang diperoleh melalui pendidikan formal atau “di pekerjaan."Sebagai
sebuah tim, anggotanya harus memiliki kombinasi keterampilan bisnis dan IT agar bisa
membangun jembatan dengan bisnis dengan menerapkan tingkat teknologi yang tepat untuk
masalah bisnis.

Pekerjaan ilmu data memiliki permintaan yang sangat tinggi. Dice.com menunjukkan jumlah
lowongan pekerjaan ilmu data di situs webnya telah meningkat sekitar 32% selama tahun 2019
dan memang.com menunjukkan peningkatan permintaan data scientist sebesar 29%.Ketika sebuah
referensi dibuat untuk pekerjaan ilmu data, orang langsung berpikir “ilmuwan data”, tapi tim
ilmu data pada umumnya terdiri dari beberapa orang yang masing-masing memiliki kelompok
berbeda keterampilan. Misalnya, ilmuwan data memerlukan keterampilan untuk membuka kunci
yang berharga dan wawasan prediktif untuk mempengaruhi keputusan bisnis dan memacu daya
saing, sementara data lainnya.Anggota tim sains pada dasarnya adalah seorang pemrogram komputer
dan yang lainnya adalah ahli statistik atau berfungsi sebagai penghubung antara IT dan bisnis
untuk memastikan kesesuaian untuk kebutuhan bisnis saat ini dan yang sedang berlangsung.
Pekerjaan Tugas pekerjaan Skill Contoh perusahaan
yang
memperkerjakan
Manajer data Mengelola tim ilmu Sistem database (SQL dan Coursera,
dan analisis data NoSQL), kepemimpinan dan Microsoft,
proyek, pengelolaan Slack, Motorola
antarpribadi komunikasi,
penambangan data dan
pemodelan prediktif
Ilmuwan data Membersihkan, Komputasi terdistribusi, Google, Microsoft
memijat, dan pemodelan prediktif, Adobe
mengatur data secara bercerita dan
besar-besaran memvisualisasikan statistika,
pembelajaran mesin
Analis data Kumpulkan, proses, Spreadsheet (Excel), SQL IBM, HP, DHL
dan lakukan analisis dan NoSQL database
data statistik
Arsitek data Membuat cetak biru Solusi gudang data, Visa, Coca-cola,
untuk diintegrasikan, pengetahuan mendalam Logitech
memusatkan, tentang arsitektur basis data,
melindungi, dan pemodelan data dan
memelihara data pengembangan sistem
sumber
Insiyur data Mengembangkan, SQL dan NoSQL, sistem Spotify, Amazon,
membangun, basis data, pemodelan data, Facebook
menguji dan API Data, gudang data solusi
mempertahankan
arsitektur
Administrator Pastikan database Cadangan dan pemulihan Tableau, Reddit,
data tersedia untuk semua pemodelan data dan Twitter
pengguna yang desain, SQL dan NoSQL,
berwenang dan sistem basis data dan
berfungsi keamanan data, ERP dan
baik dan aman pengetahuan bisnis
Ahli data Mengumpulkan, Teori statistik dan metode Linkedin, Johnson
statistika menganalisis, dan penambangan data dan and Johnson,
menafsirkan pembelajaran mesin, Pepsico
data kualitatif dan komputasi Hadoop, SQL dan
kuantitatif dengan NoSQL,
teori dan metode sistem basis data, alat awan
statistik ERP dan bisnis pengetahuan
Analis bisnis Meningkatkan proses Alat dasar (misalnya, Uber, Dell, Oracle
bisnis sebagai Microsoft Office), Visualisasi
perantara antara Data (misalnya, Tablo),
bisnis dan TI mendengarkan secara sadar
dan bercerita
pemahaman BI dan
pemodelan data

Wawasan karir 6.2


Ilmuwan Data memanipulasi Big Data untuk hasil yang Dapat ditindaklanjuti
Big data, alat analitik, jaringan yang kuat, dan kekuatan pemrosesan yang lebih besar telah
memberikan kontribusinya untuk pertumbuhan bidang ilmu data.Menurut glassdoor.com, rata-rata
tahunan gaji untuk ilmuwan data junior di Amerika Serikat adalah $121,319 dan $162,134 untuk
ilmuwan data senior.Facebook dan Google adalah perusahaan dengan bayaran tertinggi untuk
ilmuwan data gaji lebih dari $200K.

Namun, ini bukan hanya soal uang, sebagian besar ilmuwan data sangat menikmati apa yang
mereka lakukan.Pekerjaannya adalah menarik mencakup berbagai aspek organisasi dan dalam
beberapa kasus melibatkan menganalisis program penjangkauan masyarakat yang didukung
perusahaan.Menurut Greg Gordon, VP grup praktik Big Data di Kronos, penyedia solusi
manajemen tenaga kerja di cloud, menjadi ilmuwan data “bukan tentang duduk di ruangan
sepanjang hari, kita melakukan pekerjaan dan menerapkannya pada masalah pelanggan.Kami
bekerja dan berinteraksi dengan pelanggan setiap hari tentang masalah nyata, kemudian
mencoba mereplikasi, membuat model, dan menyelesaikannya.”

Contoh menarik tentang apa yang dilakukan seorang data scientist dapat ditemukan dengan
mempelajari Jonathan Goldman, orang yang mengubah LinkedIn.Pada saat Goldman bergabung,
LinkedIn telah bergabung karyawan kurang dari 8 juta anggota.Goldman memperhatikan bahwa
anggota yang ada mengundang anggota mereka teman dan kolega untuk bergabung, tetapi mereka
tidak menjalin hubungan dengan anggota lain di tingkat yang diharapkan oleh para
eksekutif.Seorang manajer LinkedIn berkata, “Rasanya seperti tiba di resepsi konferensi dan
menyadari bahwa anda tidak mengenal siapa pun.Jadi, kamu berdiri saja di pojok menyeruput
minumanmu dan kamu mungkin akan pulang lebih awal.”Goldman mulai menganalisis data dari
profil pengguna dan mencari pola untuk memprediksi di jaringan mana profil tertentu akan
digunakan.Meskipun sebagian besar manajer LinkedIn tidak melihat nilai dalam pekerjaan
Goldman, Reid Hoffman, salah satu pendiri dan CEO Linkedin pada saat itu, memahami kekuatan
analitik karena pengalamannya di PayPal.Dengan persetujuan Hoffman, Goldman menerapkan
metode dan teknik ilmu data untuk menguji apa yang akan terjadi jika anggota diberikan nama
anggota lain yang mereka miliki belum terhubung tetapi sepertinya tahu.Dia menampilkan tiga
pertandingan baru terbaik untuk setiap anggota berdasarkan profil LinkedIn-nya.Dalam beberapa
hari, rasio klik-tayang meningkat, pertandingan-pertandingan itu meroket dan segalanya benar-
benar meningkat.Berkat fitur yang satu ini, pertumbuhan Linkedin meningkat drastis.

Para ilmuwan data yang paling sukses dan banyak dicari, memiliki kombinasi antara keduanya
dalam keterampilan analitis, kecakapan teknis, dan ketajaman bisnis diperlukan untuk
menganalisis secara efektif kumpulan data yang sangat besar sambil berpikir kritis dan mengubah
asumsi dengan cepat, mengubah kecerdasan mentah menjadi wawasan yang ringkas dan dapat
ditindaklanjuti.

Contoh LinkedIn menunjukkan bahwa data scientist yang baik melakukan lebih dari sekadar
mencoba memecahkan masalah-masalah bisnis yang jelas.Berpikir kreatif dan kritis adalah bagian
dari pekerjaan mereka—yaitu, bagian analis dan artis bagian.Mereka menggali data yang masuk
dengan tujuan menemukan wawasan yang sebelumnya tersembunyi yang dapat menghasilkan
keunggulan kompetitif atau mendeteksi krisis bisnis dalam waktu yang cukup untuk
mencegahnya.Ilmuwan data sering kali perlu mengevaluasi dan memilihnya peluang dan ancaman
yang akan memberikan nilai terbesar bagi perusahaan atau merek.

Software to Support the Data Science Team


Bahasa pemrograman komputer yang paling umum digunakan yang mendasari solusi analitik
data tingkat lanjut meliputi:
Python → bahasa pemrograman berorientasi objek tingkat tinggi. Ini memiliki fungsi,
tipe dinamis, dan manajemen memori otomatis dan digunakan oleh ilmuwan data karena
dapat diperluas dan menyediakan beberapa pustaka analisis data gratis.

R → bahasa pemrograman open source yang dapat diperluas yang berjalan pada platform
Windows, Macintosh, Unix, dan Linux. R menawarkan katalog lengkap metode statistik dan
grafis dan mencakup algoritma pembelajaran mesin, regresi linier dan deret waktu, serta
inferensi statistik. R adalah alternatif untuk paket statistik yang lebih tradisional seperti SPSS,
SAS, dan STATA.

Apache Hadoop → Hadoop adalah bahasa sumber terbuka yang tidak menempatkan
persyaratan pada struktur data yang dapat diprosesnya dan mendistribusikan masalah komputasi
ke beberapa server. Untuk menyimpan data, Hadoop menggunakan sistem file terdistribusinya
sendiri, Hadoop File System (HDFS). HDFS mudah diskalakan. Server dan mesin dapat
ditambahkan untuk mengakomodasi peningkatan volume data.

Apache Spark → menggunakan kumpulan data terdistribusi tangguh (RDD) dan tidak
menyediakan sistem penyimpanan file terdistribusi. Ini paling sering digunakan untuk
perhitungan dan meskipun dapat berjalan secara independen, ini juga dapat digunakan dengan
Hadoop karena membuat kumpulan data terdistribusi dari file yang disimpan di HDFS.

RDD/Resilient distributed dataset adalah kumpulan objek yang toleran terhadap kesalahan,
tidak dapat diubah, dan terdistribusi yang dapat diproses secara paralel di seluruh cluster.

Menggunakan bahasa pemrograman ini sebagai landasan, analisis data tingkat lanjut yang mudah
digunakan perangkat lunak ini dimaksudkan untuk digunakan oleh tim ilmu data yang terlatih
secara formal serta pengguna dan tim bisnis individu, terkadang disebut sebagai “Citizen data
scientics”.

Citizen data scientist adalah karyawan dalam organisasi yang dapat menggunakan metode dan
teknik analitik data lanjutan serta perangkat lunak untuk membuat model data tetapi belum dilatih
secara formal sebagai ilmuwan data.

Menurut 2020 Gartner Magic Quadrant for Data Science and Machine Learning Platforms
(Gartner, 2020b), pemimpin dalam perangkat lunak analitik tingkat lanjut adalah:
 Alteryx → platform analitik end-to-end yang ramah pengguna yang memungkinkan
ilmuwan data dan analis untuk memecahkan masalah bisnis dengan cepat melalui
antarmuka visual swalayan yang intuitif dengan atau tanpa pengkodean. Alteryx
menemukan, menyiapkan, menganalisis, menyajikan, dan mengelola model analitik yang
dapat diterapkan dengan mengotomatiskan tugas data manual ke dalam alur kerja analitik
yang dapat diulang.
 SAS Visual Data Mining and Machine Learning → menawarkan pemrosesan data
mentah end-to-end menjadi wawasan yang dapat ditindaklanjuti untuk memberdayakan
organisasi dalam memecahkan masalah analitik yang kompleks dan melihat hasil nyata
dengan cepat dan mudah. Ini memungkinkan anggota tim sains data dari semua tingkat
keterampilan untuk menangani tugas di sepanjang siklus hidup sains data.

 Azure Databricks → layanan analitik berbasis Apache Spark yang cepat, mudah, dan
kolaboratif yang dioptimalkan untuk platform layanan cloud Microsoft Azure. Databrick
menawarkan ruang kerja interaktif yang memungkinkan kolaborasi antara ilmuwan data,
insinyur data, dan analis bisnis.

 Tibco → kemampuan end-to-end yang kuat mulai dari manajemen data dan persiapan
hingga penyebaran dan produksi pada platform yang fleksibel dan terbuka yang dapat
mengintegrasikan model yang dikembangkan secara eksklusif menggunakan berbagai
kemampuan sumber terbuka. Agak lemah dalam augmented analytics.

 Dataiku → adalah platform perangkat lunak ilmu data kolaboratif yang gesit dan fleksibel
untuk tim analis data, insinyur, dan ilmuwan data untuk mengaktifkan analitik data
swalayan dan mengoperasionalkan pembelajaran mesin. Dataiku menawarkan kepada
pemrogram kemampuan untuk membuat kode dalam Python, R, Spark, dll. dan ilmuwan
data warga dapat memilih antarmuka visual drag-and-drop yang dapat disesuaikan dalam
proses alur kerja prediktif dari persiapan data melalui analisis hingga pemodelan dan
presentasi.

 Mathworks → sebuah platform yang terintegrasi penuh di mana semua metode dan teknik
baru terintegrasi dengan mulus dalam lingkungan yang direkayasa dengan hati-hati mulai
dari prapemrosesan data dan pengembangan model hingga produksi dan menawarkan
kemungkinan pembuatan kode secara otomatis.

6.2 Big Data and Advanced Data Analytics

Ketika kumpulan data terlalu besar atau kompleks untuk dianalisis menggunakan metode
tradisional disebut Big Data. Big data adalah faktor utama yang mendorong semakin
pentingnya hal ini analisis data tingkat lanjut saat ini. Semakin banyak manajer dan timnya
yang memanfaatkan data besar untuk membantu mendorong keberhasilan pengambilan
keputusan dan membantu fungsi pekerjaan penting.

 Big data adalah kumpulan data yang terlalu besar atau kompleks untuk dianalisis
menggunakan aplikasi pemrosesan data tradisional.
 Data analytics (Analisis data) adalah proses memeriksa kumpulan data untuk menarik
kesimpulan tentang informasi yang dikandungnya, biasanya dengan bantuan perangkat
lunak komputer.
The Four Vs of Big Data

Untuk menghasilkan nilai bisnis maksimal dari data besar, pertanyaan yang tepat harus
diajukan, dan tingkat analisis yang tepat dilakukan. Agar efektif dalam menganalisis data
secara efisien, organisasi harus memperhatikan empat sifat utama big data yang
membedakannya dari data yang dihasilkan organisasi sebelumnya.

1. Volume → Untuk menangani volume “big data” yang besar dan memberikan kemampuan
analitik yang komprehensif di platform big data.
2. Ragam (Variety) → Lingkungan analitik telah berkembang dari menarik data sebagian
besar data terstruktur dari gudang data perusahaan tunggal untuk menyertakan berbagai
sumber semi-terstruktur dan tidak terstruktur seperti posting media sosial, tweet, video,
gambar, data sensor, dan panggilan layanan pelanggan.
3. Velocity → Kecepatan data disimpan, dianalisis, dan dihasilkan laporan. Jika data tidak
diproses secara tepat waktu, mungkin data tersebut tidak lagi akurat atau berguna,
misalnya data pasar saham harus diperbarui secara real-time karena volatilitas pasar saham
seperti inventaris yang harus dilakukan agar pelanggan tidak kecewa. ketika barang yang
mereka pesan tidak dapat dikirimkan seperti yang dijanjikan.
4. Kebenaran (Veracity) → Data yang tidak lengkap, hilang atau terduplikasi perlu
diperbaiki. Volume dan variasi data yang besar berarti lebih banyak data kotor yang lebih
sulit ditangani. Jika analisis atau kumpulan data yang salah digunakan, hasilnya akan
menjadi omong kosong, seperti contoh pemenang Super Bowl dan kinerja pasar saham.
Dinyatakan sebaliknya, manajer membutuhkan konteks untuk memahami bagaimana
menafsirkan data tradisional dan besar.
Selain empat V, keahlian dan penilaian manusia (human expertise and judgment)
harus ditambahkan ke dalam campuran saat menganalisis big data. Data tidak berharga jika
tidak dapat dengan mudah dianalisis, ditafsirkan, dipahami, dan hasilnya diterapkan secara
efektif dalam konteks.

Kesalahan umum yang dilakukan organisasi adalah berinvestasi di landasan analitik seperti
kualitas data, integrasi data, dan alat analisis data namun mengabaikan komponen yang
paling penting, yaitu kemampuan pengguna untuk menginterpretasikan laporan visual.

Misalnya, salah satu tantangannya adalah bagaimana menampilkan hasil analisis data
dengan cara yang bermakna dan tidak membebani pengguna. Misalnya, mungkin perlu
menciutkan dan memadatkan hasil untuk menampilkan grafik dan bagan dengan cara yang
biasa dilihat oleh pembuat keputusan.

Hasil mungkin juga harus tersedia dengan cepat di perangkat seluler yang didukung oleh
berbagai sistem operasi, browser, dan antarmuka pengguna, dan pengguna mungkin ingin
dapat dengan mudah menjelajahi datanya sendiri secara waktu nyata.

Big Data Goals and Challenges

Organisasi tidak hanya mengumpulkan dan menyimpan data besar. Mereka perlu
menggunakannya untuk mencapai tujuan bisnis. Sasaran umum lainnya yang terkait dengan adopsi
data besar meliputi:
 Membangun budaya berbasis data.
 Ciptakan cara baru untuk berinovasi dan mengganggu dengan teknologi.
 Percepat kecepatan penawaran kemampuan dan layanan baru.
 Luncurkan produk dan layanan baru.
 Tingkatkan proses.

Tantangan terkait budaya dan teknologi yang dihadapi organisasi meliputi:

- Cultural (Kultural)

1. Dorong unit bisnis untuk berbagi informasi di seluruh silo organisasi.


2. Tentukan data internal dan eksternal, terstruktur dan tidak terstruktur apa yang akan digunakan
untuk keputusan bisnis yang berbeda.
3. Temukan dan pekerjakan profesional ilmu data yang berpengalaman.
4. Bangun tingkat kepercayaan yang tinggi antara tim ilmu data dan manajer fungsional.
5. Dapatkan dukungan manajemen puncak untuk investasi dalam big data dan pelatihan.
6. Buat cara optimal untuk mengatur program data besar.
7. Pahami di mana investasi big data harus difokuskan dalam organisasi.
8. Tentukan cara menerapkan wawasan yang dibuat dari data besar.

- Terkait teknologi

1. Secara efektif menangani empat V data besar.


2. Tentukan cara terbaik untuk menyajikan hasil analisis data (mis., visualisasi,
dasbor, augmented reality) untuk memfasilitasi pengambilan keputusan yang dapat
ditindaklanjuti.

Analitik data tingkat lanjut (advanced data analytics) adalah pemeriksaan data
menggunakan metode dan teknik canggih untuk menemukan wawasan yang lebih dalam, membuat
prediksi, dan/atau menghasilkan rekomendasi.

Perbedaan utama antara hasil yang diberikan oleh analisis deskriptif BI dan metode serta teknik
analisis data prediktif dan preskriptif yang lebih canggih adalah
- bahwa BI menyajikan wawasan data melalui pelaporan, dasbor yang mudah digunakan, dan
visualisasi interaktif,
- edangkan analisis data prediktif dan preskriptif menggunakan algoritma. dan metode ilmiah
untuk menentukan hubungan antara data secara statistik dan membuat prediksi serta
memutuskan tindakan terbaik untuk membantu organisasi memenuhi harapan pelanggan,
meningkatkan kinerja secara keseluruhan, dan tetap kompetitif.

Misalnya, data sensor dapat dianalisis secara real time untuk:


 memantau dan mengatur suhu dan kondisi iklim dari makanan yang mudah rusak saat
diangkut dari peternakan ke supermarket.
 melihat tanda-tanda pembusukan buah-buahan dan sayuran mentah dan mendeteksi risiko
kontaminasi.
 melacak kondisi mesin yang beroperasi dan memprediksi kemungkinan kegagalan.
 melacak keausan mesin dan menentukan kapan pemeliharaan preventif diperlukan.
Predictive Data Analytics

Model prediktif (predictive model) = didasarkan pada beberapa faktor yang mungkin
mempengaruhi perilaku masa depan dan memprediksi pada tingkat kepercayaan tertentu hasil dari
suatu peristiwa.

Pemodelan prediktif (Predictive modeling) = proses yang menggunakan data mining dan
probabilitas untuk meramalkan hasil untuk membuat model statistik untuk memprediksi hasil.

Predictive modeling :

Perusahaan yang telah melaporkan peningkatan laba yang signifikan dan kemampuan mereka
untuk bersaing sebagai hasil dari penggunaan model prediksi antara lain:
 Amazon = merekomendasikan produk dan layanan kepada pengguna berdasarkan perilaku
mereka sebelumnya. Diperkirakan bahwa memprediksi pemodelan menyumbang sekitar 30%
dari semua penjualan Amazon.

 Macy = menggabungkan perilaku penelusuran dalam kategori produk dan mengirimkan email
yang ditargetkan untuk setiap segmen pelanggan. Macy's mengalami peningkatan penjualan
online sebesar 8–12% dari upaya pemodelan prediktif mereka.

 Harley Davidson = menargetkan calon pelanggan, menghasilkan prospek, dan menutup


penjualan dengan mengidentifikasi calon pelanggan bernilai tinggi yang siap melakukan
pembelian dan menindaklanjuti dengan kontak perwakilan penjualan untuk memandu mereka
melalui proses penjualan.

 Sprint = secara signifikan mengurangi tingkat churn dan meningkatkan peringkat kepuasan
pelanggannya dengan mengidentifikasi pelanggan yang berisiko keluar dan secara proaktif
memberikan penawaran retensi yang dipersonalisasi menggunakan algoritme AI-power.
Prescriptive Data Analytics
Analitik preskriptif adalah analitik data tingkat ketiga dan yang paling kuat. Sama seperti
analitik prediktif mengantisipasi apa yang akan terjadi selanjutnya, analitik preskriptif
melangkah lebih jauh untuk memberi saran kepada organisasi bagaimana bereaksi dengan cara
terbaik berdasarkan prediksi.
Analisis preskriptif menggunakan teknologi pengoptimalan dan pembelajaran mesin untuk
menyelesaikan keputusan yang kompleks dengan menyarankan beberapa opsi untuk
memanfaatkan peluang di masa mendatang atau memitigasi risiko dan hasil dari setiap opsi
keputusan. Masalah tidak hanya diidentifikasi, tetapi juga diselesaikan, waktu dan biaya dapat
dihemat, dan keandalan serta efisiensi dapat ditingkatkan.

Kombinasi analitik prediktif dan preskriptif menghasilkan hasil yang paling


menguntungkan bagi organisasi. Misalnya, dengan menggunakan analisis pola, Argo Corporation,
produsen peralatan pertanian yang berbasis di Georgia, dapat mengoptimalkan opsi konfigurasi
produk untuk mesin pertanian dan permintaan pelanggan waktu nyata untuk menentukan
konfigurasi dasar yang optimal untuk mesinnya. Akibatnya, Argo mengurangi variasi produk
sebesar 61% dan memangkas hari persediaan sebesar 81% dengan tetap mempertahankan tingkat
layanannya.

Beberapa contoh sektor industri yang berbeda dan cara mereka mendapatkan keuntungan dari
analitik preskriptif meliputi:
 Ritel = meminimalkan churn pelanggan. Mengukur reaksi pelanggan terhadap tindakan
perusahaan. Mengoptimalkan penawaran produk; tingkat persediaan; kepuasan pelanggan
untuk meningkatkan retensi dan kepuasan pelanggan; meningkatkan keuntungan dan
mengurangi biaya.

 Travel and transportation (Perjalanan dan transportasi) = optimalkan pengemudi dan


perencanaan rute setiap 10 menit untuk menghilangkan ribuan mil mengemudi yang tidak
perlu dan meningkatkan retensi pengemudi; mengoptimalkan konsumsi bahan bakar untuk
mengurangi biaya dan lebih bertanggung jawab terhadap lingkungan; mengoptimalkan jadwal
kru untuk meningkatkan moral karyawan dan mempertahankan lebih banyak pilot.

 Manufaktur = mengidentifikasi peningkatan proses dan mengoptimalkan perencanaan


produksi, penjadwalan, inventaris, dan logistik rantai pasokan untuk memenuhi persyaratan
bisnis guna menawarkan penghematan waktu dan biaya yang besar, meningkatkan kelincahan,
dan memberikan laba atas investasi (ROI) yang lebih besar.

 Perawatan kesehatan (Healthcare) = secara signifikan meningkatkan transportasi pasien


dengan mengoptimalkan rumah sakit (lokasi, spesialisasi, dan tempat tidur yang tersedia) dan
mengangkut data untuk membantu petugas operator merencanakan, mengelola, dan
melaksanakan ratusan permintaan transportasi pasien harian setiap hari.

6.3 Descriptive Data Analytic Tools


Empat alat paling penting yang digunakan dalam analitik deskriptif adalah data mining , data
visualization, data dashboards dan mashup . data mining adalah proses menggunakan
perangkat lunak untuk menganalisis data yang tidak terstruktur, semi-terstruktur, dan terstruktur
dari berbagai perspektif, mengkategorikannya, dan mendapatkan korelasi atau pola antar bidang
dalam data.

Data visualization adalah penyajian data dalam format grafis untuk memudahkan pengambil
keputusan memahami konsep yang sulit atau mengidentifikasi pola baru dalam data.
Digital Dashboard adalah antarmuka elektronik statis atau interaktif yang digunakan untuk
memperoleh dan mengkonsolidasikan data di seluruh organisasi.

Data Mining digunakan sebagai langkah pertama dalam analitik data deskriptif untuk
mengidentifikasi pola yang sebelumnya tidak diketahui dalam data, yaitu, yang diketahui tidak
diketahui. Dengan menggunakan perangkat lunak penambangan data, sebuah organisasi dapat
dengan cepat dan mudah mengekstraksi informasi yang berguna dari sejumlah besar data dan
menyajikannya sebagai laporan kepada manajemen. Penambangan data dengan mudah menangani
data terstruktur seperti yang ditemukan di database atau sistem ERP.

Adding value with data mining


Nilai bisnis yang diperoleh organisasi dari data mining terbagi dalam tiga kategori:
 Membuat keputusan yang lebih terinformasi pada saat mereka perlu dibuat.
 Menemukan wawasan, pola , atau hubungan yang tidak diketahui.
 Mengotomatiskan dan merampingkan atau mendigitalkan proses bisnis.

Affinity analysis adalah teknik penambangan data yang menemukan hubungan kejadian
bersama di antara aktivitas yang dilakukan oleh individu atau kelompok tertentu.

Data visualization data telah menjadi alat yang sangat efektif bagi organisasi di seluruh dunia
untuk memperoleh pemahaman komprehensif tentang tren, permintaan pasar, dan perbaikan
proses yang diperlukan. Anda mungkin pernah mendengar ungkapan “Sebuah gambar bernilai
ribuan kata”—tampilan interaktif, bagan dengan kemampuan drill down, dan analisis geospatial
data melakukan hal itu.

Drill down adalah menelusuri sesuatu di komputer yang berpindah dari informasi umum ke
informasi yang lebih terperinci dengan berfokus pada sesuatu yang menarik, misalnya,
penjualan triwulanan—penjualan bulanan—penjualan harian.

Geospatial data adalah data yang memiliki komponen geografis eksplisit, mulai dari data
vektor dan raster hingga data tabular dengan lokasi situs.

Visualisasi data adalah cara yang cepat dan mudah untuk menyampaikan konsep secara
universal—dan Anda dapat bereksperimen dengan berbagai skenario dengan membuat sedikit
penyesuaian.
Beberapa aplikasi bisnis yang berguna untuk visualisasi data adalah sebagai berikut:
 Mengidentifikasi area yang membutuhkan perhatian atau perbaikan.
 Mengklarifikasi faktor apa saja yang mempengaruhi perilaku pelanggan .
 Membantu memahami produk mana yang harus ditempatkan di mana .
 Memprediksi volume penjualan berdasarkan lokasi.

Adding value throught learning, exploration, and discovery with data visualization

Data discovery adalah proses penggunaan BI untuk mengumpulkan data dari berbagai database
dan menggabungkannya menjadi satu sumber yang dapat dievaluasi dengan mudah dan cepat.

Heat maps Selain diagram, grafik, dan garis waktu, visualisasi data juga menyertakan peta panas.
Peta panas adalah alat yang paling banyak digunakan untuk merepresentasikan data statistik
kompleks dan menggunakan spektrum warna hangat ke dingin untuk menunjukkan perbedaan
dalam kelas data.

Augmented Reality (AR) Tingkat visualisasi data tertinggi yang tersedia saat ini adalah
augmented reality (AR) yang memadatkan data menjadi grafik atau bagan yang mudah dicerna
yang dapat diproyeksikan secara visual dengan teknologi AR untuk melibatkan pengguna
sepenuhnya. Beberapa penggunaan augmented reality meliputi:
augmented reality (AR) adalah penggunaan metode dan teknik visualisasi 3-D yang lebih
kontemporer untuk mengilustrasikan hubungan dalam data termasuk pemetaan cerdas, rutinitas
cerdas, pembelajaran mesin, dan pemrosesan bahasa alami.
 Coca-Cola telah mengembangkan aplikasi AR yang membantu pengecer
memvisualisasikan bagaimana pendingin minuman cocok dengan toko
mereka.

 Toys R Us di Australia menciptakan Perburuan Telur Paskah Virtual untuk pelanggan


mudanya. Dengan menggunakan meja komputer, seorang anak dapat mengikuti
Kelinci Paskah berkeliling toko mencari telur digital yang disembunyikan di sekitar
toko.

 IKEA menggunakan augmented reality untuk membantu pelanggan dengan visualisasi


AR tentang tampilan furnitur di ruang keluarga yang berbeda.

 Amazon View memungkinkan pembeli online melihat tampilan produk di rumah


mereka dengan mengeklik ikon kamera di aplikasi Amazon dan memilih produk di
seluruh kategori seperti furnitur, peralatan, peralatan dapur , dan dekorasi rumah.

 Google sedang menguji coba fitur augmented reality baru untuk Google Maps. Dalam
fitur baru ini, aplikasi mengambil lokasi seseorang melalui GPS dan menggunakan
data Street View untuk mempersempitnya ke lokasi persis pengguna. Itu kemudian
menampilkan panah besar dan arah di layar untuk diikuti pengguna .
 Bareburger memproyeksikan Burger Impossible tanpa daging baru mereka ke
piring virtual tamu mereka melalui aplikasi Snapchat di smartphone mereka
memungkinkan pelanggan Bareburger untuk melihat makan siang mereka sebelum
memesan.

Dashboards

Komponen utama dashboard adalah:

 Design Metode visualisasi dan keterangan deskriptif untuk menyampaikan informasi


sehingga dipahami dengan benar. Infografis banyak digunakan karena menyampaikan
informasi dengan cara yang menarik dan informatif.
 Performance metrics dan konten real-time lainnya ditampilkan di dasbor. Semua data
dasbor harus mencerminkan nilai saat ini dari setiap metrik.
 API API menghubungkan sumber data dan umpan yang berbeda untuk ditampilkan di
dasbor. Alternatifnya adalah pengguna atau IT memasukkan data secara manual ke
dashboard. Dasbor yang dibuat dengan cara ini cenderung gagal karena risiko data yang
tidak lengkap, usang, atau salah, yang membuat pengguna tidak percaya.
 Access Akses yang disukai adalah melalui browser Web yang aman dari perangkat seluler.

Dashboards are real time


Dashboards sering disalah artikan sebagai laporan yang terdiri dari berbagai pengukur, bagan, dan
dial, tetapi tujuan dasbor bisnis jauh lebih spesifik dan terarah. Tujuan dasbor adalah memberi
pengguna pandangan yang jelas tentang status KPI saat ini , peringatan waktu nyata, dan metrik
lain tentang operasi. Desain dasbor merupakan faktor penting karena pengguna bisnis harus
dapat memahami pentingnya informasi dasbor secara sekilas dan memiliki kemampuan untuk
menelusuri satu atau beberapa tingkat detail. Memiliki data waktu nyata, atau mendekati waktu
nyata, sangat penting untuk membuat pengguna mengetahui setiap perubahan yang berarti dalam
metrik saat terjadi untuk membuat keputusan secara waktu nyata dan segera mengambil tindakan
korektif. Sebagian besar dasbor saat ini bersifat interaktif.
Dasbor berfungsi dengan menghubungkan ke sistem bisnis, seperti perangkat lunak akuntansi,
ERP, CRM, SCM, sistem email, program analitik situs web, dan perangkat lunak manajemen
proyek melalui API.
Adding Value with digital Dashboard
Manfaat dasbor bisnis yang saling terkait adalah sebagai berikut:

1. Visibility Blind Spots diminimalkan atau dihilangkan. Ancaman dan peluang terdeteksi
sesegera mungkin.
2. Continuous Improvement Peringatan terkenal dari Peter Drucker adalah "jika Anda tidak
dapat mengukurnya, Anda tidak dapat memperbaikinya." Dasbor eksekutif dirancang
khusus untuk menampilkan metrik dan ukuran penting pengguna.
3. Single sign on dapat menghabiskan banyak waktu masuk ke berbagai sistem bisnis dan
menjalankan laporan. Dasbor sistem masuk tunggal menghemat waktu dan tenaga.
4. Deviations from whar was budgeted or planned Setiap metrik, seperti yang tercantum
dalam Tabel 11.3, dapat diprogram untuk menampilkan penyimpangan dari target,
seperti perbandingan aktual dan yang direncanakan atau dianggarkan.
5. Accountability Ketika karyawan mengetahui bahwa kinerja mereka dilacak hampir secara
waktu nyata dan dapat melihat hasilnya, mereka cenderung termotivasi untuk
meningkatkan kinerjanya.

Data Mashups for actionable Dashboard

Mashup data menggabungkan data bisnis dan aplikasi dari dua atau lebih sumber yang biasanya
merupakan campuran data internal dan aplikasi serta data yang bersumber secara eksternal, SaaS
(perangkat lunak sebagai layanan) dan konten Web untuk menciptakan pengalaman terintegrasi.
Mereka meningkatkan kemampuan interaktif dasbor, memungkinkan pengguna mendapatkan
wawasan baru, dan melihat tren dalam data dalam bisnis dari semua ukuran. Kemampuan mashup
perusahaan untuk menggabungkan data dan fungsionalitas dengan cepat dan mudah yang biasanya
tersebar di beberapa aplikasi, ke satu halaman Web atau layar perangkat seluler, menawarkan
peluang bisnis nyata bagi perusahaan dari segala bentuk dan ukuran di seluruh dunia..

Dalam lingkungan perusahaan, mashup dapat digunakan untuk memecahkan berbagai macam
masalah bisnis dan situasi sehari-hari. Contoh jenis mashup ini adalah sebagai berikut:

1. Customer Mashup data pelanggan yang menyediakan tampilan cepat data pelanggan
untuk staf penjualan dalam persiapan kunjungan situs pelanggan. Data dapat ditarik dari
penyimpanan data internal dan sumber Web, seperti informasi kontak, tautan ke situs
web terkait, pesanan pelanggan terkini, daftar situasi kritis, dan banyak lagi.
2. Logistics Mashup logistik yang menampilkan inventaris untuk sekelompok department
store berdasarkan kriteria tertentu. Misalnya, Anda dapat memadukan informasi badai saat
ini ke peta lokasi toko dan kemudian menyambungkan peta tersebut ke data inventaris
untuk menunjukkan toko mana yang terletak di jalur badai yang kekurangan generator.
3. Human resources Mashup SDM yang memberikan sekilas data karyawan seperti profil,
gaji, peringkat, status tunjangan, dan aktivitas. Data dapat difilter untuk menampilkan
tampilan khusus, misalnya, produk yang rata-rata penjualan kuartalannya lebih rendah dari
kuartal sebelumnya.

Enterprise Mashup Architecture


Gambar 6.17 menunjukkan arsitektur umum aplikasi mashup perusahaan. Data dari penyimpanan
data operasional, sistem bisnis, data eksternal (data ekonomi, pemasok; informasi, dan aktivitas
pesaing), dan umpan berita real-time terintegrasi untuk menghasilkan mashup perusahaan.

Adding Value with mashup

Mashup perusahaan meningkatkan efisiensi operasional, mengoptimalkan jalur penjualan,


meningkatkan kepuasan pelanggan, dan mendorong profitabilitas. Di dalam pemerintahan,
mashup berdampak positif pada area strategis seperti keterlibatan dan kepuasan warga negara,
transparansi keuangan, pengawasan proyek, kepatuhan terhadap peraturan, dan pelaporan yang
diatur undang-undang. Manfaat mashup dapat diringkas sebagai:

 Secara dramatis mengurangi waktu dan upaya yang diperlukan untuk menggabungkan
sumber data yang berbeda.
 Pengguna dapat menentukan mashup data mereka sendiri dengan menggabungkan
bidang dari sumber data berbeda yang sebelumnya tidak dimodelkan .
 Pengguna dapat mengimpor sumber data eksternal, misalnya spreadsheet dan data pesaing,
untuk membuat dasbor baru.
 Mengaktifkan pembuatan kueri kompleks oleh bukan pakar dengan alat pembuat kueri
seret dan lepas.

6.4 Metode dan teknik analisis data prediktif dan prespektif

Alat analitik data prediktif dan preskriptif yang paling umum adalah penambangan teks,
penambangan data spasial, regresi, pengoptimalan, dan pengambilan keputusan berbasis aturan,
serta pembelajaran mesin. Masing-masing dibahas selanjutnya.

Text mining adalah bentuk khusus dari penambangan data. Sementara penambangan data
terutama berfokus pada analisis data numerik terstruktur, penambangan teks menginterpretasikan
kata dan konsep dalam konteks. Ini sangat berguna dalam analitik prediktif karena saat ini
hingga 75% data organisasi terdiri dari dokumen tidak terstruktur, media sosial, pesan teks,
audio, video, gambar dan diagram, faks dan memo, call center atau catatan klaim, dll . Ketika
pelanggan mengekspresikan opini dan sikap secara bebas yang dilihat oleh jutaan pelanggan
perusahaan saat ini atau calon pelanggan di media sosial, penambangan teks membantu
perusahaan memasuki ledakan opini pelanggan online ini. Komentar sosial dan media sosial juga
sedang ditambang untuk sentiment analysis untuk memahami niat konsumen. Mengungkap
pendapat dan kekhawatiran pelanggan dan mitra dengan melacak dan menganalisis konten sosial
telah menjadi fokus utama banyak organisasi. Perusahaan yang inovatif tahu bahwa mereka
dapat lebih berhasil dalam memenuhi kebutuhan pelanggan mereka, jika mereka memahaminya
dengan lebih baik.
Sentiment analysis menggunakan pemrosesan bahasa alami, analisis teks, linguistik
komputasi, dan biometrik untuk secara sistematis mengidentifikasi, mengekstrak, dan mengukur
tahapan afektif dan informasi subjektif.

Text mining adalah proses memperoleh informasi berkualitas tinggi dari teks dibantu oleh
perangkat lunak yang dapat mengidentifikasi konsep, pola, topik, kata kunci , dan atribut lainnya
dalam data yang tidak terstruktur.

Metode dan teknik untuk menganalisis teks, dokumen, dan konten tidak terstruktur lainnya tersedia
dari beberapa vendor. Menggabungkan penambangan teks dengan penambangan data dapat
menciptakan nilai yang lebih besar lagi dengan menganalisis data terstruktur dan teks tidak
terstruktur dari sumber internal dan eksternal untuk memberikan pandangan terbaik tentang apa
yang akan terjadi.

Menambahkan Nilai dengan penambangan teks

Berikut adalah beberapa contoh jenis nilai bisnis yang telah dibuat oleh organisasi menggunakan
penambangan teks.

1. Mega-retailer Walmart ingin pembeli daringnya menemukan apa yang mereka cari
dengan lebih cepat. Walmart menganalisis data aliran klik dari 45 juta pembeli online
bulanannya; kemudian menggabungkan data tersebut dengan skor popularitas terkait
produk dan kategori. Skor popularitas dihasilkan oleh penambangan teks aliran media
sosial pengecer. Pelajaran dari analisis diintegrasikan ke dalam mesin pencari Polaris yang
digunakan oleh pelanggan di situs web perusahaan. Polaris telah menghasilkan
peningkatan 10% hingga 15% dalam pembeli online yang menyelesaikan pembelian, yang
setara dengan sekitar $1 miliar dalam penjualan online tambahan.
2. McDonald mengganti peralatan manual dengan analisis foto berkecepatan tinggi untuk
memeriksa ribuan roti per menit untuk warna , ukuran, dan distribusi biji wijen. Secara
otomatis, oven dan proses pemanggangan menyesuaikan secara instan untuk membuat
bakpao yang seragam dan mengurangi ribuan pon limbah setiap tahun. Perusahaan produk
makanan lain juga menggunakan analisis foto untuk menyortir setiap kentang goreng yang
diproduksi untuk mengoptimalkan kualitas.
3. Infinity Insurance menemukan wawasan baru yang diterapkan untuk meningkatkan
kinerja operasi penipuannya. Teks perusahaan asuransi menambang laporan adjuster
bertahun-tahun untuk mencari pendorong utama klaim penipuan. Akibatnya, perusahaan
mengurangi penipuan hingga 75%, dan menghilangkan pemasaran ke pelanggan dengan
kemungkinan klaim penipuan yang tinggi.
4. ADP Corporation adalah salah satu penyedia layanan penggajian terbesar di dunia yang
memproses data 33 juta pekerja. Saat ADP meluncurkan visualisasi data dengan analitik
prediktif untuk meningkatkan fungsi sumber daya manusia (SDM), mereka terkejut dengan
apa yang ditemukannya. Setelah mengatur informasi dan menyalurkannya melalui program
analisis, departemen SDM menemukan bahwa ADP akan segera menghadapi masalah
pensiun yang serius. Untuk memitigasi kesenjangan bakat di masa mendatang, ADP
membuat program pelatihan baru untuk mempersiapkan generasi pekerja berikutnya.

Organisasi berinvestasi dalam aplikasi penambangan teks karena mereka memiliki fitur dan
kemampuan melebihi yang ditawarkan oleh sistem lama mereka. Vendor Analytics menawarkan
segalanya mulai dari alat pelaporan yang mudah digunakan hingga perangkat lunak yang sangat
canggih untuk mengatasi masalah analisis data yang paling kompleks.

SPATIAL DATA MINING


Sistem informasi geografis (GIS) adalah alat berbasis komputer yang menangkap, menyimpan,
memanipulasi, menganalisis, dan memvisualisasikan data geografis pada peta. GIS bukan hanya
tentang pemetaan data, pemerintah, dunia usaha, dan individu merasakan manfaat GIS dalam
menyelesaikan permasalahan sehari-hari dengan menggunakan data geospasial.

GEOCORDING
Geocoding adalah proses membaca teks masukan seperti alamat dan mengubahnya menjadi
keluaran dalam bentuk koordinat lintang/bujur.

INFRASTRUCTURE AND LOCATION AWARE COLLECTION OF GEOSPATIAL


DATA
Infrastruktur yang dibutuhkan untuk mengumpulkan data geospasial terus berkembang. Seluler
dan Internet penyedia layanan, sensor, Google Earth, GPS, dan sistem RFID mengetahui
lokasi masing-masing pengguna atau objek yang terhubung. Foursquare, Google Maps, dan
aplikasi seluler lainnya mengandalkan GPS lokasi.
ADDING VALUE WITH SPATIAL DATA MINING
Alat GIS telah memberikan kontribusi yang signifikan terhadap pengambilan keputusan di
bidang keuangan, akuntansi, pemasaran, dan bidang bisnis lainnya. Aplikasi bisnis meliputi hal-
hal berikut:
 Analysts
dapat menunjukkan dengan tepat wilayah geografis di mana toko dengan kinerja tertinggi
berada didirikan.
 Retailers
dapat mempelajari bagaimana penjualan toko dipengaruhi oleh populasi atau
kedekatannya toko pesaing.
 A retail chain
dengan rencana untuk membuka seratus toko baru dapat menggunakan GIS untuk
mengidentifikasi yang relevan demografi, kedekatan dengan jalan raya, transportasi
umum, dan toko pesaing pilih opsi lokasi terbaik.
 Food and consumer products companies
dapat memetakan lokasi panggilan pengaduan, memungkinkan ketertelusuran produk jika
terjadi krisis atau penarikan kembali.
 Sales reps
mungkin lebih baik menargetkan kunjungan pelanggan mereka dengan menganalisis
geografi penjualan target.

REGRESSION MODELING
Dua jenis pemodelan regresi linier dan deret waktu sangat berguna dalam memprediksi perilaku
masa depan dan meresepkan wawasan yang dapat ditindaklanjuti. Pemodelan regresi linier
adalah digunakan untuk memprediksi nilai suatu variabel yang bergantung pada nilai satu atau
lebih variabel lainnya variabel. Variabel yang ingin diprediksi disebut variabel terikat. Variabel
yang Anda gunakan untuk memprediksi nilai variabel lain disebut independen (atau penjelas)
variabel. Regresi linier cocok dengan garis atau permukaan lurus yang meminimalkan perbedaan
antara nilai keluaran yang diprediksi dan aktual.
Regresi linier adalah metode statistik yang menganalisis dan menemukan hubungan antara
variabel terikat dan satu atau lebih variabel bebas (atau penjelas). Linier sederhana regresi
memiliki satu variabel penjelas. Regresi linier berganda memiliki dua atau lebih variabel
penjelas.

TIME-SERIES REGRESSION
Deret waktu adalah kumpulan nilai data dari waktu ke waktu. Regresi deret waktu adalah
dilakukan dengan memplot serangkaian titik data yang terdefinisi dengan baik dan mencoba
memprediksi apa yang akan terjadi berdasarkan pengukuran data pada interval waktu yang
konsisten selama a periode waktu tertentu, misalnya bulanan, triwulanan, atau tahunan. Garis
tren menunjukkan arah pergerakan suatu variabel seiring berjalannya waktu.
Model regresi deret waktu memperkirakan arah tren suatu variabel dari waktu ke waktu. Tiga
cara menganalisis data menggunakan regresi deret waktu adalah:
1. Tren rangkaian titik data yang naik, turun, atau tetap datar seiring berjalannya waktu
2. Tingkat Perubahan tingkat perubahan relatif antar titik data dari waktu ke waktu.
3. Siklus pola yang berulang secara teratur dalam data, seperti pada akhir kuartal saat
penjualan perwakilan biasanya menutup penjualan dan melihat apakah mereka
telah mencapai targetnya.
Deret waktu konstan adalah deret waktu yang nilai rata-rata deret waktu tersebut adalah konstan
lembur. Deret waktu yang sedang tren adalah deret waktu yang nilai rata-rata deret waktu
tersebut dapat berfluktuasi berdasarkan musim.

ADDING VALUE WITH REGRESSION


Optimalisasi keputusan adalah proses menghitung nilai variabel yang mengarah pada suatu nilai
optimal dari peristiwa yang diselidiki. Pengambilan keputusan berdasarkan aturan adalah
pengambilan keputusan yang membantu pemula dalam mengambil Keputusan seorang ahli.

ADDING VALUE WITH OPTIMIZATION AND RULES BASED DECISION MAKING


Pembelajaran mesin. Alat analisis data lain yang menjadi populer untuk digunakan oleh
perusahaan besar kumpulan data adalah pembelajaran mesin. Teknologi yang digunakan untuk
mengimplementasikan pembelajaran mesin adalah dikenal sebagai komputasi kognitif.
Komputasi kognitif adalah teknologi yang menggunakan algoritma pembelajaran mesin.

ADDING VALUE WITH MACHINE LEARNING


Pembelajaran mesin membantu organisasi mengidentifikasi gambar, mempersonalisasi
kampanye pemasaran, menganalisis genomik dan "mengarahkan" kendaraan otonom.
Pembelajaran mesin menciptakan model yang memberikan perkiraan yang akurat seperti
perkiraan permintaan, dan prediksi kegagalan peralatan memanipulasi input real-time dan data
historis. Empat tugas utama pembelajaran mesin menerapkan aturan yang diketahui untuk
mencakup:
• Mengkategorikan orang atau benda.
• Memprediksi kemungkinan hasil atau tindakan berdasarkan pola yang teridentifikasi.
• Mengidentifikasi pola dan hubungan yang sebelumnya tidak diketahui.
• Mendeteksi perilaku yang tidak terduga.

Anda mungkin juga menyukai