Disusun Oleh :
Bustika
Trisakti School Of
Management 2024
6.1 Business Intelligence and Data Science ( Kecerdasan Bisnis dan Ilmu Data )
Rasionalitas terikat ( Bounded Rationality ) adalah gagasan bahwa rasionalitas dibatasi oleh
kemudahan keputusan, keterbatasan kognitif pikiran dan waktu yang tersedia untuk membuat
keputusan.
Analitik data ( Data Analytics ) adalah salah satu cara agar pembuat keputusan dapat lebih mudah
mengoptimalkan keputusan mereka dengan mengurangi volume data yang sangat besar menjadi
data yang andal, akurat, dan tepat waktu dalam jumlah yang dapat dikelola yang disajikan
dengan cara yang mudah dipahami.
Data Driven Decision-Making with Data Analytics ( Pengambilan Keputusan Berbasis Data
dengan Analisis Data )
Ada tiga tingkat analitik data yang bervariasi dalam kompleksitas dan nilai tambah. Ketiga level
tersebut adalah analitik data deskriptif, prediktif, dan preskriptif.
1. Analitik data deskriptif ( Descriptive ) tujuannya yaitu membuat ringkasan data historis
untuk menghasilkan informasi yang berguna dan mungkin menyiapkan data untuk analisis
yang lebih canggih di masa mendatang.
2. Analitik data prediktif ( Predictive ) adalah proses menggunakan metode dan teknik
analisis data untuk memodelkan dan membuat prediksi tentang peristiwa yang tidak
diketahui dari data.
3. Analisis data preskriptif ( Prescriptive ) didedikasikan untuk menemukan tindakan terbaik
di antara berbagai pilihan dengan parameter yang diketahui
Kecerdasan bisnis ( BI /
Business Intelligence ) adalah serangkaian praktik terbaik, perangkat lunak, infrastruktur, dan alat
untuk memperoleh dan mengubah data mentah yang sangat terstruktur menjadi wawasan yang
dapat ditindaklanjuti untuk membantu manajer di semua tingkat organisasi membuat keputusan
bisnis yang tepat.
Ilmu data ( Data Science ) adalah bidang multidisiplin yang menggunakan keahlian domain,
metode ilmiah, keterampilan pemrograman, algoritme, dan statistik untuk mengekstraksi
pengetahuan dan wawasan dari kumpulan data besar terstruktur, semi-terstruktur, dan tidak
terstruktur untuk memprediksi perilaku masa depan dan menentukan tindakan.
Mashup data ( Data Mashup ) adalah integrasi dua atau lebih kumpulan data dari berbagai sistem
bisnis dan sumber eksternal tanpa bergantung pada langkah tengah ETL (ekstrak, ubah, dan muat)
ke gudang data atau bantuan dari TI.
Visualisasi data ( Data Visualization ) adalah proses merepresentasikan bisnis abstrak atau data
ilmiah sebagai gambar, diagram, grafik, atau animasi yang dapat membantu memahami makna
data.
Embedded BI adalah integrasi alat dan kemampuan analitik swalayan dalam aplikasi perangkat
lunak bisnis yang umum digunakan.
Adding Value with Traditional and Modern BI ( Menambah Nilai dengan BI Tradisional
dan Modern )
Perusahaan dan seluruh sektor industri menggunakan visualisasi data dan interaktivitas BI untuk
meningkatkan kecepatan dan kualitas pengambilan keputusan—sering kali dengan tampilan
seluler - dengan cara berikut :
1. Quick Detection and Decisions in Stock Markets ( Deteksi dan Keputusan Cepat di
Pasar Saham )
Perusahaan Wall Street, pedagang, manajer kekayaan, analis risiko, dan regulator
mengandalkan kemampuan mereka untuk memproses dan memanfaatkan anomali pasar
secara real time. Institusi keuangan tidak hanya membutuhkan visualisasi data, tetapi
eksekutif dan investor mereka juga mengharapkan kualitas dan kegembiraan visual untuk
memahami data keuangan yang kering, seperti solusi interpretasi visual real-time yang
mencerminkan peluang, risiko, dan perubahan pasar.
2. Prompt Disaster Response by the Insurance Industry ( Tanggapan Bencana yang
Cepat oleh Industri Asuransi )
Keefektifan tanggapan perusahaan asuransi terhadap badai dahsyat atau peristiwa bencana
lainnya bergantung pada kemampuannya menggabungkan data dalam jumlah besar untuk
sepenuhnya memahami dampaknya.
Pratt dan Fruhlinger (2019) menjelaskan bagaimana beberapa organisasi mendapat manfaat dari
penggunaan BI:
1. HelloFresh
Solusi BI menghemat waktu kerja tim analitik pemasaran 10–20 jam per hari dengan
mengotomatiskan proses pelaporan dan memberdayakan tim pemasaran yang lebih besar
untuk mengembangkan kampanye pemasaran digital individual regional berdasarkan
analisis agregat perilaku pelanggan.
2. REI
Meningkatkan tingkat keanggotaan dan kepuasan anggotanya dengan menganalisis tingkat
akuisisi, retensi, dan aktivasi dalam basis data keanggotaan koperasi mereka. Mereka
juga
meningkatkan metode pengiriman, manajemen siklus hidup anggota, dan penawaran
kategori produk dengan menganalisis segmentasi pelanggan.
3. Chipotle
Memiliki sumber data berbeda yang menghalangi tim untuk melihat tampilan terpadu
restorannya. Platform BI modern baru memungkinkan mereka membuat tampilan operasi
terpusat untuk melacak operasi restoran di tingkat nasional. Hal ini menghasilkan akses
staf yang lebih baik ke data dan kecepatan pengiriman laporan untuk proyek strategis
meningkat tiga kali lipat dari triwulan ke bulan dan menghemat ribuan jam kerja.
4. Sistem Sekolah Columbus Ohio ( Columbus Ohio School System )
Menggunakan alat BI untuk memeriksa berbagai titik data mulai dari tingkat kehadiran
siswa hingga kinerja siswa untuk meningkatkan pembelajaran siswa dan tingkat
kelulusan SMA.
Analitik buatan adalah penggunaan pembelajaran mesin dan AI pada alat BI untuk
mengotomatiskan persiapan data dan membantu pengguna menemukan dan berbagi wawasan.
Pembelajaran mesin adalah algoritme ilmiah yang mengidentifikasi pola dalam data besar untuk
dipelajari data dan menciptakan wawasan berdasarkan data.
Diharapkan hingga akhir tahun 2020, tugas pengelolaan data manual akan berkurang sebesar 45
persen atau lebih dari separuh sistem bisnis besar baru akan menggunakan data konteks dengan
nyata untuk meningkatkan pengambilan keputusan.
Menurut Gartner Magic Quadrant 2020 untuk BI dan Analytics (Gartner, 2020a), pemimpin saat
ini di bidang BI dan platform analisis data deskriptif adalah:
Microsoft Power BI menawarkan data yang mudah digunakan persiapan, penemuan
data berbasis visual, dasbor interaktif, dan analisis tambahan.Ini tersedia di tempat
sebagai penawaran SaaS dan menawarkan fungsionalitas AI/pembelajaran mesin dengan
wawasan yang sadar konteks.
Tableau memungkinkan pengguna bisnis mengakses, mempersiapkan, menganalisis dan
menyajikan hasil kueri data.Ini telah menambah analitik dan data kemampuan tata kelola
bersama dengan kueri bahasa alami dan wawasan otomatis.
Qlik menawarkan pengguna di semua tingkatan untuk menjalankan Qlik Associative.
Mesin-mesin inferensi yang terintegrasi untuk menggantikan pendekatan berbasis kueri,
yang memisahkan data dari konteksnya.Dengan menggunakan mesin inferensi, pengguna
dapat memasukkan input sebanyak-banyaknya tentang informasi yang mereka miliki,
dan perangkat lunak tidak hanya mencari informasi yang diberikan tetapi juga akan
membuat asosiasi dengan semua data relevan lainnya.
Thoughtspot memiliki antarmuka berbasis pencarian yang mendukung pertanyaan
kompleks dengan analitik yang ditingkatkan, termasuk crowdsourcing yang digerakkan
oleh AI, rekomendasi dan pemantauan otonom terhadap metrik bisnis.Ini juga memiliki
database opsi kueri untuk database Snowflake.
Ilmu data
Seringkali BI saja tidak cukup.Daripada hanya menggambarkan status utama data terstruktur
saat ini, ilmu data melampaui fungsi pelaporan BI dengan menggunakan metode ilmiah dan
pemodelan data untuk memprediksi perilaku di masa depan dan menentukan tindakan untuk
mengoptimalkan proses berdasarkan data tidak terstruktur, semi-terstruktur, dan
terstruktur.Biasanya, data historis digunakan untuk membangun model matematika berdasarkan
tren hal-hal penting. Dalam ilmu data, model tersebut kemudian digunakan pada data saat ini
untuk memprediksi apa yang akan terjadi selanjutnya dan menentukan tindakan yang harus
diambil untuk mendapatkan hasil yang optimal.Tujuan dari ilmu data adalah untuk menemukan
pola dan tren dalam kumpulan data besar yang mengarah pada solusi praktis untuk berpusat pada
data di masalah kehidupan nyata. Untuk melakukan hal ini, ilmuwan data menggabungkan
pemikiran kritis dan metode ilmiah dengan berbagai metode dan teknik data yang
memungkinkan mereka dengan mudah memahami dan memperoleh data nyata dan makna dari
data tersebut.
Sepanjang siklus hidupnya, ilmu data menggabungkan pengetahuan dari banyak disiplin ilmu
STEM termasuk matematika, statistika dan pemrograman komputer dan melengkapinya dengan
domain pengetahuan tentang topik yang menarik untuk digunakan ilmiah yang didukung secara
metode algoritmik.Masing-masing dibahas dalam Bagian 6.4.
Metode dan teknik ilmu data juga mengembangkan “produk data” seperti yang dibuat oleh
mesin rekomendasi yang memanfaatkan data pengguna untuk membuat saran yang
dipersonalisasi seperti item untuk membeli yang disajikan oleh Amazon, saran film dari Roku dan
tips musik dari Pandora.
Data Produk adalah fungsi teknis yang merangkum suatu algoritma dan dirancang untuk itu yang
terintegrasi langsung ke dalam aplikasi inti.
Misalnya, ilmu data diusulkan untuk mendorong industri otomotif di dunia di masa depan karena
banyaknya data besar yang dihasilkan oleh sensor seiring dengan perkembangan kendaraan yang
lebih otonom dan “produsen mobil tradisional akan bermitra dengan perusahaan non-otomotif
teknologi seperti Google, Apple, Uber, dan Lyft untuk memanfaatkan kekuatan mereka dan
meminimalkannya kelemahan bawaannya untuk menentukan arah pengembangan fitur
kendaraan”Sektor industri dan tugas bisnis lain yang dapat diterapkan oleh ilmu data termasuk:
Penerbangan, pemantauan 'kesehatan' pesawat secara real-time dengan memprediksi
kinerja minyak, bahan bakar, lepas landas dan mekanika pesawat secara umum.
Pemasaran, menghasilkan kupon di tempat penjualan berdasarkan profil pelanggan dan
perolehannya wawasan berharga tentang perilaku pelanggan, termasuk konten apa yang
ingin mereka baca di halaman web atau produk apa yang paling mungkin mereka beli
melalui produk yang dihasilkan secara ilmiah model data dan algoritma.
Layanan Keuangan, memperbarui portofolio risiko keuangan dalam hitungan
menit.Menilai risiko kredit melalui pemodelan data menggunakan pembelajaran mesin dan
alat kuantitatif.
Layanan Kesehatan, algoritme komputer sudah lebih baik daripada dokter manusia dalam
menganalisis gambar medis seperti CT atau PET scan dan MRI untuk mengidentifikasi
kelainan dengan lebih akurat.Kemampuan yang lebih besar untuk mengklasifikasikan
dan mengobati kanker dan efek pengobatan.Menggunakan deteksi pola algoritma untuk
mengidentifikasi asma dan COPD dengan mencatat dan menganalisis pasien bernapas dan
memberikan umpan balik secara real-time melalui aplikasi smartphone.
Energi, peramalan harga dan permintaan listrik.Model canggih memantau ketersediaan
pabrik, tren historis, musiman dan cuaca.
Manufaktur, memprediksi kegagalan mesin melalui pemantauan dan prediksi aplikasi
pemeliharaan untuk mengurangi waktu henti dan meminimalkan pemborosan.
Rantai Pasokan, mengidentifikasi peluang perbaikan di seluruh rantai pasokan dan
pengadaan hingga manajemen ketersediaan di dalam toko.
Manajemen Risiko, mendeteksi penipuan atau gangguan data sebelum mempengaruhi
operasi dan menganalisis risiko untuk peramalan investasi keuangan yang akurat.
Algoritma, perhotelan dan pariwisata yang banyak digunakan dalam pengelolaan
pendapatan, sistem di mana data tentang cuaca, popularitas penerbangan, kamar hotel
atau restoran atau bahkan preferensi selancar atau ski memengaruhi harga dan
ketersediaan secara real-time.
Perangkat lunak, law Legal AI dapat membaca dan memindai dokumen peradilan untuk
menemukan penyimpangan dan preseden.
Perangkat pintar dan kota, pengenalan gambar melalui kamera jarak jauh digunakan di
perangkat pintar, perangkat pengawasan dan pemantauan rumah dan analisis kota.
Membangun tim ilmu data
Setiap organisasi membutuhkan orang-orang yang dapat menganalisis dan menemukan wawasan
dalam data yang diambil dari berbagai sumber, termasuk transaksi pelanggan, aliran klik, sensor
IoT, media sosial, file log, dan plot GPS. Organisasi besar memiliki tim sains data tersendiri,
sedangkan di perusahaan kecil mungkin hanya ada satu orang yang memiliki keterampilan analitik
data yang diperlukan yang diperoleh melalui pendidikan formal atau “di pekerjaan."Sebagai
sebuah tim, anggotanya harus memiliki kombinasi keterampilan bisnis dan IT agar bisa
membangun jembatan dengan bisnis dengan menerapkan tingkat teknologi yang tepat untuk
masalah bisnis.
Pekerjaan ilmu data memiliki permintaan yang sangat tinggi. Dice.com menunjukkan jumlah
lowongan pekerjaan ilmu data di situs webnya telah meningkat sekitar 32% selama tahun 2019
dan memang.com menunjukkan peningkatan permintaan data scientist sebesar 29%.Ketika sebuah
referensi dibuat untuk pekerjaan ilmu data, orang langsung berpikir “ilmuwan data”, tapi tim
ilmu data pada umumnya terdiri dari beberapa orang yang masing-masing memiliki kelompok
berbeda keterampilan. Misalnya, ilmuwan data memerlukan keterampilan untuk membuka kunci
yang berharga dan wawasan prediktif untuk mempengaruhi keputusan bisnis dan memacu daya
saing, sementara data lainnya.Anggota tim sains pada dasarnya adalah seorang pemrogram komputer
dan yang lainnya adalah ahli statistik atau berfungsi sebagai penghubung antara IT dan bisnis
untuk memastikan kesesuaian untuk kebutuhan bisnis saat ini dan yang sedang berlangsung.
Pekerjaan Tugas pekerjaan Skill Contoh perusahaan
yang
memperkerjakan
Manajer data Mengelola tim ilmu Sistem database (SQL dan Coursera,
dan analisis data NoSQL), kepemimpinan dan Microsoft,
proyek, pengelolaan Slack, Motorola
antarpribadi komunikasi,
penambangan data dan
pemodelan prediktif
Ilmuwan data Membersihkan, Komputasi terdistribusi, Google, Microsoft
memijat, dan pemodelan prediktif, Adobe
mengatur data secara bercerita dan
besar-besaran memvisualisasikan statistika,
pembelajaran mesin
Analis data Kumpulkan, proses, Spreadsheet (Excel), SQL IBM, HP, DHL
dan lakukan analisis dan NoSQL database
data statistik
Arsitek data Membuat cetak biru Solusi gudang data, Visa, Coca-cola,
untuk diintegrasikan, pengetahuan mendalam Logitech
memusatkan, tentang arsitektur basis data,
melindungi, dan pemodelan data dan
memelihara data pengembangan sistem
sumber
Insiyur data Mengembangkan, SQL dan NoSQL, sistem Spotify, Amazon,
membangun, basis data, pemodelan data, Facebook
menguji dan API Data, gudang data solusi
mempertahankan
arsitektur
Administrator Pastikan database Cadangan dan pemulihan Tableau, Reddit,
data tersedia untuk semua pemodelan data dan Twitter
pengguna yang desain, SQL dan NoSQL,
berwenang dan sistem basis data dan
berfungsi keamanan data, ERP dan
baik dan aman pengetahuan bisnis
Ahli data Mengumpulkan, Teori statistik dan metode Linkedin, Johnson
statistika menganalisis, dan penambangan data dan and Johnson,
menafsirkan pembelajaran mesin, Pepsico
data kualitatif dan komputasi Hadoop, SQL dan
kuantitatif dengan NoSQL,
teori dan metode sistem basis data, alat awan
statistik ERP dan bisnis pengetahuan
Analis bisnis Meningkatkan proses Alat dasar (misalnya, Uber, Dell, Oracle
bisnis sebagai Microsoft Office), Visualisasi
perantara antara Data (misalnya, Tablo),
bisnis dan TI mendengarkan secara sadar
dan bercerita
pemahaman BI dan
pemodelan data
Namun, ini bukan hanya soal uang, sebagian besar ilmuwan data sangat menikmati apa yang
mereka lakukan.Pekerjaannya adalah menarik mencakup berbagai aspek organisasi dan dalam
beberapa kasus melibatkan menganalisis program penjangkauan masyarakat yang didukung
perusahaan.Menurut Greg Gordon, VP grup praktik Big Data di Kronos, penyedia solusi
manajemen tenaga kerja di cloud, menjadi ilmuwan data “bukan tentang duduk di ruangan
sepanjang hari, kita melakukan pekerjaan dan menerapkannya pada masalah pelanggan.Kami
bekerja dan berinteraksi dengan pelanggan setiap hari tentang masalah nyata, kemudian
mencoba mereplikasi, membuat model, dan menyelesaikannya.”
Contoh menarik tentang apa yang dilakukan seorang data scientist dapat ditemukan dengan
mempelajari Jonathan Goldman, orang yang mengubah LinkedIn.Pada saat Goldman bergabung,
LinkedIn telah bergabung karyawan kurang dari 8 juta anggota.Goldman memperhatikan bahwa
anggota yang ada mengundang anggota mereka teman dan kolega untuk bergabung, tetapi mereka
tidak menjalin hubungan dengan anggota lain di tingkat yang diharapkan oleh para
eksekutif.Seorang manajer LinkedIn berkata, “Rasanya seperti tiba di resepsi konferensi dan
menyadari bahwa anda tidak mengenal siapa pun.Jadi, kamu berdiri saja di pojok menyeruput
minumanmu dan kamu mungkin akan pulang lebih awal.”Goldman mulai menganalisis data dari
profil pengguna dan mencari pola untuk memprediksi di jaringan mana profil tertentu akan
digunakan.Meskipun sebagian besar manajer LinkedIn tidak melihat nilai dalam pekerjaan
Goldman, Reid Hoffman, salah satu pendiri dan CEO Linkedin pada saat itu, memahami kekuatan
analitik karena pengalamannya di PayPal.Dengan persetujuan Hoffman, Goldman menerapkan
metode dan teknik ilmu data untuk menguji apa yang akan terjadi jika anggota diberikan nama
anggota lain yang mereka miliki belum terhubung tetapi sepertinya tahu.Dia menampilkan tiga
pertandingan baru terbaik untuk setiap anggota berdasarkan profil LinkedIn-nya.Dalam beberapa
hari, rasio klik-tayang meningkat, pertandingan-pertandingan itu meroket dan segalanya benar-
benar meningkat.Berkat fitur yang satu ini, pertumbuhan Linkedin meningkat drastis.
Para ilmuwan data yang paling sukses dan banyak dicari, memiliki kombinasi antara keduanya
dalam keterampilan analitis, kecakapan teknis, dan ketajaman bisnis diperlukan untuk
menganalisis secara efektif kumpulan data yang sangat besar sambil berpikir kritis dan mengubah
asumsi dengan cepat, mengubah kecerdasan mentah menjadi wawasan yang ringkas dan dapat
ditindaklanjuti.
Contoh LinkedIn menunjukkan bahwa data scientist yang baik melakukan lebih dari sekadar
mencoba memecahkan masalah-masalah bisnis yang jelas.Berpikir kreatif dan kritis adalah bagian
dari pekerjaan mereka—yaitu, bagian analis dan artis bagian.Mereka menggali data yang masuk
dengan tujuan menemukan wawasan yang sebelumnya tersembunyi yang dapat menghasilkan
keunggulan kompetitif atau mendeteksi krisis bisnis dalam waktu yang cukup untuk
mencegahnya.Ilmuwan data sering kali perlu mengevaluasi dan memilihnya peluang dan ancaman
yang akan memberikan nilai terbesar bagi perusahaan atau merek.
R → bahasa pemrograman open source yang dapat diperluas yang berjalan pada platform
Windows, Macintosh, Unix, dan Linux. R menawarkan katalog lengkap metode statistik dan
grafis dan mencakup algoritma pembelajaran mesin, regresi linier dan deret waktu, serta
inferensi statistik. R adalah alternatif untuk paket statistik yang lebih tradisional seperti SPSS,
SAS, dan STATA.
Apache Hadoop → Hadoop adalah bahasa sumber terbuka yang tidak menempatkan
persyaratan pada struktur data yang dapat diprosesnya dan mendistribusikan masalah komputasi
ke beberapa server. Untuk menyimpan data, Hadoop menggunakan sistem file terdistribusinya
sendiri, Hadoop File System (HDFS). HDFS mudah diskalakan. Server dan mesin dapat
ditambahkan untuk mengakomodasi peningkatan volume data.
Apache Spark → menggunakan kumpulan data terdistribusi tangguh (RDD) dan tidak
menyediakan sistem penyimpanan file terdistribusi. Ini paling sering digunakan untuk
perhitungan dan meskipun dapat berjalan secara independen, ini juga dapat digunakan dengan
Hadoop karena membuat kumpulan data terdistribusi dari file yang disimpan di HDFS.
RDD/Resilient distributed dataset adalah kumpulan objek yang toleran terhadap kesalahan,
tidak dapat diubah, dan terdistribusi yang dapat diproses secara paralel di seluruh cluster.
Menggunakan bahasa pemrograman ini sebagai landasan, analisis data tingkat lanjut yang mudah
digunakan perangkat lunak ini dimaksudkan untuk digunakan oleh tim ilmu data yang terlatih
secara formal serta pengguna dan tim bisnis individu, terkadang disebut sebagai “Citizen data
scientics”.
Citizen data scientist adalah karyawan dalam organisasi yang dapat menggunakan metode dan
teknik analitik data lanjutan serta perangkat lunak untuk membuat model data tetapi belum dilatih
secara formal sebagai ilmuwan data.
Menurut 2020 Gartner Magic Quadrant for Data Science and Machine Learning Platforms
(Gartner, 2020b), pemimpin dalam perangkat lunak analitik tingkat lanjut adalah:
Alteryx → platform analitik end-to-end yang ramah pengguna yang memungkinkan
ilmuwan data dan analis untuk memecahkan masalah bisnis dengan cepat melalui
antarmuka visual swalayan yang intuitif dengan atau tanpa pengkodean. Alteryx
menemukan, menyiapkan, menganalisis, menyajikan, dan mengelola model analitik yang
dapat diterapkan dengan mengotomatiskan tugas data manual ke dalam alur kerja analitik
yang dapat diulang.
SAS Visual Data Mining and Machine Learning → menawarkan pemrosesan data
mentah end-to-end menjadi wawasan yang dapat ditindaklanjuti untuk memberdayakan
organisasi dalam memecahkan masalah analitik yang kompleks dan melihat hasil nyata
dengan cepat dan mudah. Ini memungkinkan anggota tim sains data dari semua tingkat
keterampilan untuk menangani tugas di sepanjang siklus hidup sains data.
Azure Databricks → layanan analitik berbasis Apache Spark yang cepat, mudah, dan
kolaboratif yang dioptimalkan untuk platform layanan cloud Microsoft Azure. Databrick
menawarkan ruang kerja interaktif yang memungkinkan kolaborasi antara ilmuwan data,
insinyur data, dan analis bisnis.
Tibco → kemampuan end-to-end yang kuat mulai dari manajemen data dan persiapan
hingga penyebaran dan produksi pada platform yang fleksibel dan terbuka yang dapat
mengintegrasikan model yang dikembangkan secara eksklusif menggunakan berbagai
kemampuan sumber terbuka. Agak lemah dalam augmented analytics.
Dataiku → adalah platform perangkat lunak ilmu data kolaboratif yang gesit dan fleksibel
untuk tim analis data, insinyur, dan ilmuwan data untuk mengaktifkan analitik data
swalayan dan mengoperasionalkan pembelajaran mesin. Dataiku menawarkan kepada
pemrogram kemampuan untuk membuat kode dalam Python, R, Spark, dll. dan ilmuwan
data warga dapat memilih antarmuka visual drag-and-drop yang dapat disesuaikan dalam
proses alur kerja prediktif dari persiapan data melalui analisis hingga pemodelan dan
presentasi.
Mathworks → sebuah platform yang terintegrasi penuh di mana semua metode dan teknik
baru terintegrasi dengan mulus dalam lingkungan yang direkayasa dengan hati-hati mulai
dari prapemrosesan data dan pengembangan model hingga produksi dan menawarkan
kemungkinan pembuatan kode secara otomatis.
Ketika kumpulan data terlalu besar atau kompleks untuk dianalisis menggunakan metode
tradisional disebut Big Data. Big data adalah faktor utama yang mendorong semakin
pentingnya hal ini analisis data tingkat lanjut saat ini. Semakin banyak manajer dan timnya
yang memanfaatkan data besar untuk membantu mendorong keberhasilan pengambilan
keputusan dan membantu fungsi pekerjaan penting.
Big data adalah kumpulan data yang terlalu besar atau kompleks untuk dianalisis
menggunakan aplikasi pemrosesan data tradisional.
Data analytics (Analisis data) adalah proses memeriksa kumpulan data untuk menarik
kesimpulan tentang informasi yang dikandungnya, biasanya dengan bantuan perangkat
lunak komputer.
The Four Vs of Big Data
Untuk menghasilkan nilai bisnis maksimal dari data besar, pertanyaan yang tepat harus
diajukan, dan tingkat analisis yang tepat dilakukan. Agar efektif dalam menganalisis data
secara efisien, organisasi harus memperhatikan empat sifat utama big data yang
membedakannya dari data yang dihasilkan organisasi sebelumnya.
1. Volume → Untuk menangani volume “big data” yang besar dan memberikan kemampuan
analitik yang komprehensif di platform big data.
2. Ragam (Variety) → Lingkungan analitik telah berkembang dari menarik data sebagian
besar data terstruktur dari gudang data perusahaan tunggal untuk menyertakan berbagai
sumber semi-terstruktur dan tidak terstruktur seperti posting media sosial, tweet, video,
gambar, data sensor, dan panggilan layanan pelanggan.
3. Velocity → Kecepatan data disimpan, dianalisis, dan dihasilkan laporan. Jika data tidak
diproses secara tepat waktu, mungkin data tersebut tidak lagi akurat atau berguna,
misalnya data pasar saham harus diperbarui secara real-time karena volatilitas pasar saham
seperti inventaris yang harus dilakukan agar pelanggan tidak kecewa. ketika barang yang
mereka pesan tidak dapat dikirimkan seperti yang dijanjikan.
4. Kebenaran (Veracity) → Data yang tidak lengkap, hilang atau terduplikasi perlu
diperbaiki. Volume dan variasi data yang besar berarti lebih banyak data kotor yang lebih
sulit ditangani. Jika analisis atau kumpulan data yang salah digunakan, hasilnya akan
menjadi omong kosong, seperti contoh pemenang Super Bowl dan kinerja pasar saham.
Dinyatakan sebaliknya, manajer membutuhkan konteks untuk memahami bagaimana
menafsirkan data tradisional dan besar.
Selain empat V, keahlian dan penilaian manusia (human expertise and judgment)
harus ditambahkan ke dalam campuran saat menganalisis big data. Data tidak berharga jika
tidak dapat dengan mudah dianalisis, ditafsirkan, dipahami, dan hasilnya diterapkan secara
efektif dalam konteks.
Kesalahan umum yang dilakukan organisasi adalah berinvestasi di landasan analitik seperti
kualitas data, integrasi data, dan alat analisis data namun mengabaikan komponen yang
paling penting, yaitu kemampuan pengguna untuk menginterpretasikan laporan visual.
Misalnya, salah satu tantangannya adalah bagaimana menampilkan hasil analisis data
dengan cara yang bermakna dan tidak membebani pengguna. Misalnya, mungkin perlu
menciutkan dan memadatkan hasil untuk menampilkan grafik dan bagan dengan cara yang
biasa dilihat oleh pembuat keputusan.
Hasil mungkin juga harus tersedia dengan cepat di perangkat seluler yang didukung oleh
berbagai sistem operasi, browser, dan antarmuka pengguna, dan pengguna mungkin ingin
dapat dengan mudah menjelajahi datanya sendiri secara waktu nyata.
Organisasi tidak hanya mengumpulkan dan menyimpan data besar. Mereka perlu
menggunakannya untuk mencapai tujuan bisnis. Sasaran umum lainnya yang terkait dengan adopsi
data besar meliputi:
Membangun budaya berbasis data.
Ciptakan cara baru untuk berinovasi dan mengganggu dengan teknologi.
Percepat kecepatan penawaran kemampuan dan layanan baru.
Luncurkan produk dan layanan baru.
Tingkatkan proses.
- Cultural (Kultural)
- Terkait teknologi
Analitik data tingkat lanjut (advanced data analytics) adalah pemeriksaan data
menggunakan metode dan teknik canggih untuk menemukan wawasan yang lebih dalam, membuat
prediksi, dan/atau menghasilkan rekomendasi.
Perbedaan utama antara hasil yang diberikan oleh analisis deskriptif BI dan metode serta teknik
analisis data prediktif dan preskriptif yang lebih canggih adalah
- bahwa BI menyajikan wawasan data melalui pelaporan, dasbor yang mudah digunakan, dan
visualisasi interaktif,
- edangkan analisis data prediktif dan preskriptif menggunakan algoritma. dan metode ilmiah
untuk menentukan hubungan antara data secara statistik dan membuat prediksi serta
memutuskan tindakan terbaik untuk membantu organisasi memenuhi harapan pelanggan,
meningkatkan kinerja secara keseluruhan, dan tetap kompetitif.
Model prediktif (predictive model) = didasarkan pada beberapa faktor yang mungkin
mempengaruhi perilaku masa depan dan memprediksi pada tingkat kepercayaan tertentu hasil dari
suatu peristiwa.
Pemodelan prediktif (Predictive modeling) = proses yang menggunakan data mining dan
probabilitas untuk meramalkan hasil untuk membuat model statistik untuk memprediksi hasil.
Predictive modeling :
Perusahaan yang telah melaporkan peningkatan laba yang signifikan dan kemampuan mereka
untuk bersaing sebagai hasil dari penggunaan model prediksi antara lain:
Amazon = merekomendasikan produk dan layanan kepada pengguna berdasarkan perilaku
mereka sebelumnya. Diperkirakan bahwa memprediksi pemodelan menyumbang sekitar 30%
dari semua penjualan Amazon.
Macy = menggabungkan perilaku penelusuran dalam kategori produk dan mengirimkan email
yang ditargetkan untuk setiap segmen pelanggan. Macy's mengalami peningkatan penjualan
online sebesar 8–12% dari upaya pemodelan prediktif mereka.
Sprint = secara signifikan mengurangi tingkat churn dan meningkatkan peringkat kepuasan
pelanggannya dengan mengidentifikasi pelanggan yang berisiko keluar dan secara proaktif
memberikan penawaran retensi yang dipersonalisasi menggunakan algoritme AI-power.
Prescriptive Data Analytics
Analitik preskriptif adalah analitik data tingkat ketiga dan yang paling kuat. Sama seperti
analitik prediktif mengantisipasi apa yang akan terjadi selanjutnya, analitik preskriptif
melangkah lebih jauh untuk memberi saran kepada organisasi bagaimana bereaksi dengan cara
terbaik berdasarkan prediksi.
Analisis preskriptif menggunakan teknologi pengoptimalan dan pembelajaran mesin untuk
menyelesaikan keputusan yang kompleks dengan menyarankan beberapa opsi untuk
memanfaatkan peluang di masa mendatang atau memitigasi risiko dan hasil dari setiap opsi
keputusan. Masalah tidak hanya diidentifikasi, tetapi juga diselesaikan, waktu dan biaya dapat
dihemat, dan keandalan serta efisiensi dapat ditingkatkan.
Beberapa contoh sektor industri yang berbeda dan cara mereka mendapatkan keuntungan dari
analitik preskriptif meliputi:
Ritel = meminimalkan churn pelanggan. Mengukur reaksi pelanggan terhadap tindakan
perusahaan. Mengoptimalkan penawaran produk; tingkat persediaan; kepuasan pelanggan
untuk meningkatkan retensi dan kepuasan pelanggan; meningkatkan keuntungan dan
mengurangi biaya.
Data visualization adalah penyajian data dalam format grafis untuk memudahkan pengambil
keputusan memahami konsep yang sulit atau mengidentifikasi pola baru dalam data.
Digital Dashboard adalah antarmuka elektronik statis atau interaktif yang digunakan untuk
memperoleh dan mengkonsolidasikan data di seluruh organisasi.
Data Mining digunakan sebagai langkah pertama dalam analitik data deskriptif untuk
mengidentifikasi pola yang sebelumnya tidak diketahui dalam data, yaitu, yang diketahui tidak
diketahui. Dengan menggunakan perangkat lunak penambangan data, sebuah organisasi dapat
dengan cepat dan mudah mengekstraksi informasi yang berguna dari sejumlah besar data dan
menyajikannya sebagai laporan kepada manajemen. Penambangan data dengan mudah menangani
data terstruktur seperti yang ditemukan di database atau sistem ERP.
Affinity analysis adalah teknik penambangan data yang menemukan hubungan kejadian
bersama di antara aktivitas yang dilakukan oleh individu atau kelompok tertentu.
Data visualization data telah menjadi alat yang sangat efektif bagi organisasi di seluruh dunia
untuk memperoleh pemahaman komprehensif tentang tren, permintaan pasar, dan perbaikan
proses yang diperlukan. Anda mungkin pernah mendengar ungkapan “Sebuah gambar bernilai
ribuan kata”—tampilan interaktif, bagan dengan kemampuan drill down, dan analisis geospatial
data melakukan hal itu.
Drill down adalah menelusuri sesuatu di komputer yang berpindah dari informasi umum ke
informasi yang lebih terperinci dengan berfokus pada sesuatu yang menarik, misalnya,
penjualan triwulanan—penjualan bulanan—penjualan harian.
Geospatial data adalah data yang memiliki komponen geografis eksplisit, mulai dari data
vektor dan raster hingga data tabular dengan lokasi situs.
Visualisasi data adalah cara yang cepat dan mudah untuk menyampaikan konsep secara
universal—dan Anda dapat bereksperimen dengan berbagai skenario dengan membuat sedikit
penyesuaian.
Beberapa aplikasi bisnis yang berguna untuk visualisasi data adalah sebagai berikut:
Mengidentifikasi area yang membutuhkan perhatian atau perbaikan.
Mengklarifikasi faktor apa saja yang mempengaruhi perilaku pelanggan .
Membantu memahami produk mana yang harus ditempatkan di mana .
Memprediksi volume penjualan berdasarkan lokasi.
Adding value throught learning, exploration, and discovery with data visualization
Data discovery adalah proses penggunaan BI untuk mengumpulkan data dari berbagai database
dan menggabungkannya menjadi satu sumber yang dapat dievaluasi dengan mudah dan cepat.
Heat maps Selain diagram, grafik, dan garis waktu, visualisasi data juga menyertakan peta panas.
Peta panas adalah alat yang paling banyak digunakan untuk merepresentasikan data statistik
kompleks dan menggunakan spektrum warna hangat ke dingin untuk menunjukkan perbedaan
dalam kelas data.
Augmented Reality (AR) Tingkat visualisasi data tertinggi yang tersedia saat ini adalah
augmented reality (AR) yang memadatkan data menjadi grafik atau bagan yang mudah dicerna
yang dapat diproyeksikan secara visual dengan teknologi AR untuk melibatkan pengguna
sepenuhnya. Beberapa penggunaan augmented reality meliputi:
augmented reality (AR) adalah penggunaan metode dan teknik visualisasi 3-D yang lebih
kontemporer untuk mengilustrasikan hubungan dalam data termasuk pemetaan cerdas, rutinitas
cerdas, pembelajaran mesin, dan pemrosesan bahasa alami.
Coca-Cola telah mengembangkan aplikasi AR yang membantu pengecer
memvisualisasikan bagaimana pendingin minuman cocok dengan toko
mereka.
Google sedang menguji coba fitur augmented reality baru untuk Google Maps. Dalam
fitur baru ini, aplikasi mengambil lokasi seseorang melalui GPS dan menggunakan
data Street View untuk mempersempitnya ke lokasi persis pengguna. Itu kemudian
menampilkan panah besar dan arah di layar untuk diikuti pengguna .
Bareburger memproyeksikan Burger Impossible tanpa daging baru mereka ke
piring virtual tamu mereka melalui aplikasi Snapchat di smartphone mereka
memungkinkan pelanggan Bareburger untuk melihat makan siang mereka sebelum
memesan.
Dashboards
1. Visibility Blind Spots diminimalkan atau dihilangkan. Ancaman dan peluang terdeteksi
sesegera mungkin.
2. Continuous Improvement Peringatan terkenal dari Peter Drucker adalah "jika Anda tidak
dapat mengukurnya, Anda tidak dapat memperbaikinya." Dasbor eksekutif dirancang
khusus untuk menampilkan metrik dan ukuran penting pengguna.
3. Single sign on dapat menghabiskan banyak waktu masuk ke berbagai sistem bisnis dan
menjalankan laporan. Dasbor sistem masuk tunggal menghemat waktu dan tenaga.
4. Deviations from whar was budgeted or planned Setiap metrik, seperti yang tercantum
dalam Tabel 11.3, dapat diprogram untuk menampilkan penyimpangan dari target,
seperti perbandingan aktual dan yang direncanakan atau dianggarkan.
5. Accountability Ketika karyawan mengetahui bahwa kinerja mereka dilacak hampir secara
waktu nyata dan dapat melihat hasilnya, mereka cenderung termotivasi untuk
meningkatkan kinerjanya.
Mashup data menggabungkan data bisnis dan aplikasi dari dua atau lebih sumber yang biasanya
merupakan campuran data internal dan aplikasi serta data yang bersumber secara eksternal, SaaS
(perangkat lunak sebagai layanan) dan konten Web untuk menciptakan pengalaman terintegrasi.
Mereka meningkatkan kemampuan interaktif dasbor, memungkinkan pengguna mendapatkan
wawasan baru, dan melihat tren dalam data dalam bisnis dari semua ukuran. Kemampuan mashup
perusahaan untuk menggabungkan data dan fungsionalitas dengan cepat dan mudah yang biasanya
tersebar di beberapa aplikasi, ke satu halaman Web atau layar perangkat seluler, menawarkan
peluang bisnis nyata bagi perusahaan dari segala bentuk dan ukuran di seluruh dunia..
Dalam lingkungan perusahaan, mashup dapat digunakan untuk memecahkan berbagai macam
masalah bisnis dan situasi sehari-hari. Contoh jenis mashup ini adalah sebagai berikut:
1. Customer Mashup data pelanggan yang menyediakan tampilan cepat data pelanggan
untuk staf penjualan dalam persiapan kunjungan situs pelanggan. Data dapat ditarik dari
penyimpanan data internal dan sumber Web, seperti informasi kontak, tautan ke situs
web terkait, pesanan pelanggan terkini, daftar situasi kritis, dan banyak lagi.
2. Logistics Mashup logistik yang menampilkan inventaris untuk sekelompok department
store berdasarkan kriteria tertentu. Misalnya, Anda dapat memadukan informasi badai saat
ini ke peta lokasi toko dan kemudian menyambungkan peta tersebut ke data inventaris
untuk menunjukkan toko mana yang terletak di jalur badai yang kekurangan generator.
3. Human resources Mashup SDM yang memberikan sekilas data karyawan seperti profil,
gaji, peringkat, status tunjangan, dan aktivitas. Data dapat difilter untuk menampilkan
tampilan khusus, misalnya, produk yang rata-rata penjualan kuartalannya lebih rendah dari
kuartal sebelumnya.
Secara dramatis mengurangi waktu dan upaya yang diperlukan untuk menggabungkan
sumber data yang berbeda.
Pengguna dapat menentukan mashup data mereka sendiri dengan menggabungkan
bidang dari sumber data berbeda yang sebelumnya tidak dimodelkan .
Pengguna dapat mengimpor sumber data eksternal, misalnya spreadsheet dan data pesaing,
untuk membuat dasbor baru.
Mengaktifkan pembuatan kueri kompleks oleh bukan pakar dengan alat pembuat kueri
seret dan lepas.
Alat analitik data prediktif dan preskriptif yang paling umum adalah penambangan teks,
penambangan data spasial, regresi, pengoptimalan, dan pengambilan keputusan berbasis aturan,
serta pembelajaran mesin. Masing-masing dibahas selanjutnya.
Text mining adalah bentuk khusus dari penambangan data. Sementara penambangan data
terutama berfokus pada analisis data numerik terstruktur, penambangan teks menginterpretasikan
kata dan konsep dalam konteks. Ini sangat berguna dalam analitik prediktif karena saat ini
hingga 75% data organisasi terdiri dari dokumen tidak terstruktur, media sosial, pesan teks,
audio, video, gambar dan diagram, faks dan memo, call center atau catatan klaim, dll . Ketika
pelanggan mengekspresikan opini dan sikap secara bebas yang dilihat oleh jutaan pelanggan
perusahaan saat ini atau calon pelanggan di media sosial, penambangan teks membantu
perusahaan memasuki ledakan opini pelanggan online ini. Komentar sosial dan media sosial juga
sedang ditambang untuk sentiment analysis untuk memahami niat konsumen. Mengungkap
pendapat dan kekhawatiran pelanggan dan mitra dengan melacak dan menganalisis konten sosial
telah menjadi fokus utama banyak organisasi. Perusahaan yang inovatif tahu bahwa mereka
dapat lebih berhasil dalam memenuhi kebutuhan pelanggan mereka, jika mereka memahaminya
dengan lebih baik.
Sentiment analysis menggunakan pemrosesan bahasa alami, analisis teks, linguistik
komputasi, dan biometrik untuk secara sistematis mengidentifikasi, mengekstrak, dan mengukur
tahapan afektif dan informasi subjektif.
Text mining adalah proses memperoleh informasi berkualitas tinggi dari teks dibantu oleh
perangkat lunak yang dapat mengidentifikasi konsep, pola, topik, kata kunci , dan atribut lainnya
dalam data yang tidak terstruktur.
Metode dan teknik untuk menganalisis teks, dokumen, dan konten tidak terstruktur lainnya tersedia
dari beberapa vendor. Menggabungkan penambangan teks dengan penambangan data dapat
menciptakan nilai yang lebih besar lagi dengan menganalisis data terstruktur dan teks tidak
terstruktur dari sumber internal dan eksternal untuk memberikan pandangan terbaik tentang apa
yang akan terjadi.
Berikut adalah beberapa contoh jenis nilai bisnis yang telah dibuat oleh organisasi menggunakan
penambangan teks.
1. Mega-retailer Walmart ingin pembeli daringnya menemukan apa yang mereka cari
dengan lebih cepat. Walmart menganalisis data aliran klik dari 45 juta pembeli online
bulanannya; kemudian menggabungkan data tersebut dengan skor popularitas terkait
produk dan kategori. Skor popularitas dihasilkan oleh penambangan teks aliran media
sosial pengecer. Pelajaran dari analisis diintegrasikan ke dalam mesin pencari Polaris yang
digunakan oleh pelanggan di situs web perusahaan. Polaris telah menghasilkan
peningkatan 10% hingga 15% dalam pembeli online yang menyelesaikan pembelian, yang
setara dengan sekitar $1 miliar dalam penjualan online tambahan.
2. McDonald mengganti peralatan manual dengan analisis foto berkecepatan tinggi untuk
memeriksa ribuan roti per menit untuk warna , ukuran, dan distribusi biji wijen. Secara
otomatis, oven dan proses pemanggangan menyesuaikan secara instan untuk membuat
bakpao yang seragam dan mengurangi ribuan pon limbah setiap tahun. Perusahaan produk
makanan lain juga menggunakan analisis foto untuk menyortir setiap kentang goreng yang
diproduksi untuk mengoptimalkan kualitas.
3. Infinity Insurance menemukan wawasan baru yang diterapkan untuk meningkatkan
kinerja operasi penipuannya. Teks perusahaan asuransi menambang laporan adjuster
bertahun-tahun untuk mencari pendorong utama klaim penipuan. Akibatnya, perusahaan
mengurangi penipuan hingga 75%, dan menghilangkan pemasaran ke pelanggan dengan
kemungkinan klaim penipuan yang tinggi.
4. ADP Corporation adalah salah satu penyedia layanan penggajian terbesar di dunia yang
memproses data 33 juta pekerja. Saat ADP meluncurkan visualisasi data dengan analitik
prediktif untuk meningkatkan fungsi sumber daya manusia (SDM), mereka terkejut dengan
apa yang ditemukannya. Setelah mengatur informasi dan menyalurkannya melalui program
analisis, departemen SDM menemukan bahwa ADP akan segera menghadapi masalah
pensiun yang serius. Untuk memitigasi kesenjangan bakat di masa mendatang, ADP
membuat program pelatihan baru untuk mempersiapkan generasi pekerja berikutnya.
Organisasi berinvestasi dalam aplikasi penambangan teks karena mereka memiliki fitur dan
kemampuan melebihi yang ditawarkan oleh sistem lama mereka. Vendor Analytics menawarkan
segalanya mulai dari alat pelaporan yang mudah digunakan hingga perangkat lunak yang sangat
canggih untuk mengatasi masalah analisis data yang paling kompleks.
GEOCORDING
Geocoding adalah proses membaca teks masukan seperti alamat dan mengubahnya menjadi
keluaran dalam bentuk koordinat lintang/bujur.
REGRESSION MODELING
Dua jenis pemodelan regresi linier dan deret waktu sangat berguna dalam memprediksi perilaku
masa depan dan meresepkan wawasan yang dapat ditindaklanjuti. Pemodelan regresi linier
adalah digunakan untuk memprediksi nilai suatu variabel yang bergantung pada nilai satu atau
lebih variabel lainnya variabel. Variabel yang ingin diprediksi disebut variabel terikat. Variabel
yang Anda gunakan untuk memprediksi nilai variabel lain disebut independen (atau penjelas)
variabel. Regresi linier cocok dengan garis atau permukaan lurus yang meminimalkan perbedaan
antara nilai keluaran yang diprediksi dan aktual.
Regresi linier adalah metode statistik yang menganalisis dan menemukan hubungan antara
variabel terikat dan satu atau lebih variabel bebas (atau penjelas). Linier sederhana regresi
memiliki satu variabel penjelas. Regresi linier berganda memiliki dua atau lebih variabel
penjelas.
TIME-SERIES REGRESSION
Deret waktu adalah kumpulan nilai data dari waktu ke waktu. Regresi deret waktu adalah
dilakukan dengan memplot serangkaian titik data yang terdefinisi dengan baik dan mencoba
memprediksi apa yang akan terjadi berdasarkan pengukuran data pada interval waktu yang
konsisten selama a periode waktu tertentu, misalnya bulanan, triwulanan, atau tahunan. Garis
tren menunjukkan arah pergerakan suatu variabel seiring berjalannya waktu.
Model regresi deret waktu memperkirakan arah tren suatu variabel dari waktu ke waktu. Tiga
cara menganalisis data menggunakan regresi deret waktu adalah:
1. Tren rangkaian titik data yang naik, turun, atau tetap datar seiring berjalannya waktu
2. Tingkat Perubahan tingkat perubahan relatif antar titik data dari waktu ke waktu.
3. Siklus pola yang berulang secara teratur dalam data, seperti pada akhir kuartal saat
penjualan perwakilan biasanya menutup penjualan dan melihat apakah mereka
telah mencapai targetnya.
Deret waktu konstan adalah deret waktu yang nilai rata-rata deret waktu tersebut adalah konstan
lembur. Deret waktu yang sedang tren adalah deret waktu yang nilai rata-rata deret waktu
tersebut dapat berfluktuasi berdasarkan musim.