Anda di halaman 1dari 58

PSSI - E

CH. 6
Business Intelligence, Data
Science, and Data Analytics
202050116 Andri Gunawan
202050171 Jenifer Lisnawati Hasim
202050172 Jessica Natalie
202050070 Jesica Sugito
202050091 Melvania Biyan
Business Intelligence and Data Science
Business Intelligence and Data Science

Bounded rationality adalah konsep dimana rasionalitas


terbatas oleh kemudahan pengambulan keputusan,
keterbatasan kognitif pikiran dan waktu yang tersedia untuk
membuat keputusan. Herbert Simon berkata bahwa
manager sering membuat keputusan yang memuaskan
(cukup baik namun tidak optimal) daripada keputusan yang
mengoptimalkan.
Three levels of data analytics
Descriptive
01 Membuat ringkasan data historis untuk
menghasilkan informasi yang berguna dan
mungkin menyiapkan data untuk analisis Predictive
yang lebih canggih di masa mendatang.

02 Proses menggunakan metode dan teknik


analitik data untuk memodelkan dan
membuat prediksi tentang peristiwa yang
tidak diketahui dari data.
Prescriptive
03 Untuk menemukan tindakan terbaik di antara
berbagai pilihan yang diberikan parameter
yang diketahui.
BI and Data Science

Business Data Science


intelligence
Bidang multi-diciplinary yang menggunakan
Seperangkat praktik, perangkat lunak, keahlian domain, metode ilmiah,
infrastruktur, dan alat terbaik untuk keterampilan pemrograman, algoritme, dan
memperoleh dan mengubah data mentah statistik untuk mengekstrak pengetahuan dari
yang sangat terstruktur menjadi wawasan kumpulan data besar terstruktur, semi-
yang dapat ditindaklanjuti untuk membantu terstruktur, dan tidak terstruktur untuk
manajer di semua tingkat organisasi membuat memprediksi perilaku masa depan dan
keputusan bisnis. menentukan tindakan.
Traditional and Modern BI
Traditional BI
Memberi para manajer "snapshot" yang mudah dipahami tentang apa
yang terjadi sekarang dan apa yang terjadi di masa lalu yang
membawa organisasi ke kondisi saat ini. Metode analisis ini relatif
tidak canggih yang menggunakan dasbor, mashup data, dan
visualisasi data.

Modern BI
Lebih fleksibel dan mudah diakses daripada BI tradisional.
Fokusnya adalah menyediakan analitik layanan mandiri interaktif
visual untuk meningkatkan kecepatan dan kualitas pengambilan
keputusan.
Finding and Hiring BI Professionals

• Saat ini kekurangan profesional BI yang


benar-benar memahami data besar.
Profesional BI : • Permintaan di masa depan diperkirakan
• Analis BI
akan lebih tinggi daripada saat ini.
• Pengembang BI
• Manajer BI
• Konsultan BI
• Analis bisnis.
Software to Support BI Professionals

7 Atribut utama perangkat lunak BI modern :


• Kecepatan
• Visualisasi
• Satu sumber kebenaran
• Kolaborasi real-time
• Tata kelola yang komprehensif
• Skalabilitas
• Mobilitas
Software to Support BI Professionals

Tableau Thoughtspot
Memungkinkan pengguna Memiliki antarmuka berbasis
bisnis untuk mengakses, pencarian yang mendukung
menyiapkan, menganalisis, dan pertanyaan kompleks dengan
menyajikan hasil kueri data analitik tambahan.

Microsoft Power BI Qlik


Menawarkan inferensi
Menawarkan persiapan data
terintegrasi untuk
yang mudah digunakan,
menggantikan query-based
penemuan data berbasis visual,
approach, yang memisahkan
dasbor interaktif, dan analitik
data dari konteksnya.
tambahan.
Data Science
Seven Stage Decision Science Lifecycle
Data Science

Data Science(ilmu data) : gabungan dari beberapa kedisiplinan STEM dan pengetahuan domain.
Menambah Nilai dengan Ilmu Data

Wawasan yang diperoleh melalui pendekatan ilmu data, kemudian dapat


mengarah pada keputusan bisnis.

Metode dan teknik ilmu data juga mengembangkan "produk data" seperti
yang dibuat oleh mesin rekomendasi yang memanfaatkan data pengguna
untuk membuat saran yang dipersonalisasi.

Data Product (Produk data) adalah fungsi teknis yang merangkum algoritme
dan dirancang untuk diintegrasikan langsung ke dalam aplikasi inti.
Perangkat Lunak untuk Mendukung Tim Ilmu Data
Bahasa pemrograman komputer yang paling umum digunakan yang mendasari solusi analitik data tingkat lanjut

Python R
bahasa pemrograman open source yang dapat
bahasa pemrograman berorientasi objek
diperluas yang berjalan pada platform
tingkat tinggi Windows, Macintosh, Unix, dan Linux

Apache Hadoop Apache Spark


bahasa sumber terbuka yang tidak menempatkan
menggunakan kumpulan data terdistribusi
kondisi pada struktur data yang dapat diproses dan
tangguh (RDD) dan tidak menyediakan sistem
mendistribusikan masalah komputasi di beberapa
server penyimpanan file terdistribusi
Perangkat Lunak untuk Mendukung Tim Ilmu Data
Para pemimpin dalam perangkat lunak analitik tingkat lanjut

SAS Visual Data Mining


Alteryx and Machine Learning Azure Databricks

Tibco Dataiku Mathworks


Learning Objectives (2 of 4)

Business
Intelligence
and Data
Science

Predictive and
Prescriptive Big Data and
Data Analytics Advanced
Methods Data
and Analytics
Techniques

Descriptive
Data
Analytics
Methods and
Techniques
Big Data

Big data adalah kumpulan data yang terlalu besar atau


kompleks untuk dianalisis menggunakan aplikasi
pemrosesan data tradisional.

Data Analytics (Analisis data) adalah proses pemeriksaan


kumpulan data untuk menarik kesimpulan tentang
informasi yang dikandungnya, biasanya dengan bantuan
perangkat lunak komputer.
The Four Vs of Big Data

Volume Variety Velocity


menarik sebagian besar data
menangani volume kecepatan data
terstruktur, semi-terstruktur,
besar "data besar" dan tidak terstruktur disimpan, dianalisis,
dan laporan dibuat

Human expertise and


Veracity
judgment
Data yang tidak lengkap, keahlian dan penilaian manusia
hilang atau terduplikasi harus ditambahkan ke dalam
perlu diperbaiki campuran saat menganalisis data
besar
Tujuan
Big Data
Big Data Challanges
Kultural
• Dorong unit bisnis untuk berbagi informasi di seluruh silo organisasi.
• Tentukan data internal dan eksternal, terstruktur dan tidak terstruktur apa yang akan digunakan untuk keputusan
bisnis yang berbeda.
• Temukan dan pekerjakan profesional ilmu data yang berpengalaman.
• Bangun kepercayaan tingkat tinggi antara tim ilmu data dan manajer fungsional.
• Dapatkan dukungan manajemen puncak untuk investasi dalam data besar dan pelatihan.
• Ciptakan cara optimal untuk mengatur program big data.
• Pahami di mana investasi big data harus difokuskan dalam organisasi.
• Tentukan cara menerapkan wawasan yang dibuat dari data besar.

Terkait teknologi
• Secara efektif menangani empat V data besar.
• Tentukan cara terbaik untuk menyajikan hasil analisis data
Predictive Data Analytics

Model prediktif didasarkan pada beberapa faktor yang


mungkin mempengaruhi perilaku masa depan dan
memprediksi pada tingkat kepercayaan tertentu hasil dari
suatu peristiwa.

Pemodelan prediktif adalah proses yang menggunakan


penambangan data dan probabilitas untuk meramalkan hasil
untuk membuat model statistik untuk memprediksi hasil.
STUDENT PROCESS
Sama seperti analitik prediktif

01
mengantisipasi apa yang akan
terjadi selanjutnya, analitik
preskriptif melangkah lebih jauh
untuk memberi tahu organisasi
03
cara bereaksi sebaik mungkin
berdasarkan prediksi
Analitik preskriptif menggunakan
teknologi pengoptimalan dan
Analitik preskriptif pembelajaran mesin untuk
adalah analitik data menyelesaikan keputusan kompleks

02
dengan menyarankan beberapa opsi
tingkat ketiga dan untuk memanfaatkan peluang di
paling kuat masa depan atau mengurangi risiko
dan hasil dari setiap opsi keputusan.
Alat Analisis Data
03 Deskriptif
4 Alat Analisis Data Deskriptif
Data Mining Data Visualization
Proses penggunaan perangkat lunak untuk

01 menganalisis data tidak terstruktur, semi-


terstruktur, dan terstruktur dari berbagai
perspektif, mengkategorikannya, dan
02 Penyajian data dalam format grafik untuk
memudahkan pengambil
memahami konsep yang sulit atau
keputusan

memperoleh korelasi atau pola di antara mengidentifikasi pola baru dalam data
bidang-bidang dalam data

Digital Dashboards Mashups

03 Elektronik statis atau interaktif antarmuka


yang digunakan untuk memperoleh dan
mengkonsolidasikan data di seluruh
04 Data mashup menggabungkan data bisnis dan
aplikasi dari dua atau lebih sumber

organisasi
Tambah Nilai dengan Data Mining
Nilai bisnis yang diperoleh organisasi dari penambangan data terbagi dalam tiga kategori:

Membuat keputusan Menemukan wawasan, Mengotomatisasi dan


yang lebih tepat pada pola, atau hubungan merampingkan atau
saat mereka perlu dibuat. yang tidak diketahui. mendigitalkan proses
bisnis.
Menambah Nilai melalui Pembelajaran, Eksplorasi, dan Penemuan dengan
Visualisasi Data

Visualisasi data memungkinkan pembelajaran dan juga


digunakan sebagai penjelajah data dan alat penemuan
data.
Penemuan data adalah proses penggunaan BI untuk
mengumpulkan data dari berbagai basis data dan
menggabungkannya menjadi satu sumber yang dapat
dengan mudah dan langsung dievaluasi.
Selain bagan, grafik, dan garis waktu, visualisasi data juga
menyertakan peta panas.
Peta panas adalah alat yang paling sering digunakan untuk
merepresentasikan data statistik yang kompleks dan
menggunakan spektrum warna hangat hingga dingin
untuk menunjukkan perbedaan dalam kelas data.
Augmented Reality (AR)
• Tingkat visualisasi data tertinggi yang tersedia saat ini
• Augmented Reality (AR) adalah penggunaan metode dan teknik visualisasi 3-D yang lebih
kontemporer untuk menggambarkan hubungan dalam data termasuk pemetaan cerdas, rutinitas
cerdas, pembelajaran mesin, dan pemrosesan bahasa alami. Beberapa kegunaan AR:
1. Coca-Cola telah mengembangkan aplikasi AR yang membantu pengecer dalam
memvisualisasikan bagaimana pendingin minuman akan masuk ke toko mereka.
2. IKEA menggunakan augmented reality untuk membantu pelanggan dengan visualisasi AR
tentang bagaimana furnitur akan terlihat di ruang tamu yang berbeda.
Dashboards

Sistem dasbor digital menggabungkan Dasbor meningkatkan integrasi informasi


beberapa visualisasi data ke dalam satu dengan mengumpulkan banyak sumber
layar untuk meningkatkan pelaporan data dan umpan data yang berbeda,
dan memfasilitasi operasi dan keputusan mengekstraksi fitur yang menarik, dan
bisnis yang lancar. memanipulasi data, sehingga informasi
dalam format yang lebih mudah diakses.
Komponen Utama Dasbor
Design Metrik kinerja
Metode visualisasi dan
keterangan deskriptif KPI dan konten waktu nyata
untuk menyampaikan lainnya ditampilkan di
informasi sehingga dasbor.
dipahami dengan benar.

API Akses
API menghubungkan Akses yang dipilih
sumber data dan feed adalah melalui browser
yang berbeda untuk Web yang aman dari
ditampilkan di dasbor. perangkat seluler.
Dasbor Adalah Waktu Nyata

• Tujuan dasbor adalah untuk memberi pengguna pandangan yang jelas


tentang status KPI saat ini, peringatan waktu nyata, dan metrik lainnya
tentang operasi.

• Desain dasbor merupakan faktor penting karena pengguna bisnis harus


dapat memahami pentingnya informasi dasbor secara sekilas dan
memiliki kemampuan untuk menelusuri satu atau lebih tingkat detail.

• Memiliki waktu nyata, atau mendekati waktu nyata, data sangat penting.
Menambah Nilai dengan Dasbor Digital

- Visibilitas. Bintik-bintik buta diminimalkan atau dihilangkan. Ancaman dan peluang terdeteksi sesegera
mungkin.

- Perbaikan terus-menerus. Dasbor eksekutif dirancang khusus untuk menampilkan metrik dan ukuran
kritis pengguna.

- Sistem masuk tunggal. Dasbor sistem masuk tunggal menghemat waktu dan tenaga.

- Penyimpangan dari apa yang dianggarkan atau direncanakan. Setiap metrik dapat diprogram untuk
menampilkan penyimpangan dari target, seperti perbandingan aktual dan yang direncanakan atau
dianggarkan.

- Akuntabilitas. Ketika karyawan mengetahui bahwa kinerja mereka dilacak hampir secara real time dan
dapat melihat hasilnya, mereka cenderung termotivasi untuk meningkatkan kinerja mereka.
Mashup Data untuk Dasbor yang Dapat Ditindaklanjuti

● Data mashup menggabungkan data bisnis dan aplikasi dari dua atau lebih sumber

● Mereka meningkatkan kemampuan interaktif dasbor, memungkinkan pengguna


untuk mendapatkan wawasan baru, dan melihat tren dalam data dalam bisnis dari
semua ukuran

● Mashup adalah solusi cepat dan hemat biaya untuk berbagai masalah analisis data

● Dengan mashup pengguna dapat memfilter data berdasarkan kebutuhannya


sehingga hanya informasi yang dibutuhkan yang disediakan oleh layanan data
yang tersedia

● Mashup tetap berada di belakang layar dan tidak terlihat karena data disajikan
seolah-olah berasal dari satu sumber
Menambah Nilai dengan Mashup
Manfaat mashup dapat diringkas sebagai:

Pengguna dapat menentukan mashup data


Secara dramatis mengurangi waktu dan upaya mereka sendiri dengan menggabungkan bidang
yang diperlukan untuk menggabungkan dari sumber data berbeda yang sebelumnya
sumber data yang berbeda. tidak dimodelkan.

Pengguna dapat mengimpor sumber data Memungkinkan pembuatan kueri kompleks


eksternal, misalnya, spreadsheet dan data oleh nonahli dengan alat pembuatan kueri
pesaing, untuk membuat dasbor baru. seret dan lepas.
Metode dan Teknik Analisis Data Deskriptif:
Pertanyaan

1. Mengapa penambangan data berharga bagi organisasi?


2. Bagaimana visualisasi data berkontribusi pada pembelajaran organisasi?
3. Bagaimana peta panas dan awan tag menyampaikan informasi?
4. Berikan dua contoh visualisasi data untuk manajemen kinerja
5. Menurut Anda mengapa dasbor harus dalam waktu nyata dan disesuaikan
untuk eksekutif atau manajer?
6. Apa manfaat dashboard?
7. Jelaskan mengapa manajer bisnis membutuhkan teknologi data mashup.
8. Apa tiga manfaat teknologi mashup bagi organisasi?
Learning objectives (4 of 4)
Business
Intelligence
and Data
Science

Predictive and Big Data


Prescriptive and
Data Analytics
Methods Advanced
and Data
Techniques Analytics

Descriptive
Data Analytics
Methods and
Techniques
Data Prediktif dan Preskriptif
Metode dan Teknik Analisis

Alat analisis data prediktif dan preskriptif yang paling umum adalah:

- Penambangan teks (Text mining)

- Penambangan data spasial (Spatial data mining)

- Regresi

- Pengoptimalan dan pengambilan keputusan berbasis aturan

- Pembelajaran mesin (Machine learning)


Penambangan Data (Text Mining)

● Penambangan teks adalah bentuk khusus dari penambangan data.

● Sementara penambangan data terutama berfokus pada analisis data numerik


terstruktur, penambangan teks menafsirkan kata-kata dan konsep dalam konteks.

● Komentar sosial dan media sosial juga sedang ditambang untuk analisis sentimen
guna memahami maksud konsumen.
Spatial Data Mining
● Sistem Informasi Geografis (GIS) dan perangkat lunak
penambangan data secara alami merupakan teknologi sinergis
● GIS menghubungkan data dengan geografi untuk memahami
apa yang termasuk di mana
● GIS bukan hanya tentang data pemetaan, pemerintah, bisnis,
dan individu menemukan GIS berguna dalam memecahkan
masalah sehari-hari menggunakan data geospasial.
Geocoding

MERCURY VENUS
Mercury is the closest planet Venus has a beautiful name
to the Sun and the smallest and is the second planet from
one the Sun
Adding Value with Spatial Data Mining

Analysts A retail chain Retailers


dapat menunjukkan dengan dengan rencana untuk dapat mempelajari
tepat area geografis di mana membuka seratus toko baru bagaimana penjualan toko
toko dengan kinerja dapat menggunakan GIS untuk dipengaruhi oleh populasi
tertinggi didirikan. mengidentifikasi demografi atau kedekatan dengan toko
yang relevan, kedekatan dengan pesaing
jalan raya, transportasi umum,
dan toko pesaing untuk memilih
opsi lokasi terbaik.
Adding Value with Spatial Data Mining

Food and consumer products


Sales reps
companies
dapat memetakan lokasi mungkin lebih baik
panggilan pengaduan, menargetkan kunjungan
memungkinkan keterlacakan pelanggan mereka dengan
produk jika terjadi krisis menganalisis geografi target
atau penarikan kembali. penjualan.
Regreesion Modeling : Linear Regression
• Linear Regression digunakan untuk memprediksi nilai suatu variabel
yang bergantung pada nilai satu atau lebih variabel lainnya.
• Variabel yang ingin Anda prediksi disebut variabel dependen. Variabel
yang Anda gunakan untuk memprediksi nilai variabel lain disebut
variabel independen (atau penjelas).
• Linear Regression cocok dengan garis lurus atau permukaan yang
meminimalkan perbedaan antara nilai keluaran yang diprediksi dan aktual
• Regression Linear digunakan untuk membuat keputusan berdasarkan
data daripada mengandalkan pengalaman dan intuisi
Regression Modeling: Time-Series Regression

Time Series Regression


dilakukan dengan
memplot serangkaian
titik data yang terdefinisi
dengan baik dan
Time Series adalah mencoba memprediksi Garis tren / Trend line
kumpulan nilai data dari apa yang akan terjadi menunjukkan arah
waktu ke waktu. padanya di masa depan pergerakan variabel
berdasarkan pengukuran seiring berjalannya
data pada interval waktu waktu
yang konsisten selama
periode waktu tertentu
Time-Series Regression
Tiga cara data dapat dianalisis menggunakan regresi deret waktu adalah:

02
01 03
Rate of Change adalah Cycles Regularly
tingkat perubahan relatif Repreating dalam data,
Trend Series titik data
antara titik data dari seperti pada akhir
naik, turun, atau tetap
waktu ke waktu. kuartal ketika
datar dari waktu ke
perwakilan penjualan
waktu
biasanya menutup
penjualan dan melihat
apakah mereka telah
mencapai target.
Decision Optimization and Rules-Based Decision-
Making

Optimization adalah Rules based decision


proses menghitung making adalah
nilai variabel yang pengambilan keputusan
mengarah ke nilai yang membantu
optimal dari kejadian pemula membuat
yang diselidiki. keputusan seperti
seorang ahli
Machine learning is scientific algorithms that identify
patterns in big data to learn from the data and create
insights based on the data.

Machine Cognitive computing is the technology that uses

Learning machine learning algorithms.

The four main tasks that machine learning applies


known rules to include:
Predicting likely Identifying
Detecting
Categorizing people outcomes or actions previously unknown
unexpected
or things. based on identified patterns and
behaviors.
patterns. relationships.

Anda mungkin juga menyukai