Anda di halaman 1dari 2

Business Analytics Session 4 GSLC

Nama Lengkap William Widjaya


NIM 2401960214
Kelas LB11

Data Modelling and Distribution Fitting

Distribution Fitting adalah pencocokan probability distribution terhadap data untuk


mengetahui distribusi yang sesuai dari data yang digunakan.

Dalam business analytics, sample data diperlukan untuk mendapat gambaran dan
pemahaman mengenai distribusi dari variabel tersebut. Untuk mendapat gambaran tersebut,
dapat dibuat histogram dan descriptive statistics. Namun penggunaan sample data ini
membatasi gambaran dari data tersebut secara menyeluruh, misalnya kejadian yang tidak
pasti diluar data sample.

Pendekatan yang lebih baik akan masalah tersebut adalah dengan mengidentifikasi
probability distribution dengan mencocokan teori distribusi kepada data dan memverifikasi
kecocokannya secara statistik.

Sebelum mencocokan data pada probability distribution, terdapat beberapa hal yang
dapat diamati seperti:

- Histogram data biasanya simetris dengan titik puncak di tengah, sementara data
eksponensial memiliki skew positif
- Mean dan median pada data yang terdistribusi umumnya memiliki nilai yang hampir
sama, sementara data yang terdistribusi eksponensial memiliki median lebih rendah
dari mean serta mean yang hampir sama dengan nilai standard deviation.
Gambar 1. Data dan Statistik Demand Passenger

Pada gambar 1 yang berisi data mengenai total penumpang dari 25 penerbangan,
terlihat bahwa distribusinya simetris disertai dengan nilai mean, median, dan mode yang
hampir sama, namun terdapat sedikit nilai skewness positif. Berdasarkan hal tersebut, sample
diatas dapat digunakan untuk mewakili berbagai variasi pada data populasi yang digunakan,
sehingga distribusi normal dari data tersebut tidak cocok untuk digunakan dalam membuat
model untuk analisis prediktif atau preskriptif.

Anda mungkin juga menyukai