RHEA.SM
PGPDSBA Online Sep_B 2021
1
Daftar isi
1. Masalah 1:......................................................................................................................................................
1.1. Objektif...........................................................................................................................................................
1.2. Analisis Data Deskriptif dan Eksploratif..........................................................................................................
1.2.1. Analisis Data Deskriptif:..........................................................................................................................
1.2.2. Data Deret Waktu- Diplot:......................................................................................................................
1.2.3. Analisis Data Eksplorasi:..........................................................................................................................
1.3. Pemisahan data Latih dan Uji.........................................................................................................................
1.4. Membangun model yang berbeda dan memeriksa RMSE............................................................................
1.4.1. Regresi linier:........................................................................................................................................
1.4.2. Model Naïve Bayes:..............................................................................................................................
1.4.3. Prakiraan Rata-Rata Sederhana:...........................................................................................................
1.4.4. Prakiraan Rata-Rata Bergerak:..............................................................................................................
1.4.5. Pemulusan Eksponensial Sederhana:....................................................................................................
1.4.6. Pemulusan Eksponensial Ganda:..........................................................................................................
1.4.7. Pemulusan Eksponensial Tiga Kali Lipat:...............................................................................................
1.4.8. Perataan Eksponensial Tiga Kali (Perkalian):.........................................................................................
1.5. Memeriksa Stasioneritas...............................................................................................................................
1.6. ARIMA dan SARIMA menggunakan metode AIC terendah:..........................................................................
1.7. ARIMA dan SARIMA berdasarkan titik potong ACF dan PACF:......................................................................
1.8. Membandingkan nilai RMSE.........................................................................................................................
1.9. Membangun model optimal dan perkiraan 12 bulan...................................................................................
1.10. Temuan dan Saran................................................................................................................................
2
Daftar Gambar
Gamba Nama Nomor
r No. halaman
Gamb Plot Time Series – Penjualan Sepatu 5
ar 1
Gamb Plot Kotak Bulanan Penjualan Sepatu 6
ar 2
Gamb Penjualan Sepatu Bulanan selama bertahun-tahun 6
ar 3
Gamb Time Series Plot bersama dengan Mean dan Median 6
ar 4
Gamb Dekomposisi multiplikatif dari kumpulan data 7
ar 5
Gamb Dekomposisi Aditif dari kumpulan data 8
ar 6
Gamb Penjualan Sepatu- Melatih dan Uji split 9
ar 7
Gamb Regresi linier 10
ar 8
Gamb Model Naïve Bayes 11
ar 9
Gamb Prakiraan Rata-Rata Sederhana 11
ar 10
Gamb Trailing Moving Average Forecast 12
ar 11
Gamb Pemulusan Eksponensial Tunggal 13
ar 12
Gamb Smoothing Eksponensial Tunggal dan Ganda 13
ar 13
Gamb Perataan Eksponensial Sederhana, Ganda, dan Tiga Kali Lipat 14
ar 14
Gamb Perataan Eksponensial Sederhana, Ganda, dan Tiga Kali (Perkalian) 14
ar 15
Gamb Stasioneritas Penjualan Sepatu pada lag 1 16
ar 16
Gamb AIC-ARIMA(2,1,3) A. Rangkuman, B. Grafik dan C. Diagnostik 18
ar 17
Gamb AIC- SARIMA(0,1,2) (1, 0, 2, 12) A. Rangkuman, B. Grafik dan C. Diagnostik 20
ar 18
Gamb Autokorelasi Data yang Dibedakan 21
ar 19
Gamb Autokorelasi Parsial dari Data yang Dibedakan 21
ar 20
Gamb ACF/PACF- ARIMA(3,1,1) A. Rangkuman, B. Grafik dan C. Diagnostik 22
ar 21
Gamb Gambar-22 ACF/PACF- SARIMA(3,1,1) (2, 0, 4, 12) A. Rangkuman, B. Grafik dan C. 24
ar 22
Diagnostik
Gamb Prakiraan Model Optimal untuk 12 bulan ke depan 25
3
ar 23
Daftar tabel
Tabel No. Nama Nomor
halaman
Tabel 1 Rangkuman informasi statistik deskriptif 4
Meja 2 Latih dan Tes Split 9
Tabel 3 Hasil Ringkasan dari semua model 24
1. Masalah 1:
1.1. Objektif
Tujuan masalahnya adalah untuk membangun model yang optimal, untuk meramalkan
penjualan sepasang sepatu untuk 12 bulan mendatang dari mana data saat ini berakhir.
Kami juga harus mengomentari model yang dibuat dan melaporkan temuan kami dan
menyarankan tindakan yang harus diambil perusahaan untuk penjualan di masa
mendatang.
Latar Belakang: Anda adalah seorang analis di perusahaan sepatu IJK dan Anda
diharapkan untuk meramalkan penjualan sepasang sepatu untuk 12 bulan mendatang
dari mana data berakhir. Data penjualan sepasang sepatu telah diberikan kepada
Anda dari Januari 1980 hingga Juli 1995.
Kamus data:
Tahun bulan: Bulan dan Tahun Penjualan Sepatu
Penjualan_Sepatu Penjualan sepatu bulanan
1.2.1. : Analisi
s Data Deskriptif:
Dataset telah dibaca dan disimpan sebagai kerangka data untuk analisis lebih
lanjut.
Kumpulan data yang disediakan terdiri dari total 2 kolom dan memiliki 187
entri yang bersifat numerik. Tidak ada nilai null yang ada.
Kolom pertama mewakili tanggal dimana Penjualan Sepatu telah dicatat.
Sedangkan kolom kedua mewakili Penjualan itu sendiri.
Tabel 1 berikut terdiri dari head(), tail(), info() dan deskripsi dataset yang
ada.
4
Kepala kumpulan data: Ekor set data: Info kumpulan data:
Jelaskan fungsi pada dataset: Tidak ada nilai null dalam kumpulan data.
Deret waktu adalah serangkaian pengukuran pada variabel yang sama yang
dikumpulkan dari waktu ke waktu. Pengukuran ini dilakukan pada interval
waktu yang teratur. Deret waktu adalah serangkaian titik data yang diindeks
dalam urutan waktu. Paling umum, deret waktu adalah urutan yang diambil
pada titik waktu yang berjarak sama secara berurutan. Jadi itu adalah urutan
data waktu-diskrit.
Kita dapat dengan jelas melihat tren tahunan penjualan sepatu pada
Gambar-1 di bawah ini. Grafik ini memberi kita ikhtisar data tanpa benar-
benar harus memeriksa setiap angka dalam kumpulan data.
5
Analisis Data Eksplorasi mengacu pada proses kritis dalam melakukan
penyelidikan awal pada data untuk menemukan pola, menemukan anomali,
dan menguji hipotesis.
Pada Gambar-2 berikut dapat dilihat Plot Kotak Bulanan Penjualan Sepatu.
Kita bisa melihat ada outlier yang hadir di bulan April dan Mei. Ini memberi
tahu kami bahwa ada beberapa penjualan yang dilakukan pada bulan-bulan
itu di luar biasanya.
Kami melihat bahwa penjualan cenderung meningkat pada paruh kedua
tahun ini lebih dari yang pertama. Desember mencatat penjualan sepatu
tertinggi.
Lonjakan itu mungkin karena musim liburan, dan mungkin sepatu sangat
populer dibeli dan digunakan baik untuk konsumsi sendiri atau tujuan
hadiah.
Kita bisa melihat tren bulanan dan tahunan yang ditampilkan pada Gambar-
3 . Sekali lagi menunjukkan kepada kita bahwa Desember adalah bulan
paling populer untuk Penjualan Sepatu serta tahun puncak penjualan antara
tahun 1986 dan 1988. Puncak ini mungkin karena minat yang meluas dan
banyak inovasi yang dilakukan untuk memikat pelanggan agar membeli
produk mereka, sehingga mendongkrak penjualan.
Gambar-4 menunjukkan kepada kita deret waktu yang diplot bersama
dengan nilai rata-rata dan median yang diplot di sepanjang grafik yang sama,
untuk mendapatkan pemahaman tentang fluktuasi data dari dua ukuran
tendensi sentral ini.
Selain itu karena rata-rata terbukti lebih tinggi dari median, mengarah pada
kesimpulan bahwa distribusinya miring secara positif.
6
Gambar-3 Penjualan Sepatu Bulanan selama bertahun-tahun
7
Gambar-5 Multiplicative Decomposition dari dataset
8
Gambar-6 Additive Decomposition dari dataset
Karena kami melihat perubahan dalam jumlah absolut untuk kumpulan data khusus
ini, kami melanjutkan dengan menggunakan model aditif.
Latih data Kepala set data: Data uji Kepala kumpulan data:
9
Latih data Ekor dari set data: Data uji Ekor dari kumpulan data:
10
Kami telah diminta untuk membuat berbagai model pemulusan eksponensial
pada data pelatihan dan mengevaluasi model menggunakan RMSE pada data
uji.
Kami juga membuat model lain seperti regresi linier, model perkiraan naif,
model rata-rata sederhana, dll. Dan memeriksa kinerja pada data uji
menggunakan RMSE.
Tujuan utama membangun begitu banyak model adalah untuk memastikan
kami memilih model optimal dengan nilai RMSE dan MAPE terendah.
MAPE adalah singkatan dari kesalahan persentase absolut rata-rata. Ini
adalah efek perkalian rata-rata antara setiap rata-rata estimasi dan hasil yang
diamati. RMSE adalah singkatan dari root mean squared error, yaitu standar
deviasi.
11
Gambar-9 Model Naïve Bayes
Nilai RMSE tampaknya paling rendah untuk Naïve Bayes sejauh ini. Namun
karena perkiraannya konstan selama bertahun-tahun, ini bukanlah model yang
ideal untuk kumpulan data kami.
Metodenya sangat sederhana. Kami rata-rata data berdasarkan bulan atau kuartal
atau tahun dan kemudian menghitung rata-rata untuk periode tersebut. Kami
kemudian melanjutkan untuk mencari tahu, berapa persentasenya terhadap rata-
rata keseluruhan.
12
Tipe model RMSE
Regresi Tepat Waktu 266.276
5
Model Naif 245.121
3
Model Rata-Rata Sederhana 63.9845
7
Moving Average Forecasting adalah teknik yang naif dan efektif dalam
peramalan deret waktu.
Menghitung rata-rata bergerak melibatkan pembuatan rangkaian baru di mana
nilainya terdiri dari rata-rata pengamatan mentah dalam rangkaian waktu asli.
Rata-rata bergerak mengharuskan Anda menentukan ukuran jendela yang
disebut lebar jendela. Ini menentukan jumlah pengamatan mentah yang
digunakan untuk menghitung nilai rata-rata bergerak. Kami telah
menggunakan metode rata-rata bergerak trailing.
13
Nilai RMSE tampaknya terendah untuk Metode Trailing Moving Average 2 poin
sejauh ini.
14
Gambar-13 Simple and Double Exponential Smoothening
15
Nilai alpha atau smoothening level pada grafik yang diplot adalah 0,571,
sedangkan beta atau smoothening trend adalah 0,0001 dan gamma atau
smoothening seasonal adalah 0,202.
Nilai RMSE tampaknya terendah untuk Metode Trailing Moving Average 2 poin
sejauh ini.
Uji Augmented Dickey-Fuller adalah uji akar unit yang menentukan apakah
ada akar unit dan selanjutnya apakah deret tersebut tidak stasioner.
Hipotesis dalam bentuk sederhana untuk uji ADF adalah:
H0: Seri Waktu memiliki akar unit dan karenanya tidak stasioner.
16
H1: Seri Waktu tidak memiliki akar unit dan dengan demikian
stasioner.
Kami ingin seri menjadi stasioner untuk membangun model ARIMA dan
dengan demikian kami ingin nilai p dari tes ini kurang dari nilai Alpha.
Ketika ADF diterapkan pada model kami mendapat nilai p 0,801 yang lebih
tinggi dari 0,5, sehingga kami gagal menolak hipotesis nol. Disimpulkan
bahwa deret tersebut tidak stasioner.
Kami sekarang harus melakukan perbedaan level pada dataset dan memeriksa
Stasioneritas.
Nilai p setelah pembedaan level 1 adalah 0,0361<0,05, oleh karena itu kami
sekarang menolak hipotesis nol dan menyimpulkan bahwa deret tersebut
stasioner dengan lag 1.
Di bawah ini adalah representasi grafis yang sama. Nilai statistik uji adalah -
3,532, sedangkan jumlah lag yang digunakan adalah 12.
Sekarang data sudah stasioner, kita dapat melanjutkan untuk membuat model
ARIMA dan SARIMA.
Model ARIMA terdiri dari bagian Auto-Regressive (AR) dan Moving Average (MA)
setelah kita membuat Time Series stasioner dengan mengambil derajat/urutan
perbedaan yang benar.
Model ARIMA dapat dibangun dengan mempertimbangkan Akaike Information
Criterion (AIC). Dalam hal ini, kami memilih nilai 'p' dan 'q' untuk menentukan
urutan AR dan MA yang memberi kami nilai AIC terendah. Turunkan AIC lebih baik
modelnya.
Bahasa pengkodean mencoba urutan 'p' dan 'q' yang berbeda untuk sampai pada
kesimpulan ini. Ingat, bahkan untuk cara memilih nilai 'p' dan 'q' seperti itu, kita harus
memastikan bahwa deret tersebut stasioner.
17
Rumus untuk menghitung AIC adalah 2k – 2ln(L), dimana k adalah jumlah parameter
yang akan diestimasi dan L adalah estimasi likelihood.
Untuk model SARIMA, kita juga dapat mengestimasi 'p', 'q' , 'P' dan 'Q' dengan
melihat nilai AIC terendah.
ARIMA:
i. Kami pertama-tama membuat kisi dari semua hasil yang mungkin (p,d,q).
Kisaran 'p' dan 'q' menjadi (0,4) dan 'd' konstanta = 1.
Model: (0, 1, 1)
Model: (0, 1, 2)
Model: (0, 1, 3)
Model: (1, 1, 0)
Model: (1, 1, 1)
Model: (1, 1, 2)
Model: (1, 1, 3)
Model: (2, 1, 0)
Model: (2, 1, 1)
Model: (2, 1, 2)
Model: (2, 1, 3)
Model: (3, 1, 0)
Model: (3, 1, 1)
Model: (3, 1, 2)
Model: (3, 1, 3)
param AIC
11 (2, 1, 3) 1480.805493
15 (3, 1, 3) 1482.566450
5 (1, 1, 1) 1492.487187
6 (1, 1, 2) 1494.423859
9 (2, 1, 1) 1494.431498
2 (0, 1, 2) 1494.964605
3 (0, 1, 3) 1495.148474
14 (3, 1, 2) 1495.655855
13 (3, 1, 1) 1496.346864
18
7 (1, 1, 3) 1496.385878
10 (2, 1, 2) 1496.410739
1 (0, 1, 1) 1497.050322
12 (3, 1, 0) 1498.930309
8 (2, 1, 0) 1498.950483
4 (1, 1, 0) 1501.643124
0 (0, 1, 0) 1508.283772
iii. AIC terendah untuk ARIMA jelas (2, 1, 3) dengan AIC 1480,80. Kami
sekarang menyesuaikan data kereta dengan model dan prakiraan pada set
pengujian. Dan kami mendapatkan Ringkasan ARIMA, grafik, dan hasil
diagnostik.
A.
B.
19
C.
SARIMA:
20
Model: (1, 1, 1)(1, 0, 1, 12)
Model: (1, 1, 2)(1, 0, 2, 12)
Model: (2, 1, 0)(2, 0, 0, 12)
Model: (2, 1, 1)(2, 0, 1, 12)
Model: (2, 1, 2)(2, 0, 2, 12)
iii. AIC terendah untuk SARIMA jelas (0, 1, 2) (1, 0, 2, 12) dengan AIC
1156.165429. Kami sekarang menyesuaikan data kereta dengan model dan
prakiraan pada set pengujian. Dan kami mendapatkan Ringkasan SARIMA,
grafik, dan hasil diagnostik. Hal ini dapat dilihat pada Gambar-18 di bawah
ini.
A.
21
B.
C.
1.7. ARIMA dan SARIMA berdasarkan titik potong ACF dan PACF:
Model ARIMA terdiri dari bagian Auto-Regressive (AR) dan Moving Average
(MA) setelah kita membuat Time Series stasioner dengan mengambil
derajat/urutan perbedaan yang benar.
Urutan AR dipilih dengan melihat di mana plot PACF cut-off (untuk pita interval
kepercayaan yang sesuai) dan urutan MA dipilih dengan melihat di mana plot
ACF cut-off (untuk pita interval kepercayaan yang sesuai).
Tingkat atau urutan perbedaan yang benar memberi kita nilai 'd' sedangkan nilai
'p' untuk urutan model AR dan nilai 'q' untuk urutan model MA.
Untuk SARIMA, parameter musiman 'F' dapat ditentukan dengan melihat plot
ACF. Plot ACF diharapkan menunjukkan lonjakan pada kelipatan 'F' sehingga
menunjukkan adanya musiman.
22
Selain itu, untuk model Musiman, plot ACF dan PACF akan berperilaku sedikit
berbeda dan tidak akan selalu terus menurun karena jumlah kelambatan
meningkat.
ARIMA:
i. Kita harus mengamati plot ACF dan PACF. Kami mendapatkan nilai 'p' dari
PACF dan nilai 'q' dari plot ACF. Berikut ini adalah plot pada d=1:
A.
23
B.
C.
i. Kita harus mengamati plot ACF dan PACF. Kami mendapatkan nilai 'p' dari
PACF dan nilai 'q' dari plot ACF. Dari plot di atas Gambar 19 dan 20 pada
d=1, frekuensi= 12. Kami juga menemukan P, D, Q dari plot di atas dengan
mencari puncak musiman.
A.
24
B.
C.
25
Gambar-22 ACF/PACF- SARIMA(3,1,1) (2, 0, 4, 12 ) A. Rangkuman, B. Grafik dan
C.Diagnostik
26
AIC-ARIMA(2,1,3) 184.648 85.73498
Penghalusan Eksponensial Sederhana 196.404
8
Model Naif 245.121
3
Penghalusan Eksponensial Ganda 266.161
2
Regresi Tepat Waktu 266.276
5
Kami melihat bahwa model terbaik dengan RMSE paling kecil di Trailing Moving
Average 2 poin, diikuti oleh semua rata-rata bergerak lainnya dan juga rata-rata
sederhana. Di tempat ke -6 kita melihat AIC-SARIMA(0, 1, 2)(1, 0, 2, 12).
Karena nilai RMSE tidak terlalu jauh dari posisi 1 sampai 6 untuk kemudahan
perhitungan dan prediktabilitas yang akurat, kami memilih AIC-SARIMA(0, 1, 2)(1,
0, 2, 12). Selain itu, model ARIMA lebih efisien secara komputasi dan memberikan
prediksi yang akurat.
Ini juga mempertimbangkan MAPE, dan merupakan ide bagus untuk memiliki lebih
dari satu parameter akurasi.
Pemulusan eksponensial di seluruh industri dan model ARIMA lebih populer dalam
hal pembuatan model. Sementara teknik pemulusan eksponensial tergantung pada
asumsi penurunan bobot eksponensial untuk data masa lalu dan ARIMA digunakan
dengan mengubah deret waktu menjadi deret stasioner dan mempelajari sifat deret
stasioner melalui ACF dan PACF dan kemudian memperhitungkan efek regresi
otomatis dan rata-rata bergerak. dalam deret waktu, jika ada.
Kami akan membangun model yang optimal dengan AIC-SARIMA(0, 1, 2)(1, 0, 2, 12)
sesuai penjelasan yang sudah diberikan di atas.
27
1.10. Temuan dan Saran
Kumpulan data berisi total 187 entri di antaranya 2 variabel. Kolom pertama
mewakili tanggal dimana Penjualan Sepatu telah dicatat. Sedangkan kolom
kedua mewakili Penjualan itu sendiri. Tidak ada nilai null dalam kumpulan
data.
Ada outlier hadir pada bulan April dan Mei. Ini memberi tahu kami bahwa
ada beberapa penjualan yang dilakukan pada bulan-bulan itu di luar
biasanya.
Penjualan cenderung meningkat pada paruh kedua tahun ini lebih dari yang
pertama. Desember mencatat penjualan sepatu tertinggi.
Lonjakan itu mungkin karena musim liburan, dan mungkin sepatu sangat
populer dibeli dan digunakan baik untuk konsumsi sendiri atau tujuan
hadiah.
Dalam tren bulanan dan tahunan, kami melihat bahwa Desember adalah
bulan paling populer untuk Penjualan Sepatu serta tahun puncak penjualan
antara tahun 1986 dan 1988. Puncak ini mungkin karena minat yang meluas
dan banyak inovasi yang dilakukan untuk memikat pelanggan agar membeli
produk mereka, sehingga meningkatkan penjualan.
Dari perkiraan kami melihat puncak yang jelas, menunjukkan penjualan yang
lebih baik dari tahun sebelumnya. Oleh karena itu, produsen harus
memastikan mereka memiliki cukup dan lebih dari tahun sebelumnya.
Perusahaan dapat mendongkrak penjualan lebih tinggi dari perkiraan jika
mereka fokus pada Periklanan dan meluncurkan jenis Sepatu baru yang unik.
Dengan diluncurkannya sepatu baru, mereka dapat memikat pelanggan dan
memikat mereka untuk berpikir bahwa mereka perlu membeli sepatu tersebut
karena merupakan salah satu dari jenisnya. Memberi produsen keuntungan
penggerak pertama.
Ini akan memastikan peningkatan penjualan untuk sementara dan kemudian
keputusan untuk menghentikan pembuatan jenis sepatu yang tidak begitu
populer dapat diambil juga. Ini akan membantu menghemat sumber daya
penting yang dapat digunakan di tempat lain.
Ada harapan lonjakan dari tahun ke tahun akan kembali memuncak, karena
sepatu adalah kebutuhan dan komoditas tidak akan pernah kehilangan arti
pentingnya.
28
29