Anda di halaman 1dari 29

PROYEK YANG DIPERPANJANG

PERAMALAN RANGKAIAN WAKTU

PENJUALAN SEPATU - LAPORAN BISNIS

RHEA.SM
PGPDSBA Online Sep_B 2021

1
Daftar isi

1. Masalah 1:......................................................................................................................................................
1.1. Objektif...........................................................................................................................................................
1.2. Analisis Data Deskriptif dan Eksploratif..........................................................................................................
1.2.1. Analisis Data Deskriptif:..........................................................................................................................
1.2.2. Data Deret Waktu- Diplot:......................................................................................................................
1.2.3. Analisis Data Eksplorasi:..........................................................................................................................
1.3. Pemisahan data Latih dan Uji.........................................................................................................................
1.4. Membangun model yang berbeda dan memeriksa RMSE............................................................................
1.4.1. Regresi linier:........................................................................................................................................
1.4.2. Model Naïve Bayes:..............................................................................................................................
1.4.3. Prakiraan Rata-Rata Sederhana:...........................................................................................................
1.4.4. Prakiraan Rata-Rata Bergerak:..............................................................................................................
1.4.5. Pemulusan Eksponensial Sederhana:....................................................................................................
1.4.6. Pemulusan Eksponensial Ganda:..........................................................................................................
1.4.7. Pemulusan Eksponensial Tiga Kali Lipat:...............................................................................................
1.4.8. Perataan Eksponensial Tiga Kali (Perkalian):.........................................................................................
1.5. Memeriksa Stasioneritas...............................................................................................................................
1.6. ARIMA dan SARIMA menggunakan metode AIC terendah:..........................................................................
1.7. ARIMA dan SARIMA berdasarkan titik potong ACF dan PACF:......................................................................
1.8. Membandingkan nilai RMSE.........................................................................................................................
1.9. Membangun model optimal dan perkiraan 12 bulan...................................................................................
1.10. Temuan dan Saran................................................................................................................................

2
Daftar Gambar
Gamba Nama Nomor
r No. halaman
Gamb Plot Time Series – Penjualan Sepatu 5
ar 1
Gamb Plot Kotak Bulanan Penjualan Sepatu 6
ar 2
Gamb Penjualan Sepatu Bulanan selama bertahun-tahun 6
ar 3
Gamb Time Series Plot bersama dengan Mean dan Median 6
ar 4
Gamb Dekomposisi multiplikatif dari kumpulan data 7
ar 5
Gamb Dekomposisi Aditif dari kumpulan data 8
ar 6
Gamb Penjualan Sepatu- Melatih dan Uji split 9
ar 7
Gamb Regresi linier 10
ar 8
Gamb Model Naïve Bayes 11
ar 9
Gamb Prakiraan Rata-Rata Sederhana 11
ar 10
Gamb Trailing Moving Average Forecast 12
ar 11
Gamb Pemulusan Eksponensial Tunggal 13
ar 12
Gamb Smoothing Eksponensial Tunggal dan Ganda 13
ar 13
Gamb Perataan Eksponensial Sederhana, Ganda, dan Tiga Kali Lipat 14
ar 14
Gamb Perataan Eksponensial Sederhana, Ganda, dan Tiga Kali (Perkalian) 14
ar 15
Gamb Stasioneritas Penjualan Sepatu pada lag 1 16
ar 16
Gamb AIC-ARIMA(2,1,3) A. Rangkuman, B. Grafik dan C. Diagnostik 18
ar 17
Gamb AIC- SARIMA(0,1,2) (1, 0, 2, 12) A. Rangkuman, B. Grafik dan C. Diagnostik 20
ar 18
Gamb Autokorelasi Data yang Dibedakan 21
ar 19
Gamb Autokorelasi Parsial dari Data yang Dibedakan 21
ar 20
Gamb ACF/PACF- ARIMA(3,1,1) A. Rangkuman, B. Grafik dan C. Diagnostik 22
ar 21
Gamb Gambar-22 ACF/PACF- SARIMA(3,1,1) (2, 0, 4, 12) A. Rangkuman, B. Grafik dan C. 24
ar 22
Diagnostik
Gamb Prakiraan Model Optimal untuk 12 bulan ke depan 25

3
ar 23

Daftar tabel
Tabel No. Nama Nomor
halaman
Tabel 1 Rangkuman informasi statistik deskriptif 4
Meja 2 Latih dan Tes Split 9
Tabel 3 Hasil Ringkasan dari semua model 24

1. Masalah 1:
1.1. Objektif

 Tujuan masalahnya adalah untuk membangun model yang optimal, untuk meramalkan
penjualan sepasang sepatu untuk 12 bulan mendatang dari mana data saat ini berakhir.
 Kami juga harus mengomentari model yang dibuat dan melaporkan temuan kami dan
menyarankan tindakan yang harus diambil perusahaan untuk penjualan di masa
mendatang.

1.2. Analisis Data Deskriptif dan Eksploratif

Latar Belakang: Anda adalah seorang analis di perusahaan sepatu IJK dan Anda
diharapkan untuk meramalkan penjualan sepasang sepatu untuk 12 bulan mendatang
dari mana data berakhir. Data penjualan sepasang sepatu telah diberikan kepada
Anda dari Januari 1980 hingga Juli 1995.
Kamus data:
Tahun bulan: Bulan dan Tahun Penjualan Sepatu
Penjualan_Sepatu Penjualan sepatu bulanan
1.2.1. : Analisi
s Data Deskriptif:

 Dataset telah dibaca dan disimpan sebagai kerangka data untuk analisis lebih
lanjut.
 Kumpulan data yang disediakan terdiri dari total 2 kolom dan memiliki 187
entri yang bersifat numerik. Tidak ada nilai null yang ada.
 Kolom pertama mewakili tanggal dimana Penjualan Sepatu telah dicatat.
Sedangkan kolom kedua mewakili Penjualan itu sendiri.
 Tabel 1 berikut terdiri dari head(), tail(), info() dan deskripsi dataset yang
ada.

Tabel-1: Rangkuman informasi statistik deskriptif

4
Kepala kumpulan data: Ekor set data: Info kumpulan data:

Jelaskan fungsi pada dataset: Tidak ada nilai null dalam kumpulan data.

1.2.2. Data Deret Waktu- Diplot:

 Deret waktu adalah serangkaian pengukuran pada variabel yang sama yang
dikumpulkan dari waktu ke waktu. Pengukuran ini dilakukan pada interval
waktu yang teratur. Deret waktu adalah serangkaian titik data yang diindeks
dalam urutan waktu. Paling umum, deret waktu adalah urutan yang diambil
pada titik waktu yang berjarak sama secara berurutan. Jadi itu adalah urutan
data waktu-diskrit.
 Kita dapat dengan jelas melihat tren tahunan penjualan sepatu pada
Gambar-1 di bawah ini. Grafik ini memberi kita ikhtisar data tanpa benar-
benar harus memeriksa setiap angka dalam kumpulan data.

Gambar-1 Time Series Plot – Penjualan Sepatu

1.2.3. Analisis Data Eksplorasi:

5
 Analisis Data Eksplorasi mengacu pada proses kritis dalam melakukan
penyelidikan awal pada data untuk menemukan pola, menemukan anomali,
dan menguji hipotesis.
 Pada Gambar-2 berikut dapat dilihat Plot Kotak Bulanan Penjualan Sepatu.
Kita bisa melihat ada outlier yang hadir di bulan April dan Mei. Ini memberi
tahu kami bahwa ada beberapa penjualan yang dilakukan pada bulan-bulan
itu di luar biasanya.
 Kami melihat bahwa penjualan cenderung meningkat pada paruh kedua
tahun ini lebih dari yang pertama. Desember mencatat penjualan sepatu
tertinggi.
 Lonjakan itu mungkin karena musim liburan, dan mungkin sepatu sangat
populer dibeli dan digunakan baik untuk konsumsi sendiri atau tujuan
hadiah.
 Kita bisa melihat tren bulanan dan tahunan yang ditampilkan pada Gambar-
3 . Sekali lagi menunjukkan kepada kita bahwa Desember adalah bulan
paling populer untuk Penjualan Sepatu serta tahun puncak penjualan antara
tahun 1986 dan 1988. Puncak ini mungkin karena minat yang meluas dan
banyak inovasi yang dilakukan untuk memikat pelanggan agar membeli
produk mereka, sehingga mendongkrak penjualan.
 Gambar-4 menunjukkan kepada kita deret waktu yang diplot bersama
dengan nilai rata-rata dan median yang diplot di sepanjang grafik yang sama,
untuk mendapatkan pemahaman tentang fluktuasi data dari dua ukuran
tendensi sentral ini.
 Selain itu karena rata-rata terbukti lebih tinggi dari median, mengarah pada
kesimpulan bahwa distribusinya miring secara positif.

Gambar-2 Petak Kotak Bulanan Penjualan Sepatu

6
Gambar-3 Penjualan Sepatu Bulanan selama bertahun-tahun

Gambar-4 Time Series Plot beserta Mean dan Median


 DEKOMPOSISI DATASET:

Dekomposisi deret waktu melibatkan pemikiran tentang deret sebagai


kombinasi komponen level, tren, musiman, dan gangguan. Dekomposisi
memberikan model abstrak yang berguna untuk berpikir tentang deret waktu
secara umum dan untuk pemahaman yang lebih baik tentang masalah selama
analisis dan peramalan deret waktu. Mereka adalah dua jenis umumnya
multiplikatif dan aditif.

(i) Dekomposisi Perkalian Dataset:


Data direpresentasikan dalam bentuk penggandaan komponen
musiman, tren, siklus, dan residual. Digunakan di mana perubahan
diukur dalam persen (%) perubahan.

7
Gambar-5 Multiplicative Decomposition dari dataset

(ii) Dekomposisi Aditif Dataset:


Data direpresentasikan dalam bentuk penambahan komponen
musiman, tren, siklus, dan residual. Digunakan di mana perubahan
diukur dalam kuantitas absolut.

8
Gambar-6 Additive Decomposition dari dataset

Karena kami melihat perubahan dalam jumlah absolut untuk kumpulan data khusus
ini, kami melanjutkan dengan menggunakan model aditif.

1.3. Pemisahan data Latih dan Uji

Pemisahan uji-latih digunakan untuk memperkirakan kinerja algoritme pembelajaran


mesin yang berlaku untuk Algoritma/Aplikasi berbasis prediksi. Metode ini adalah
prosedur yang cepat dan mudah dilakukan sehingga kita dapat membandingkan hasil
model pembelajaran mesin kita sendiri dengan hasil mesin.
Kedua kumpulan data tersebut telah dipisahkan pada Tahun 1991. Artinya data uji
dimulai dari tahun 1991.

Tabel-2: Train and Test Split

Latih data Kepala set data: Data uji Kepala kumpulan data:

9
Latih data Ekor dari set data: Data uji Ekor dari kumpulan data:

Bentuk Data Kereta = (132, 1) Bentuk Data Uji = (55, 1)

Representasi grafis dari Train and Test Split:

Figure-7 Shoe Sales- Train and Test split

1.4. Membangun model yang berbeda dan memeriksa RMSE

10
 Kami telah diminta untuk membuat berbagai model pemulusan eksponensial
pada data pelatihan dan mengevaluasi model menggunakan RMSE pada data
uji.
 Kami juga membuat model lain seperti regresi linier, model perkiraan naif,
model rata-rata sederhana, dll. Dan memeriksa kinerja pada data uji
menggunakan RMSE.
 Tujuan utama membangun begitu banyak model adalah untuk memastikan
kami memilih model optimal dengan nilai RMSE dan MAPE terendah.
 MAPE adalah singkatan dari kesalahan persentase absolut rata-rata. Ini
adalah efek perkalian rata-rata antara setiap rata-rata estimasi dan hasil yang
diamati. RMSE adalah singkatan dari root mean squared error, yaitu standar
deviasi.

1.4.1. Regresi linier:

 Regresi Linear adalah algoritma pembelajaran mesin berdasarkan


pembelajaran yang diawasi. Itu melakukan tugas regresi. Ini adalah alat yang
hebat untuk peramalan. Kita dapat melihat dari gambar di bawah ini bahwa
regresi linier terhadap waktu terus meningkat.

Gambar-8 Regresi Linear

Tipe model RMSE


Regresi Tepat Waktu 266.2765

1.4.2. Model Naïve Bayes:

 Pengklasifikasi seperti Naive Bayes menggunakan model bahasa untuk


mengklasifikasikan dan membuat prediksi pada data deret waktu. Gambar-9
menyatakan bahwa Prakiraan Naif pada data Uji selalu sama untuk seluruh
data, yang tidak ideal.

11
Gambar-9 Model Naïve Bayes

Tipe model RMSE


Regresi Tepat Waktu 266.2765
Model Naif 245.1213

Nilai RMSE tampaknya paling rendah untuk Naïve Bayes sejauh ini. Namun
karena perkiraannya konstan selama bertahun-tahun, ini bukanlah model yang
ideal untuk kumpulan data kami.

1.4.3. Prakiraan Rata-Rata Sederhana:

Metodenya sangat sederhana. Kami rata-rata data berdasarkan bulan atau kuartal
atau tahun dan kemudian menghitung rata-rata untuk periode tersebut. Kami
kemudian melanjutkan untuk mencari tahu, berapa persentasenya terhadap rata-
rata keseluruhan.

Gambar-10 Simple Average Forecast

12
Tipe model RMSE
Regresi Tepat Waktu 266.276
5
Model Naif 245.121
3
Model Rata-Rata Sederhana 63.9845
7

Nilai RMSE tampaknya paling rendah untuk Metode Rata-Rata Sederhana


sejauh ini. Namun karena perkiraannya konstan selama bertahun-tahun, ini
bukanlah model yang ideal untuk kumpulan data kami.

1.4.4. Prakiraan Rata-Rata Bergerak:

 Moving Average Forecasting adalah teknik yang naif dan efektif dalam
peramalan deret waktu.
 Menghitung rata-rata bergerak melibatkan pembuatan rangkaian baru di mana
nilainya terdiri dari rata-rata pengamatan mentah dalam rangkaian waktu asli.
 Rata-rata bergerak mengharuskan Anda menentukan ukuran jendela yang
disebut lebar jendela. Ini menentukan jumlah pengamatan mentah yang
digunakan untuk menghitung nilai rata-rata bergerak. Kami telah
menggunakan metode rata-rata bergerak trailing.

Figure-11 Trailing Moving Average Forecast

Tipe model RMSE


Regresi Tepat Waktu 266.2765
Model Naif 245.1213
Model Rata-Rata Sederhana 63.98457
2pointTrailingMovingAverage 45.94874
4pointTrailingMovingRata-rata 57.87269
6pointTrailingMovingRata-rata 63.45689
9pointTrailingMovingRata-rata 67.72365

13
Nilai RMSE tampaknya terendah untuk Metode Trailing Moving Average 2 poin
sejauh ini.

1.4.5. Pemulusan Eksponensial Sederhana:

 Single Exponential Smoothing, singkatnya SES, juga disebut Simple


Exponential Smoothing, adalah metode peramalan deret waktu untuk data
univariat tanpa tren atau musiman. Ini membutuhkan satu parameter, yang
disebut alpha (a), juga disebut faktor pemulusan atau koefisien pemulusan.
 Nilai alpha atau smoothening level dimana grafik diplot adalah 0,605.

Gambar-12 Pemulusan Eksponensial Sederhana

1.4.6. Pemulusan Eksponensial Ganda:

 Pemulusan eksponensial ganda menggunakan komponen level dan


komponen tren pada setiap periode. Pemulusan eksponensial ganda
menggunakan dua bobot, (juga disebut parameter pemulusan), untuk
memperbarui komponen pada setiap periode.
 Nilai alpha atau smoothening level dimana grafik diplot adalah 0,594,
sedangkan beta atau smoothening trend adalah 0,0002.

14
Gambar-13 Simple and Double Exponential Smoothening

1.4.7. Pemulusan Eksponensial Tiga Kali Lipat:

 Pemulusan eksponensial rangkap tiga digunakan untuk menangani data deret


waktu yang mengandung komponen musiman. Metode ini didasarkan pada
tiga persamaan pemulusan: komponen stasioner, tren, dan musiman. Baik
musiman maupun tren dapat bersifat aditif atau multiplikatif. Ini adalah
model aditif.
 Nilai alpha atau smoothening level pada grafik yang diplot adalah 0,570,
sedangkan beta atau smoothening trend adalah 0,0001 dan gamma atau
smoothening seasonal adalah 0,293.

Gambar-14 Simple, Double dan Triple Exponential Smoothening

1.4.8. Perataan Eksponensial Tiga Kali (Perkalian):

 Metode ini didasarkan pada tiga persamaan pemulusan: komponen stasioner,


tren, dan musiman. Ini adalah model perkalian.

15
 Nilai alpha atau smoothening level pada grafik yang diplot adalah 0,571,
sedangkan beta atau smoothening trend adalah 0,0001 dan gamma atau
smoothening seasonal adalah 0,202.

Gambar-15 Simple, Double dan Triple Exponential Smoothening (Perkalian)


Tipe model RMSE
Regresi Tepat Waktu 266.2765
Model Naif 245.1213
Model Rata-Rata Sederhana 63.98457
2pointTrailingMovingAverage 45.94874
4pointTrailingMovingRata-rata 57.87269
6pointTrailingMovingRata-rata 63.45689
9pointTrailingMovingRata-rata 67.72365
Penghalusan Eksponensial Sederhana 196.4048
Penghalusan Eksponensial Ganda 266.1612
TripleExponentialSmoothing 128.9925
TripleExponentialSmoothingMultiplicative 83.73405

Nilai RMSE tampaknya terendah untuk Metode Trailing Moving Average 2 poin
sejauh ini.

1.5. Memeriksa Stasioneritas

 Uji Augmented Dickey-Fuller adalah uji akar unit yang menentukan apakah
ada akar unit dan selanjutnya apakah deret tersebut tidak stasioner.
 Hipotesis dalam bentuk sederhana untuk uji ADF adalah:
H0: Seri Waktu memiliki akar unit dan karenanya tidak stasioner.

16
H1: Seri Waktu tidak memiliki akar unit dan dengan demikian
stasioner.
 Kami ingin seri menjadi stasioner untuk membangun model ARIMA dan
dengan demikian kami ingin nilai p dari tes ini kurang dari nilai Alpha.
 Ketika ADF diterapkan pada model kami mendapat nilai p 0,801 yang lebih
tinggi dari 0,5, sehingga kami gagal menolak hipotesis nol. Disimpulkan
bahwa deret tersebut tidak stasioner.
 Kami sekarang harus melakukan perbedaan level pada dataset dan memeriksa
Stasioneritas.
 Nilai p setelah pembedaan level 1 adalah 0,0361<0,05, oleh karena itu kami
sekarang menolak hipotesis nol dan menyimpulkan bahwa deret tersebut
stasioner dengan lag 1.
 Di bawah ini adalah representasi grafis yang sama. Nilai statistik uji adalah -
3,532, sedangkan jumlah lag yang digunakan adalah 12.
 Sekarang data sudah stasioner, kita dapat melanjutkan untuk membuat model
ARIMA dan SARIMA.

Gambar-16 Stasioneritas Penjualan Sepatu pada lag 1

1.6. ARIMA dan SARIMA menggunakan metode AIC terendah:

 Model ARIMA terdiri dari bagian Auto-Regressive (AR) dan Moving Average (MA)
setelah kita membuat Time Series stasioner dengan mengambil derajat/urutan
perbedaan yang benar.
 Model ARIMA dapat dibangun dengan mempertimbangkan Akaike Information
Criterion (AIC). Dalam hal ini, kami memilih nilai 'p' dan 'q' untuk menentukan
urutan AR dan MA yang memberi kami nilai AIC terendah. Turunkan AIC lebih baik
modelnya.
 Bahasa pengkodean mencoba urutan 'p' dan 'q' yang berbeda untuk sampai pada
kesimpulan ini. Ingat, bahkan untuk cara memilih nilai 'p' dan 'q' seperti itu, kita harus
memastikan bahwa deret tersebut stasioner.

17
 Rumus untuk menghitung AIC adalah 2k – 2ln(L), dimana k adalah jumlah parameter
yang akan diestimasi dan L adalah estimasi likelihood.
 Untuk model SARIMA, kita juga dapat mengestimasi 'p', 'q' , 'P' dan 'Q' dengan
melihat nilai AIC terendah.

 ARIMA:
i. Kami pertama-tama membuat kisi dari semua hasil yang mungkin (p,d,q).
Kisaran 'p' dan 'q' menjadi (0,4) dan 'd' konstanta = 1.

Berikut ini adalah kisi dari semua kemungkinan hasil:

Model: (0, 1, 1)
Model: (0, 1, 2)
Model: (0, 1, 3)
Model: (1, 1, 0)
Model: (1, 1, 1)
Model: (1, 1, 2)
Model: (1, 1, 3)
Model: (2, 1, 0)
Model: (2, 1, 1)
Model: (2, 1, 2)
Model: (2, 1, 3)
Model: (3, 1, 0)
Model: (3, 1, 1)
Model: (3, 1, 2)
Model: (3, 1, 3)

ii. Kami kemudian melanjutkan untuk menyesuaikan model ARIMA ke dalam


masing-masing kombinasi di atas dan akhirnya memilih yang memiliki nilai
AIC paling sedikit.

param AIC

11 (2, 1, 3) 1480.805493

15 (3, 1, 3) 1482.566450

5 (1, 1, 1) 1492.487187

6 (1, 1, 2) 1494.423859

9 (2, 1, 1) 1494.431498

2 (0, 1, 2) 1494.964605

3 (0, 1, 3) 1495.148474

14 (3, 1, 2) 1495.655855

13 (3, 1, 1) 1496.346864

18
7 (1, 1, 3) 1496.385878

10 (2, 1, 2) 1496.410739

1 (0, 1, 1) 1497.050322

12 (3, 1, 0) 1498.930309

8 (2, 1, 0) 1498.950483

4 (1, 1, 0) 1501.643124

0 (0, 1, 0) 1508.283772

iii. AIC terendah untuk ARIMA jelas (2, 1, 3) dengan AIC 1480,80. Kami
sekarang menyesuaikan data kereta dengan model dan prakiraan pada set
pengujian. Dan kami mendapatkan Ringkasan ARIMA, grafik, dan hasil
diagnostik.

A.

B.

19
C.

Gambar-17 AIC-ARIMA(2,1,3) A. Rangkuman, B. Grafik dan C. Diagnostik

iv. Kami akhirnya memeriksa keakuratan model dengan bantuan perhitungan


RMSE dan MAPE.

Tipe model RMSE MAPE


AIC-ARIMA(2,1,3) 184.648 85.73498

 SARIMA:

i. Kami membuat kisi dari semua kemungkinan kombinasi (p,d,q) bersama


dengan musiman (P,D,Q) dan musiman 12. Kisaran 'p' dan 'q' menjadi (0,4)
dan 'd' konstanta = 1.

Berikut ini adalah kisi dari semua kemungkinan hasil:

Model: (0, 1, 1)(0, 0, 1, 12)


Model: (0, 1, 2)(0, 0, 2, 12)
Model: (1, 1, 0)(1, 0, 0, 12)

20
Model: (1, 1, 1)(1, 0, 1, 12)
Model: (1, 1, 2)(1, 0, 2, 12)
Model: (2, 1, 0)(2, 0, 0, 12)
Model: (2, 1, 1)(2, 0, 1, 12)
Model: (2, 1, 2)(2, 0, 2, 12)

ii. Kami kemudian melanjutkan untuk menyesuaikan model SARIMA ke dalam


masing-masing kombinasi di atas dan akhirnya memilih yang memiliki nilai
AIC paling sedikit.

param musiman AIC


23 (0, 1, 2) (1, 0, 2, 12) 1156.165429
50 (1, 1, 2) (1, 0, 2, 12) 1157.082589
26 (0, 1, 2) (2, 0, 2, 12) 1157.772313
77 (2, 1, 2) (1, 0, 2, 12) 1158.490996
80 (2, 1, 2) (2, 0, 2, 12) 1158.630324

iii. AIC terendah untuk SARIMA jelas (0, 1, 2) (1, 0, 2, 12) dengan AIC
1156.165429. Kami sekarang menyesuaikan data kereta dengan model dan
prakiraan pada set pengujian. Dan kami mendapatkan Ringkasan SARIMA,
grafik, dan hasil diagnostik. Hal ini dapat dilihat pada Gambar-18 di bawah
ini.

iv. Kami akhirnya memeriksa keakuratan model dengan bantuan perhitungan


RMSE dan MAPE. AIC-SARIMA memiliki RMSE dan MAPE terendah
hingga saat ini.

Tipe model RMSE MAPE


AIC-ARIMA(2,1,3) 184.648 85.73498
AIC-SARIMA(0, 1, 2)(1, 0, 2, 12) 69.03066 26.45588

A.

21
B.

C.

Gambar-18 AIC- SARIMA(0,1,2) (1, 0, 2, 12) A. Rangkuman, B. Grafik dan C.


Diagnostik

1.7. ARIMA dan SARIMA berdasarkan titik potong ACF dan PACF:

 Model ARIMA terdiri dari bagian Auto-Regressive (AR) dan Moving Average
(MA) setelah kita membuat Time Series stasioner dengan mengambil
derajat/urutan perbedaan yang benar.
 Urutan AR dipilih dengan melihat di mana plot PACF cut-off (untuk pita interval
kepercayaan yang sesuai) dan urutan MA dipilih dengan melihat di mana plot
ACF cut-off (untuk pita interval kepercayaan yang sesuai).
 Tingkat atau urutan perbedaan yang benar memberi kita nilai 'd' sedangkan nilai
'p' untuk urutan model AR dan nilai 'q' untuk urutan model MA.
 Untuk SARIMA, parameter musiman 'F' dapat ditentukan dengan melihat plot
ACF. Plot ACF diharapkan menunjukkan lonjakan pada kelipatan 'F' sehingga
menunjukkan adanya musiman.

22
 Selain itu, untuk model Musiman, plot ACF dan PACF akan berperilaku sedikit
berbeda dan tidak akan selalu terus menurun karena jumlah kelambatan
meningkat.

 ARIMA:

i. Kita harus mengamati plot ACF dan PACF. Kami mendapatkan nilai 'p' dari
PACF dan nilai 'q' dari plot ACF. Berikut ini adalah plot pada d=1:

Gambar-19 Autokorelasi Data Diferensiasi

Gambar-20 Autokorelasi Parsial Data yang Dibedakan

ii. Kami kemudian melanjutkan untuk memasukkan model ARIMA ke dalam


(3,1,1). Nilai-nilai ini telah ditemukan dari plot ACF dan PACF. Dan kami
mendapatkan Ringkasan ARIMA, grafik, dan hasil diagnostik.

A.

23
B.

C.

Gambar-21 ACF/PACF- ARIMA(3,1,1) A. Rangkuman, B. Grafik dan C. Diagnostik

iii. Kami akhirnya memeriksa keakuratan model dengan bantuan perhitungan


RMSE dan MAPE. AIC-SARIMA memiliki RMSE dan MAPE terendah
hingga saat ini.

Tipe model RMSE MAPE


AIC-ARIMA(2,1,3) 184.648 85.7349
8
AIC-SARIMA(0, 1, 2)(1, 0, 2, 12) 69.0306 26.4558
6 8
ACF/PACF-ARIMA(3,1,1) 144.183 66.9104
9 9
 SARIMA:

i. Kita harus mengamati plot ACF dan PACF. Kami mendapatkan nilai 'p' dari
PACF dan nilai 'q' dari plot ACF. Dari plot di atas Gambar 19 dan 20 pada
d=1, frekuensi= 12. Kami juga menemukan P, D, Q dari plot di atas dengan
mencari puncak musiman.

ii. Kami kemudian melanjutkan untuk memasukkan model SARIMA ke dalam


(3,1,1) (2, 0, 4, 12). Nilai-nilai ini telah ditemukan dari plot ACF dan PACF.
Dan kami mendapatkan Ringkasan SARIMA, grafik, dan hasil diagnostik.

A.

24
B.

C.

25
Gambar-22 ACF/PACF- SARIMA(3,1,1) (2, 0, 4, 12 ) A. Rangkuman, B. Grafik dan
C.Diagnostik

iii. Kami akhirnya memeriksa keakuratan model dengan bantuan perhitungan


RMSE dan MAPE. AIC-SARIMA memiliki RMSE dan MAPE terendah
hingga saat ini.

Tipe model RMSE MAPE


AIC-ARIMA(2,1,3) 184.648 85.73498
AIC-SARIMA(0, 1, 2)(1, 0, 2, 12) 69.0306 26.45588
6
ACF/PACF-ARIMA(3,1,1) 144.183 66.91049
9
ACF/PACF-SARIMA(3,1,1)(2, 0, 4, 12) 109.924 46.26953
2

1.8. Membandingkan nilai RMSE

Tabel 3- Hasil Ringkasan dari semua model RMSE


Tipe model RMSE MAPE
2pointTrailingMovingAverage 45.9487
4
4pointTrailingMovingRata-rata 57.8726
9
6pointTrailingMovingRata-rata 63.4568
9
Model Rata-Rata Sederhana 63.9845
7
9pointTrailingMovingRata-rata 67.7236
5
AIC-SARIMA(0, 1, 2)(1, 0, 2, 12) 69.0306 26.45588
6
TripleExponentialSmoothingMultiplicative 83.7340
5
ACF/PACF-SARIMA(3,1,1)(2, 0, 4, 12) 109.924 46.26953
2
TripleExponentialSmoothing 128.992
5
ACF/PACF-ARIMA(3,1,1) 144.183 66.91049
9

26
AIC-ARIMA(2,1,3) 184.648 85.73498
Penghalusan Eksponensial Sederhana 196.404
8
Model Naif 245.121
3
Penghalusan Eksponensial Ganda 266.161
2
Regresi Tepat Waktu 266.276
5

 Kami melihat bahwa model terbaik dengan RMSE paling kecil di Trailing Moving
Average 2 poin, diikuti oleh semua rata-rata bergerak lainnya dan juga rata-rata
sederhana. Di tempat ke -6 kita melihat AIC-SARIMA(0, 1, 2)(1, 0, 2, 12).
 Karena nilai RMSE tidak terlalu jauh dari posisi 1 sampai 6 untuk kemudahan
perhitungan dan prediktabilitas yang akurat, kami memilih AIC-SARIMA(0, 1, 2)(1,
0, 2, 12). Selain itu, model ARIMA lebih efisien secara komputasi dan memberikan
prediksi yang akurat.
 Ini juga mempertimbangkan MAPE, dan merupakan ide bagus untuk memiliki lebih
dari satu parameter akurasi.
 Pemulusan eksponensial di seluruh industri dan model ARIMA lebih populer dalam
hal pembuatan model. Sementara teknik pemulusan eksponensial tergantung pada
asumsi penurunan bobot eksponensial untuk data masa lalu dan ARIMA digunakan
dengan mengubah deret waktu menjadi deret stasioner dan mempelajari sifat deret
stasioner melalui ACF dan PACF dan kemudian memperhitungkan efek regresi
otomatis dan rata-rata bergerak. dalam deret waktu, jika ada.

1.9. Membangun model optimal dan perkiraan 12 bulan

Kami akan membangun model yang optimal dengan AIC-SARIMA(0, 1, 2)(1, 0, 2, 12)
sesuai penjelasan yang sudah diberikan di atas.

Gambar-23 Prakiraan Model Optimal untuk 12 bulan ke depan

27
1.10. Temuan dan Saran

 Kumpulan data berisi total 187 entri di antaranya 2 variabel. Kolom pertama
mewakili tanggal dimana Penjualan Sepatu telah dicatat. Sedangkan kolom
kedua mewakili Penjualan itu sendiri. Tidak ada nilai null dalam kumpulan
data.
 Ada outlier hadir pada bulan April dan Mei. Ini memberi tahu kami bahwa
ada beberapa penjualan yang dilakukan pada bulan-bulan itu di luar
biasanya.
 Penjualan cenderung meningkat pada paruh kedua tahun ini lebih dari yang
pertama. Desember mencatat penjualan sepatu tertinggi.
 Lonjakan itu mungkin karena musim liburan, dan mungkin sepatu sangat
populer dibeli dan digunakan baik untuk konsumsi sendiri atau tujuan
hadiah.
 Dalam tren bulanan dan tahunan, kami melihat bahwa Desember adalah
bulan paling populer untuk Penjualan Sepatu serta tahun puncak penjualan
antara tahun 1986 dan 1988. Puncak ini mungkin karena minat yang meluas
dan banyak inovasi yang dilakukan untuk memikat pelanggan agar membeli
produk mereka, sehingga meningkatkan penjualan.
 Dari perkiraan kami melihat puncak yang jelas, menunjukkan penjualan yang
lebih baik dari tahun sebelumnya. Oleh karena itu, produsen harus
memastikan mereka memiliki cukup dan lebih dari tahun sebelumnya.
 Perusahaan dapat mendongkrak penjualan lebih tinggi dari perkiraan jika
mereka fokus pada Periklanan dan meluncurkan jenis Sepatu baru yang unik.
 Dengan diluncurkannya sepatu baru, mereka dapat memikat pelanggan dan
memikat mereka untuk berpikir bahwa mereka perlu membeli sepatu tersebut
karena merupakan salah satu dari jenisnya. Memberi produsen keuntungan
penggerak pertama.
 Ini akan memastikan peningkatan penjualan untuk sementara dan kemudian
keputusan untuk menghentikan pembuatan jenis sepatu yang tidak begitu
populer dapat diambil juga. Ini akan membantu menghemat sumber daya
penting yang dapat digunakan di tempat lain.
 Ada harapan lonjakan dari tahun ke tahun akan kembali memuncak, karena
sepatu adalah kebutuhan dan komoditas tidak akan pernah kehilangan arti
pentingnya.

28
29

Anda mungkin juga menyukai