PROPOSAL SKRIPSI
RAMADANI
1620160002
JAKARTA
2020
DAFTAR ISI
BAB I PENDAHULUAN........................................................................................1
A. Latar Belakang..........................................................................................1
B. Rumusan Masalah.....................................................................................2
C. Batasan Masalah........................................................................................2
D. Tujuan Penelitian.......................................................................................3
E. Mannfaat Penelitian...................................................................................3
A. Deret Waktu..............................................................................................4
C. Stasioner....................................................................................................7
F. Metode Box-Jenkins...................................................................................10
d. Operator Backshift...............................................................................12
i
f. Konstanta pada Model ARIMA..............................................................13
I. Evaluasi Model...........................................................................................16
A. Jenis Penelitian........................................................................................18
B. Sumber Data............................................................................................18
C. Variabel Penelitian..................................................................................18
ii
DAFTAR GAMBAR
iii
DAFTAR TABEL
iv
BAB I
PENDAHULUAN
A. Latar Belakang
Berkembangnya ilmu pengetahuan sains dan teknologi, membuat keingintahuan
peristiwa mendatang semakin meningkat, yang mengakibatkan keperluan akan
berbagai ilmu peramalan semakin meningkat, contohnya peramalan di bidang
ekonomi, perdagangan, perindustrian dan sebagainya yang telah menghadirkan
berbagai macam hasil. Hasil tersebut nantinya akan digunakan untuk mengambil
sebuah keputusan. Hasil keputusan tersebut dapat digunakan sebagai
pertimbangan dalam menentukan langkah-langkah selanjutnya untuk kemajuan
sebuah perusahaan.
1
Kebutuhan peramalan tersebut terdapat juga di lingkungan perusahaan Lembaga
Bimbingan Belajar (LBB). Peramalan jumlah pendaftaran siswa baru terhadap
lembaga bimbingan belajar dapat membantu penyusunan jadwal kelas dan jam
belajar (penjadwalan sumber daya), menentukan kapan dibutuhkannya pengajar
tambahan dan buku materi tambahan untuk siswa baru (penyediaan sumber daya
tambahan), serta penentuan peralatan untuk mempermudah kegiatan belajar
mengajar (penentuan sumber daya yang dibutuhkan). Maka dari itu, peramalan
dalam menentukan jumlah pendaftaran siswa baru sangatlah penting, agar
kegiatan belajar mengajar tetap kondusif dan kebutuhan siswa dapat terpenuhi.
Untuk meramalkan jumlah pendaftaran siswa baru pada periode yang akan datang,
dapat menggunakan analisis deret waktu (time series analysis). Metode peramalan
tersebut berdasarkan hasil observasi masa lalu dan masa yang akan datang, yang
dipengaruhi oleh hasil observasi saat ini. Akan tetapi jumlah pendaftaran siswa
baru pada lembaga bimbingan belajar bersifat tak menentu (musiman), maka
metode yang dapat digunakan adalah metode Seasonal Integrated Moving
Average (SARIMA). Metode seasonal arima merupakan bentuk data musiman
model ARIMA. Berdasarkan uraian latar belakang di atas, penulis mengajukan
permasalahan penelitian dengan judul “Penentuan Jumlah Siswa Baru
Menggunakan Metode Seasonal Autoregressive Integrated Moving Average
(studi kasus Lembaga Bimbingan Belajar Danish Educa)”.
B. Rumusan Masalah
Rumusan masalah dalam penelitian sebagai berikut :
1. Bagaimana mengestimasi model SARIMA menggunakan metode Ordinary
Least Story (OLS)?
2. Bagaimana menerapkan model SARIMA untuk meramalkan jumlah siswa baru
pada beberapa periode ke depan?
C. Batasan Masalah
Batasan masalah dalam penelitian sebagai berikut :
1. Metode yang digunakan adalah Seasonal Autoregressive Integrated Moving
Average (SARIMA).
2
2. Dikarenakn perusahaan baru berdiri sejak 2010 maka data yang tersedia hanya
7 tahun terakhir.
3. Tidak membahas aspek pembiayaan.
4. Diasumsikan bahwa kondisi politik sosial ekonomi pada tahun 2020 sama
dengan tahun sebelumnya.
D. Tujuan Penelitian
Tujuan pe nelitian ini sebagai berikut :
E. Mannfaat Penelitian
a. Manfaat Teoritis
1. Dengan penelitian ini, diharapkan hasil penelitian dapat menjadi sumbangan
teoritis pada kajian ilmu matematika.
2. Hasil penelitian akan menjadi kajian yang dapat digunakan sebagai referensi
dalam mengembangkan penelitian berikutnya.
b. Manfaat Praktis
1. Untuk perusahaan
Dengan hasil penelitian ini diharpakan memberikan kepastian kepada Lembaga
Bimbingan Belajar Danish Educa Pekayon dalam memprediksi jumlah siswa
pada tahun ajaran baru 2021/2022.
2. Untuk penulis
Menambah wawasan ilmu pengetahuan dalam penerapan model SARIMA pada
peramalan penentuan jumlah siswa baru Lembaga Danish Educa Pekayon.
3
BAB II
LANDASAN TEORI
A. Deret Waktu
Peramalan (forecasting) merupakan alat penting dalam pengambilan kesimpulan
dari informasi yang diserap dari masa lalu, dan dapat digunakan sebagai dasar
keputusan. Maka dari itu, analisis deret waktu (times series analysis) adalah suatu
metode kuantitatif untuk menentukan pola data masa lalu yang telah dikumpulkan
secara teratur menurut rentetan waktu kejadian baik per jam, per hari, ataupun per
bulan. Misal data hasil dari observasi adalah Zt , karena analisis deret berkala
bertujuan memodelkan ketidakpastian hasil observasi maka dari itu Zt
diasumsikan sebagai variabel acak. Sehingga bentuk Zt akan mengikuti distribusi
peluang.
Selain dari asumsi, yang paling penting pada model deret berkala adalah hasil dari
masing–masing observasi dimana setiap kejadian waktu yang berbeda memiliki
ketergantungan antara satu sama lain. Dimana kebergantungan inilah yang nanti
akan diperiksa dalam analisis berkala. Maka bisa kita simpulkan bahwa kumpulan
dari variabel acak tersebut disebut sebagai proses stokastik.
Adapun proses stokastik yang perlu diperhatikan adalah rata – rata kovarians.
Untuk proses stokastik {Z t ≔0 ±1 ± 2, … . } fungsi rata – rata dapat didefiniskan,
Dimana nilai ekspetasi proses terhadap selang waktu t, artinya μ bisa berbeda
setiap selang waktu. Sedangkan fungsi autokovarians dapat didefinisikan sebagai
berikut,
Dimana t , s=0 ±1 ±2 , … .
4
ρt ,s =Corr ¿
Dimana t , s=0 ±1 ±2 , … .
1. γ t , s=Var ( Z t ) ρt ,t =1
2. γ t , s=γ s ,t ρt ,s =ρs , t
3. ¿ γ t , s∨¿ √ (γ ¿ ¿ t ,t ∙ γ s ,s )¿ ¿ ρt ,t ∨≤1
5
b. Pola Data Trend
Pola data trend terjadi apabila data pengamatan mengalami kenaikan atau
penurunan selama periode jangka panjang. Suatu data pengamatan yang
mempunyai trend disebut nonstasioner. Pola data ini dapat digambarkan sebagai
berikut :
6
Gambar d Pola Data Siklus
C. Stasioner
Suatu data dikatakan stasioner jika pola data berada pada kesetimbangan di sekitar
nilai rata-rata (mean) yang konstan, dan variansi disekitar rata-rata konstan selama
waktu tertentu. Sifat-sifat statistik di masa yang akan mendatang pada model
stasioner dapat diramalkan berdasarkan historis yang telah terjadi di masa lalu.
Berdasarkan pengertiannya, suatu proses stokastik {Z t } dikatakan stasioner jika
distribusi bersama Z(t¿¿ 1−k ), Z(t¿¿ 2−k ), . .. . Z (t ¿¿ n−k )¿ ¿ ¿ untuk setiap
waktu t dan s, serta untuk setiap selang waktu k.
Hal ini mengakibatkan jika n=1, maka E( Z ¿¿ t)=E (Z ¿¿ t−k )¿ ¿, untuk semua t
dan k, sehingga fungsi rata-ratanya ( μ¿¿ t)¿ konstan sepanjang waktu. Selain itu,
Var ( Z¿ ¿t )=Var ( Z¿ ¿t−k )¿ ¿ juga konstan sepanjang waktu. Jika n=2, maka
Cov (Z ¿ ¿ t , Z s)=Cov(Z ¿ ¿ t−k , Z s−k )¿ ¿. Apabila telah dipilih t = s, kemudian k =
t maka diperoleh :
γ t , s=Cov (Z ¿ ¿t , Z s )¿
¿ Cov ( Z t−s , Z 0 )
¿ Cov ( Z 0 , Z t−s )
¿ Cov ( Z 0 , Z|t−s|)
¿ γ 0 ,|t −s|
7
Hal ini mengakibatkan kovarians antara Zt dan Z s bergantung pada selisih waktu
bukan pada waktu t dan s. Maka dari itu, proses stokastik yang stasioner dapat
dinotasikan menjadi sederhana yaitu :
γ o=Var (Z t ), ⍴o=1
γ k =γ −k , ⍴k =⍴−k
¿ γ k ∨≤ γ 0, ¿ ⍴k ∨≤ 1
Pengujian stasioner terhadap suatu deret berkala dapat dilakukan dengan cara uji
Augmented Dicky Fuller. dimana uji Augmented Dicky Fuller paling sering
digunakan dalam pengujian stasioner dari data, hanya dengan melihat apakah
terdapat akar satuan dalam model statistikanya :
Uji statistik :
δ^
τ^ =
^
se( δ)
Kriteria pengujian :
n = jumlah data
τ = konstanta
8
Terkadang data dari suatu penelitian tidak selamanya menunjukkan kestasioneran,
hal ini disebabkan karena data belum stasioner secara rata-rata, varians atau
keduanya. Jika data yang belum stasioner secara varians maka dapat dilakukan
x λ −1
dengan cara transformasi Box-Cox dimana rumusnya adalah y= dengan
λ
λ ≠ 0. Selain rumus tersebut, dapat digunakan juga transformasi pangkat dengan
tolok ukur sebagai berikut :
Nilai λ Transformasi
-1,0 1
Zt
-0,5 1
√ Zt
0,0 lnZ t
0,5 √ Zt
1,0 Tanpa Transformasi
9
n−k
∑ ( Zt −Z)( Z t +k −Z)
r k = t =1 n
, k =0 , 1 ,2 , … .
2
∑ ( Z t −Z )
t=1
Dimana :
1
kesalahan standar ser = dapat digunakan untuk memeriksa apakah r k berbeda
k
√n
secara nyata dari nol.
Sehingga mengakibatkan seluruh nilai korelasi dari suatu barisan data secara acak
(tidak autokorelasi bersignifikan) akan terletak di daerah nilai tengah nol
ditambah atau dikurangi nilai Z-score dengan taraf signifikan 95 % yaitu 1,96 kali
kesalahan standar.
Dimana ∅ kk merupakan variabel korelasi antara dua buah peubah acak Zt dan Zt −k
dengan syarat Zt −1 , Z t−2 ,… , Zt −k+1 (Cryer, 1986). Pada umumnya metode yang
sering digunakan untuk menghitung koefisien autokorelasi parsial adalah
persamaan Yule-Walker. Dan untuk memperoleh nilai autokorelasi parsial adalah,
10
k−1
ρk −∑ ∅k−1 j ρk− j
j=1
∅ kk = k−1
1−∑ ∅ k−1 j ρk− j
j=1
Dimana :
∅ kk =¿koefisien autokorelasi parsial lag periode ke-k
Dimana Zt dapat diasumsikan sebagai stasioner dan E(Z ¿¿ t)=0 ¿. Sehingga, nilai
barisan Zt adalah kombinasi linier dari sejumlah p, nilai Zt akhir di masa lampau
dijumlah dengan a t menyatakan sesuatu yang tidak dapat dijelaskan oleh nilai Zt
dimasa lampau tersebut, dan a t merupakan variabel acak yang independent
dengan rata-rata nol. Secara umum untuk menghitung nilai autokorelasi dalam
proses AR( p) adalah :
11
σ 2α
γ 0=
1−∅1 ρ1−∅2 ρ2−. . .. .−∅ p ρ p
ρ1=∅1 + ∅2 ρ1 +. .. . .+ ∅ 2 ρ1−1
ρ2=∅ 1 ρ1 +∅ 2 +. .. . .+ ∅ p ρ p−2
Untuk k ≥ q+1
Apabila suatu deret waktu mempunyai grafik fungsi autokorelasi yang terpisah
pada lag ke-q dan fungsi autokorelasi parsial turun secara eksponensial, maka
deret waktu tersebut dapat dioperasikan terhadap proses MA (q ).
12
c. Proses Campuran Autoregressive dan Moving Average (ARMA)
Jika suatu deret berkala memiliki model yang sebagian merupakan proses
Autoregressive dan Moving Averager maka deret tersebut dapat diasumsikan
memiliki model persamaan sebagai berikut :
d. Operator Backshift
Operator backshift dinyatakan B dengan operasi sebagai berikut :
BX t= X t−1
Dimana,
13
(1−B)2=¿ operator differencing ordo ke-d.
Atau,
Dimana,
x t=(1−B s)Z t
Dimana s sebagai periode setiap musim. Model seasonal yang terjadi sebelumnya
memiliki jarak (lag) sepanjang musim yang terjadi, sehingga MA (Q) yang
bersifat seasonal dengan sepanjang musim s dapat dinyatakan :
14
Bisa juga dalam bentuk operator backshift,
Zt =θ s (B) at
Lalu untuk model seasonal AR (P) dengan musim sepanjang s dapat dinyatakan :
Zt =∅1 Z t −s +∅ 1 Z t−s +. . .. .+ ∅ p Z t − p+ at
s 2s Qs
1−∅1 B −∅2 B −. . .. .−∅ Q B ¿ Z t =at
Maka, suatu hasil observasi {Z t } mengikuti proses yang dibentuk oleh gabungan
antara model ARIMA (p, d, q) dan SARIMA (P, D, Q), yang mengakibatkan
suatu model dapat dimanipulasi menggunakan operator backshift, yaitu :
∅ 1 ( B ) ∅ s ( B ) ∇s ∇ DS Z t=θ ( B ) θs ( B) at
Dimana,
15
H 0 :r 1=r 2=.. . ..=r k =0 (residu bersifat acak)
m
r 2k
Q=n(n+2) ∑
k n−k
Terima H 0 jika nilai Q> X (a ,db ) atau p−value>α. Sehingga, autokorelasi dari
barisan residu yang diuji tidak berbeda dari nol, atau disebut juga residu bersifat
acak.
D=maksimum|F0 ( X ) −S N (X )|
Terima H 0 jika Dhitung < Dtabel atau p−value>α. Maka residu bersifat normal.
I. Evaluasi Model
Suatu model dikatakan baik jika memiliki tingkat keakuratan yang benar. Untuk
mengukur tingkat keakuratan suatu model, ada beberapa alat ukur yang dapat
digunakan untuk mengevaluasi hasil peramalan model terhadap data observasi,
yaitu :
16
a. Mean Square Error (MSE)
n
1
MSE= ∑ (A −Ft )2
n t =1 t
Dimana :
17
BAB III
METODE PENELITIAN
A. Jenis Penelitian
Jenis penelitian yang digunakan bersifat explanatory research dan aplikasinya
adalah mengumpulkan referensi yang berhubungan dengan permasalahan yang
diperoleh dari data penelitian. Kemudian mempelajari, membahas, serta
menjabarkan hasil pengamatan studi, lalu dituangkan ke dalam penulisan karya
tulis berupa tugas akhir ini.
B. Sumber Data
Jenis data pada penelitian ini adalah data sekunder berupa jumlah pendaftaran
siswa baru dimulai dari tahun ajaran 2013/2014 sampai dengan tahun ajaran
2019/2020. Total data tersebut berjumlah 2121 data runtun waktu yang diperoleh
dari lembaga bimbingan belajar Danish Educa Pekayon. Untuk pengujiannya, data
dari tahun ajaran 2013/2014 digunakan sebagai menentukan model yang sesuai,
sedangkan untuk data dari tahun ajaran 2019/2020 digunakan sebagai
mengevaluasi model yang tepat, dimana model tersebut digunakan sebagai
peramalan.
C. Variabel Penelitian
Variabel dalam penelitian ini adalah data siswa Lembaga Bimbingan Belajar
Danish Educa Pekayon tahun ajaran 2013/2014 sampai dengan 2019/2020.
18
Hipotesis :
H 0 :δ =0 (data deret waktu tidak stasioner)
H 1 : δ <0 (data deret waktu stasioner)
Kriteria pengujian :
Tolak H o jika |^τ δ|≥|τ (n , ∝)| Dickey Fuller
Jika data memperlihatkan ketidakstasioneran, maka perlu ditetapkan apakah
data tidak stasioner secara rata-rata atau varians atau keduanya sehingga
dapat diperbaiki menggunakan transformasi differencing.
2. Mengidentifikasi Model
Jika data sudah dikatakan bersifat stasioner baik secara rata-rata ataupun
varians maka dapat ditentukan model yang tepat berdasarkan kriteria yang
ada. Hal ini perlu dilakukan untuk mendapatkan hasil peramalan dari model
yang dibentuk memuaskan dan tidak sia-sia. Menurut Gaynor P.E. dan
Kirkpatrick R.C. model SARIMA dapat ditentukan dengan kriteria sebagai
berikut :
a. Apabila ACF terpotong (cut off) setelah lag 1 atau 2 dan lag musiman
tidak signifikan dan PACF perlahan-lahan menghilang (dies down), maka
diperoleh model non seasonal MA (q=1 atau 2).
b. Apabila ACF terpotong (cut off) setelah lag musiman L dan lag non
musiman tidak signifikan dan PACF perlahan-lahan menghilang (does
down), maka diperoleh model seasonal MA (Q=1).
c. Apabila ACF terpotong setelah lag musiman L dan lag non musiman (cut
off) setelah lag 1 atau 2, maka diperoleh model non seasonal MA (q=1
atau 2 dan Q=1).
d. Apabila ACF perlahan-;ahan menghilang (dies down) dan PACF
terpotong (cut off) setelah lag 1 atau 2 dan lag musiman tidak signifikan,
maka diperoleh model non seasonal AR (p=1).
e. Apabila ACF perlahan-lahan menghilang (dies down) dan PACF
terpotong (cut off) setelah lag musiman L dan lag non musiman tidak
signifikan, maka diperoleh model seasonal AR (p=1).
19
f. Apabila ACF perlahan-lahan menghilang (dies down) dan PACF
terpotong (cut off) setelah lag musiman L, dan non musiman terpotong
(cut off) setelah lag 1 atau 2, maka diperoleh model non seasonal dan
seasonal AR (p=1 atau 2 dan P=1).
g. Apabila ACF dan PACF perlahan-lahan menghilang (dies down) maka
diperoleh campuran (ARMA) model.
3. Estimasi Parameter dari Model
Jika beberapa model sudah dipilih, maka selanjutnya adalah mengestimasi
parameter dari model tersebut. Pada penelitian kali ini metode yang
digunakan untuk estimasi parameter model yaitu dengan metode perbaikan
secara iteratif. Taksiran awal dipilih kemudian diperhalus secara iteratif
hingga kesalahan menjadi sekecil mungkin. Proses ini akan dikerjakan oleh
suatu program komputer.
4. Pengujian Model
Jika suatu model telah terpilih dan sudah diestimasi nilai parameternya,
langkah berikutnya adalah menguji apakah model tersebut sesuai dengan
data. Adapun langkah-langkah pengujiannya adalah sebagai berikut :
h. Keberartian koefisien
Hipotesis dan kriteria uji keberartian koefisien adalah sebagai berikut :
Hipotesis : H 0=¿ koefisien tidak berarti
H 1=¿ koefisien berarti
Dengan α =0,05
Kriteria uji : Tolak H 0 jika p−value<α, artinya koefisien telah
berarti.
i. Memenuhi asumsi White Noise
Suatu asumsi dikatakan bahwa residu bersifat acak dan normal. Hipotesis
dan kriteria uji keacakan residu adalah sebagai berikut :
Hipotesis : H 0 :r 1=r 2=.. .=r k =0 (residu bersifat acak)
H 1 :∃ r i ≠ r j=0 (residu tidak bersifat acak)
Kriteria uji : Terima H 0 jika nilaiQ> X (a ,db ) atau p−value>α
20
Sedangkan hipotesis dan kriteria uji kenormalan residu adalah sebagai
berikut :
Hipotesis : H 0=¿ residu berdistribusi normal
H 1=¿ residu tidak berdistribusi normal
Kriteria uji : Tolak H 0 jika Dhitung > Dtabel p−value<α.
j. Pemilihan model
Dari beberapa model yang memenuhi asumsi keberartian koefisien dan
asumsi white noise akan dipilih satu model terbaik berdasarkan nilai
MSE dari masing-masing model.
5. Peramalan
Jika telah model telah ditentukan diantara beberapa model dugaan yang
lainnya, maka peramalan dapat dilkukan untuk periode selanjutnya. Hasil
peramalan metode SARIMA dapat digunakan dalam jangka waktu menengah
yaitu tiga bulan hingga dua tahun.
21
Mulai
Input
Data
Transformasi Uji
Tidak
Differencing Stasioner
Ya
Identifikasi Model
Estimasi Parameter
Model
- Keberartian Koefisien
- Asumsi White Moise
Tidak - Paling Akurat?
Ya
Peramalan
Selesai
22
Gambar E. Diagram Alir Penelitian
23