Anda di halaman 1dari 12

Priscila Elia Kusumaningtyas 06211740000038 Analisis Data-C

Tugas Analisis Data – Regresi Dummy

Toko “Electronic Word” merupakan toko yang menjual peralatan radio dan video.
Toko tersebut ingin mempelajari hubungan antara volume penjualan toko dengan jumlah
rumah tangga dan lokasi toko. Adapun data penelitian adalah sebagai berikut.

Tabel 1. Data Penelitian


No Number of households (thousand) Location Sales Volume (thousand $)
1 161 Street 157,27
2 99 Street 93,28
3 135 Street 136,81
4 120 Street 123,79
5 164 Street 153,51
6 221 Mall 241,74
7 179 Mall 201,54
8 204 Mall 206,71
9 214 Mall 229,78
10 101 Mall 135,22
11 231 Downtown 224,71
12 206 Downtown 195,29
13 248 Downtown 242,16
14 107 Downtown 115,21
15 205 Downtown 197,82
Berdasarkan data pada Tabel 1, variabel yang berperan sebagai variabel perdiktor
(X) adalah Number of household (thousand) dan Location, sedangkan yang berperan
sebagai variabel respons (Y) adalah Sales Volume (thousand $). Metode yang digunakan
untuk menganalisis data penelitian tersebut adalah Regresi Linear dengan Vriabel Dummy
karena terdapat data yang bersifat kategorik pada variabel prediktornya yaitu Location dan
variabel responnya merupakan data yang bersifat kontinyu.

Langkah Analisis

Berikut merupakan langkah analisis dalam penelitian ini.

1. Melakukan analisis statistika deskriptif .


2. Melakukan visualisasi scatterplot.
3. Melakukan perhitungan korelasi antara variabel prediktor dengan variabel respon.
Priscila Elia Kusumaningtyas 06211740000038 Analisis Data-C

4. Melakukan uji multikolinearitas.


5. Melakukan analisis regresi linear dengan variabel dummy dengan Langkah-langkah
sebagai berikut.
a. Membuat kode variabel dummy.
b. Melakukan pemodelan regresi variabel dummy.
c. Melakukan uji serentak dan uji parsial.
d. Interpretasi model regresi dummy.
6. Melakukan pengujian asumsi residual model regresi.
7. Menarik kesimpulan.

Analisis Statistika Deskriptif

Sebelum menganalisis suatu data harus diketahui bagaimana karakteristik dari data
tersebut. Salah satu cara untuk mengetahui gambaran umum dari suatu data adalah dengan
menggunakan analisis statistika desktriptif. Pada penelitian ini akan dilakukan analisis
statistika deskriptif pada data penelitian Toko Electronic World yaitu variabel Jumlah rumah
tangga dan volume penjualan toko pada setiap lokasi. Berikut merupakan analisis statistika
deskriptif data penelitian Toko Electronic World.
Tabel 2. Statistika Deskriptif Data Penelitian Electronic Word
Variabel Location Mean Varians Minimum Maksimum
Number of Downtown 199,4 2993,3 107,0 248,0
household Mall 183,8 2395,7 101,0 221,0
Street 135,8 758,7 99,0 164,0
Sales Volume Downtown 195,0 2370,3 115,2 242,2
Mall 203,0 1707,0 135,2 241,7
Street 132,9 671,7 93,3 157,3
Berdasarkan Tabel 2 dapat diketahui bahwa jumlah rumah tangga pada lokasi
Downtown lebih banyak dibandingkan jumlah rumah tangga pada lokasi Mall dan Street. Hal
ini dapat dilihat berdasarkan nilai rata-rata variabel Number of household untuk lokasi
Downtown yaitu sebesar 199,4 dimana nilai tersebut lebih besar dibandingkan rata-rata
variabel Number of household untuk lokasi Mall dan Street yang berturut-turut sebesar 183,8
dan 135,8. Sedangkan untuk volume penjualan barang, diketahui bahwa di lokasi Mall
memiliki rata-rata volume penjualan barang yang lebih tinggi dibandingkan dengan lokasi
Downtown dan Street. Lokasi yang memiliki jumlah rumah tangga dan volume penjualan
barang paling banyak adalah lokasi Downtown dan yang paling sedikit adalah lokasi Street.
Priscila Elia Kusumaningtyas 06211740000038 Analisis Data-C

Variasi jumlah rumah tangga dan volume penjualan pada setiap lokasi berbeda-beda. Lokasi
yang memiliki variasi jumlah rumah tangga dan volume penjualan paling tinggi adalah lokasi
Downtown dengan nilai varians untuk jumlah rumah tangga sebesar 2993,3 dan nilai varians
untuk volume penjualan sebesar 2370,3.
Scatter Plot Volume Penjualan v.s Number of Household dengan Kategori Lokasi
Berikut merupakan scatterplot antara variabel Volume Penjualan v.s variabel Jumlah
rumah tangga dengan kategori lokasi.

260 Location
Downtown
240 Mall
Street

220

200
Sales Volume

180

160

140

120

100

100 120 140 160 180 200 220 240 260


Number of household

Gambar 1. Scatterplot Volume Penjualan dengan Jumlah Rumah Tangga


Berdasarkan scatter plot antara Volume Penjualan (Y) dengan Jumlah Rumah
Tangga (X1) di atas diperoleh informasi bahwa titik-titik data setiap kategori lokasi
(Downtown, Mall, dan Street) memberikan pola yang linear. Adapun garis regresi pada
scatter plot antara volume penjualan (Y) dengan Jumlah Rumah Tangga (X1) untuk setiap
lokasi tersebut menunjukkan hubungan positif yang berarti bahwa berarti jika jumlah rumah
tangga di setiap lokasi semakin tinggi (banyak) maka volume penjualan barang elektronik di
setiap lokasi juga akan meningkat.

Korelasi antara Variabel Respons dengan Variabel Prediktor

Berikut merupakan perhitungan korelasi variabel Volume Penjualan dengan Jumlah


Rumah Tangga dan korelasi variabel Volume Penjualan dengan Lokasi.

(i) Korelasi antara variabel Volume Penjualan dengan Jumlah Rumah Tangga

Correlations
Pearson 0,963
correlation
P-value 0,000
Priscila Elia Kusumaningtyas 06211740000038 Analisis Data-C

Berdasarkan output MINITAB di atas, didapatkan hasil bahwa nilai korelasi antara
variabel volume penjualan dengan lokasi sebesar 0,963. Nilai korelasi sebesar 0,963 ini
berarti bahwa terdapat hubungan yang kuat (signifikan) positif antara variabel volume
penjualan dengan jumlah rumah tangga. Artinya jumlah rumah tangga berpengaruh
signifikan terhadap volume penjualan barang elektronik.

(ii) Korelasi antara Volume Penjualan dengan Lokasi


Akan diteliti apakah terdapat hubungan antara Volume Penjualan dengan Lokasi Toko
( Street, Mall, dan Downtown.
Hipotesis
H0 : Tidak ada hubungan antara volume penjualan dengan lokasi toko
H1 : Terdapat hubungan antara volume penjualan dengan lokasi toko
Tingkat Signifikansi α =0,05
Statistik Uji : Menggunakan koefisien korelasi Eta

Berikut merupakan perhitungan statistik uji

Lokasi Toko
 
No
Street Mall Downtown Jumlah
Y1 Y1^2 Y2 Y2^2 Y3 Y3^2  
24733.8
1 157.27 5 241.74 58438.23 224.71 50494.58  
8701.15
2 93.28 8 201.54 40618.37 195.29 38138.18  
18716.9
3 136.81 8 206.71 42729.02 242.16 58641.47  
15323.9
4 123.79 6 229.78 52798.85 115.21 13273.34  
23565.3
5 153.51 2 135.22 18284.45 197.82 39132.75  
n 5   5   5   15
jumlah yi 664.66   1014.99   975.19   2654.84
rata2 yi 132.932   202.998   195.038   530.968
ni x rata2 88354.58   206040.94   190199.   484594.6
Priscila Elia Kusumaningtyas 06211740000038 Analisis Data-C

yi^2 1
91041.2
sum y^2   7   212868.9   199680.3 503590.5

= 0,047298

Daerah Kritis : Tolak H0 jika


Keputusan : Fhitung = 0,013453 ; F0,05; (2;12) = 3,89 maka Fhitung < Ftabel Tolak H0
Kesimpulan : Terdapat hubungan antara volume penjualan dengan lokasi toko

Uji Multikolinearitas

Salah satu kriteria yang dapat digunakan untuk mendeteksi adanya multikolinieritas
adalah Variance Inflation Factor (VIF).

merupakan koefisien determinasi antara Xj dengan variabel bebas lainnya pada


persamaan model regresi, dimana j = 1, 2, ..., p. Apabila nilai VIF lebih dari 5, maka dapat
diindikasikan terdapat kasus multikolinieritas.
Tabel 3. Nilai VIF
Number of
Z1 Z2
Household
VIF 1,45 1,88 1,37
Tabel 3 menunjukkan bahwa tidak ada indikasi terjadi kasus multikolinieritas
antar variabel prediktor karena nilai VIF untuk setiap variabel prediktor kurang dari 5.
Variabel Z1 dan Z2 merupakan hasil pengkodean variabel dummy.

Analisis Regresi dengan Variabel Dummy


Analisis regresi dengan variabel dummy dilakukan dengan langkah-langkah sebagai
berikut.

a. Membuat kode variabel dummy.


Variabel prediktor Lokasi merupakan variabel kualitatif dengan tiga kategori yaitu
Downtown, Street, dan Mall. Oleh karena itu, pada analisis ini variabel Lokasi menjadi
Priscila Elia Kusumaningtyas 06211740000038 Analisis Data-C

variabel dummy. Adapun jumlah variabel dummy yang dibentuk adalah sebanyak (n - 1) di
mana n merupakan jumlah kategori dari variabel kualitatif. Oleh karena variabel Lokasi
memiliki 3 kategorik, maka variabel dummy yang dapat dibentuk adalah sebanyak 2 yaitu Z1
dan Z2. Adapun elemen dari Z1 dan Z2 terdiri dari 0 dan 1 yang membentuk suatu matriks
koresponden dengan determinan tidak sama dengan 0. Berikut merupakan matriks
koresponden dari variabel lokasi.

First row of Street


First row of Mall
First row of Downtown

Sehingga diperoleh data penelitian dengan kode variabel dummy sebagai berikut.

Tabel 4. Data Penelitian dengan Kode Variabel Dummy

No Number of Location Sales Volume Z1 Z2


households (thousand $)
(thousand)
1 161 Street 157,27 1 0
2 99 Street 93,28 1 0
3 135 Street 136,81 1 0
4 120 Street 123,79 1 0
5 164 Street 153,51 1 0
6 221 Mall 241,74 0 1
7 179 Mall 201,54 0 1
8 204 Mall 206,71 0 1
9 214 Mall 229,78 0 1
10 101 Mall 135,22 0 1
11 231 Downtown 224,71 0 0
12 206 Downtown 195,29 0 0
13 248 Downtown 242,16 0 0
14 107 Downtown 115,21 0 0
15 205 Downtown 197,82 0 0

b. Melakukan pemodelan regresi dummy


Berikut merupakan output MINITAB hasil pemodelan regresi variabel Volume
Penjualan v.s variabel Z1, dan variabel Z2.

Analysis of Variance
D F-
Source F Adj SS Adj MS Value P-Value
Regression 3 33268,7 11089,6 275,07 0,000
  Number of household 1 18552,4 18552,4 460,19 0,000
  Z1 1 83,5 83,5 2,07 0,178
  Z2 1 1128,8 1128,8 28,00 0,000
Error 11 443,5 40,3    
Total 14 33712,2      
Priscila Elia Kusumaningtyas 06211740000038 Analisis Data-C

Output MINITAB di atas merupakan tabel ANOVA dari regresi antara variabel volume
penjualan vs variabel Z1 dan variabel Z2. Berdasarkan output tabel ANOVA dapat diketahui
bahwa nilai F-Value dari model regresi tersebut sebesar 275,07 sedangkan Ftabel (0.05;3;11)
adalah 3,59. Dari hasil tersebut, Fvalue lebih besar dari Ftabel yang artinya model tersebut
signifikan. Sehingga model tersebut sudah sesuai untuk memodelkan data. Selanjutnya
diperoleh output koefisien determinasi (R-sq) sebagai berikut.

Model Summary
S R-sq R-sq(adj) R-sq(pred)

6,34941 98,68 98,33% 97,68%


%
Berdasarkan output koefisien determinasi (R-sq) dapat diketahui bahwa R-Square dari
model regresi linear dengan variabel dummy ini adalah sebesar 98,68% yang artinya
kemampuan variabel predictor (Jumlah Rumah Tangga), variabel Z1, dan variabel Z2
dalam menjelaskan variansi dari variabel respons (Volume Penjualan) adalah sebesar
98,68% dan sisanya dijelaskan oleh variabel-variabel yang lain. Selanjutnya diperoleh
output mengenai koefisien regresi sebagai berikut.

Coefficients
SE
Term Coef Coef T-Value P-Value VIF

Constant 21,84 8,56 2,55 0,027  


Number of household 0,8686 0,0405 21,45 0,000 1,45
Z1 -6,86 4,77 -1,44 0,178 1,88
Z2 21,51 4,07 5,29 0,000 1,37

Output MINITAB di atas menunjukkan bahwa parameter β 0=21,84 , parameter


β 1=0,8686 , parameter α 1=−6,86 , dan parameter α 2=21,51. Selain itu diperoleh nilai p-
value untuk Constant adalah 0,027 ; p-value untuk variabel Jumlah Rumah Tangga adalah
0,000 kemudian p-value untuk variabel dummy Z1 adalah 0,178 dan p-value untuk variabel
dummy Z2 adalah 0,000. P-value untuk variabel Jumlah rumah tangga, dan variabel Z2 lebih
kecil dari alpha 0,05 sehingga untuk variabel Jumlah Rumah Tangga dan variabel
Priscila Elia Kusumaningtyas 06211740000038 Analisis Data-C

dummy Z2 signifikan memberikan pengaruh dalam model. Adapun p-value untuk


variabel dummy Z1 sebesar 0,178 yang artinya lebih besar dari alpha 0,05 sehingga variabel
dummy Z1 tidak berpengaruh signifikan dalam model .
Model regresi linear dengan variabel dummy secara umum dapat dinyatakan dengan
persamaan sebagai berikut :

Adapun fitted equation dari regresi linear dummy pada penelitian ini adalah :

Sehingga berdasarkan fitted equation tersebut didapatkan 3 model persamaan untuk setiap
lokasi yaitu :

, untuk Downtown
, untuk Street
, untuk Mall

Interpretasi Model Regresi Dummy

Berikut merupakan interpretasi dari model regresi dummy untuk setiap kategori Lokasi.

1. Lokasi Street (Z1 = 1, Z2 = 0)

Untuk toko yang berlokasi di Street (pinggir jalan) , apabila variabel X (jumlah rumah
tangga) yang ada di sekitar toko sejumlah 0 maka volume penjualan toko adalah sebesar
14,98 ribu dollar. Namun, jika jumlah rumah tangga yang ada di sekitar toko mengalami
peningkatan sejumlah 1 rumah tangga maka volume penjualan toko akan mengalami
kenaikan sebesar 0,8686 ribu dollar.
2. Lokasi Mall (Z1 = 0, Z2 =1)

Untuk toko yang berlokasi di Mall (dalam Mall), apabila variabel X (jumlah rumah
tangga) yang ada di sekitar toko sejumlah 0 maka volume penjualan toko adalah sebesar
43,35 ribu dollar. Namun, jika jumlah rumah tangga yang ada di sekitar toko meningkat
sejumlah 1 rumah tangga maka volume penjualan toko akan mengalami kenaikan sebesar
0,8686 ribu dollar.
Priscila Elia Kusumaningtyas 06211740000038 Analisis Data-C

3. Lokasi Downtown (Z1 = 0, Z2 = 0)

Untuk toko yang berlokasi di Downtown (tengah kota), apabila variabel X (jumlah rumah
tangga) yang ada di sekitar toko sejumlah 0 maka volume penjualan toko adalah sebesar
21,84 ribu dollar. Namun, jika jumlah rumah tangga yang ada di sekitar toko meningkat
sejumlah 1 rumah tangga maka volume penjualan toko akan mengalami kenaikan sebesar
0,8686 ribu dollar.

Uji Asumsi Residual

Uji asumsi residual merupakan salah satu syarat yang harus dipenuhi pada analisis
regresi linear dengan variabel dummy. Apabila syarat-syarat terpenuhi maka estimasi
parameternya tidak bias sehingga hasil dari pemodelannya dapat dipertanggungjawabkan.
Asumsi yang harus dipenuhi pada analisis antara lain residual harus identik, residual harus
independent, dan residual berdistribusi normal.

Residual Plots for Sales Volume


Normal Probability Plot Versus Fits
99
5
90
0
Residual
Percent

50
-5

10 -10

1 -15
-10 0 10 100 150 200 250
Residual Fitted Value

Histogram Versus Order


8
5
6
Frequency

0
Residual

4 -5

2 -10

0 -15
-12 -8 -4 0 4 8 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Residual Observation Order

Berdasarkan plot residual di atas dapat diperoleh informasi bahwa di atas diketahui
bahwa residual diindikasikan telah memenuhi asumsi distribusi normal, karena dapat terlihat
titik-titik data dari residual menyebar mengikuti garis normal. Selanjutnya residual juga
diindikasikan memenuhi asumsi identik karena sebaran data residual menyebar secara acak
atau tidak membentuk pola tertentu (corong). Kemudian untuk asumsi independent dapat
Priscila Elia Kusumaningtyas 06211740000038 Analisis Data-C

dilihat dari plot bahwa tidak terdapat keterpautan waktu pada observasi sehingga
diindikasikan memenuhi asumsi independent.
Adapun pengujian asumsi residual adalah sebagai berikut.

a) Uji Asumsi Residual Berdistribusi Normal


Salah satu uji yang dapat menguji residual berdistribusi normal adalah dengan
menggunakan Uji Kolmogorov-Smirnov. Hipotesis dari Uji Kolmogorov-Smirnov adalah
sebagai berikut.

Hipotesis

H0 : F (x) = F0 (x) untuk semua x (residual berdistribusi normal)

H1 : F (x) ≠ F0 (x) untuk minimal satu nilai x (residual tidak berdistribusi normal)

Taraf signifikansi α =0,05

Statistika Uji

D =|
S( x)−F 0(x)|
¿

p-value = 0,116

Normal
99
Mean -4,07378E-14
StDev 5,628
95 N 15
KS 0,197
90 P-Value 0,116

80
70
Percent

60
50
40
30
20

10

1
-15 -10 -5 0 5 10
RESI

Daerah Kritis : Tolak H0 jika D> Dq (1−α) atau p-value < α

Keputusan : p-value = 0,116 ; α =0,05 maka Gagal Tolak H0

Kesimpulan : Residual memenuhi asumsi distribusi normal.


Priscila Elia Kusumaningtyas 06211740000038 Analisis Data-C

b) Uji Asumsi Residual Berdistribusi Identik


Uji residual identic digunakan untuk melihat homogenitas dari variansi residual.
Identik artinya adalah ε i memiliki nilai konstan atau sama dengan σ 2 dimana varians
responnya sama dengan varians errornya. Uji asumsi identic dapat dilakukan dengan dua cara
yaitu secara visual dan secara numerik. Secara visual yaitu dengan melihat pola dari titik titik
residual pada plot versus fits. Adapun secara numerik dapat dilakukan uji glejser. Uji glejser
dilakukan dengan cara meregresikan hasil absolut ε i terhadap variabel predictor. Uji
Hipotesis dari Uji Glejser adalah sebagai berikut.

Hipotesis

H0 :

H1 :
Taraf signifikansi α =0,05
Statistik Uji :

Adapun tabel ANOVA dari hasil regresi absolut ε i terhadap variabel predictor (Jumlah
Rumah Tangga, Z1, dan Z2) adalah sebagai berikut.
Analysis of Variance
D Adj
Source F Adj SS MS F-Value P-Value

Regression 3 20,064 6,688 0,55 0,657

  Number of household 1 3,897 3,897 0,32 0,582

  Z1 1 10,351 10,351 0,86 0,375

  Z2 1 17,847 17,847 1,48 0,250

Error 11 132,994 12,090    

Total 14 153,058      

Daerah Kritis : Tolak H0 jika atau p-value < α


Keputusan :
p-value Variabel Jumlah Rumah Tangga = 0,582 > α =0,05
p-value Variabel Z1 = 0,375 > α =0,05 Gagal Tolak H0
p-value Variabel Z2 = 0,250 > α =0,05
Priscila Elia Kusumaningtyas 06211740000038 Analisis Data-C

Kesimpulan : Residual memenuhi asumsi identik.


c) Uji Asumsi Residual Independen
Uji residual independent digunakan untuk melihat apakah komponen error
berkorelasi dengan urutan waktu, urutan ruang, atau korelasi pada komponen error itu
sendiri. Apabila terjadi korelasi pada residual itu artinya bahwa residual terjadi autokorelasi.
Cara mendeteksi adamya autokorelasi dengan melihat plot ACF dari residual sebagai berikut.

Autocorrelation Function for RESI


(with 5% significance limits for the autocorrelations)

1,0

0,8

0,6

0,4
Autocorrelation

0,2

0,0

-0,2

-0,4

-0,6

-0,8

-1,0

1 2 3 4 5 6 7 8 9 10 11 12 13 14
Lag

Berdasarkan plot Autocorrelation Function residual di atas dapat diketahui bahwa lag
dari plot tersebut tidak ada yang menembus Confident Interval (batas merah) sehingga
residual memenuhi asumsi independent.

Anda mungkin juga menyukai