Jelajahi eBook
Kategori
Jelajahi Buku audio
Kategori
Jelajahi Majalah
Kategori
Jelajahi Dokumen
Kategori
Disusun Oleh:
KELOMPOK 4
Clara Septyana Rahma Sulaeman
Dian Saskia Bani
Didik Abidin
Fauzul Hidayah
Nurul Ardhiani
Salsa Nopian Pamungkas
Zukha Latifah
1.
Regresikan y terhadap x
Diperoleh hasil sbb:
4. Buat scatter-plot antara residual (ei) dan nilai harapan dibwah kenormalan
=> Descriptive Statistics => P-P Plot => masukkan Standarized Residual
ke dalam kolom variabel => Test distribution: normal => OK
b. Histogram, Q-Q plot, Detren d Q-Q plots, Steam-Leaf, Boxplot
Data:
Cara pengujian:
Manampilkan residual terstd pada
lembar kerja:
Output SPSS:
a. Histogram
Ketika
membentuk
histogram
kurva
normal
bar/batang
kurva
berada
normal
Standardized
di
maka
Residual
berdistribusi normal.
b. Stem-and-Leaf Plot
Stem &
Leaf
-1
-1
-0
-0
0
0
1
1
9
001
699
13
11344
799
03
5
1,00
3,00
3,00
2,00
5,00
3,00
2,00
1,00
Stem width:
Each leaf:
.
.
.
.
.
.
.
.
1,00000
1 case(s)
Ketika
angka-angka
membentuk
kurva
miring
kanan,
ke
Standardized
normal
maka
Residual
berdistribusi normal.
pelajari
kuantil
data.
d. Boxplot
tampilahn grafis dari kuantil data yang dinyatakan dalam bentuk kotak. Pada
Boxplot digambarkan posisi median (Q2), kuantil 1(Q1) dan kuantil 3(Q3).
Dapat menunjukkan
a. adanya pencilan (outlier)
b. kesimetrisan data
Ketika
bloxpot
berada
di
standardized
residual
berdistribusi normal.
Note:
Note: Buka lagi catatan mengenai
box plot, bagaimana cara membuat
jika manual
NOTE:
Pengujian dengan metode grafik sering menimbulkan perbedaan persepsi
di antara beberapa pengamat (subjektive) sehingga pengujian normalitas
dengan uji statistik bebas dari keragu-raguan meskipun tidak ada jaminan
bahwa pengujian dengan uji statistik lebih baik dari pengujian dengan
metode grafik.
Keterangan :
Xi = Angka pada data
Z = Transformasi dari angka ke notasi pada distribusi normal
F(x) = Probabilitas komulatif normal
S(x) = Probabilitas komulatif empiris
PERSYARATAN
a. Data berskala interval atau ratio (kuantitatif)
b. Data tunggal / belum dikelompokkan pada tabel distribusi frekuensi
c. Dapat untuk n besar maupun n kecil.
SIGNIFIKANSI
Signifikansi uji, nilai | F (x) - S (x) | terbesar dibandingkan dengan nilai tabel
Lilliefors.
Jika nilai | F (x) - S (x) | terbesar < nilai tabel Lilliefors, maka Ho diterima ; Ha
ditolak.
Jika nilai | F(x) - S(x) | terbesar > dari nilai tabel Lilliefors, maka Ho ditolak ; Ha
diterima.
Contoh :
Berdasarkan data ujian statistik dari 18 mahasiswa didapatkan data sebagai
berikut ; 46, 57, 52, 63, 70, 48, 52, 52, 54, 46, 65, 45, 68, 71, 69, 61, 65, 68.
Selidikilah dengan = 5%, apakah data tersebut di atas diambil dari populasi
yang berdistribusi normal ?
Penyelesaian :
1. Hipotesis
Ho : Populasi nilai ujian statistik berdistribusi normal
H1 : Populasi nilai ujian statistik tidak berdistribusi normal
2. Nilai
Nilai = level signifikansi = 5% = 0,05
3. Statistik Penguji
Nilai | F(x) - S(x) | tertinggi sebagai angka penguji normalitas, yaitu 0,1469.
4. Derajat Bebas
Df tidak diperlukan
5. Nilai tabel
Nilai Kuantil Penguji Lilliefors, = 0,05 ; N = 18 yaitu 0,2000. Tabel Lilliefors
pada lampiran
6. Daerah penolakan
Menggunakan rumus | 0,1469 | < | 0,2000| ; berarti Ho diterima, Ha ditolak
7. Kesimpulan: Populasi nilai ujian statistik berdistribusi normal.
b. Uji Kolmogorov Smirnov
Kelebihan dari uji ini adalah sederhana dan tidak menimbulkan perbedaan
persepsi di antara satu pengamat dengan pengamat yang lain, yang sering
terjadi pada uji normalitas dengan menggunakan grafik.
Konsep dasar dari uji normalitas Kolmogorov Smirnov adalah dengan
membandingkan distribusi data (yang akan diuji normalitasnya) dengan
distribusi normal baku. Distribusi normal baku adalah data yang telah
ditransformasikan ke dalam bentuk Z-Score dan diasumsikan normal. Jadi
sebenarnya uji Kolmogorov Smirnov adalah uji beda antara data yang diuji
normalitasnya dengan data normal baku. Seperti pada uji beda biasa, jika
signifikansi di bawah 0,05 berarti terdapat perbedaan yang signifikan, dan jika
signifikansi di atas 0,05 maka tidak terjadi perbedaan yang signifikan. Penerapan
pada uji Kolmogorov Smirnov adalah bahwa jika signifikansi di bawah 0,05
berarti data yang akan diuji mempunyai perbedaan yang signifikan dengan data
normal baku, berarti data tersebut tidak normal.Lebih lanjut, jika signifikansi di
atas 0,05 maka berarti tidak terdapat perbedaan yang signifikan antara data yang
akan diuji dengan data normal baku, artinya data yang kita uji normalkan tidak
berbeda dengan normal baku.
Jika kesimpulan kita memberikan hasil yang tidak normal, maka kita tidak
bisa menentukan transformasi seperti apa yang harus kita gunakan untuk
normalisasi. Jadi ya kalau tidak normal, gunakan plot grafik untuk melihat
menceng ke kanan atau ke kiri, atau menggunakan Skewness dan Kurtosis
sehingga dapat ditentukan transformasi seperti apa yang paling tepat
dipergunakan.
untuk perhitungan manualnya bisa menggunakan teori dibawah ini
Rumus
Keterangan :
Xi = Angka pada data
Z = Transformasi dari angka ke notasi pada distribusi normal
FT = Probabilitas komulatif normal
FS = Probabilitas komulatif empiris
FT = komulatif proporsi luasan kurva normal berdasarkan notasi Zi, dihitung
dari luasan kurva mulai dari ujung kiri kurva sampai dengan titik Z.
Siginifikansi
Signifikansi uji, nilai | FT FS | terbesar dibandingkan dengan nilai tabel
Kolmogorov Smirnov. Jika nilai | FT FS | terbesar kurang dari nilai tabel
Kolmogorov Smirnov, maka Ho diterima ; H1 ditolak. Jika nilai | FT FS |
terbesar lebih besar dari nilai tabel Kolmogorov Smirnov, maka Ho ditolak ;
H1diterima. Tabel Nilai Quantil Statistik Kolmogorov Distribusi Normal.
Contoh
Penyelesaian
1. Hipotesis
Ho : tidak beda dengan populasi normal (data Normal).
H1 : ada beda dengan populasi nomal (data tdak normal) .
2. : 0,05
3. Buat tabel
a.) Langkah pertama adalah menetukan rata-rata data yaitu:
rata2= data/n=2195/27=81,3
b.) langkah berikutnya adalah menghitung Standart defiasi: SD=akar( (xxrata)2/n)=akar(2749.63/27)=akar(101.838)=10,1
c.) menghitung z score untuk i=1 maka didapkan (67-81,3)/10,1=-1,39
d.) (komulatif proporsi luasan kurva normal berdasarkan notasi Zi, dihitung dari
luasan kurva mulai dari ujung kiri kurva sampai dengan titik Z.). Tentukan besar
peluang untuk masing-masing nilai z berdasarkan tabel z dan diberi nama F(z)
(lihat tabel z) . jika nilai z minus, maka 0,5 dikurangi (-) luas wilayah pada tabel
z. Sebaliknya, jika nilai z positif, maka 0,5 ditambah (+) luas nilai z pada tabel,
sehingga diperoleh nilai-nilai F(z) ,..untuk Zscore -1,39 maka didapatkan nilai
F(1,39)=0.4177 sehingga Ft=0.5-0.4177=0.823.
e.) menentukan Fs dari saat i=1 yaitu data pertama yaitu x=67 jumlahnya yaitu ada 2
yaitu pada data pertama dan kedua maka Fs pada data pertama diperoleh
2/27=0.740
f.) |Ft-Fs| pada data pertama adalah |0.823-0.740|=0.083,
Sehingga diperoleh tabel:
No
Xi
67
67
4.
uji :
D
=
- Fs |
68
69
70
70
72
72
77
10
77
11
78
12
78
13
78
14
78
15
80
16
82
17
84
18
87
19
88
20
89
21
90
Zsco
re
1,3
9
1,3
9
1,2
9
1,1
9
1,1
0
1,1
0
0,9
0
0,9
0
0,4
2
0,4
2
0,3
2
0,3
2
0,3
2
0,3
2
0,1
2
0,0
7
0,2
6
0,5
5
0,6
5
0,7
5
0,8
Ft
Fs
| Ft
-Fs |
0,08
23
0,07
40
0,00
83
0,08
23
0,07
40
0,00
83
0,09
85
0,11
11
0,01
26
0,11
70
0,14
81
0,03
11
0,13
57
0,22
22
0,08
65
0,13
57
0,22
22
0,08
65
0,18
41
0,29
63
0,11
22
0,18
41
0,29
63
0,11
22
0,33
72
0,37
04
0,03
32
0,33
72
0,37
04
0,03
32
0,37
45
0,51
85
0,14
40
0,37
45
0,51
85
0,14
40
0,37
45
0,51
85
0,14
40
0,37
45
0,51
85
0,14
40
0,45
22
0,55
55
0,10
33
0,52
79
0,60
26
0,70
88
0,74
22
0,77
34
0,79
0,59
26
0,62
96
0,66
66
0,70
37
0,74
07
0,81
0,06
47
0,02
70
0,04
22
0,03
85
0,03
27
0,01
Statistik
maks | Ft
= 1,440
Kriteria uji : tolak Ho jika Dmaks Dtabel , terima dalam hal lainya.dengan =
0,05 dan N=27
Karena Dmaks = 0,1440 < Dtabel = 0,2540,jadi Ho diterima,berarti sampel
yang diambil dari populasi yang berdistribusi normal.
Lihat tabel z
tabel D
Contoh:
Lakukan pengujian untuk mengetahui apakah data dalam tabel distribusi
frekuensi berikut berasal dari populasi berdistribusi normal atau tidak?
Tabel Distribusi Frekuensi
Langkah pertama, hitunglah nilai mean dan simpangan baku dari data tersebut
seperti berikut.
Tabel Distribusi Frekuensi :
Dari hasil perhitungan dalam tabel tersebut, didapat nilai X2hitung = 68,25.
2. Menggunakan SPSS
a. Uji Kolmogorov Smirnov
Ho: Residual berasal dari populasi yang berdistribusi normal
Ha: Residual tidak berasal dari populasi yang berdistribusi normal
Dari lembar kerja yang sudah terdapat Residual(standardized) => Analyze
=> Non Parametric Test=> Legacy dialogs => 1 Sample K-S
Masukkan Standardized Residual ke dalam test variable list =>
centang test distribution normal (sudah terdefault) => OK
One-Sample Kolmogorov-Smirnov Test
N
Normal Parametersa,b
Most Extreme Differences
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
a. Test distribution is Normal.
b. Calculated from data.
Mean
Std.
Deviation
Absolute
Positive
Negative
Standardized
Residual
20
0E-7
,97332853
,123
,123
-,099
,549
,924
Dari lembar kerja yang sudah terdapat Residual(standardized) => Analyze =>
Descriptive statistics => Explore => Masukkan Standardized
Residual ke dalam dependent list =>Plot => centang histogram dan
normal plots with test
Tests of Normality
Kolmogorov-Smirnova
Statist
Df
Sig.
ic
Standardized
,123
20
Residual
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction
,200*
Shapiro-Wilk
Statist
df
ic
Sig.
,959
,529
20
Dapat dilihat bahwa signifikansi dari uji lilifors adalah 0,2 yang artinya >
(0,05) sehingga tidak signifikan untuk menolak Ho. Dengan demikian Ho
diterima.
Simpulan: Dengan tingkat keyakinan 95% dapat disimpulkan bahwa residual
berasal dari populasi yang berdistribusi normal.
c. Uji Shapirowilks
Ho: Residual berasal dari populasi yang berdistribusi normal
Ha: Residual tidak berasal dari populasi yang berdistribusi normal
Dari hasil di atas dapat dilihat bahwa signifikansi dari uji Shapiro-Wilk adalah
0,529 yang artinya > (0,05) sehingga tidak signifikan untuk menolak Ho.
Dengan demikian Ho diterima.
Simpulan: Dengan tingkat keyakinan 95% dapat disimpulkan bahwa residual
berasal dari populasi yang berdistribusi normal.
X1
150200
94900
79657
32420
27780
82888
29502
51849
65475
93890
129786
118461
136056
150427
61488
62441
47970
X2
30000
16000
11400
9100
24000
12500
22000
7200
11700
12500
18800
32000
14800
14000
9800
12500
11400
X3
28
39
36
32
24
20
20
21
36
38
23
21
24
40
36
35
37
X4
25
38
35
31
24
19
19
20
35
37
21
21
22
39
35
34
36
X5
3
1
1
1
1
1
1
1
1
1
2
1
2
1
1
1
1
206336
41200
378600
224278
183600
51400
88397
72800
242220
305018
227800
60000
1149900
304325
2481619
357000
2.55E+07
882035
52000
737100
1528800
2139000
3864100
125272
24360
198175
136280
96008
33100
62560
34248
155707
196878
156175
25880
840400
165175
1020887
133488
345000
429700
25000
523946
1125551
1905500
2347370
28000
22000
21000
24000
14500
18000
11500
19000
14000
16700
14800
20000
48000
15000
167800
30000
6619317
45600
20000
75000
70800
17500
160000
23
26
38
25
24
22
35
24
27
34
28
22
59
24
126
25
1706
24
21
22
20
26
46
23
26
36
25
23
22
34
24
25
32
26
22
57
23
84
25
921
21
19
22
18
26
44
1
1
2
1
1
1
1
1
2
2
2
1
2
1
42
5
785
3
2
70
2
45
2
2. Masukkan variabel yang hendak di uji pada kotak Dependent List. (yaitu: Standarized
Residual)
3. Tekan tombol Plots => Beri tanda pada Normality Plot With Test => OK
Tests of Normality
Kolmogorov-Smirnova
Statistic
df
Sig.
Standardized
Residual
.278
40
.000
Shapiro-Wilk
Statistic
df
Sig.
.794
40
.000
Interpretasi:
Pada Test of Normality:
Terlihat bahwa nilai P-value yaitu Sig. bernilai 0.000 (untuk kedua uji
normalitas)<0.05. Sehingga dapat disimpulkan bahwa Standardized Residual tidak
memenuhi asumsi distribusi normal.
Pada Histogram dan Standardized Steam and Leaf Plot, terlihat bahwa data tidak
berdistribusi normal.
Pada scatter plot di atas (Normal Q-Q Plot of Standardized Residual dan Detrended
Normal Q-Q Plot of Standardized Residual) data tersebar memiliki pola tertentu,
selain itu pada box plotjuga terlihat bahwa data memiliki banyak nilai ekstrim,
sehingga dapat disimpulkan bahwa Standardized Residual tidak memenuhi asumsi
distribusi normal.
Uji Kolgomorov-Smirnov:
1. Klik Analyze Nonparametric Test 1-Sample
3. Output SPSS:
Mean
Std. Deviation
Absolute
Positive
Negative
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
40
.0000000
.93369956
.278
.224
-.278
1.757
.004
Jika asumsi kenormalan tidak terpenuhi, artinya data tidak berdistribusi normal.
Adapun langkah-langkah yang harus dilakukan adalah:
Jika asumsi kenormalan tidak terpenuhi, artinya data tidak berdistribusi normal. Adapun
langkah-langkah yang harus dilakukan adalah:
1. Menambah jumlah sampel
Tambahan data 10 sampel:
2251660
45000000
153
15
37
170
2125899
571456518
56000000
1504
359
56
1800
7620732
117216298
27
3
9
457090
30
8275591 6640729
177700
13
8
20
5386215
647662800
1350000
221
24
00
250
6494858
697725375
16043368
204
35
77
250
371184944 1680637
51084038
85
10
89
1241399
228039832
75000000
125
2
22
130
Dilakukan pengujian untuk melihat apakah data berdistribusi normal, seperti cara
di atas (sebelumnya).
296907473
Tests of Normality
Kolmogorov-Smirnova
Statistic
Standardized Residual
.420
df
Shapiro-Wilk
Sig.
48
.000
Statistic
.431
df
Sig.
48
.000
Terlihat bahwa nilai P-value yaitu Sig. bernilai 0.000 (untuk kedua uji normalitas)<0.05.
Sehingga dapat disimpulkan bahwa Standardized Residual tidak memenuhi asumsi distribusi
normal.
Pada scatter plot di atas (Normal Q-Q Plot of Standardized Residual dan Detrended Normal
Q-Q Plot of Standardized Residual) data tersebar memiliki pola tertentu, selain itu pada box
plotjuga terlihat bahwa data memiliki banyak nilai ekstrim, sehingga dapat disimpulkan
bahwa Standardized Residual tidak memenuhi asumsi distribusi normal.
Uji Kolgomorov-Smirnov:
One-Sample Kolmogorov-Smirnov Test
Standardized
Residual
N
48
Normal Parametersa
Mean
.0000000
Std. Deviation
Most Extreme Differences
.94531319
Absolute
.420
Positive
.420
Negative
-.325
Kolmogorov-Smirnov Z
2.910
a.
.000
Test distribution is
Normal.
Terlihat bahwa nilai P-value yaitu Asymp.Sig (2-tailed) bernilai 0.000< 0.05. Sehingga dapat
disimpulkan bahwa Standardized Residual tidak memenuhi asumsi distribusi normal.
Kesimpulannya:
Penambahan jumlah sampel sebanyak 10 sampel, tidak dapat mengatasi ketdaknormalan data.
Tests of Normality
Kolmogorov-Smirnova
Statistic
Unstandardized Residual
a. Lilliefors Significance Correction
.261
df
Shapiro-Wilk
Sig.
34
.000
Statistic
.609
df
Sig.
34
.000
Terlihat bahwa nilai P-value yaitu Sig. bernilai 0.000 (untuk kedua uji normalitas)<0.05.
Sehingga dapat disimpulkan bahwa Standardized Residual tidak memenuhi asumsi distribusi
normal.
Pada scatter plot di atas (Normal Q-Q Plot of Standardized Residual dan Detrended
Normal Q-Q Plot of Standardized Residual) data tersebar memiliki pola tertentu, selain itu
pada box plot juga terlihat bahwa data masih memiliki ada beberapa nilai ekstrim, sehingga
dapat disimpulkan bahwa Standardized Residual tidak memenuhi asumsi distribusi normal.
Kesimpulannya:
Penambahan jumlah sampel sebanyak 10 sampel, tidak dapat mengatasi ketdaknormalan data.
3. Transformasi
A. Lakukan transformasi dengan mencari nilai Ln dari seluruh variabel, yaitu dengan cara
berikut:
Uji Kolmogorov-Smirnov:
Ho: Residual berasal dari populasi yang berdistribusi normal
Ha: Residual tidak berasal dari populasi yang berdistribusi normal
1. Klik Transform, Compute Variable.
Pada kotak Function Group, pilih All, lalu pada kotak Fuctions and Special
Variables pilih Ln.
Masukkan variabel Y pada Nurmeric Expression. OK.
2. Lakukan langkah (1) untuk variabel lainnya (X1, X2, X3, X4, dan X5).
3. Cari residual terstandarisasi dengan klik Analyze, Regression, Linear.
Masukkan variabel lnY pada Dependent, dan variabel lnX1, lnX2, lnX3, lnX4
dan lnX5 pada Independent(s).
Klik Save, beri tanda centang pada Standardized di bagian Residuals. Klik
Continue.
Masukkan Standardized residual ke Test Variable List. Beri tanda centang pada
Test Distribution Normal (sudah default). OK.
5. Muncul output:
One-Sample Kolmogorov-Smirnov Test
Std Res2
N
40
Normal Parametersa,b
Mean
Std. Deviation
0E-7
.93369956
Absolute
.117
Positive
.064
Negative
-.117
Kolmogorov-Smirnov Z
.743
.639
Interpretasi:
Nilai Kolmogorov-Smirnov Z = 0,743; yang artinya lebih besar dari (0,05)
Uji Liliefors:
Ho: Residual berasal dari populasi yang berdistribusi normal
Ha: Residual tidak berasal dari populasi yang berdistribusi normal
1. Dengan nilai Standardized residual yang sama pada Uji Kolmogorov-Smirnov,
lakukan pengujian kenormalan setelah data ditransformasi dengan cara klik
Analyze, Descriptive statistics, Explore.
Klik Plots, centang Histogram dan Normalilty plots with test. Continue. OK.
3. Muncul output:
Tests of Normality
Kolmogorov-Smirnova
Statistic
Std Res2
.117
df
Shapiro-Wilk
Sig.
40
.175
Statistic
df
.958
Sig.
40
.139
Interpretasi:
Dapat dilihat bahwa signifikansi dari uji Liliefors adalah 0,175 yang artinya
lebih besar dari (0,05) sehingga tidak signifikan untuk menolak Ho.
Uji Saphiro-Wilks:
Ho: Residual berasal dari populasi yang berdistribusi normal
Ha: Residual tidak berasal dari populasi yang berdistribusi normal
Interpretasi:
Dari hasil di atas dapat dilihat bahwa signifikansi dari uji Shapiro-Wilk
adalah 0,139 yang artinya lebih besar dari (0,05) sehingga tidak signifikan
B. Lakukan transformasi dengan memangkatkan seluruh variabel dengan -1, yaitu dengan
cara berikut:
Uji Kolmogorov-Smirnov:
Ho: Residual berasal dari populasi yang berdistribusi normal
2. Lakukan langkah (1) untuk variabel lainnya (X1, X2, X3, X4, dan X5).
3. Cari residual terstandarisasi dengan klik Analyze, Regression, Linear.
Klik Save, beri tanda centang pada Standardized di bagian Residuals. Klik
Continue. OK.
4. Setelah nilai residual muncul, lakukan pengujian kenormalan setelah data
ditransformasi dengan cara klik Analyze, Nonparametric Tests, Legacy Dialogs,
1-Sample K-S.
Masukkan Standardized residual ke Test Variable List. Beri tanda centang pada
Test Distribution Normal (sudah default). OK.
5. Muncul output:
One-Sample Kolmogorov-Smirnov Test
Std Res3
N
40
Normal Parametersa,b
Mean
Std. Deviation
0E-7
.93369956
Absolute
.101
Positive
.101
Negative
-.081
Kolmogorov-Smirnov Z
.637
.812
Interpretasi:
Nilai Kolmogorov-Smirnov Z = 0,637; yang artinya lebih besar dari (0,05)
Uji Liliefors:
Ho: Residual berasal dari populasi yang berdistribusi normal
Ha: Residual tidak berasal dari populasi yang berdistribusi normal
1. Dengan nilai Standardized residual yang sama pada Uji Kolmogorov-Smirnov,
lakukan pengujian kenormalan setelah data ditransformasi dengan cara klik
Analyze, Descriptive statistics, Explore.
Klik Plots, centang Histogram dan Normalilty plots with test. Continue. OK.
3. Muncul output:
Tests of Normality
Kolmogorov-Smirnova
Statistic
Std Res3
.101
df
Shapiro-Wilk
Sig.
40
.200*
Statistic
df
.965
Sig.
40
.251
Interpretasi:
Dapat dilihat bahwa signifikansi dari uji Liliefors adalah 0,200 yang artinya
lebih besar dari (0,05) sehingga tidak signifikan untuk menolak Ho.
Uji Saphiro-Wilks:
Ho: Residual berasal dari populasi yang berdistribusi normal
Ha: Residual tidak berasal dari populasi yang berdistribusi normal
Interpretasi:
Dari hasil di atas dapat dilihat bahwa signifikansi dari uji Shapiro-Wilk
adalah 0,251 yang artinya lebih besar dari (0,05) sehingga tidak signifikan
Untuk melihat apakah suatu fungsi regresi linear dapat digunakan pada data yang
sedang dianalisis, maka dapat digunakan plot residual (sisaan) dan variabel independen atau
^
plot residual (sisaan) dan fitted value ( Y ), serta scatter plot (diagram pencar). Namun,
scatter plot tidak selalu seefektif plot residual (sisaan). Gambar 4.3a merupakan scatter plot
serta garis regresi untuk melihat hubungan antara jumlah informasi transit dan pengendara bus
dalam 8 kota yang dihasilkan dari program komputer serta, dimana X adalah jumlah peta
transit bus yang dibagikan kepada penduduk secara gratis di kota tersebut pada waktu awal
survei serta Y adalah peningkatan pengendara bus harian pada jam - jam tidak sibuk selama
periode survei. Data dan fitted value disajikan dalam Tabel 4.1, kolom 1, 2, dan 3. Grafik
menunjukkan bahwa fungsi regresi linear sangat tidak cocok untuk data tersebut.
Gambar 4.3b menampilkan plot residual e dan variabel independen X untuk contoh data yang
sama yang disajikan dalam Tabel 4.1 kolom 4. Lack of fit dari fungsi regresi linear
diperlihatkan dari plot residual dan X pada Gambar 4.3b, karena jarak residual terhadap titik 0
membentuk pola yang sistematis. Nilai residual akan negatif jika X semakin kecil, positif
untuk nilai X yang menengah, dan kembali negatif untuk nilai X yang besar.
Secara umum, plot residual memiliki beberapa kelebihan daripada scatter plot. Pertama, plot
residual dapat dengan mudah digunakan untuk memeriksa aspek kecocokan lain dari model.
Kedua, terdapat kesempatan dimana skala scatter plot menempatkan Yi mendekati fitted value
Y^ i
, contohnya ketika slopenya curam. Sehingga menjadi lebih sulit untuk mempelajari kecocokan
fungsi regresi linear dari scatter plot. Di sisi lain, plot residual dapat dengan jelas menunjukkan pola
sistematis dalam deviasi di sekitar garis regresi.
Gambar 4.4a menunjukkan situasi awal plot residual dan X ketika model linear cocok digunakan.
Residual cenderung membentuk pita horizontal di sekitar 0, menunjukkan tidak ada kecenderungan
yang sistematis.
Gambar 4.4b menunjukkan indikasi dibutuhkannya fungsi regresi curvilinear. Di sini residual
cenderung bervariasi dalam pola yang sistematis antara positif dan negatif.
Y^
^
untuk model regresi linear sederhana. Alasannya adalah karena fitted value Y
adalah fungsi
linear dari X. Jadi, bukan pola dasar dari plot titik - titik yang dipengaruhi, melainkan hanya
nilai X.
Jika fungsi regresi tidak linear, pendekatan langsung digunakan untuk memodifikasi model
regresi. Misalnya dengan menggunakan fungsi regresi kuadratik atau fungsi regresi
eksponensial. Atau dapat pula digunakan transformasi.