Anda di halaman 1dari 48

NORMALISASI DAN LINIERITAS

Disusun Oleh:
KELOMPOK 4
Clara Septyana Rahma Sulaeman
Dian Saskia Bani
Didik Abidin
Fauzul Hidayah
Nurul Ardhiani
Salsa Nopian Pamungkas
Zukha Latifah

SEKOLAH TINGGI ILMU STATISTIK


2014

1. Pemeriksaan Sisaan ( Melihat kenormalan sisaan melalui


plot maupun diagram)
a. P-P plot (percentiles-Percentiles Plot)
(Plot antara e dengan Expected value e)
Contoh:

PP Plot dapat dibuat dengan tahapan sebagai


berikut:

Misalkan pada kasus regresi linier


sederhana antara y (IPK) terhadap x
(skor tes masuk PT) dari 20

1.

Regresikan y terhadap x
Diperoleh hasil sbb:

observasi sebagai berikut:

2. Hitung nilai residual, lalu diurutkan


dari yang terkecil ke yang terbesar .

3. Cari nilai harapan dari residual yang telah diurutkan tersebut


dibawah asumsi kenormalan (teori statistik mengatakan bahwa
untuk random variabel dg rata-rata 0 dan estimasi variannya MSE,
maka pendekatan yang baik untuk nilai harapan dari observasi
terkecil ke-i dlm suatu random sampel berukuran n adalah :

dimana z(A) mpk persentile ke-A dari distribusi normal baku.


Misal Z(0,90) = 1,282 Z(0,95) = 1,645
Z(0,03) = -1,87

4. Buat scatter-plot antara residual (ei) dan nilai harapan dibwah kenormalan

Jika plot memiliki kecenderungan mengikuti garis y=x, maka data


(error) mengikuti distribusi normal .
Hasilnya adalah sebagai
berikut:

Karena plot-plot cenderung mengikuti garis


y=x maka Standardized Residual
berdistribusi normal.
Mengapa demikian?
Karena ketika mendekati y=x, maka error
yang sebenarnya akan cenderung sama
dengan error yang kita harapkan.

P-P Plot dengan SPSS: Analyze

=> Descriptive Statistics => P-P Plot => masukkan Standarized Residual
ke dalam kolom variabel => Test distribution: normal => OK
b. Histogram, Q-Q plot, Detren d Q-Q plots, Steam-Leaf, Boxplot
Data:

Cara pengujian:
Manampilkan residual terstd pada
lembar kerja:

1. Analyze => Regression =>


Linear
2. Masukkan var depeden dan
independent
3. Save => centang residual
standardized => OK
Membuat plot dan diagram:

4. Analyze => Descriptive


Statistics => Explore
5. Masukkan variabel yang
hendak di uji pada kotak
Dependen. (Standarized
Residual)
6. Tekan tombol Plots => Beri
tanda pada Normality Plot With
Test => OK

Output SPSS:
a. Histogram
Ketika
membentuk

histogram
kurva

normal

seperti lonceng dan sebagian


besar
baewah
maka

bar/batang
kurva

berada

normal

Standardized

di

maka

Residual

berdistribusi normal.

Note: Buka lagi catatan


mengenai histogram, bagaimana
cara membuat jika manual

b. Stem-and-Leaf Plot

Diagram yang dipergunakan untuk menyajikan kumpulan data tanpa harus


kehilangan informasi semua data individualnya, secara efektif dapat menampilkan
distribusi data, apakah penyebarannya terpusat atau tersebar.
Dalam stem and leaf diagram data-data dipisahkan menjadi dua bagian,
angka pertama yang ditulis sebelah kiri disebut batang(stem) dan sedangkan angkaangka sisanya yang ditulis sebelah kanan disebut dengan daun (leaf).
Standardized Residual Stem-and-Leaf Plot
Frequency

Stem &

Leaf

-1
-1
-0
-0
0
0
1
1

9
001
699
13
11344
799
03
5

1,00
3,00
3,00
2,00
5,00
3,00
2,00
1,00
Stem width:
Each leaf:

.
.
.
.
.
.
.
.

1,00000
1 case(s)

Ketika

angka-angka

membentuk

kurva

miring

kanan,

ke

Standardized

normal
maka
Residual

berdistribusi normal.

Note: Buka lagi catatan


mengenai Stem-Leaf plot ,
bagaimana cara membuat jika
manual

c. QQ Plot (Quantile-Quantile Plot)


QQplot atau Plot Kuantil adalah diagram yang menggambarkan hubungan
antara quantil teoritis suatu distribusi dengan kuantil riil suatu data (dalam hal ini:
residual) . Khusus untuk distribusi normal grafiknya disebut Qqnorm
.
Expected normal
e1, e2, .. . ., e(n)
(i0,5)
pi=
n
Untuk setiap i tentukan Q (pi).
Q (pi) adalah quantile normal standar=> Gunakan bantuan tabel normal standar
Dari contoh di atas
N=20
(10,5)
i = 1 => p1= 20 =0,025 => Q(0,025)=-1,96
dan seterusnya..

Secara teoritis, suatu set


data dikatakan mempunyai
sebaran normal apabila data
tersebar di sekitar garis.
Terlihat bahwa data
menyebar di sekitar garis, dan
tidak ada data yang letaknya
jauh dari garis. kemungkinan
besar, sebaran data normal.
Note:

pelajari

kuantil

data.

d. Boxplot
tampilahn grafis dari kuantil data yang dinyatakan dalam bentuk kotak. Pada
Boxplot digambarkan posisi median (Q2), kuantil 1(Q1) dan kuantil 3(Q3).
Dapat menunjukkan
a. adanya pencilan (outlier)
b. kesimetrisan data

Ketika

bloxpot

berada

di

tengah dengan kedua kaki yang


sama panjang, garis horizontal
(median) berada di tengah bloxpot,
maka

standardized

residual

berdistribusi normal.
Note:
Note: Buka lagi catatan mengenai
box plot, bagaimana cara membuat
jika manual

Ilustrasi plot dengan error yang tidak berdistribusi normal

NOTE:
Pengujian dengan metode grafik sering menimbulkan perbedaan persepsi
di antara beberapa pengamat (subjektive) sehingga pengujian normalitas
dengan uji statistik bebas dari keragu-raguan meskipun tidak ada jaminan
bahwa pengujian dengan uji statistik lebih baik dari pengujian dengan
metode grafik.

2. Uji asumsi klasik ( Melihat kenormalan menggunakan ujiuji statistik)


1. Manual
a. Uji Liliefors
Metode Lilliefors menggunakan data dasar yang belum diolah
dalam tabel distribusi frekuensi. Data ditransformasikan dalam nilai
Z untuk dapat dihitung luasan kurva normal sebagai probabilitas
komulatif normal. Probabilitas tersebut dicari bedanya dengan
probabilitas kumulatif empiris. Beda terbesar dibanding dengan
tabel Lilliefors. Liliefors adalah uji yang menggunakan pendekatan
sampel (statistik), sehingga banyak digunakan untuk data kecil.

Tabel pengujian kenormalan dengan Uji Liliefors

Keterangan :
Xi = Angka pada data
Z = Transformasi dari angka ke notasi pada distribusi normal
F(x) = Probabilitas komulatif normal
S(x) = Probabilitas komulatif empiris
PERSYARATAN
a. Data berskala interval atau ratio (kuantitatif)
b. Data tunggal / belum dikelompokkan pada tabel distribusi frekuensi
c. Dapat untuk n besar maupun n kecil.
SIGNIFIKANSI
Signifikansi uji, nilai | F (x) - S (x) | terbesar dibandingkan dengan nilai tabel
Lilliefors.
Jika nilai | F (x) - S (x) | terbesar < nilai tabel Lilliefors, maka Ho diterima ; Ha
ditolak.
Jika nilai | F(x) - S(x) | terbesar > dari nilai tabel Lilliefors, maka Ho ditolak ; Ha
diterima.

Contoh :
Berdasarkan data ujian statistik dari 18 mahasiswa didapatkan data sebagai
berikut ; 46, 57, 52, 63, 70, 48, 52, 52, 54, 46, 65, 45, 68, 71, 69, 61, 65, 68.
Selidikilah dengan = 5%, apakah data tersebut di atas diambil dari populasi
yang berdistribusi normal ?
Penyelesaian :
1. Hipotesis
Ho : Populasi nilai ujian statistik berdistribusi normal
H1 : Populasi nilai ujian statistik tidak berdistribusi normal
2. Nilai
Nilai = level signifikansi = 5% = 0,05
3. Statistik Penguji

Nilai | F(x) - S(x) | tertinggi sebagai angka penguji normalitas, yaitu 0,1469.
4. Derajat Bebas
Df tidak diperlukan
5. Nilai tabel
Nilai Kuantil Penguji Lilliefors, = 0,05 ; N = 18 yaitu 0,2000. Tabel Lilliefors
pada lampiran
6. Daerah penolakan
Menggunakan rumus | 0,1469 | < | 0,2000| ; berarti Ho diterima, Ha ditolak
7. Kesimpulan: Populasi nilai ujian statistik berdistribusi normal.
b. Uji Kolmogorov Smirnov
Kelebihan dari uji ini adalah sederhana dan tidak menimbulkan perbedaan
persepsi di antara satu pengamat dengan pengamat yang lain, yang sering
terjadi pada uji normalitas dengan menggunakan grafik.
Konsep dasar dari uji normalitas Kolmogorov Smirnov adalah dengan
membandingkan distribusi data (yang akan diuji normalitasnya) dengan
distribusi normal baku. Distribusi normal baku adalah data yang telah
ditransformasikan ke dalam bentuk Z-Score dan diasumsikan normal. Jadi
sebenarnya uji Kolmogorov Smirnov adalah uji beda antara data yang diuji
normalitasnya dengan data normal baku. Seperti pada uji beda biasa, jika
signifikansi di bawah 0,05 berarti terdapat perbedaan yang signifikan, dan jika
signifikansi di atas 0,05 maka tidak terjadi perbedaan yang signifikan. Penerapan

pada uji Kolmogorov Smirnov adalah bahwa jika signifikansi di bawah 0,05
berarti data yang akan diuji mempunyai perbedaan yang signifikan dengan data
normal baku, berarti data tersebut tidak normal.Lebih lanjut, jika signifikansi di
atas 0,05 maka berarti tidak terdapat perbedaan yang signifikan antara data yang
akan diuji dengan data normal baku, artinya data yang kita uji normalkan tidak
berbeda dengan normal baku.
Jika kesimpulan kita memberikan hasil yang tidak normal, maka kita tidak
bisa menentukan transformasi seperti apa yang harus kita gunakan untuk
normalisasi. Jadi ya kalau tidak normal, gunakan plot grafik untuk melihat
menceng ke kanan atau ke kiri, atau menggunakan Skewness dan Kurtosis
sehingga dapat ditentukan transformasi seperti apa yang paling tepat
dipergunakan.
untuk perhitungan manualnya bisa menggunakan teori dibawah ini
Rumus

Keterangan :
Xi = Angka pada data
Z = Transformasi dari angka ke notasi pada distribusi normal
FT = Probabilitas komulatif normal
FS = Probabilitas komulatif empiris
FT = komulatif proporsi luasan kurva normal berdasarkan notasi Zi, dihitung
dari luasan kurva mulai dari ujung kiri kurva sampai dengan titik Z.

Siginifikansi
Signifikansi uji, nilai | FT FS | terbesar dibandingkan dengan nilai tabel
Kolmogorov Smirnov. Jika nilai | FT FS | terbesar kurang dari nilai tabel
Kolmogorov Smirnov, maka Ho diterima ; H1 ditolak. Jika nilai | FT FS |
terbesar lebih besar dari nilai tabel Kolmogorov Smirnov, maka Ho ditolak ;
H1diterima. Tabel Nilai Quantil Statistik Kolmogorov Distribusi Normal.

Contoh

Suatu penelitian tentang berat badan peserta pelatihan kebugaran


fisik/jasmani dengan sampel sebanyak 27 orang diambil secara random,
didapatkan data sebagai berikut ; 78, 78, 95, 90, 78, 80, 82, 77, 72, 84, 68, 67, 87,
78, 77, 88, 97, 89, 97, 98, 70, 72, 70, 69, 67, 90, 97 kg. Selidikilah dengan = 5%,
apakah data tersebut di atas diambil dari populasi yang berdistribusi normal?

Penyelesaian
1. Hipotesis
Ho : tidak beda dengan populasi normal (data Normal).
H1 : ada beda dengan populasi nomal (data tdak normal) .
2. : 0,05
3. Buat tabel
a.) Langkah pertama adalah menetukan rata-rata data yaitu:
rata2= data/n=2195/27=81,3
b.) langkah berikutnya adalah menghitung Standart defiasi: SD=akar( (xxrata)2/n)=akar(2749.63/27)=akar(101.838)=10,1
c.) menghitung z score untuk i=1 maka didapkan (67-81,3)/10,1=-1,39
d.) (komulatif proporsi luasan kurva normal berdasarkan notasi Zi, dihitung dari
luasan kurva mulai dari ujung kiri kurva sampai dengan titik Z.). Tentukan besar
peluang untuk masing-masing nilai z berdasarkan tabel z dan diberi nama F(z)
(lihat tabel z) . jika nilai z minus, maka 0,5 dikurangi (-) luas wilayah pada tabel
z. Sebaliknya, jika nilai z positif, maka 0,5 ditambah (+) luas nilai z pada tabel,
sehingga diperoleh nilai-nilai F(z) ,..untuk Zscore -1,39 maka didapatkan nilai
F(1,39)=0.4177 sehingga Ft=0.5-0.4177=0.823.
e.) menentukan Fs dari saat i=1 yaitu data pertama yaitu x=67 jumlahnya yaitu ada 2
yaitu pada data pertama dan kedua maka Fs pada data pertama diperoleh
2/27=0.740
f.) |Ft-Fs| pada data pertama adalah |0.823-0.740|=0.083,
Sehingga diperoleh tabel:

No
Xi

67

67

4.
uji :
D
=
- Fs |

68

69

70

70

72

72

77

10

77

11

78

12

78

13

78

14

78

15

80

16

82

17

84

18

87

19

88

20

89

21

90

Zsco
re
1,3
9
1,3
9
1,2
9
1,1
9
1,1
0
1,1
0
0,9
0
0,9
0
0,4
2
0,4
2
0,3
2
0,3
2
0,3
2
0,3
2
0,1
2
0,0
7
0,2
6
0,5
5
0,6
5
0,7
5
0,8

Ft

Fs

| Ft
-Fs |

0,08
23

0,07
40

0,00
83

0,08
23

0,07
40

0,00
83

0,09
85

0,11
11

0,01
26

0,11
70

0,14
81

0,03
11

0,13
57

0,22
22

0,08
65

0,13
57

0,22
22

0,08
65

0,18
41

0,29
63

0,11
22

0,18
41

0,29
63

0,11
22

0,33
72

0,37
04

0,03
32

0,33
72

0,37
04

0,03
32

0,37
45

0,51
85

0,14
40

0,37
45

0,51
85

0,14
40

0,37
45

0,51
85

0,14
40

0,37
45

0,51
85

0,14
40

0,45
22

0,55
55

0,10
33

0,52
79
0,60
26
0,70
88
0,74
22
0,77
34
0,79

0,59
26
0,62
96
0,66
66
0,70
37
0,74
07
0,81

0,06
47
0,02
70
0,04
22
0,03
85
0,03
27
0,01

Statistik
maks | Ft
= 1,440

Kriteria uji : tolak Ho jika Dmaks Dtabel , terima dalam hal lainya.dengan =
0,05 dan N=27
Karena Dmaks = 0,1440 < Dtabel = 0,2540,jadi Ho diterima,berarti sampel
yang diambil dari populasi yang berdistribusi normal.
Lihat tabel z

tabel D

c. Uji Chi Square


Uji normalitas dengan Chi Kuadrat (X2) dipergunakan untuk menguji data dalam
bentuk data kelompok dalam tabel distribusi frekuensi. Seperti halnya uji
Liliefors, uji normalitas dengan uji Chi-Kuadrat dilakukan dengan langkahlangkah:
Pertama-tama, diawali dengan menentukan taraf signifikansi, misalkan 0,05
untuk menguji hipotesis:
1. Hipotesis
Ho : Sampel berasal dari populasi berdistribusi normal.
Ha : Sampel tidak berasal dari populasi berdistribusi normal.

dengan kriteria pengujian:


Jika X2hitung < X2tabel terima Ho
Jika X2hitung > X2tabel tolak Ho
Kedua, lakukan langkah-langkah uji normalitas dengan chi kuadrat (X2) sebagai
berikut:
a.) Membuat daftar distribusi frekuensi dari data yang berserakan ke dalam
distribusi frekuensi data kelompok (jika data belum disajikan dalam tabel
disitribusi frekuensi kelompok).
b.) Mencari rata-rata (mean) data kelompok
c.) Mencari simpangan baku data kelompok
d.) Tentukan batas nyata (tepi kelas) tiap interval kelas dan jadikan sebagai Xi(X1,
X2, X3, ..., Xn). Kemudian lakukan konversi, setiap nilai tepi kelas (Xi) menjadi
nilai baku Z1, Z2, Z3, ..., Zn. Dimana nilai baku Zi ditentukan dengan rumus Zi =
(Xi - Xrata)/s
e.) Tentukan besar peluang setiap nilai Z berdasarkan tabel Z (luas lengkungan di
bawah kurva normal standar dari 0 ke Z, dan disebut dengan F(Zi)).
f.) Tentukan luas tiap kelas interval dengan cara mengulangi nilai F(z) yang lebih
besar diatas atau dibawahnya.
g.) Tentukan fe (frekuensi eskpektasi) dengan cara membagi luas kelas tiap interval
dibagi number of cases (n)
h.) Masukkan frekuensi observasi (faktual) sebagai fo
i.) Cari nilai setiap interval
j.) Tentukan nilai X2hitung setiap interval
k.) Tentukan nilai X2tabel pada taraf signifikansi dan derajat kebebasan k-1 dengan
k adalah banyaknya kelas/kelompok interval
l.) Bandingkan jumlah total X2hitung dengan X2tabel
m.) Apabila X2hitung < X2tabel maka sampel berasal dari populasi yang
berdistribusi normal, dan jika X2hitung > X2tabel maka sampel berasal dari
populasi tidak normal

Contoh:
Lakukan pengujian untuk mengetahui apakah data dalam tabel distribusi
frekuensi berikut berasal dari populasi berdistribusi normal atau tidak?
Tabel Distribusi Frekuensi

Langkah pertama, hitunglah nilai mean dan simpangan baku dari data tersebut
seperti berikut.
Tabel Distribusi Frekuensi :

Dari data diatas didapat,


nilai mean = 59,2.
nilai simpangan baku = 11,5
Selanjutnya tentukan nilai tepi kelas atas dan bawah setiap interval kelas, lalu
kemudian konversilah setiap nilai tepi kelas tersebut menjadi nilai baku, dan
seterusnya tentukan nilai (fo - fe)2/fe, seperti disajikan dalam tabel berikut.
Tabel Hitung Chi-Kuadrat:

Dari hasil perhitungan dalam tabel tersebut, didapat nilai X2hitung = 68,25.

2. Menggunakan SPSS
a. Uji Kolmogorov Smirnov
Ho: Residual berasal dari populasi yang berdistribusi normal
Ha: Residual tidak berasal dari populasi yang berdistribusi normal
Dari lembar kerja yang sudah terdapat Residual(standardized) => Analyze
=> Non Parametric Test=> Legacy dialogs => 1 Sample K-S
Masukkan Standardized Residual ke dalam test variable list =>
centang test distribution normal (sudah terdefault) => OK
One-Sample Kolmogorov-Smirnov Test

N
Normal Parametersa,b
Most Extreme Differences
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
a. Test distribution is Normal.
b. Calculated from data.

Mean
Std.
Deviation
Absolute
Positive
Negative

Standardized
Residual
20
0E-7
,97332853
,123
,123
-,099
,549
,924

Nilai Kolmogorov-Smirnov Z = 0 ,549 yang artinya > (0,05) sehingga tidak


signifikan untuk menolak Ho. Dengan demikian Ho diterima.
Simpulan: Dengan tingkat keyakinan 95% dapat disimpulkan bahwa residual
berasal dari populasi yang berdistribusi normal.
Selain itu dapat diidentifikasi dari keterangan Test distribution is Normal.
b. Uji Liliefors
Ho: Residual berasal dari populasi yang berdistribusi normal
Ha: Residual tidak berasal dari populasi yang berdistribusi normal

Dari lembar kerja yang sudah terdapat Residual(standardized) => Analyze =>
Descriptive statistics => Explore => Masukkan Standardized
Residual ke dalam dependent list =>Plot => centang histogram dan
normal plots with test
Tests of Normality
Kolmogorov-Smirnova
Statist
Df
Sig.
ic
Standardized
,123
20
Residual
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction

,200*

Shapiro-Wilk
Statist
df
ic

Sig.

,959

,529

20

Dapat dilihat bahwa signifikansi dari uji lilifors adalah 0,2 yang artinya >
(0,05) sehingga tidak signifikan untuk menolak Ho. Dengan demikian Ho
diterima.
Simpulan: Dengan tingkat keyakinan 95% dapat disimpulkan bahwa residual
berasal dari populasi yang berdistribusi normal.

c. Uji Shapirowilks
Ho: Residual berasal dari populasi yang berdistribusi normal
Ha: Residual tidak berasal dari populasi yang berdistribusi normal
Dari hasil di atas dapat dilihat bahwa signifikansi dari uji Shapiro-Wilk adalah
0,529 yang artinya > (0,05) sehingga tidak signifikan untuk menolak Ho.
Dengan demikian Ho diterima.
Simpulan: Dengan tingkat keyakinan 95% dapat disimpulkan bahwa residual
berasal dari populasi yang berdistribusi normal.

Contoh Kasus: Uji Normalitas


Y
316200
130156
111882
45711
50800
147375
59852
75680
88248
133242
206336
188393
215307
209200
86205
86920
66431

X1
150200
94900
79657
32420
27780
82888
29502
51849
65475
93890
129786
118461
136056
150427
61488
62441
47970

X2
30000
16000
11400
9100
24000
12500
22000
7200
11700
12500
18800
32000
14800
14000
9800
12500
11400

X3
28
39
36
32
24
20
20
21
36
38
23
21
24
40
36
35
37

X4
25
38
35
31
24
19
19
20
35
37
21
21
22
39
35
34
36

X5
3
1
1
1
1
1
1
1
1
1
2
1
2
1
1
1
1

206336
41200
378600
224278
183600
51400
88397
72800
242220
305018
227800
60000
1149900
304325
2481619
357000
2.55E+07
882035
52000
737100
1528800
2139000
3864100

125272
24360
198175
136280
96008
33100
62560
34248
155707
196878
156175
25880
840400
165175
1020887
133488
345000
429700
25000
523946
1125551
1905500
2347370

28000
22000
21000
24000
14500
18000
11500
19000
14000
16700
14800
20000
48000
15000
167800
30000
6619317
45600
20000
75000
70800
17500
160000

Langkah-Langkah Pengujian dengan SPSS:


Menampilkan Standardized Residual
1. Klik Analyze => Regression => Linear

2. Masukkan variabel depeden dan variabel independent

23
26
38
25
24
22
35
24
27
34
28
22
59
24
126
25
1706
24
21
22
20
26
46

23
26
36
25
23
22
34
24
25
32
26
22
57
23
84
25
921
21
19
22
18
26
44

1
1
2
1
1
1
1
1
2
2
2
1
2
1
42
5
785
3
2
70
2
45
2

3. Save => centang Standardized Residual => OK

4. Nilai Standardized Residual dimunculkan pada tabel data (ZRE_1)

Membuat plot dan diagram:


1. Klik Analyze => Descriptive Statistics => Explore

2. Masukkan variabel yang hendak di uji pada kotak Dependent List. (yaitu: Standarized
Residual)

3. Tekan tombol Plots => Beri tanda pada Normality Plot With Test => OK

4. Output SPSS yang diperoleh:

Tests of Normality
Kolmogorov-Smirnova
Statistic
df
Sig.
Standardized
Residual

.278

a. Lilliefors Significance Correction

40

.000

Shapiro-Wilk
Statistic
df
Sig.
.794

40

.000

Interpretasi:
Pada Test of Normality:
Terlihat bahwa nilai P-value yaitu Sig. bernilai 0.000 (untuk kedua uji
normalitas)<0.05. Sehingga dapat disimpulkan bahwa Standardized Residual tidak
memenuhi asumsi distribusi normal.

Pada Histogram dan Standardized Steam and Leaf Plot, terlihat bahwa data tidak
berdistribusi normal.
Pada scatter plot di atas (Normal Q-Q Plot of Standardized Residual dan Detrended
Normal Q-Q Plot of Standardized Residual) data tersebar memiliki pola tertentu,
selain itu pada box plotjuga terlihat bahwa data memiliki banyak nilai ekstrim,
sehingga dapat disimpulkan bahwa Standardized Residual tidak memenuhi asumsi
distribusi normal.

Uji Kolgomorov-Smirnov:
1. Klik Analyze Nonparametric Test 1-Sample

2. Masukkan variabel standardized residual pada kolom Test Variable Test OK

3. Output SPSS:

One-Sample Kolmogorov-Smirnov Test


Standardized
Residual
N
Normal Parametersa
Most Extreme
Differences

Mean
Std. Deviation
Absolute
Positive
Negative

Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)

40
.0000000
.93369956
.278
.224
-.278
1.757
.004

a. Test distribution is Normal.


Terlihat bahwa nilai P-value yaitu Asymp.Sig (2-tailed) bernilai 0.004 < 0.05. Sehingga dapat
disimpulkan bahwa Standardized Residual tidak memenuhi asumsi distribusi normal.

Jika asumsi kenormalan tidak terpenuhi, artinya data tidak berdistribusi normal.
Adapun langkah-langkah yang harus dilakukan adalah:
Jika asumsi kenormalan tidak terpenuhi, artinya data tidak berdistribusi normal. Adapun
langkah-langkah yang harus dilakukan adalah:
1. Menambah jumlah sampel
Tambahan data 10 sampel:
2251660
45000000
153
15
37
170
2125899
571456518
56000000
1504
359
56
1800
7620732
117216298
27
3
9
457090
30
8275591 6640729
177700
13
8
20
5386215
647662800
1350000
221
24
00
250
6494858
697725375
16043368
204
35
77
250
371184944 1680637
51084038
85
10
89
1241399
228039832
75000000
125
2
22
130
Dilakukan pengujian untuk melihat apakah data berdistribusi normal, seperti cara
di atas (sebelumnya).
296907473

Outpus SPSS yang diperoleh adalah:

Tests of Normality
Kolmogorov-Smirnova
Statistic
Standardized Residual

.420

df

Shapiro-Wilk

Sig.
48

.000

Statistic
.431

df

Sig.
48

.000

a. Lilliefors Significance Correction

Terlihat bahwa nilai P-value yaitu Sig. bernilai 0.000 (untuk kedua uji normalitas)<0.05.
Sehingga dapat disimpulkan bahwa Standardized Residual tidak memenuhi asumsi distribusi
normal.

Pada scatter plot di atas (Normal Q-Q Plot of Standardized Residual dan Detrended Normal
Q-Q Plot of Standardized Residual) data tersebar memiliki pola tertentu, selain itu pada box
plotjuga terlihat bahwa data memiliki banyak nilai ekstrim, sehingga dapat disimpulkan
bahwa Standardized Residual tidak memenuhi asumsi distribusi normal.
Uji Kolgomorov-Smirnov:
One-Sample Kolmogorov-Smirnov Test
Standardized
Residual
N

48

Normal Parametersa

Mean

.0000000

Std. Deviation
Most Extreme Differences

.94531319

Absolute

.420

Positive

.420

Negative

-.325

Kolmogorov-Smirnov Z

2.910

Asymp. Sig. (2-tailed)

a.

.000

Test distribution is
Normal.

Terlihat bahwa nilai P-value yaitu Asymp.Sig (2-tailed) bernilai 0.000< 0.05. Sehingga dapat
disimpulkan bahwa Standardized Residual tidak memenuhi asumsi distribusi normal.
Kesimpulannya:
Penambahan jumlah sampel sebanyak 10 sampel, tidak dapat mengatasi ketdaknormalan data.

2. Menghapus data yang outlier

Cara lain yang mungkin dilakukan adalah dengan menghapus data


yang bersifat outlier. Dalam kasus ini ada 6 data, yaitu data ke: 30,
33, 37, 38, 39, dan 40.
Dengan cara yang sama seperti pada no. 1, output SPSSnya:

Tests of Normality
Kolmogorov-Smirnova
Statistic
Unstandardized Residual
a. Lilliefors Significance Correction

.261

df

Shapiro-Wilk

Sig.
34

.000

Statistic
.609

df

Sig.
34

.000

Terlihat bahwa nilai P-value yaitu Sig. bernilai 0.000 (untuk kedua uji normalitas)<0.05.
Sehingga dapat disimpulkan bahwa Standardized Residual tidak memenuhi asumsi distribusi
normal.

Pada scatter plot di atas (Normal Q-Q Plot of Standardized Residual dan Detrended
Normal Q-Q Plot of Standardized Residual) data tersebar memiliki pola tertentu, selain itu
pada box plot juga terlihat bahwa data masih memiliki ada beberapa nilai ekstrim, sehingga
dapat disimpulkan bahwa Standardized Residual tidak memenuhi asumsi distribusi normal.
Kesimpulannya:
Penambahan jumlah sampel sebanyak 10 sampel, tidak dapat mengatasi ketdaknormalan data.

3. Transformasi
A. Lakukan transformasi dengan mencari nilai Ln dari seluruh variabel, yaitu dengan cara
berikut:
Uji Kolmogorov-Smirnov:
Ho: Residual berasal dari populasi yang berdistribusi normal
Ha: Residual tidak berasal dari populasi yang berdistribusi normal
1. Klik Transform, Compute Variable.

Pada kotak Function Group, pilih All, lalu pada kotak Fuctions and Special
Variables pilih Ln.
Masukkan variabel Y pada Nurmeric Expression. OK.

2. Lakukan langkah (1) untuk variabel lainnya (X1, X2, X3, X4, dan X5).
3. Cari residual terstandarisasi dengan klik Analyze, Regression, Linear.

Masukkan variabel lnY pada Dependent, dan variabel lnX1, lnX2, lnX3, lnX4
dan lnX5 pada Independent(s).

Klik Save, beri tanda centang pada Standardized di bagian Residuals. Klik
Continue.

4. Setelah nilai residual muncul, lakukan pengujian kenormalan setelah data


ditransformasi dengan cara klik Analyze, Nonparametric Tests, Legacy Dialogs,
1-Sample K-S.

Masukkan Standardized residual ke Test Variable List. Beri tanda centang pada
Test Distribution Normal (sudah default). OK.

5. Muncul output:
One-Sample Kolmogorov-Smirnov Test

Std Res2
N

40

Normal Parametersa,b

Most Extreme Differences

Mean
Std. Deviation

0E-7
.93369956

Absolute

.117

Positive

.064

Negative

-.117

Kolmogorov-Smirnov Z

.743

Asymp. Sig. (2-tailed)

.639

a. Test distribution is Normal.


b. Calculated from data.

Interpretasi:
Nilai Kolmogorov-Smirnov Z = 0,743; yang artinya lebih besar dari (0,05)

sehingga tidak signifikan untuk menolak Ho. Dengan demikian Ho diterima.


Kesimpulan: Dengan tingkat keyakinan 95% dapat disimpulkan bahwa

residual berasal dari populasi yang berdistribusi normal.


Selain itu dapat diidentifikasi dari keterangan Test distribution is Normal"

Uji Liliefors:
Ho: Residual berasal dari populasi yang berdistribusi normal
Ha: Residual tidak berasal dari populasi yang berdistribusi normal
1. Dengan nilai Standardized residual yang sama pada Uji Kolmogorov-Smirnov,
lakukan pengujian kenormalan setelah data ditransformasi dengan cara klik
Analyze, Descriptive statistics, Explore.

2. Masukkan Standardized Residual ke dalam Dependent list.

Klik Plots, centang Histogram dan Normalilty plots with test. Continue. OK.

3. Muncul output:
Tests of Normality
Kolmogorov-Smirnova
Statistic
Std Res2

.117

df

Shapiro-Wilk

Sig.
40

.175

Statistic

df

.958

Sig.
40

.139

a. Lilliefors Significance Correction

Interpretasi:
Dapat dilihat bahwa signifikansi dari uji Liliefors adalah 0,175 yang artinya
lebih besar dari (0,05) sehingga tidak signifikan untuk menolak Ho.

Dengan demikian Ho diterima.


Simpulan: Dengan tingkat keyakinan 95% dapat disimpulkan bahwa residual
berasal dari populasi yang berdistribusi normal.

Uji Saphiro-Wilks:
Ho: Residual berasal dari populasi yang berdistribusi normal
Ha: Residual tidak berasal dari populasi yang berdistribusi normal
Interpretasi:

Dari hasil di atas dapat dilihat bahwa signifikansi dari uji Shapiro-Wilk
adalah 0,139 yang artinya lebih besar dari (0,05) sehingga tidak signifikan

untuk menolak Ho. Dengan demikian Ho diterima.


Kesimpulan: Dengan tingkat keyakinan 95% dapat disimpulkan bahwa
residual berasal dari populasi yang berdistribusi normal.

B. Lakukan transformasi dengan memangkatkan seluruh variabel dengan -1, yaitu dengan
cara berikut:
Uji Kolmogorov-Smirnov:
Ho: Residual berasal dari populasi yang berdistribusi normal

Ha: Residual tidak berasal dari populasi yang berdistribusi normal


1. Klik Transform, Compute Variable.

Ketik 1/Y pada Nurmeric Expression dengan terlebih dahulu memasukkan


variabel Y. OK.

2. Lakukan langkah (1) untuk variabel lainnya (X1, X2, X3, X4, dan X5).
3. Cari residual terstandarisasi dengan klik Analyze, Regression, Linear.

Masukkan variabel satuperY pada Dependent, dan variabel satuperX1,


satuperX2, satuperX3, satuperX4 dan satuperX5 pada Independent(s).

Klik Save, beri tanda centang pada Standardized di bagian Residuals. Klik
Continue. OK.
4. Setelah nilai residual muncul, lakukan pengujian kenormalan setelah data
ditransformasi dengan cara klik Analyze, Nonparametric Tests, Legacy Dialogs,
1-Sample K-S.

Masukkan Standardized residual ke Test Variable List. Beri tanda centang pada
Test Distribution Normal (sudah default). OK.

5. Muncul output:
One-Sample Kolmogorov-Smirnov Test
Std Res3
N

40

Normal Parametersa,b

Most Extreme Differences

Mean
Std. Deviation

0E-7
.93369956

Absolute

.101

Positive

.101

Negative

-.081

Kolmogorov-Smirnov Z

.637

Asymp. Sig. (2-tailed)

.812

a. Test distribution is Normal.


b. Calculated from data.

Interpretasi:
Nilai Kolmogorov-Smirnov Z = 0,637; yang artinya lebih besar dari (0,05)

sehingga tidak signifikan untuk menolak Ho. Dengan demikian Ho diterima.


Kesimpulan: Dengan tingkat keyakinan 95% dapat disimpulkan bahwa

residual berasal dari populasi yang berdistribusi normal.


Selain itu dapat diidentifikasi dari keterangan Test distribution is Normal"

Uji Liliefors:
Ho: Residual berasal dari populasi yang berdistribusi normal
Ha: Residual tidak berasal dari populasi yang berdistribusi normal
1. Dengan nilai Standardized residual yang sama pada Uji Kolmogorov-Smirnov,
lakukan pengujian kenormalan setelah data ditransformasi dengan cara klik
Analyze, Descriptive statistics, Explore.

2. Masukkan Standardized Residual ke dalam Dependent list.

Klik Plots, centang Histogram dan Normalilty plots with test. Continue. OK.

3. Muncul output:
Tests of Normality
Kolmogorov-Smirnova
Statistic
Std Res3

.101

df

Shapiro-Wilk

Sig.
40

.200*

Statistic

df

.965

Sig.
40

.251

*. This is a lower bound of the true significance.


a. Lilliefors Significance Correction

Interpretasi:
Dapat dilihat bahwa signifikansi dari uji Liliefors adalah 0,200 yang artinya
lebih besar dari (0,05) sehingga tidak signifikan untuk menolak Ho.

Dengan demikian Ho diterima.


Simpulan: Dengan tingkat keyakinan 95% dapat disimpulkan bahwa residual
berasal dari populasi yang berdistribusi normal.

Uji Saphiro-Wilks:
Ho: Residual berasal dari populasi yang berdistribusi normal
Ha: Residual tidak berasal dari populasi yang berdistribusi normal
Interpretasi:

Dari hasil di atas dapat dilihat bahwa signifikansi dari uji Shapiro-Wilk
adalah 0,251 yang artinya lebih besar dari (0,05) sehingga tidak signifikan

untuk menolak Ho. Dengan demikian Ho diterima.


Kesimpulan: Dengan tingkat keyakinan 95% dapat disimpulkan bahwa
residual berasal dari populasi yang berdistribusi normal.

Ketidaklinearan Fungsi Regresi

Untuk melihat apakah suatu fungsi regresi linear dapat digunakan pada data yang
sedang dianalisis, maka dapat digunakan plot residual (sisaan) dan variabel independen atau
^
plot residual (sisaan) dan fitted value ( Y ), serta scatter plot (diagram pencar). Namun,
scatter plot tidak selalu seefektif plot residual (sisaan). Gambar 4.3a merupakan scatter plot
serta garis regresi untuk melihat hubungan antara jumlah informasi transit dan pengendara bus
dalam 8 kota yang dihasilkan dari program komputer serta, dimana X adalah jumlah peta
transit bus yang dibagikan kepada penduduk secara gratis di kota tersebut pada waktu awal
survei serta Y adalah peningkatan pengendara bus harian pada jam - jam tidak sibuk selama
periode survei. Data dan fitted value disajikan dalam Tabel 4.1, kolom 1, 2, dan 3. Grafik
menunjukkan bahwa fungsi regresi linear sangat tidak cocok untuk data tersebut.
Gambar 4.3b menampilkan plot residual e dan variabel independen X untuk contoh data yang
sama yang disajikan dalam Tabel 4.1 kolom 4. Lack of fit dari fungsi regresi linear
diperlihatkan dari plot residual dan X pada Gambar 4.3b, karena jarak residual terhadap titik 0
membentuk pola yang sistematis. Nilai residual akan negatif jika X semakin kecil, positif
untuk nilai X yang menengah, dan kembali negatif untuk nilai X yang besar.

Secara umum, plot residual memiliki beberapa kelebihan daripada scatter plot. Pertama, plot
residual dapat dengan mudah digunakan untuk memeriksa aspek kecocokan lain dari model.
Kedua, terdapat kesempatan dimana skala scatter plot menempatkan Yi mendekati fitted value
Y^ i
, contohnya ketika slopenya curam. Sehingga menjadi lebih sulit untuk mempelajari kecocokan

fungsi regresi linear dari scatter plot. Di sisi lain, plot residual dapat dengan jelas menunjukkan pola
sistematis dalam deviasi di sekitar garis regresi.
Gambar 4.4a menunjukkan situasi awal plot residual dan X ketika model linear cocok digunakan.
Residual cenderung membentuk pita horizontal di sekitar 0, menunjukkan tidak ada kecenderungan
yang sistematis.
Gambar 4.4b menunjukkan indikasi dibutuhkannya fungsi regresi curvilinear. Di sini residual
cenderung bervariasi dalam pola yang sistematis antara positif dan negatif.

Plot residual dan fitted value

Y^

memberi informasi yang sama dengan plot residu dan X

^
untuk model regresi linear sederhana. Alasannya adalah karena fitted value Y

adalah fungsi

linear dari X. Jadi, bukan pola dasar dari plot titik - titik yang dipengaruhi, melainkan hanya
nilai X.
Jika fungsi regresi tidak linear, pendekatan langsung digunakan untuk memodifikasi model
regresi. Misalnya dengan menggunakan fungsi regresi kuadratik atau fungsi regresi
eksponensial. Atau dapat pula digunakan transformasi.

Anda mungkin juga menyukai