AnalisisDataStatistik FINAL2
AnalisisDataStatistik FINAL2
net/publication/320372456
CITATION READS
1 32,460
1 author:
Adi Setiawan
Universitas Kristen Satya Wacana
113 PUBLICATIONS 283 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
THE EVALUATION OF LAND AREA MEASUREMENT USING GPS TECHNOLOGY View project
All content following this page was uploaded by Adi Setiawan on 13 October 2017.
Adi Setiawan
Penerbit
Tisara Grafika Salatiga
2017
i
Katalog Dalam Terbitan
519.5
ADI Adi Setiawan
a Analisis data statistik/ Adi Setiawan. -- Salatiga : Tisara Grafika, 2017.
v, 225 p. ; 25 cm.
ISBN 978-602-9493-52-8
1. Statistics. I. Title.
ii
KATA PENGANTAR
iii
iv
DAFTAR ISI
DAFTAR ISI v
I PENDAHULUAN 1
VI ANALISIS VARIANSI 67
XI PENUTUP 202
DAFTAR PUSTAKA 203
LAMPIRAN-LAMPIRAN 205
v
BAB I
PENDAHULUAN
***
Contoh II.1
Variabel random X mempunyai distribusi eksponensial
dengan mean 1 jika mempunyai fungsi kepadatan probabilitas
2| Adi Setiawan
f(x) = e-x
untuk x > 0. Fungsi distribusi kumulatif dari variabel random
X adalah
F(x) = 1- e-x
untuk x > 0 dan 0 untuk x 0. Gambar II.1 mempresentasikan
fungsi distribusi dari distribusi eskponensial dengan mean/
rata-rata 1 atau laju (rate) 1. Fungsi kuantil dari distribusi
eksponensial tersebut adalah
F 1 ( ) ln(1 )
dengan (0,1). Sebagai contoh, untuk = 0,2, diperoleh
kuantil 0,2 atau kuantil 20% adalah
F 1 (0,2) ln(1 0,2) ln( 0,8) 0,2231.
Gambar II.2 mempresentasikan fungsi kuantil dari distribusi
eksponensial yaitu
F 1 ( ) ln(1 )
dengan (0,1).
1.0
0.8
0.6
0.4
0.2
0.0
0 2 4 6 8 10
Contoh II.2
Misalkan variabel random X mempunyai distribusi eksponensial
dengan rata-rata 1. Jika variabel random
4| Adi Setiawan
Y = a + bX
dengan a, b R dan b > 0 maka fungsi distribusi dari Y adalah
ya
FY ( y ) P( Y y ) P( a b X y ) P( X ( y a) / b ) F
b
yaitu
ya
FY ( y ) 1 exp
b
untuk y > a dan 0 untuk y 0. Fungsi kuantilnya adalah
F 1 ( ) (a b ) ln(1 )
dengan (0,1). Hal itu berarti memenuhi
F 1a , b ( ) a b F 1 ( ) .
Contoh II.3
Dengan bantuan komputer dapat dibangkitkan 50 bilangan
random dari distribusi N(2,4). Gambar 3.2 memberikan QQ-
plot untuk 50 bilangan random dengan sumbu x menyatakan
kuantil N(0,1) dan sumbu y menyatakan statistik berurut
(ordered statistics) dari 50 bilangan random tersebut. QQplot
terhadap distribusi normal dari data dalam paket program
qqnorm(u) dengan u menyatakan vektor data. Terlihat bahwa
6
6
6
4
4
Sample Quantiles
Sample Quantiles
Sample Quantiles
2
2
2
0
0
-2
-2
-4
-2
-2 -1 0 1 2 -2 -1 0 1 2 -2 -1 0 1 2
Gambar II.3 Tiga QQ-plot dari 50 titik data dari N(2,4) melawan N(0,1).
6| Adi Setiawan
3.0
2
Kuantil N(0,1)
Kuantil U(0,3)
1
2.0
-2 -1 0
1.0
0.0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
6
Kuantil N(0,9)
Kuantil N(0,9)
2
-2
-6
-20
2.0
1.5
10
1.0
1.5
5
0.5
Eksponensial
Cauchy
N(0,1)
1.0
0
0.0
-0.5
-5
0.5
-1.0
-10
0.0
-2 -1 0 1 2 -2 -1 0 1 2 -2 -1 0 1 2
Tabel II.1 Data inflasi bulanan mulai Januari 2009 sampai dengan
Desember 2011
BULAN INFLASI BULAN INFLASI BULAN INFLASI
Januari 2009 -0.07 Januari 2010 0.84 Januari 2011 0.89
Februari 2009 0.21 Februari 2010 0.3 Februari 2011 0.13
Maret 2009 0.22 Maret 2010 -0.14 Maret 2011 -0.32
April 2009 -0.31 April 2010 0.15 April 2011 -0.31
Mei 2009 0.04 Mei 2010 0.29 Mei 2011 0.12
Juni 2009 0.11 Juni 2010 0.97 Juni 2011 0.55
Juli 2009 0.45 Juli 2010 1.57 Juli 2011 0.67
Agustus 2009 0.56 Agustus 2010 0.76 Agustus 2011 0.93
September 2009 1.05 September 2010 0.44 September 2011 0.27
Oktober 2009 0.19 Oktober 2010 0.06 Oktober 2011 -0.12
November 2009 -0.03 November 2010 0.6 November 2011 0.34
Desember 2009 0.33 Desember 2010 0.92 Desember 2011 0.57
1.0
0.5
0.0
-2 -1 0 1 2
Theoretical Quantiles
8| Adi Setiawan
II.3 QQ-plot untuk uji simetrik
Besaran stokastik X disebut mempunyai distribusi simetri
sekitar jika X- dan -X mempunyai distribusi yang sama.
Jika X berdistribusi kontinu maka X berdistribusi simetri
sekitar dan fungsi kepadatannya simetri sekitar .
Distribusi simetri dipandang lebih sederhana dari pada
distribusi asimetri. Untuk menilai bahwa data berasal dari
distribusi simetri dapat digunakan bantuan histogram atau
stem-and-leaf plot. Demikian juga dengan menggunakan
parameter kemencengan merupakan petunjuk yang baik,
parameter kemencengan sama dengan nol belum berarti
bahwa suatu distribusi nampak simetri. Cara yang lebih kuat
adalah dengan menentukan selisih antara mean dan median
dari suatu distribusi yang menceng. Kemencengan dapat juga
dinilai dari fungsi kuantil, dengan mudah dapat ditunjukkan
bahwa fungsi kuantil memenuhi
F 1 (1 ) 2 F 1 ( )
dengan (0,1) . Kesamaan ini berlaku untuk setiap distribusi
simetri F. Hal ini berarti untuk suatu distribusi simetri
titik-titik
F 1
( ) , F 1 (1 ) | (0,1)
terletak pada garis lurus. Untuk data-data X 1 , X 2 ,..., X n
berasal dari suatu distribusi simetrik dan diharapkan bahwa
titik-titik { ( X (i ) , X ( ni 1) ) | i = 1, 2,..., n } akan terletak pada
suatu garis lurus juga. Plot dari titik tersebut dikenal dengan
nama plot simetrik (symmetric plot atau symplot).
Contoh II.5
Gambar II.7 mempresentasikan plot simetrik untuk data dari
distribusi eksponensial. Terlihat bahwa tidak mengikuti garis
lurus sehingga cenderung tidak simetris seperti juga ditunjuk-
kan dengan histogramnya.
4
15
Frequency
3
10
2
5
1
0
0
0 1 2 3 4 0 1 2 3 4
Contoh II.6
Berdasarkan data pada Contoh II.4, dapat dibuat histogram
dan plot simetrik dari data inflasi bulanan tersebut yang
dinyatakan pada Gambar II.8. Terlihat bahwa data inflasi
bulanan tersebut kurang simetrik karena titik-titik cenderung
tidak terletak pada garis lurus, tetapi apabila kita membuang
outlier maka akan diperoleh hasil pada Gambar II.9 yang
cenderung lebih simetrik.
0 1 2 3 4 5 6 7
1.5
1.0
Frequency
0.5
0.0
Gambar II.8 Histogram dan Plot simetrik dari data pada Contoh II.4
10 | Adi Setiawan
7
1.0
6
5
0.6
Frequency
4
3
0.2
2
1
-0.2
0
Gambar II.9 Histogram dan Plot simetrik dari data pada Contoh II.4
tanpa mengikutsertakan outlier
***
Soal 1
Variabel random X berdistribusi eksponensial dengan mean b
sehingga mempunyai fungsi kepadatan probabilitas
1
f ( x) e x / b
b
untuk x > 0. Tentukan fungsi distribusi dan fungsi kuantilnya.
Penyelesaian
Fungsi distribusi dari variabel random X adalah F(x) = 0 untuk
x < 0 dan
x 1
F ( x)
x
e t / b dt e t / b 1 e x / b
0 b 0
Soal 2
Variabel random X berdistribusi seragam pada (a,b) dengan a,b
R dan b > a sehingga mempunyai fungsi kepadatan
probabilitas
1
f ( x)
ba
untuk a < x < b. Tentukan fungsi distribusi dan fungsi
kuantilnya.
12 | Adi Setiawan
Penyelesaian
Fungsi distribusi dari variabel random X adalah F(x) = 0 untuk
x a dan
xa
x
1 x t
F ( x) dt
aba ba 0 ba
untuk a < x < b serta F(x) = 1 untuk x b. Akibatnya, fungsi
kuantil dapat diperoleh dengan
xa
y
ba
sehingga
(b a) y x a
atau
x a (b a) y.
Akibatnya, diperoleh fungsi kuantil
F ( ) a (b a)
untuk (0,1).
Soal 3
Variabel random X mempunyai fungsi kepadatan probabilitas
f ( x) k x
untuk 0 < x < 2. Tentukan k sehingga f(x) merupakan fungsi
kepadatan probabilitas, fungsi distribusi dan fungsi kuantilnya.
Penyelesaian
Konstanta k ditentukan sehingga
f ( x) dx 1
atau
2
2 x2
1 k x dx k 2k
0 2 0
Soal 4
Variabel random X berdistribusi N(0,1) dan Y = 2X + 1 maka
tentukan grafik fungsi distribusi dari X dan Y. Tentukan juga
grafik dari fungsi kuantil dari variabel random X dan fungsi
kuantil variabel random Y.
Penyelesaian
Karena variabel random X berdistribusi N(0,1) maka variabel
random Y berdistribusi normal dengan mean
E[Y] = E[ 2X + 1 ] = 2 E[X] + 1 = 2 (0) + 1 = 1
dan variansi adalah
V[Y] = V[ 2X + 1 ] = 4 V[X] = 4 (1) = 4.
Grafik fungsi distribusi X dan Y dinyatakan pada Gambar
II.10.
14 | Adi Setiawan
Gambar II.10 Grafik fungsi distribusi variabel random X dan Y
(grafik titik-titik)
Soal 5
Variabel random X mempunyai distribusi chi-kuadrat dengan
derajat bebas sehingga mempunyai fungsi kepadatan
probabilitas dengan
1
f ( x) / 2 x / 2 1 e x / 2
2 ( / 2)
untuk x > 0. Gambarkan grafik dari f(x), F(x) dan fungsi kuanti
F-1().
Penyelesaian
Grafik fungsi kepadatan probabilitas chi-kuadrat dengan
derajat bebas 5 dan fungsi distribusinya dinyatakan pada
Gambar II.11.
0.8
0.10
0.6
F(x)
f(x)
0.4
0.05
0.2
0.00
0.0
0 5 10 15 20 0 5 10 15 20
x x
5
0
alfa
Soal 6
Variabel random X mempunyai distribusi Beta dengan
parameter = 3 dan = 4 sehingga mempunyai fungsi
kepadatan probabilitas
(7)
f ( x) x 31 (1 x) 41 60 x 2 (1 x)3
(3) (4)
untuk 0 < x < 1. Gambarkan grafik dari f(x), F(x) dan fungsi
kuanti F-1().
16 | Adi Setiawan
Penyelesaian
Grafik fungsi kepadatan probabilitas dari distribusi Beta
dengan parameter = 3 dan = 4 dan fungsi distribusinya
dinyatakan pada Gambar II.13.
1.0
2.0
0.8
1.5
0.6
F(x)
f(x)
1.0
0.4
0.5
0.2
0.0
x x
0.4
0.2
0.0
alfa
Soal 7
Apabila dibangkitkan sampel ukuran 50 dari distribusi
eksponensial dengan mean 3 maka bagaimanakah grafik QQ-
plot sampel melawan distribusi teoritisnya ?
5
0
0 5 10
Theoritial Quantiles
Soal 8
Apabila dibangkitkan sampel ukuran 50 dari distribusi Beta
dengan parameter = 3 dan = 4 maka bagaimanakah grafik
QQ-plot sampel melawan distribusi teoritisnya ?
Penyelesaian
Grafik pada Gambar II.16 menyatakan grafik QQ-plot sampel
ukuran 50 dari distribusi Beta dengan parameter = 3 dan
= 4 melawan distribusi teoritisnya. Terlihat bahwa titik-titik
dalam QQ-plotnya cenderung membentuk garis y = x.
18 | Adi Setiawan
1.0
0.8
Sample Quantiles
0.6
0.4
0.2
0.0
Theoritial Quantiles
Soal 9
Gambarkan grafik dari fungsi kuantil dari distribusi N(5,4)
yaitu F ( ) melawan F (1 ) dengan (0,1). Grafik ini
1 1
8
6
4
2
0
0 2 4 6 8 10
Fungsi kuantil alfa dari N
(5,4)
Soal 10
Berikan contoh-contoh lain dari distribusi N(5,4) yang
simetrik maupun yang tidak simetrik dan gambarkan plot
simetrik masing-masing.
Penyelesaian
Fungsi kuantil 1-alfa chi-kuadrat dgn df=5
15
2
Fungsi kuantil
1-alfa N(0,1)
10
0
5
-2 -1
-2 -1 0 1 2 0 5 10 15
Fungsi kuantil alfa N(0,1) Fungsi kuantil alfa chi-kuadrat dgn df=5
Fungsi kuantil 1-alfa Beta(3,3)
15
10
0.4
5
0.0
20 | Adi Setiawan
Grafik dari fungsi kuantil F ( ) melawan fungsi kuantil
1
22 | Adi Setiawan
9. Gunakan plot simetrik untuk mengecek apakah distribusi
Gamma(4,3) simetrik atau tidak.
10. Gunakan plot simetrik untuk mengecek apakah laju
inflasi bulanan Kota Ambon periode Januari 2009 sampai
dengan Juni 2013 simetrik. Ulangi pertanyaan yang
sama untuk Kota Jayapura.
Tabel II.2 Tabel laju inflasi Bulanan Kota Ambon dan Kota Jayapura
dari bulan Januari 2009 s/d Juni 2013.
BULAN AMBON JAYAPURA BULAN AMBON JAYAPURA
24 | Adi Setiawan
Hipotesis nol akan ditolak untuk D n nilai besar. Distribusi
Dn tidak terdistribusi seperti yang biasa dikenal dan nilai
kritiknya dapat dihitung dengan komputer. Secara praktis
statistic D n dapat dihitung dengan rumus
i i 1
Dn maxmax{ F ( X (i ) ) , F ( X ( i ) ) } .
n n
Suatu sifat yang membuat uji Kolmogorov-Smirnov
sangat bernilai adalah bahwa distribusi D n di bawah hipotesis
nol untuk setiap fungsi distribusi kontinu akan sama. Karena
Dn bebas distribusi atas kelas dari fungsi distribusi kontinu
maka nilai kritik tidak tergantung pada F sehingga dengan
suatu tabel dapat ditentukan nilai kritiknya (Tabel Kolmogorov-
Smirnov pada Lampiran 1).
Gambar III.1 memberikan distribusi empirik dari
sampel yang diambil dari distribusi N(0,1) (dalam bentuk
fungsi tangga – step function) dan fungsi distribusi dari N(0,1)
yang sebenarnya.
ecdf(x)
1.0
0.8
0.6
Fn(x)
0.4
0.2
0.0
-4 -2 0 2 4
i 1
a F X (i ) b F X ( i )
i
X (i ) max { a , b }
n n
0,0175 0,0493 0,0173 0,0493
0,2101 0,0562 0,1228 0,1228
0,2175 0,0045 0,0621 0,0621
0,4441 0,0919 0,1586 0,1586
0,4568 0,0334 0,1000 0,1000
0,6053 0,0541 0,1208 0,1208
0,6690 0,0211 0,0878 0,0878
1,0593 0,1200 0,1866 0,1866
1,0768 0,0593 0,1260 0,1260
1,2043 0,0334 0,1000 0,1000
1,4469 0,0314 0,0980 0,0980
1,5702 0,0080 0,0587 0,0587
1,8560 0,0230 0,0437 0,0437
2,3655 0,0272 0,0394 0,0394
3,0576 0,0470 0,0197 0,0470
D n = 0,1866
26 | Adi Setiawan
Nilai statistik uji Kolmogorov-Smirnov tersebut dibanding-
kan dengan nilai kritik yang didapat dalam tabel Kolmogorov-
Smirnov dua sisi untuk ukuran n = 15 dengan memilih
=0,05 yaitu 0,338. Karena D n = 0,1866 lebih kecil dari nilai
kritik yaitu 0,338 maka hipotesis yang menyatakan bahwa
nilai populasinya eksponensial standard adalah benar. Grafik
distribusi empirik dari data tersebut dapat dilihat pada
Gambar III.2.
ecdf(x)
1.0
0.8
0.6
Fn(x)
0.4
0.2
0.0
0 1 2 3 4 5
Contoh III.2
Misalkan dimiliki data
42, 46, 44, 48, 47, 48, 48, 57, 55, 55
i 1
F ( x(i ) ) a F X (i ) n b F X (i ) n
i
Data
No Max{a, b}
Terurut
Contoh III.3
Berdasarkan data pada Contoh II.4, diperoleh statistik hitung
uji Kolmogorov-Smirnov Dn = 0,1086 dan dengan tingkat
keberartian 5% diperoleh titik kritis 0,221 sehingga H0
diterima berarti data inflasi bulanan nasional Indonesia
periode Januari 2009 sampai dengan Desember 2011
berdistribusi normal dengan rata-rata 0,3675 dan simpangan
baku 0,4337.
28 | Adi Setiawan
III.2 Uji Chi-kuadrat
Selain uji Kolmogorov-Smirnov dapat juga digunakan
uji Chi-Kuadrat. Uji ini dilakukan dengan mulai membagi
garis dalam sejumlah interval tertutup I 1 ,…, I K
……I1……|……I2……|………………………………|…Ik……..
Selanjutnya didefinisikan N i sebagai jumlah pengamatan
pada interval I i dan dihitung statistik
k
[ N i npi ]2
2
X i 1 npi
dengan pi probabilitas atas F pada I i . Bilangan npi adalah
harapan dari N i jika distribusi yang sebenarnya dari pengamatan
sama dengan F. Besaran X 2 dibawah hipotesis nol menentukan
berapa frekuensi pengamatan N i menyimpang dari harapan.
Hipotesis nol bahwa pengamatan berasal dari F ditolak untuk
nilai X 2 besar. Distribusi X 2 mendekati distribusi 2 dengan
derajat bebas k-1 untuk n besar.
Contoh III.4
Lima puluh dua digit diambil secara random dari buku
telepon. Bilangan-bilangan itu setelah diurutkan dapat dinyata-
kan sebagai berikut :
23 23 24 27 29 31 32 33 33 35
36 37 40 42 43 43 44 45 48 48
54 54 56 57 57 58 58 58 58 59
61 61 62 63 64 65 66 68 68 70
73 73 74 75 77 81 87 89 93 97.
Dengan menggunakan uji chi-kuadrat akan dilakukan pengu-
jian hipotesis bahwa distribusinya normal dengan meannya
55 dan deviasi standard 19. Apabila dilakukan dengan
pembagian 6 interval maka didapat pembagian interval
sebagai berikut:
2
No Interval Frekuensi (N i ) Harapan (np i ) (N i - np i ) / np i
1 ( , 34,5], 9 7 0,286
2 ( 34,5 , 46,5 ], 9 9,3 0,097
3 ( 46,5 , 59,5 ], 11 13,4 0,423
4 ( 59,5 , 70,5 ], 11 9,8 0,147
5 ( 70,5 , 82,5 ], 6 6,8 0,094
6 ( 82,5 , ) 4 3,7 0,024
X 2 = 1,071
30 | Adi Setiawan
populasi yang distribusinya tidak diketahui. Dihitung mean
1 n
sampel X X i sebagai estimasi dari mean populasinya
n i 1
yang tidak diketahui dan deviasi standard sampel
1 n
s ( X i X )2
n 1 i 1
sebagai estimasi deviasi standard populasi yang juga tidak
diketahui. Selanjutnya dihitung nilai variabel unit standard
Zi dengan rumus
Xi X
Zi
s
dengan i = 1, 2, …., n. Nilai statistik uji Lilliefors dihitung dari
nilai-nilai Zi, i = 1, 2, ….,, n dengan langkah-langkah sebagai
berikut :
a) Hipotesis :
H0 : Sampel random berasal dari populasi normal.
H1 : Distribusi populasinya tidak normal.
b) Dipilih tingkat keberartian α.
c) Digunakan statistik uji yang didefinisikan sebagai jarak
vertikal maksimum antara fungsi distribusi empirik
sampel X1, X2, …, Xn dengan fungsi distribusi normal
dengan mean X dan deviasi standard s yakni
T max | F * ( x) S ( x) | .
x
Contoh III.5
32 | Adi Setiawan
Contoh III.6
Berdasarkan data pada Contoh II.4, diperoleh statistik hitung
uji Lilliefors T = 0,1086 dan dengan tingkat keberartian 5 %
diperoleh titik kritis 0,1477 sehingga H0 diterima berarti data
inflasi bulanan nasional Indonesia periode Januari 2009
sampai dengan Desember 2011 berdistribusi normal dengan
rata-rata 0,3675 dan simpangan baku 0,4337. Kesimpulan
yang sama juga diperoleh jika digunakan uji Kolmogorov-
Smirnov.
***
Soal 1
Dengan tingkat keberartian 5%, ujilah apakah data laju inflasi
bulanan di kota Ambon untuk periode Januari 2009 sampai
dengan Juni 2013 mempunyai distribusi normal dengan metode
Kolmogorov-Smirnov.
Penyelesaian
Dengan menggunakan data pada Tabel II.2, diperoleh statistik
Kolmogorov-Smirnov Dn = 0,0836 sedangkan titik kritis diperoleh
dari Tabel Kolmogorov-Smirnov (Lampiran 1) dengan ukuran
1,36
sampel n = 54 yaitu 0,1851 sehingga
54
Dn = 0,0836 < 0,1851.
Akibatnya H0 diterima sehingga data laju inflasi di kota
Ambon berdistribusi normal.
Soal 2
Dengan tingkat keberartian 5%, ujilah apakah data laju inflasi
bulanan di kota Ambon untuk periode Januari 2009 sampai
dengan Juni 2013 mempunyai distribusi normal dengan
metode Lilliefors.
Penyelesaian
Dengan menggunakan data pada Tabel II.2, diperoleh statistik
Lilliefors T = 0,0836 sedangkan titik kritis diperoleh dari Tabel
0,886
Lilliefors dengan ukuran sampel n = 54 yaitu 0,1206 .
54
Akibatnya H0 diterima sehingga data laju inflasi di kota
Ambon berdistribusi normal.
34 | Adi Setiawan
Soal 3
Tabel III.4 menyatakan data berkelompok. Dengan tingkat
keberartian 5% dan metode chi-kuadrat, tentukan apakah
data berkelompok pada Tabel III.4 berdistribusi normal.
Penyelesaian
Berdasarkan data pada Tabel III.4, mean untuk data ber-
kelompok 56,7 dan simpangan baku untuk data berkelompok
adalah 15,3645 sehingga dapat ditentukan nilai harapan
untuk masing-masing kelas seperti dinyatakan pada Tabel
III.5. Nilai harapan kelas pertama dapat diperoleh dari nilai
Z1 diperoleh dari tepi kelas atas pertama yaitu
19,5 x 19,5 56,7
Z1 2,4212
s 15,3645
sehingga diperoleh
p1 P(Z z1 ) P(Z 2,4212) 0,0077
(lihat Lampiran 4) dan nilai harapan kelas pertama sebesar
np1 = 150(0,0077) = 1,1602.
Nilai Z2 diperoleh
29,5 x 29,5 56,7
Z2 1,7703
s 15,3645
sehingga diperoleh
p2 P( z1 Z z2 ) P(Z 1,7703) P(Z 2,4212) 0,0306
dan nilai harapan kelas kedua sebesar
np2 = 150(0,0306) = 4,5906.
Dengan cara yang sama, dapat diperoleh nilai harapan untuk
kelas ke-3 sampai dengan kelas ke-8. Selanjutnya, nilai Z8
diperoleh
89,5 x 89,5 56,7
Z8 2,1348
s 15,3645
sehingga
p9 1 P( Z z8 ) 1 0,9836 0,0164
dan nilai harapan kelas ke-9 adalah
np9 = 150(0,0164) = 2,4584.
Tabel III.5 Data Berkelompok dan Nilai Harapannya pada Soal III.3
36 | Adi Setiawan
Tabel III.6 Tabel Bantu Perhitungan Statistik X2 pada Soal III.3
Nilai ( f i npi ) 2
Harapan (npi) npi
No Kelas Interval Frekuensi (f i)
1 20-29 6 5,7508 0,2714
2 30-39 9 13,9700 1,7682
3 40-49 31 28,2303 0,2717
4 50-59 42 37,8943 0,4448
5 60-69 32 33,7951 0,0954
6 70-79 17 20,0227 0,4563
7 80-89 10 10,3369 0,2676
Total 150 150 3,5754
Soal 5
Dengan tingkat keberartian 5% dan dengan menggunakan
metode chi-kuadrat, ujilah apakah data laju inflasi bulanan
di kota Ambon dari periode Januari 2009 sampai dengan Juni
2013 berdistribusi normal ?
Penyelesaian
Untuk memudahkan pemilihan interval yang digunakan dalam
penggunaan metode chi-kuadrat dibantu dengan grafik
histogram yang diperoleh dari paket program R yang dinyatakan
pada Gambar III.4 sehingga dapat diperoleh tabel data
berkelompok pada Tabel III.7. Nilai harapan diperoleh dari
anggapan bahwa sampelnya diambil dari distribusi normal.
Tetapi karena terdapat interval yang harga harapannya
kurang dari 5 maka digabungkan menjadi 1 yaitu interval 1
digabungkan dengan interval kedua sedangkan interval 6 dan
7 digabungkan dengan interval ke 5 sehingga diperoleh hasil
seperti pada Tabel III.8. Selanjutnya dapat dihitung
X2hitung = 11,4040.
Dengan menggunakan tingkat keberartian = 5 % diperoleh
titik kritis dari distribusi Chi-kuadrat dengan derajat bebas 3
Histogram of ambon
15
Frequency
10
5
0
-3 -2 -1 0 1 2 3 4
ambon
Gambar III.4 Histogram Data Inflasi Bulanan Kota Ambon Januari 2009
sampai dengan Juni 2013
38 | Adi Setiawan
Tabel III.8 Tabel Bantu Perhitungan Statistik X2 pada Soal III.5
Nilai ( f i npi ) 2
Harapan npi
No Kelas Interval Frekuensi (f i) (npi)
1 Kurang dari -1,00 5 8,5674 1,4854
2 -0,99 s/d 0,00 13 18,4326 1,6011
3 0,01 s/d 1,00 19 18,4326 0,0175
4 Lebih dari 1,00 17 8,5674 8,3000
Total 54 54 11,4040
*****
40 | Adi Setiawan
BAB IV
UJI KECOCOKAN : DISTRIBUSI MULTINOMIAL
Definisi IV.1
Percobaan multinomial terdiri dari n usaha (trial) dan tiap usaha
menghasilkan k hasil yang bereda yaitu E1, E2, ..., Ek serta
masing-masing dengan probabilitas p1, p2, ..., pk. Distribusi
multinomial akan memberikan probabilitas bahwa E1 akan muncul
sebanyak y1, E2 akan muncul sebanyak y2 kali dan seterusnya
dalam pengambilan saling bebas sebanyak n kali sehingga y1 +
y2 + .... + yk = n sehingga
n y1 y2
f ( y1 , y2 ,...., yk ; p1 , p2 ,...., pk ) p1 p2 ....pk yk
y1 , y2 ,..., yk
dengan p1 + p2 + .... + pk = 1 dan yi 0 untuk i = 1, 2, ...,k.
Contoh IV.1
Berdasarkan teori genetika, perbandingan seekor hamster betina
akan melahirkan anak dengan bulu merah, hitam dan putih adalah
8:4:4. Tentukan probabilitas bahwa akan lahir 8 ekor anak yang
terdiri dari 5 ekor merah, 2 ekor hitam dan 1 ekor putih.
Penyelesaian
Berdasarkan informasi di atas diperoleh
p1 = P( mendapatkan hamster merah) = 1/2,
p2 = P( mendapatkan hamster hitam) = 1/4,
p3 = P( mendapatkan hamster putih) = ½.
42 | Adi Setiawan
Langkah 5
Hipotesis nol H0 ditolak jika nilai-p < dengan tingkat
keberartian atau jika X2hitung > ; k 1 dengan adalah kuantil
2
ke-(1-) 100 %.
Contoh IV.2
Misalkan seorang pengembang perumahan menjual 3 tipe
rumah yaitu tipe mawar, tipe menur dan tipe melati. Apabila
dari 100 rumah yang dimiliki, 25 rumah tipe mawar, 35 rumah
tipe menur dan 40 rumah tipe melati, apakah ada tipe rumah
yang lebih disukai dibandingkan dengan tipe yang lain?
Gunakan tingkat keberartian 5%.
Penyelesaian
Dalam permasalahan ini, diinginkan untuk menguji hipotesis
nol H0 : tidak ada tipe rumah yang lebih disukai dibandingkan
dengan tipe yang lain (p1 = p2 = p3 = 1/3), hipotesis alternatif
H1 : ada tipe rumah yang lebih disukai dibandingkan dengan
tipe yang lain, dengan tingkat keberartian 5%. Di bawah H0
benar maka
e1 = e2 = e3 = 33,3333
sehingga diperoleh statistik uji
k
( f i ei ) 2 (25 33,3333) 2 (35 33,3333) 2 (40 33,3333) 2
X 2
i 1 ei 33,3333 33,3333 33,3333
= 3,5000.
Hipotesis nol ditolak jika X2hitung lebih besar dari titik kritis
2 ; k 1 yaitu 5,9915. Akibatnya hipotesis nol H0 diterima
sehingga tidak ada tipe rumah yang lebih disukai dibandingkan
dengan tipe yang lain.
Soal 1
Dalam suatu populasi, 70% populasi tersebut mengunakan
tangan kanan, 20% menggunakan tangan kiri dan 10% dapat
menggunakan kedua tangannya. Jika 10 orang diambil dari
populasi tersebut maka :
a. Berapa probabilitasnya bahwa semuanya dapat meng-
gunakan tangan kanannya?
b. Berapa probabilitasnya bahwa 7 orang menggunakan
tangan kanan, 2 orang menggunakan tangan kiri dan 1
orang dapat menggunakan kedua tangannya?
Penyelesaian
Percobaan tersebut termasuk dalam percobaan multinomial
dengan parameter n =10, p1 = 0,7, p2 = 0,2 dan p3 = 0,1
sehingga jika dimisalkan X1 = banyaknya orang yang dapat
menggunakan tangan kanannya, X2 = banyaknya orang yang
dapat menggunakan tangan kirinya dan X3 = banyaknya
orang yang dapat menggunakan kedua tangannya maka
a. Probabilitasnya bahwa semuanya dapat menggunakan
kedua tangannya adalah
10
P(X1 = 10, X2 = 0, X3 = 0) = (0,7)10 0,0282.
10,0,0
b. Probabilitasnya bahwa semuanya dapat menggunakan
kedua tangannya adalah
10
P(X1 = 7, X2 = 2, X3 = 1) = (0,7)7 (0,2) 2 (01)1 0,1186.
7, 2,1
Soal 2
Manusia dapat dikasifikasikan ke dalam golongan darah tipe
O, A, B dan AB. Dalam suatu populasi, proporsi masing-
masing golongan darah tersebut adalah 0,45, 0,40, 0,10 dan
44 | Adi Setiawan
0,05. Misalkan 6 orang diambil secara random dari populasi
tersebut :
a. Berapakah probabilitas bahwa terdapat 3 golongan
darah O dan 3 golongan darah A?
b. Berapa probabilitasnya tidak ada golongan darah AB?
Penyelesaian
a. Percobaan tersebut termasuk percobaan multinomial
dengan parameter n = 6, pO = 0,45, pA = 0,4, pB = 0,1
dan pAB=0,05 sehingga jika dimisalkan XO= banyaknya
orang golongan darah tipe O, XA = banyaknya orang
dengan golongan darah tipe A , XB = banyaknya orang
dengan golongan darah tipe B dan XAB = banyaknya
orang dengan golongan darah tipe B maka probabili-
tasnya bahwa semuanya dapat menggunakan kedua
tangannya adalah
P(XO = 3, XA = 3, XB = 0, XAB = 0)
6
= (0,45)3 (0,4)3 0,1166.
3,3,0,0
b. Percobaan tersebut termasuk percobaan binomial dengan
parameter n = 6 dan pAB = 0,05 sehingga jika dimisalkan
X = banyaknya orang golongan darah tipe AB maka
probabilitasnya bahwa semuanya dapat menggunakan
kedua tangannya adalah
6
P(X = 0) = (0,95) (0,05) 0,7351.
6 0
0
Soal 3
Gunakan statistik X2 dengan tingkat keberartian 10% untuk
menguji hipotesis nol H0 : pA = 0,4, pB = 0,4 dan pC = 0,2,
melawan hipotesis alternatif H1 : proporsi populasi tidak pA
= 0,4, pB = 0,4 dan pC = 0,2. Bila dimiliki sampel ukuran 200
dan menghasilkan 60 dalam kategori A, 120 dalam kategori
B dan 20 dalam kategori C.
Soal 4
Tahun lalu, penilaian mahasiswa yang mengambil mata
kuliah Statistika adalah 3% A, 28% B, 45% C dan 24% E.
Apabila tahun ini, dari 400 mahasiswa yang mengambil mata
kuliah Statistika terdapat 24 yang mendapatkan A, 124 yang
mendapatkan B, 172 yang mendapatkan C dan sisanya
mendapatkan E, apakah penilaian tahun ini sama dengan
penilaian tahun lalu ? Gunakan tingkat keberartian 5%.
a. Gunakan cara nilai-p.
b. Gunakan cara titik kritis.
Penyelesaian
Dalam permasalahan ini, diinginkan untuk menguji hipotesis
nol H0 : pA = 0,03, pB = 0,28, pC = 0,45, pE = 0,24 melawan
hipotesis alternatif H1 : proporsi populasi tidak pA = 0,03,
46 | Adi Setiawan
pB = 0,28, pC = 0,45, pE = 0,24 dengan tingkat keberartian 5
%. Di bawah H0 benar maka
e1 = 400 (0,03) = 12,
e2 = 400 (0,28) = 112,
e3 = 400 (0,45) = 180,
e4 = 400 (0,24) = 96,
sehingga diperoleh statistik uji
k
( f i ei ) 2 (24 12) 2 (124 112) 2 (172 180) 2 ( 80 96) 2
X 2
i 1 ei 12 112 180 96
= 16,3079.
Hipotesis nol ditolak jika X2hitung lebih besar dari titik kritis
2 ; k 1 yaitu 7,8147. Akibatnya hipotesis nol H0 ditolak
sehingga proporsi tidak pA = 0,03, pB = 0,28, pC = 0,45, dan
pE = 0,24.
Dalam hal ini, juga dapat digunakan cara nilai-p. Nilai-
p dapat dihitung dengan
nilai-p = P(
2
3 > 16,3079) = 0,0010.
Akibatnya lebih kecil dari tingkat keberartian 5% sehingga H0
ditolak.
Soal 5
Dari survei 5 tahun lalu diperoleh hasil bahwa 20 persen
menjawab setuju, 70 persen menjawab tidak setuju dan sisanya
tidak menjawab untuk pertanyaan tentang aborsi. Pada
tahun ini diadakan survei dan dari 1600 responden, ternyata
400 responden menjawab setuju, 1100 responden dan sisanya
tidak menjawab. Gunakan tingkat keberartian 10% untuk
menguji apakah hasil survei tahun ini sama dengan hasil
survei 5 tahun lalu.
Penyelesaian
Diinginkan untuk menguji hipotesis nol : ps = 0,2, pts = 0,7
dan pa = 0,1 melawan hipotesis alternatif H1 : H0 tidak benar
dengan menggunakan tingkat keberartian 10 %. Hipotesis nol
maka
e1 = 1600 (0,2) = 320,
e2 = 1600 (0,7) = 1120,
e3 = 1600 (0,1) = 160,
sehingga diperoleh statistik uji
k
( f i ei ) 2 (400 320) 2 (110 1120) 2 (100 160) 2
X
2
i 1 ei 320 1120 160
= 42,8571.
Karena X2hitung lebih besar dari 4,6052 maka hipotesis nol H0
ditolak sehingga proporsi tidak ps = 0,2, pts = 0,7 dan pa =
0,1.
48 | Adi Setiawan
LATIHAN
***
50 | Adi Setiawan
BAB V
ANALISIS TABEL KONTINGENSI (TABEL k r )
Ada
Tidak Ada keriput Jumlah
Keriput
Suka manis 200 100 300
Tidak Suka Manis 200 500 700
Jumlah 400 600 1000
Contoh V.2
Seorang sosiolog tertarik untuk mengetahui apakah anak
mempunyai ketergantungan untuk memilih pekerjaan yang
sama dengan ayahnya. Untuk meneliti hal ini diambil sampel
500 laki-laki dan ditanya pekerjaannya dan pekerjaan ayahnya.
Ringkasan data yang berkenaan dengan jawaban pertanyaan
itu dapat dilihat pada Tabel V.3.
Anak
Tanpa
Bisnis Kecakapan Tani
Kecakapan
Bisnis 55 38 7 0
Ayah Kecakapan 79 71 25 0
Tanpa 22 75 38 10
kecakapan
Tani 15 23 10 32
52 | Adi Setiawan
V.1. Uji Chi-kuadrat Untuk Tabel k r
j 1 np j
konvergen dalam distribusi ke distribusi 2 dengan derajat
bebas k-1.
Model A
Berdasarkan pada Contoh V.2 dipunyai sampel sebesar
n=500 yang digolongkan ke dalam dua kategori yaitu
pekerjaan orang tua dan pekerjaan anak. Di bawah model ini
matriks dari frekuensi sel mempunyai distribusi kr-multinomial
dengan parameter n, p11, ...., pkr
k r
N
i 1
i. N
j 1
j. n.
Dalam model ini semua frekuensi Ni. dan N.j adalah besaran
stokastik.
Model B
Tabel k r dapat juga dipandang sebagai k sampel
independen yang digolongkan ke dalam peubah kolom. Di
Model C
Dalam model ini data dalam tabel berasal dari r sampel
independen dari distribusi k-nomial dengan parameter
sampel ke-j adalah N.j, p1j, ..., pkj untuk j = 1,2, ..., r dan N.j
sampel yang tidak stokastik.
r
Model B : pi. p j untuk i = 1, 2, ..., k.
j 1
k
Model C : p. j pi untuk j = 1, 2, ..., r.
i 1
54 | Adi Setiawan
k r ( N ij npij ) 2
X 2
i 1 j 1 npij
yang untuk n besar akan mendekati distribusi chi-kuadrat
dengan derajat bebas kr-1. Teorema berikut ini digunakan
secara praktis dalam melakukan uji chi-kuadrat pada tabel
kontingensi.
Teorema V.1
Di bawah hipotesis nol H0A, H0B dan H0C masing-masing
dalam model A, B dan C mempunyai besaran uji
^
k r ( N ij n p ij ) 2
X2 ^
i 1 j 1 n p ij
dengan pij didefinisikan sebagai
^ N i . N. j
p ij
n2
untuk n cukup besar maka X2 mendekati distribusi 2 dengan
derajat bebas (k-1)(r-1).
Contoh V.3
Berdasarkan pada Contoh V.2, diperoleh statistik uji X2
adalah 126,9841 dengan titik kritis 3,81 jika digunakan tingkat
keberartian 5%. Hipotesis nol menyatakan bahwa tidak ada
keterkaitan antara kesukaan akan makanan manis dengan
munculnya keriput pada wajah. Karena X2 hitung lebih besar
dari titik kritis maka H0 ditolak sehingga ada keterkaitan
antara kesukaan akan makanan manis dengan munculnya
keriput pada wajah.
Contoh V.4
Dalam Contoh V.2, dapat diketahui bahwa data berasal dari
satu sampel dan akan dilakukan pengujian terhadap hipotesis
nol bahwa tidak ada keterkaitan antara pemilihan pekerjaan
anak dengan pekerjaan orang tua sehingga model yang tepat
adalah model A. Hasil perhitungan untuk statistik uji X2
Contoh V.5
Pada analisis tabel kontingensi dapat dilakukan juga per-
hitungan residu ternorma untuk melihat kecenderungan
56 | Adi Setiawan
kategori mana yang sangat berkaitan erat. Pada tabel berikut
ini diberikan residu ternormanya untuk tiap-tiap sel. Dengan
bantuan boxplot dari residu ternorma maka dapat dilihat
bahwa sel (4,4) mempunyai residu ternorma yang ekstrim
(outlier). Hal ini berarti bahwa pemilihan pekerjaan petani
oleh anak sangat erat kaitannya dengan pekerjaan ayah
sebagai petani.
Anak
Tanpa
Bisnis Kecakapan Tani
Kecakapan
Bisnis 3,56 -0,53 -2,90 -2,90
Ayah Kecakapan 2,47 -0,17 -0,57 -3,83
Tanpa 3,92 -2,36 3,07 -0,62
kecakapan
Tani -2,36 -1,76 -0,78 9,76
***
Soal 1
Sampel dari 100 orang laki-laki usia 45 sampai dengan 65
yang mempunyai tekanan darah tinggi dan berpenyakit jantung
dinyatakan pada Tabel V.5. Ujilah apakah ada keterkaitan
antara orang laki-laki yang mempunyai tekanan darah tinggi
dengan orang berpenyakit jantung dengan tingkat
keberartian 5%.
Penyakit Jantung
Ada Tidak Ada Jumlah
Tekanan darah tinggi
Ada 32 39 71
Tidak Ada 64 264 328
Jumlah 96 303 399
Penyelesaian
Untuk menguji apakah ada keterkaitan antara orang laki-laki
yang mempunyai tekanan darah tinggi dengan orang ber-
penyakit jantung dengan tingkat keberartian 5% digunakan
langkah-langkah berikut ini :
a. Hipotesis nol H0: tidak ada keterkaitan antara orang
laki-laki yang mempunyai tekanan darah tinggi dengan
orang berpenyakit jantung, melawan hipotesis alternatif
H1: ada keterkaitan antara orang laki-laki yang mem-
punyai tekanan darah tinggi dengan orang berpenyakit
jantung.
b. Tingkat keberartian = 5 %.
c. Statistik Uji X2.
d. Hipotesis nol ditolak jika X2 hitung > kuantil 95% dari
distribusi chi-kuadrat dengan derajat bebas 1 yaitu 3,84.
58 | Adi Setiawan
e. Dari Tabel V.5 diperoleh X2 hitung adalah 20,8667
sehingga lebih besar dari 3,84 dan berarti H0 ditolak.
Dengan kata lain, ada keterkaitan antara orang laki-
laki yang mempunyai tekanan darah tinggi dengan
orang berpenyakit jantung. Tabel V.6 menyatakan
kontribusi Cij untuk setiap sel terhadap X2 hitung.
Terlihat bahwa sel (1,1) bernilai positif dan relatif besar
terhadap nilai sel lain sehingga terdapat keterkaitan
positif antara adanya tekanan darah tinggi dan penyakit
jantung.
Penyakit Jantung
Ada Tidak Ada
Tekanan darah tinggi
Ada 3,6092 -2,0315
Tidak Ada -1,6792 0,9452
Soal 2
Ujilah keterkaitan antara variabel A dengan variabel B untuk
setiap kasus berikut ini:
a. Kasus 1
10 16
16 10
b. Kasus 2
100 106
106 100
c. Kasus 3
100 160
160 100
Soal 3
Berikut ini diberikan data tentang hasil penelitian kategori
nilai Matematika dan nilai Kimia dari 528 siswa yang
dinyatakan pada Tabel V.7. Ujilah dengan tingkat keberartian
1% apakah ada keterkaitan antara nilai Matematika dengan
nilai Kimia.
Tabel V.7 Tabel Data Soal V.3
Matematika
Tinggi Sedang Rendah
Kimia Tinggi 54 70 13
Sedang 48 164 40
Rendah 15 42 82
60 | Adi Setiawan
Penyelesaian
Untuk menguji apakah ada keterkaitan antara nilai Matematika
dengan nilai Kimia pada siswa dengan tingkat keberartian 1%
digunakan langkah-langkah berikut ini :
a. Hipotesis nol H0 : tidak ada keterkaitan antara nilai
Matematika dan nilai Kimia, melawan hipotesis alternatif
H1 : ada keterkaitan antara nilai Matematika dan nilai
Kimia.
b. Tingkat keberartian = 5 %.
c. Statistik Uji X2.
d. Hipotesis nol ditolak jika X2 hitung > kuantil 99% dari
distribusi chi-kuadrat dengan derajat bebas 4 yaitu
13,2767.
e. Dari Tabel V.5 diperoleh X2 hitung adalah 132,3524
sehingga lebih besar dari 13,2767 dan berarti H0
ditolak. Dengan kata lain, ada keterkaitan antara nilai
Matematika dan nilai Kimia. Tabel V.8 menyatakan
kontribusi Cij untuk setiap sel terhadap X2 hitung.
Terlihat bahwa sel (1,1) dan (3,3) bernilai positif dan
relatif besar terhadap nilai sel lain sehingga terdapat
keterkaitan positif antara nilai tinggi pada Matematika
dengan nilai tinggi pada Kimia serta nilai rendah pada
Matematika dan nilai rendah pada nilai Kimia.
Matematika
Tinggi Sedang Rendah
Kimia Tinggi 4,2909 -0,1907 -3,7220
Sedang -1,0493 2,8119 -3,0437
Rendah -2,8471 -3,5968 7,7933
Soal 4
Tabel V.9 menyatakan apakah ada saling keterkaitan antara
pengambil keputusan pinjaman di suatu bank dengan keputus-
Keputusan
Disetujui Tidak Disetujui
Pengambil Keputusan
A 24 16
B 17 13
C 35 15
D 11 9
Penyelesaian
Untuk menguji apakah ada keterkaitan antara pengambil
keputusan dan keputusan yang diambil dengan tingkat
keberartian 10 % digunakan langkah-langkah berikut ini :
a. Hipotesis nol H0: tidak ada keterkaitan antara pengambil
keputusan dan keputusan yang diambil, melawan
hipotesis alternatif H1: ada keterkaitan antara pengambil
keputusan dan keputusan yang diambil.
b. Tingkat keberartian = 10%.
c. Statistik Uji X2.
d. Hipotesis nol ditolak jika X2 hitung > kuantil 90% dari
distribusi chi-kuadrat dengan derajat bebas 3 yaitu
6,2514.
e. Dari Tabel V.5 diperoleh X2 hitung adalah 2,2063
sehingga lebih kecil dari 6,2514 dan berarti H0 diterima.
Dengan kata lain, tidak ada keterkaitan antara
pengambil keputusan dan keputusan yang diambil.
Soal 5
Data pada Tabel V.10 merupakan hasil pengumpulan selama
waktu tertentu tentang banyaknya panggilan mobil ambulan
di suatu rumah sakit untuk setiap harinya dari hari Senin
62 | Adi Setiawan
sampai hari Minggu dan terbagi ke dalam asal panggilan yaiu
dari desa atau kota. Ujilah apakah ada keterkaitan antara
asal dengan hari panggilan mobil ambulan dengan tingkat
keberartian 10%.
Penyelesaian
Untuk menguji apakah ada keterkaitan antara pengambil
keputusan dan keputusan yang diambil dengan tingkat
keberartian 10% digunakan langkah-langkah berikut ini:
a. Hipotesis nol H0 : tidak ada keterkaitan antara hari
dengan asal panggilan ambulan, melawan hipotesis
alternatif H1 : ada keterkaitan antara hari dengan asal
panggilan ambulan.
b. Tingkat keberartian = 10%.
c. Statistik Uji X2.
d. Hipotesis nol ditolak jika X2 hitung > kuantil 90% dari
distribusi chi-kuadrat dengan derajat bebas 6 yaitu
10,6446.
e. Dari Tabel V.5 diperoleh X2 hitung adalah 6,1745
sehingga lebih kecil dari 10,6446 dan berarti H0
diterima. Dengan kata lain, tidak ada keterkaitan
antara hari dengan asal panggilan ambulan. Jika
digunakan cara nilai-p maka diperoleh nilai-p adalah
0,4039 sehingga H0 diterima. Hal itu berarti, keputusan
yang sama bila digunakan cara titik kritis.
64 | Adi Setiawan
Tabel V.11 Tabel Data Soal Latihan V.2
B Bc Jumlah
A a b n1
Ac c d n2
m1 m2 n
3. Tabel V.12 berikut ini data dari hasil penelitian untuk menguji
apakah rajin atau tidaknya orang beribadah akan tergantung
pada usia. Ujilah dengan tingkat keberartian 5 %.
*****
66 | Adi Setiawan
BAB VI
ANALISIS VARIANSI
Sampel Jumlah
1 2 .... i ... k
x11 x21 .... xi1 .... xk1
x12 x22 .... xi2 .... xk2
....
x1n x1n ...
Jumlah T1. T2 . ... Ti . .... Tk . T..
i 1 ij 1 nk
Jumlah Kuadrat Perlakuan (JKP) yaitu
k
T
2
i. 2
T i 1
JKP .. ,
n nk
dan Jumlah Kuadrat Galat (JKG) yaitu JKG = JKT – JKP.
Tabel analisis variansi dapat dinyatakan pada Tabel VI.2.
Dalam hal ini, KRP adalah Kuadrat Rata-rata Perlakuan dan
KRG adalah Kuadrat Rata-rata Galat. Dengan menggunakan
tingkat keberartian (level of significance), hipotesis nol ditolak
jika Fhitung > F ; k 1; k ( n1) atau nilai-p < . Dalam hal ini, nilai-p
dihitung dengan
nilai p P( Fk 1; k ( n1) Fhitung ).
Contoh VI.1
Misalkan seorang guru mengadakan penelitian tentang
keunggulan metode pembelajaran. Apabila data yang diperoleh
dinyatakan pada Tabel VI.3, dengan menggunakan tingkat
keberartian = 5 % apakah ketiga metode pembelajaran
mempunyai rata-rata yang sama ?
68 | Adi Setiawan
Tabel VI.3 Hasil nilai dari 3 metode pembelajaran.
Penyelesaian
Analisis variansi satu arah digunakan untuk menguji
hipotesis nol
H0 : 1 = 2 = 3
melawan hipotesis alternatif
H1 : H0 tidak benar.
Hipotesis alternatif juga dapat dinyatakan dengan
H1 : 1 2 atau 2 3 atau 1 3.
Hipotesis nol akan ditolak dengan tingkat keberartian =5%
jika Fhitung > F ; k 1; k ( n1) F0, 05; 2, 9 4,2565 atau nilai-p < = 0,05.
Tabel VI.4 digunakan untuk membantu perhitungan JKT, JKP
dan JKG. Tabel distribusi F yang digunakan ada pada
Lampiran 6.
i 1 ij 1 nk 4(3)
T
2
22 2 26 2 282
i. 2
T..
i 1
JKP 507 515 507 8,
n nk 4
sehingga JKG = JKT – JKP = 11 - 8 = 3. Tabel analisis variansi
dapat dinyatakan dalam Tabel VI.5. Karena
Fhitung = 12 > 4,2565
maka H0 ditolak sehingga H0 tidak benar. Dalam hal ini, juga
dapat diperoleh
nilai-p = P( Fk 1; k ( n1) Fhitung ) P( F2,9 12) 0,0029.
Karena nilai-p < = 5 % maka H0 ditolak sehingga
kesimpulan yang sama juga diperoleh apabila menggunakan
cara titik kritis.
70 | Adi Setiawan
1 1 1 1
SE s 2 s
n1 n2 n1 n2
dan s2 adalah Kuadrat Rata-rata Galat (Mean Square of Error).
Hipotesis nol ditolak jika Shitung > S dengan
S (k 1) F ; k 1;n( k 1)
dan F;k-1,n-k menyatakan kuantil ke-(1-) dari distribusi F
dengan derajat bebas pembilang k-1 dan derajat bebas
penyebut n-k.
Contoh VI.2
Dalam Contoh VI.1, diperoleh bahwa H0 ditolak. Manakah
yang berbeda yaitu 1 2 atau 2 3 atau 1 3.
Penyelesaian
Berdasarkan data pada Tabel VI.3, diperoleh
n1 = n2 = n3 = 4,
X 1 5,5, X 2 6,5 dan X 3 7,5. Dari tabel anava (Tabel VI.5),
diperoleh s2 = 1/3 dan
S (k 1) F ; k 1;n( k 1) (3 1) F0,05; 31,123 2(4,26) 2,92.
Berdasarkan perhitungan, diperoleh
1 1 1 1
SE s 2 (1 / 3) 0,4082
n1 n2 4 4
dan
X1 X 2 | 5,5 6,5|
S hitung 2,4495.
SE 0,4082
Hal itu berarti bahwa H0 : 1 = 2 tidak ditolak. Demikian
juga dapat diperoleh
X1 X 3 | 5,5 7,5 |
S hitung 4,8990
SE 0,4082
sehingga H0 : 1 = 3 ditolak dan berarti 1 3. Selanjutnya
Contoh VI.3
Misalkan seorang guru mengadakan penelitian tentang
keunggulan metode pembelajaran. Apabila data yang diperoleh
dinyatakan pada Tabel VI.7, dengan menggunakan tingkat
72 | Adi Setiawan
keberartian = 5% apakah ketiga metode pembelajaran
mempunyai rata-rata yang sama ?
Penyelesaian
Dalam hal ini, diinginkan untuk menguji hipotesis nol
H0 : 1 = 2 = 3
melawan hipotesis alternatif
H1 : H0 tidak benar.
Hipotesis alternatif juga dapat dinyatakan dengan
H1 : 1 2 atau 2 3 atau 1 3.
Berdasarkan Tabel VI.7, diperoleh k = 3,
k
N ni 5 4 3 12,
i 1
i 1 ij 1 N 12
Jumlah Kuadrat Perlakuan (JKP)
2 2
k Ti . T.. 27 2 252 22 2 74 2
JKP 463,3833 456,3333 7,0500 ,
i 1 ni N 5 4 3 12
74 | Adi Setiawan
Contoh VI.4
Dalam Contoh VI.3, diperoleh bahwa H0 ditolak. Dengan
menggunakan tingkat keberartian 5 %, manakah yang
berbeda yaitu 1 2 atau 2 3 atau 1 3.
Penyelesaian
Berdasarkan data pada Tabel VI.8, diperoleh n1 = 5, n2 = 4, n3
= 3, X 1 6,75, X 2 6,25 dan X 3 5,5. Dari tabel anava,
diperoleh s2 = 0,291 dan
S (k 1) F ; k 1;nk k (3 1) F0,05; 31,123 2(4,26) 2,92.
Berdasarkan perhitungan, diperoleh
1 1 1 1
SE s 2 (0,291) 0,3619
n1 n2 5 4
dan
X1 X 2 | 6,75 6,25|
S hitung 1,3817.
SE 0,3619
Karena Shitung = 1,3817 < S = 2,92 maka H0 : 1 = 2 tidak
ditolak. Demikian juga dapat diperoleh
X1 X 3 | 6,75 5,5|
S hitung 3,4543
SE 0,3619
sehingga H0 : 1 = 3 ditolak dan berarti 1 3. Selanjutnya
X2 X3 | 6,25 5,5|
S hitung 2,0726
SE 0,3619
sehingga H0 : 2 = 3 tidak ditolak.
I J K
T2
T X ijk , C ,
i 1 j 1 k 1 IJK
K J K
Tij X ijk , Ti. X ijk ,
k 1 j 1 k 1
I K I
1
T. j X JKA T C,
2
ijk , i.
i 1 k 1 JK i 1
1 J 2 I J K
1 I J
JKB T. j C , JKG
IK j 1
X
i 1 j 1 k 1
ijk
2
K
T
i 1 j 1
ij
2
,
I J K
JKG X
i 1 j 1 k 1
ijk
2
C,
Jmlh
Sumber Derajat
Kuadra Kuadrat Rata-rata Statistik F
Variasi Bebas
t
Faktor A I-1 JKA KRA = JKA/(I-1) FA =
KRA/KRG
Faktor B J-1 JKB KRB = JKB/(J-1) FB =
KRB/KRG
Interaksi (I-1)(J-1) JKAB KRAB = JKAB/(I-1) FAB =
AB KRAB/KRG
Galat IJ(K-1) JKG KRG = JKG/(IJ(K-1))
76 | Adi Setiawan
H1A : ada pengaruh faktor A,
H1B : ada pengaruh faktor B,
H1AB : ada interaksi antara faktor A dan faktor B.
Hipotesis nol H0A ditolak jika FA hitung > F ; I 1, IJ ( K 1) dengan
F ; I 1, IJ ( K 1) menyatakan kuantil ke-(1-) dari distribusi F
dengan derajat bebas pembilang I-1 dan derajat bebas
penyebut IJ(K-1). Selanjutnya, hipotesis nol H0B ditolak jika
FB hitung > F ; J 1, IJ ( K 1) dengan F ; J 1, IJ ( K 1) menyatakan kuantil
ke-(1-) dari distribusi F dengan derajat bebas pembilang J-
1 dan derajat bebas penyebut IJ(K-1). Demikian juga,
hipotesis nol H0AB ditolak jika FAB hitung > F ;( I 1)( J 1), IJ ( K 1)
dengan F ;( I 1)( J 1), IJ ( K 1) menyatakan kuantil ke-(1-) dari
distribusi F dengan derajat bebas pembilang (I-1)(J-1) dan
derajat bebas penyebut IJ(K-1).
Contoh VI.4
Misalkan diberikan hasil penilaian dari 3 siswa untuk tiap-
tiap sel pada analisis variansi dua arah. Faktor (variabel) yang
pertama adalah metode pembelajaran yaitu ada 2 metode
pembelajaran (metode 1 dan metode 2) sedangkan faktor
kedua adalah motivasi belajar yang terdiri dari 3 kategori
yaitu Tinggi, Sedang dan Rendah. Tabel VI.11 menyatakan
data hasil nilai-nilai siswa.
78 | Adi Setiawan
pembelajaran dan motivasi belajar siswa terhadap hasil nilai
siswa.
Contoh VI.5
Tabel VI.13 mempresentasikan hasil nilai siswa di kota lain
dalam kasus yang sama seperti pada Contoh VI.4. Ujilah
dengan tingkat signifikansi 5% apakah terdapat interaksi
antara metode pembelajaran dengan motivasi belajar?
Motivasi
Tinggi Sedang Rendah
Metode
Metode 1 9 8 7 8 7 6 7 6 6
Metode 2 5 4 4 6 5 6 7 6 7
Penyelesaian
Berdasarkan Tabel VI.14, terlihat bahwa FAB hitung adalah
9,1 sehingga lebih besar dari titik kritis 3,8852 dan berarti
H0AB ditolak. Akibatnya, terdapat interaksi antara metode
pembelajaran dan motivasi belajar siswa terhadap hasil nilai
80 | Adi Setiawan
SOAL & PENYELESAIAN
Soal 1
Gunakan tabel distribusi F untuk menghitung :
a. F0, 05; 3, 5
b. F0,10; 6, 8
c. F0,90; 10 , 8
Penyelesaian
Dari tabel distribusi F diperoleh
a. F0, 05; 3, 5 5,4095.
b. F0,10; 6, 8 2,6683.
c. F0,90; 10, 8 0,4207.
Soal 2
Berdasarkan distribusi F dengan derajat bebas pembilang v1
dan derajat bebas penyebut v2, tentukan :
a. P( F < 3,84) untuk v1 = 5, v2 = 8.
b. P( F > 3,19) untuk v1 = 15, v2 = 20.
c. P( F 1,84) untuk v1 = 8, v2 = 4.
Penyelesaian
Dengan menggunakan paket program R, diperoleh
a. P( F < 3,84) untuk v1 = 5, v2 = 8 adalah 0,9548.
b. P( F > 3,19) untuk v1 = 15, v2 = 20 adalah 0,0084.
c. P( F 1,84) untuk v1 = 8, v2 = 4 adalah 0,7091.
Soal 3
Diadakan suatu percobaan untuk mengetahui apakah suhu
pembakaran batu bata jenis tertentu berpengaruh terhadap
kepadatan batu bata tersebut. Densitas untuk 4 suhu pem-
bakaran yang diperhatikan dapat dilihat pada Tabel VI.15.
Gunakan tingkat keberartian 10% !
Penyelesaian
Dalam analisis variansi satu arah, diinginkan untuk menguji
hipotesis nol berikut ini :
H0A : tidak ada pengaruh suhu terhadap terhadap kepadatan
batu bata atau
H0 : 1 = 2 = 3 = 4,
melawan hipotesis aleternatif bahwa H1 : tidak ada pengaruh
suhu terhadap terhadap kepadatan batu bata. Dari
perhitungan diperoleh tabel analisis variansi satu arah pada
Tabel VI.16. Dari Tabel VI.16 terlihat bahwa
Fhitung = 2,498
lebih besar dari 2,498 sehingga H0 ditolak. Hal itu berarti,
Fhitung lebih dari Ftabel = 2,498 sehingga tidak ada apakah
suhu pembakaran batu bata jenis tertentu berpengaruh
terhadap kepadatan batu bata tersebut
82 | Adi Setiawan
Soal 4
Misalkan diberikan hasil penilaian dari 3 siswa untuk tiap-
tiap sel pada analisis variansi dua arah. Faktor yang pertama
adalah metode pembelajaran yaitu ada 2 metode pembelajaran
sedangkan faktor kedua adalah motivasi belajar yang terdiri
dari 3 kategori yaitu Tinggi, Sedang dan Rendah. Tabel VI.17
menyatakan data hasil nilai-nilai siswa.
Motivasi
Tinggi Sedang Rendah
Metode
Metode 1 9 8 7 8 7 6 7 6 6
Metode 2 8 8 7 7 7 6 6 6 6
84 | Adi Setiawan
LATIHAN
Motivasi
Tinggi Sedang Rendah
Metode
Metode 1 9 9 9 9 8 9 5 6 5
Metode 2 5 6 5 6 7 6 7 8 7
******
86 | Adi Setiawan
BAB VII
ANALISIS REGRESI LINEAR SEDERHANA
i 1 i 1
D n
2 X i Yi 0 X i 1
1 i 1
Y
i 1
i b0 X i b1 0
n
X Y b
i 1
i i 0 X ib1 0 .
i 1 i 1
dan
88 | Adi Setiawan
n n
1 1
b0 ˆ0 Yi b1 X i Y b1 X .
n i1 n i1
Untuk memudahkan perhitungan, seringkali didefinisikan
2
n
Xi
i 1
( X i X )2 X i ,
n n
2
SS XX
i 1 i 1 n
n n
X i Yi
i 1 i 1
( X i X )(Yi Y ) X i Yi
n n
SS XY
i 1 i 1 n
maka
SS
b1 ˆ1 XY .
SS XX
Jika harga-harga b0 dan b1 telah diperoleh, maka persamaan
estimasinya sebagai berikut:
Yˆ b0 b1 X .
n
JKS Yi Yˆi
2
.
i 1
Yi b0 Yi b1
i 1
2
i 1
X Yi 1
i i
ˆ s
2 2
.
n2
Contoh VII.1:
Data tentang hubungan antara IPK (Indeks Prestasi Komu-
latif) dan IQ (Inteligent Quotient) mahasiswa dinyatakan pada
Tabel VII.1.
Mahasiswa (i) 1 2 3 4 5 6 7 8
IQ 105 110 115 120 125 140 145 150
IP 2,2 1,9 2,6 2,7 3,1 3,3 3,5 3,9
2.5
2.0
IQ
90 | Adi Setiawan
Tabel VII.1 Tabel perhitungan jumlah kuadrat
Xi Yi Xi Yi Xi2 Yi2
105 2,2 231 11025 4,84
110 1,9 209 12100 3,61
115 2,6 229 13225 6,76
120 2,7 324 14400 7,29
125 3,1 387,5 15625 9,61
140 3,3 462 19600 10,89
145 3,5 507,5 21025 12,25
150 3,9 585 22500 15,21
1010 23,2 3005 129500 70,46
n n n
Y b0 Yi b1 X i Yi
2
i
i 1 i 1 i 1 70.46 (1.927673) 23,2 0,038239(3005)
s2 0,04563941.
n2 82
2
n (Xi X )
i 1
c. b1 berdistribusi N1 , var( b1 ) dengan
1 2 .
var(b1 )
n
( X i X )2
i 1
^
^
d. Y k berdistribusi Nk , var(Y k ) dengan
^ ( X X ) 2
2
1
var(Y k ) n k ,
n 2
(Xi X )
i 1
^
Y k b0 b1 X k dan k 0 1 X k .
Karena 2 tidak diketahui maka biasanya digunakan sebagai
s2 estimasinya. Untuk mengestimasi parameter 1 dapat
digunakan sifat bahwa statistik
b 1
t 1
s(b1 )
1
dengan s(b1 ) n
s2 , mempunyai distribusi t
(Xi 1
i X) 2
92 | Adi Setiawan
sehingga diperoleh
b1 – t 0,025 s(b1) < 1 < b1 + t 0,025 s(b1)
0,038239 - 2,447 (0,04792) < 1 < 0,038239 + 2,447 (0,004792)
0,02651 < 1 < 0,04997.
i 1
i i
2
i 1
i Y )2
94 | Adi Setiawan
Apabila ingin menguji H0 : 1 = 0 melawan H1 : 1 0 maka
digunakan transformasi
JKG / 1 JKG
F 2
JKS /(n 2) S
yang berdistribusi F dengan derajat bebas pembilang 1 dan
derajat bebas penyebut n-2. Akibatnya H0 ditolak jika
Fhitung > F(1, n-2; 1-).
Karena E[ JKR / 1] akan cenderung lebih besar dari E[ S2 ]
jika 1 tidak nol. Hal tersebut dapat diringkas dalam bentuk
tabel analisis variansi berikut ini.
i 1 n
n n n
dan JKG X i b0 Yi b1 X i Yi .
2
i 1 i 1 i 1
Contoh VII.2 :
Berdasarkan data pada contoh di atas dapat dihitung JKR
dan JKG berikut ini :
1010 (23,2)
JKR 0,0382 3005 2,9062
8
Karena Fhitung = 63,6760 > 5,99 = F(1, 6; 0,95) = F(1, n-2; 1-) maka
H0 ditolak sehingga terdapat hubungan linear antara IP dan
IQ mahasiswa. Dapat juga dihitung nilai-p dari statistik
hitungnya yaitu :
Nilai-p = P( F(1, 6) > Fhitung )
= 1 - P( F(1, 6) Fhitung )
= 1- 0,9998
= 0,0002.
Akibatnya karena nilai-p < 0,05 maka H0 ditolak.
96 | Adi Setiawan
Jika dimiliki sampel random (X1, Y1), (X2, Y2), ….......,
(Xn, Yn), dari suatu populasi maka
n
( X
i 1
i X ) ( Yi Y )
r 1/ 2
n n
( X i X ) ( Yi Y )
2 2
i 1 i 1
dinamakan koefisien korelasi sampel antara X dan Y yang
merupakan estimasi titik dari koefisien korelasi populasi .
Demikian juga, dapat dibuktikan bahwa
JKS JKR
r 2 1
JK JK
yang dinamakan koefisien determinasi. Akibatnya
0 r2 1.
Koefisien determinasi dikalikan 100 % mengukur besarnya
prosentase data yang tidak dapat dijelaskan model regresi
sehingga (1 - r2 ) 100% menyatakan besarnya persentase
data yang dapat dijelaskan model regresi.
Contoh VII.3:
Berdasarkan data di atas, koefisien determinasi :
JKS JKR 2,90616
r 2 1 0,9139
JK JK 2,90616 0,27384
artinya hubungan antara IQ dan IP mahasiswa dapat
dijelaskan dengan model regresi linear antara IQ dan IP
mahasiswa sebesar 91,39% sedangkan sisanya sebesar
8,61% tidak dapat dijelaskan oleh model regresi linear antara
IQ dan IP mahasiswa. Dengan kata lain 91,39% variasi dari
IP karena hubungannya dengan IQ.
Apabila diinginkan untuk menguji hipotesis H0 : = 0
melawan H1 : 0 dapat digunakan statistik
n 3 (1 r ) (1 0 )
Z ln
2 (1 r ) (1 0 )
Contoh VII.3 :
Berdasarkan data di atas, inginkan menguji hipotesis ada
atau tidaknya korelasi antara IQ dan IP mahasiswa. Untuk
itu dilakukan pengujian hipotesis H0 : = 0 melawan H1:
0. Hipotesis H0 akan ditolak tingkat keberartian
= 0,05 jika Zhitung > 1,96 atau Zhitung < - 1,96.
Berdasarkan perhitungan diperoleh bahwa r = 0,956
sehingga
n 3 1 r 8 5 1 0,956
Z ln ln 4,242 .
2 1 r 2 1 0,956
Karena Zhitung = 4,242 maka terdapat korelasi antara IQ dan
IP mahasiswa atau IQ secara signifikan berkorelasi dengan
IP mahasiswa.
*****
98 | Adi Setiawan
SOAL & PENYELESAIAN
Soal 1
Tabel berikut ini digunakan sebagai alat bantu dalam
menghitung b1 dan b0. Selanjutnya jawablah pertanyaan
berikut ini :
a. Lengkapi tabel.
b. Tentukan SSXY.
c. Tentukan SSXX.
d. Tentukan b1.
e. Tentukan X dan Y .
f. Tentukan b0.
g. Tentukan persamaan garis regresinya.
Xi Yi Xi2 XiYi
7 2
4 4
5 2
2 5
1 7
1 6
3 4
n n n n
Xi Yi Xi XY
2
i i
i 1 i 1 i 1 i 1
Penyelesaian
a. Tabel perhitungan.
Xi Yi Xi2 XiYi
7 2 49 14
4 4 16 16
5 2 25 10
2 5 4 10
1 7 1 7
1 6 1 6
3 4 9 12
n n n n
X i 23
i 1
Yi 30
i 1
X i 105
i 1
2
X Y 75
i 1
i i
i 1 n 7
SS 23,5714
d. b1 ˆ1 XY 0,8010 .
SS XX 29,4286
1 n 23 1 n 30
e. X
n i 1
X i
7
3, 2857 , Y
n i 1
Yi 4,2857.
7
Soal 2
Berdasarkan Soal 1 dan tabel berikut ini :
a. Lengkapilah tabel.
b. Gambarkan scatter plot dan garis regresi least square.
Gambarkan persamaan Y = 8 - 0,5 X pada bidang
gambar yang sama.
c. Tunjukkan bahwa JKG yang diperoleh lebih besar dari
pada JKG garis regresi least square.
Xi Yi ^ ^ ^
Yi Yi Yi (Yi Yi ) 2
7 2
4 4
5 2
2 5
1 7
1 6
3 4
n ^ n ^
(Yi Y i )
i 1
(Yi Y i )2
i 1
^ ^ ^
Xi Yi Yi Yi Yi (Yi Yi ) 2
7 2 1,3105 0,6895 0,4754
4 4 3,7135 0,2865 0,0821
5 2 2,9125 -0,9125 0,8327
2 5 5,3155 -0,3155 0,0995
1 7 6,1165 0,8835 0,7806
1 6 6,1165 -0,1165 0,0136
3 4 4,5145 -0,5145 0,2647
n ^ n ^
(Yi Y i ) 0
i 1
(Yi Y i )2 2,5485
i 1
Xi Yi ^ ^ ^
Yi Yi Yi (Yi Yi ) 2
7 2 4,5 -2,5 6,25
4 4 6 -2 4
5 2 5,5 -3 12,25
2 5 7 -2 4
1 7 7,5 -0,5 0,25
1 6 7,5 -1,5 2,25
3 4 6,5 -2,5 6,25
n ^ n ^
(Y Y
i 1
i i ) 0 (Y Y
i 1
i i ) 2 35,25
Soal 3
Hitunglah JKG dan s2 untuk masing-masing kasus berikut
ini :
^
a. n = 30, SSYY = 95, SSXY = 50, 1 0,75 .
Penyelesaian
a. Berdasarkan rumus JKG diperoleh
^
JKG SSYY 1 SS XY 95 (0,75)(50) 95 37,5 57,5
sehingga s2 = JKG/(n-2) = 57,5/28 = 2,0536.
b. Dihitung
2
n
Yi
i 1 2
SSYY Yi 860 50 797,5.
n
2
i 1 n 40
Akibatnya
Soal 4
Konstruksikan interval kepercayaan 95% untuk 1 pada
masing-masing kasus berikut ini :
a. ˆ 31 , s = 3, SSXX = 35, n = 12.
1
Penyelesaian
a. Interval kepercayaan 95% untuk 1 adalah (a,b) dengan
^ s 3
a 1 t / 2; n 2 31 2,2281 28,0107
SS XX 35
dan
^ s 3
b 1 t / 2; n 2 31 2,2281 33,9893.
SS XX 35
b. Karena JKG = 1960 maka
s2 = JKG/(n-2) = 1960/16 = 122,5
sehingga s = 11,0680. Akibatnya interval kepercayaan
95% untuk 1 adalah (a,b) dengan
^ s 11,068
a 1 t / 2; n 2 64 2,1199 59,7163
SS XX 30
Soal 5
Kontruksikan scatterplot dari data berikut ini, kemudian
hitunglah r dan r2 untuk masing-masing.
a.
x -2 -1 0 1 2
y -2 1 2 5 6
b.
x -2 -1 0 1 2
y 6 5 3 2 0
Penyelesaian
a. Korelasi antara x dan y adalah r = 0,8835 dan koefisien
determinasi r2 = 0,7805. Dari scatter plot dan nilai r
terdapat hubungan positif antara x dan y.
6
4
y1
2
0
-2
-2 -1 0 1 2
x
Gambar VII.3 Grafik scatter plot antara x dan y pada Soal VII.5.a
3
2
1
0
-2 -1 0 1 2
Gambar VII.4 Grafik scatter plot antara x dan y pada Soal VII.5.b
x 0,5 1 1,5
y 2 1 3
x 5 3 -1 2 7 6 4
y 4 3 0 1 8 5 3
b.
x -2 -1 0 1 2
y -2 1 2 5 6
Nilai Kimia 60 70 70 60 60 80 70 90
10. Berikut ini pendapatan dari tim bola basket nasional dan
kekayaan yang dimiliki tim tersebut.
a. Buatlah scatter plot dari data tersebut.
b. Estimasi garis regresi yang menyatakan hubungan
antara pendapatan yang diperoleh dengan kekayaan
yang dimiliki.
c. Apakah regresi yang anda peroleh memenuhi asumsi
normalitas dari residu ?
Elang 2 10
Rajawali 3 11
Bintang Timur 3 13
Bintang Pagi 4 15
Permata Bumi 5 20
Jamrud Nusantara 4 22
Intan Merdeka 5 23
Nusa Merdeka 6 24
Nusa Cendana 7 21
Nusa Antara 6 22
***
^
Fungsi S di titik dinamakan jumlah kuadrat galat (JKG –
residual sum of square) yaitu
^ ^ ^
JKG S ( ) ( Y X )T (Y X ) RT R .
^
Dapat dibuktikan bahwa merupakan penaksir tak bias
untuk dan berlaku
^
Cov ( ) 2 ( X T X ) 1 .
Jika digunakan
^ 2 JKG
n p 1
Contoh VIII.1
IPK ternyata tidak hanya dipengaruhi oleh IQ tetapi juga KE
(Kecerdasan Emosional) mahasiswa. Tabel VIII.1 menyatakan
hubungan antara skor IQ, skor KE dan IPK. Tentukan
estimasi parameter dengan menggunakan perkalian matriks.
Penyelesaian
3.5
3.5
3.0
3.0
IP
IP
2.5
2.5
2.0
2.0
IQ KE
i 1 i 1
Standard
Koefisien Estimasi t Nilai-p
Error
Konstanta -1,5739 0,7827 -2,0109 0,1005
IQ 0,0308 0,0109 2,8257 0,0369
KE 0,0055 0,0072 0,7639 0,4794
Contoh VIII.2
Apabila dalam Contoh VIII.1, hanya digunakan dengan
peubah penjelas yang berpengaruh hanyalah peubah IQ
maka didapat JKGp = 0,2738 sedangkan apabila digunakan
peubah penjelas IQ dan KE maka didapat JKGq = 0,2450.
Dalam hal ini Fhitung parsial adalah
(10-2-1) (0,2738 – 0,2450)/[(2-1) 0,2450]
= (7) 0,0288 / 0,2450 = 0,0288
dan nilai-p-nya adalah 1-P(F7,1 0,0581) = 0,9957. Berarti
hipotesis nol diterima untuk tingkat kepentingan = 0,05
Contoh VIII.3
Berdasarkan pada Contoh VIII.1, diperoleh koefisien deter-
minasi R2 = 0,9229 dan b0 = -1,5739, b1 = 0,0308 dan b2 =
0,0055. Sumbangan efektif variabel IQ terhadap koefisien
determinasi R2 dapat dihitung dengan rumus
n
bX 1 R 2 ( X 1i X 1 )( Yi Y )
i 1 76
SE X 1 0,0308 (0,9229) 0,7361,
JK Re g 2,9349
dan sumbangan efektif variabel KE terhadap koefisien deter-
minasi R2 adalah
n
bX 2 R 2 ( X 2i X 2 )( Yi Y )
i 1 108
SE X 2 0,0055 (0,9229) 0,1868
JK Re g 2,9349
sehingga R SEX1 SEX 2 .
2
Contoh VIII.4
Data pada Tabel VIII.3 menyatakan data tentang pengukuran
Psychological Well Being (PWB) remaja di SMPN 1 Kupang
dikaitkan dengan variabel Religiusitas (RELIGI), Parent
Adolescent Relationship (PAR), usia (UMUR) dan jenis kelamin
(JK1). Variabel PWB mengukur kebahagiaan remaja, variabel
RELIGI mengukur ketaatan beragama, PAR mengukur
hubungan antara remaja dengan orang tuanya, variabel
UMUR adalah usia remaja pada saat pengukuran dan variabel
JK1 bernilai 1 jika remaja laki-laki dan 0 jika remaja
perempuan.
a. Jika digunakan tingkat keberartian 5% maka variabel
manakah yang diperlukan dalam penyusunan model
regresi ganda yang paling sederhana?
b. Berikan model regresi terpilih!
Model 1 : PWB = 0 + ,
Model 2 : PWB = 0 + 1 RELIGI + ,
Model 3 : PWB = 0 + 1 RELIGI + 2 PAR + .
Model 1, Model 2 dan Model 3 berturut-turut
mempunyai JKG1 = 14065,33, JKG2 = 9685,168 dan
JKG3 = 8656,048.
NO PWB RELEGI PAR UMUR JK1 NO PWB RELEGI PAR UMUR JK1
1 124 112 110 14 1 73 139 117 106 14 1
2 138 111 120 14 1 74 109 106 70 13 1
3 130 116 111 13 1 75 99 108 106 13 1
4 135 117 124 14 1 76 120 104 107 12 0
5 139 118 124 13 0 77 132 122 124 13 1
6 113 111 101 14 1 78 112 108 115 13 0
7 113 108 98 12 0 79 113 108 99 13 0
8 123 112 116 13 0 80 125 116 115 14 1
9 127 113 120 14 1 81 124 114 112 13 1
10 127 110 120 14 0 82 132 115 113 14 1
11 114 119 119 13 0 83 114 109 106 14 0
12 116 112 119 15 0 84 129 114 116 13 1
13 121 120 111 15 1 85 136 116 110 14 0
14 127 120 120 13 1 86 126 113 121 12 0
15 122 106 117 13 1 87 108 106 104 14 0
16 126 117 114 13 1 88 103 106 95 14 1
17 120 105 105 14 1 89 125 122 124 14 0
Contoh VIII.5
Misalkan dipunyai 4 kelompok data berurut berikut ini :
Himpunan Data X1 – X3
10 8 13 9 11 14 6 4 12 7 5
Himpunan data Y1
8,04 6,95 7,58 8,81 8,33 9,96 7,24 4,26 1 0,84 4,82 5,86
Himpunan data Y2
9,14 8,14 8,74 8,77 9,26 8,10 6,13 3,10 9,13 7,26 4,74
Himpunan data Y3
7,46 6,77 12,74 7,11 7,81 8,84 6,08 5,39 8,15 6,42 5,73
Himpunan data X4
8 8 8 8 8 8 8 8 19 8 8
Himpunan data Y4
6,58 5,76 7,71 8,84 8,47 7,04 5,25 12,50 5,56 7,91 6,89
15
10
10
y
y
5
5
0
0
0 5 10 15 20 0 5 10 15 20
x x
15
15
10
10
y
y
5
5
0
0 5 10 15 20 0 5 10 15 20
x x
0
-10
R1
Residu
Di samping scatter plot dari Y melawan Xi yang berbeda,
scatter plot dari Xi dan plot variabel tambahan juga
memberikan kajian informasi residu atas kualitas dari model
yang sesuai. Residu merupakan realisasi dari kesalahan
(error) e1, e2, ..., en sehingga QQplot dari residu melawan
distribusi normal merupakan anggapan yang masuk akal.
Berikut ini diberikan scatter plot lain yang sangat
informatif dalam pemilihan variabel bebas yang perlu
dimasukkan ke dalam model.
Residu melawan setiap peubah tak bebas dalam model.
Apabila adanya grafik kurvalinear memberikan suatu
petunjuk bahwa model harus menggunakan orde yang
lebih tinggi.
Residu melawan variabel bebas yang tidak berada
dalam model. Apabila grafik memperlihatkan kaitan
Contoh VIII.6
Gambar VIII.4 memperlihatkan scatter plot residu melawan
IQ, residu melawan KE dan residu melawan IP dari data pada
Contoh VIII.1. Terlihat bahwa tidak terdapat hubungan linear
maupun non linear dalam scatter plot – scatter plot tersebut
sehingga variabel KE tidak perlu dimasukan dalam model
terpilih.
150
130
120
3.5
140
110
130
3.0
KE
IQ
IP
100
120
2.5
90
110
2.0
80
-0.4 -0.2 0.0 0.1 0.2 -0.4 -0.2 0.0 0.1 0.2 -0.4 -0.2 0.0 0.1 0.2
r r r
Gambar VIII.4 Grafik scatter plot antara x dan y pada Soal VII.5.b
Pengacau (Outlier)
Pada analisis regresi dilakukan penganggapan bahwa model
yang digunakan sesuai untuk semua titik pengamatan. Akan
tetapi seringkali bahwa 1 atau lebih titik pengamatan
mempunyai respon yang tidak nampak berhubungan dengan
model untuk sebagian besar titik-titik yang lain. Salah satu
diagnosis yang dilakukan dalam analisis regresi adalah
mengidentifikasi titik pengacau.
1.0
log.tekanan
r
135
0.0
titik.didih titik.didih
1.0
r
0.0
0.0
Gambar VIII.5 Scatter plot data Forbes, residu melawan x, residu meawan
y dan QQplot dari residu melawan distribusi normal baku.
Untuk mendefinisikan secara formal uji pengacau,
sebelumnya didefinisikan vektor u dengan uj = 0 untuk j i
dan ui = 1 sehingga model menjadi
x -4 -3 -2 -1 0 10
y 2,48 0,73 0,04 -1,44 -1,32 0,00
2
2
1
1
y
y
0
0
-1
-1
-1
-4 -2 0 2 4 6 8 10 -4 -2 0 2 4 6 8 10 -4 -2 0 2 4 6 8 10
x x x
0
-1
-0.6
-0.6
x x Theoretical Quantiles
^
Y ditransformasikan oleh H menjadi vektor estimasi Y yaitu
sehingga matriks H dinamakan matriks hat (hat matrix).
Dalam hal ini, berlaku sifat
n
h
i 1
ii rank ( X ) p 1
dan
1
hii 1.
n
^
Untuk vektor residu berlaku, R Y Y ( I n n H )Y . Jika e1, e2,
..., en saling bebas dan berdistribusi normal maka R
berdistribusi normal dan E[R] = 0 serta mariks kovariansinya
Cov(R) = 2 (I-H). Dalam hal ini,
V ( Rii ) 1 hii
dengan
hii ( xi )T ( X T X ) 1 xi
adalah elemen diagonal ke-i dari matriks hat H.
Dari persamaan terlihat bahwa nilai besar dari hii yaitu
yang dekat dengan 1 menyebahkan V(Rii) kecil. Karena E[ Ri ]
= 0 maka titik-titik yang mempunyai nilai residu kecil
dianggap tidak dihiraukan. Titik-titik dengan nilai hii besar
menjadi titik potensial (potential point) sedangkan hii
sehingga jika hii besar tetapi tidak tepat sama dengan 1 maka
regresi sangat dipengaruhi oleh titik ke-i. Oleh karena itu titik
dengan potensial besar tidak harus berpengaruh besar akan
tetapi mempunyai potensi besar untuk berpengaruh.
Contoh VIII.9
Berdasarkan data Huber, matriks hat akan digunakan untuk
mendeteksi titik potensial. Dalam regresi linear sederhana
berlaku
1 ( x x) 2
hii n i
( xi x)2
n
i 1
n
1
dengan x xi . Bila xi x
n i 1
maka hii mempunyai nilai
0.6
0.4
0.2
1 2 3 4 5 6
Index
Titik Pengaruh
Contoh VIII.10
Jara Cook untuk beberapa himpunan data dinyatakan
berikut ini :
Data Forbes
0,062 0,005 0,002 0,000 0,001 0,001 0,001 0,006,
0,002, 0,005, 0,470, 0,000, 0,055, 0,051, 0,007, 0,009.
Data Huber
0,513 0,014 0,003 0,315 0,099 26,431.
Soal 1
Misalkan diketahui persamaan regresi yang digunakan untuk
estimasi 10 titik pengamatan dinyatakan dengan
^
y 29,127 0,5906 x1 0,498 x2
JK = 6724,125, JKR = 6216,375, sb1 0,0813 dan sb1 0,0567 .
a. Hitung RKR dan RKG.
b. Hitung Fhitung dan lakukan uji F untuk tingkat
keberartian = 0,05.
c. Lakukan uji t untuk menguji pentingnya koefisien 1
dengan tingkat keberartian = 0,05.
d. Lakukan uji t untuk menguji pentingnya koefisien 2
dengan tingkat keberartian = 0,05.
Penyelesaian
a. JKG = JK-JKR = 6724,125-6216,375 = 507,75.
RKR = JKR/2 = 6216,375/2 = 3108,188.
RKG = JKG/(n-2-1) = 6216,375/7 = 72,5357.
b. Fhitung = RKR/RKG = 3108,188/72,5357 = 42,8505.
Ftabel dengan tingkat keberartian 5% adalah
F0, 05 ; 2, 7 4,7374 sehingga H0 ditolak artinya 1 0 atau 2
0.
c. Thitung diperoleh dengan rumus
b 0,5906
Thitung 1 7,2645
sb1 0,0813
sedangkan ttabel adalah t0,025; 7 2,3646. Akibatnya H0
ditolak artinya koefisien b1 merupakan koefisien yang
penting.
d. Thitung diperoleh dengan rumus
b 0,4980
Thitung 2 8,7831
sb2 0,0567
Soal 2
Soal 3
Data pada Tabel VIII.4 menyatakan data tentang hubungan
skor self-estem SE, dukungan sosial teman sebaya DSTS dan
school connectedness SC serta jenis kelamin JK1 terhadap
skor subjective well-being SWB dari siswa-siswa SMPN 2
Tuntang Kabupaten Semarang. Dalam hal ini, 1 berarti siswa
laki-laki sedangkan 0 berarti siswa perempuan. Tentukan
model terbaik yang menyatakan hubungan antara variabel-
variabel tersebut. Tentukan koefisien determinasi dari model
terbaik tersebut dan kontribusi dari masing-masing variabel.
Penyelesaian
Korelasi Pearson antara SWB dan SE adalah 0,526 sehingga
dengan ukuran sampel n= 210 signifikan. Dipilih
Model 1 : SWB = 0 + 1 SE + ,
Model 2 : SWB = 0 + 1 SE + 2 DSTS + ,
Model 3 : SWB = 0 + 1 SE + 2 SC + ,
Model 4 : SWB = 0 + 1 SE + 2 JK1 + .
Model 1, Model 2, Model 3, Model 4 mempunyai R2 berturut-
turut adalah R12 = 0,276, R22 = 0,276, R32 = 0,289 dan R42
= 0,553. Di samping itu, Model 1, Model 2, Model 3, Model 4
mempunyai JKG berturut-turut adalah JKG1 = 78949,138,
Langkah 1
Dilakukan pengujian hipotesis nol H0 : Model 1 yang dipilih,
melawan hipotesis alternatif H1 : Model 2 yang dipilih, dengan
tingkat keberartian 5%. Statistik yang digunakan adalah
Fparsial. Hipotesis H0 ditolak jika Fhitung lebih besar dari
F ;1, n p 1 F0,05;1, 207 3,8868. Dari perhitungan diperoleh
(n q 1) ( JKG1 JKG2 ) (210 2 1)(78949,138 78948,952)
Fhitung
(q p) JKG2 (2 1) (78948,952)
atau
Fhitung = 0,0005 sehingga H0 diterima artinya Model 1 yang
dipilih.
Langkah 2
Dilakukan pengujian hipotesis nol H0 : Model 1 yang dipilih,
melawan hipotesis alternatif H1 : Model 3 yang dipilih, dengan
tingkat keberartian 5%. Statistik yang digunakan adalah F
parsial. Hipotesis H0 ditolak jika Fhitung lebih besar dari
F ;1, n p 1 F0,05;1, 207 3,8868. Dari perhitungan diperoleh
(n q 1) ( JKG1 JKG3 ) (210 2 1)(78949,138 77515,399)
Fhitung
(q p) JKG3 (2 1) (77515,399)
atau
Fhitung = 3,8287 sehingga H0 diterima artinya Model 1 yang
dipilih.
Langkah 3
Dilakukan pengujian hipotesis nol H0 : Model 1 yang dipilih,
melawan hipotesis alternatif H1 : Model 4 yang dipilih, dengan
tingkat keberartian 5%. Statistik yang digunakan adalah F
Langkah 4
Dilakukan pengujian hipotesis nol H0 : Model 4 yang dipilih,
melawan hipotesis alternatif H1 : Model 5 yang dipilih, dengan
tingkat keberartian 5%. Statistik yang digunakan adalah F
parsial. Hipotesis H0 ditolak jika Fhitung lebih besar dari
F ;1, n p 1 F0,05;1, 206 3,8870. Dari perhitungan diperoleh
(n q 1) ( JKG4 JKG5 ) (210 2 1)(48750,29 46956,222)
Fhitung
(q p) JKG5 (2 1) (46956,222)
atau
Fhitung = 7,8695 sehingga H0 ditolak artinya Model 5 yang
dipilih.
Langkah 5
Dilakukan pengujian hipotesis nol H0 : Model 5 yang dipilih,
melawan hipotesis alternatif H1 : Model 6 yang dipilih, dengan
tingkat keberartian 5%. Statistik yang digunakan adalah F
parsial. Hipotesis H0 ditolak jika Fhitung lebih besar dari
F ;1, n p 1 F0,05;1, 205 3,8872. Dari perhitungan diperoleh
Soal 4
Diketahui data hubungan antara x dan y berikut ini :
x 22 24 26 28 40
y 12 21 31 35 70
70
60
50
y
40
30
20
10
25 30 35 40
8
6
4
1 2 3 4 5
Pengambilan
Usia Tinggi Berat
Oksigen Lebar Dada
(Tahun) Badan Badan
Maksimal
1.54 8.4 132 29.1 14.4
1.74 8.7 135.5 29.7 14.5
1.32 8.9 127.7 28.4 14
1.5 9.9 131.1 28.8 14.2
1.46 9 130 25.9 13.6
1.35 7.7 127.6 27.6 13.9
1.53 7.3 129.9 29 14
1.71 9.9 138.1 33.6 14.6
1.27 9.3 126.6 27.7 13.9
1.5 8.1 131.8 30.8 14.5
x 1 1 2 3 4 4 5 15
y 18 21 22 21 23 24 26 39
***
Uji Tanda
Misalkan bahwa distribusi yang sebenarnya dari
pengamatan mempunyai median tunggal m dan bahwa setiap
pengamatan mempunyai probabilitas nol untuk sama dengan
median. Hal itu berarti diambil bilangan tunggal m dengan
sifat
P( Xi < m ) = P( Xi > m) = ½.
Akan dilakukan pengujian H0 : m = m0 melawan H0 : m m0
untuk suatu m0. Uji ini didasarkan pada besaran uji
Contoh IX.1
Dalam suatu ujian yang diikuti oleh 15 anak didapatkan nilai
ujian sebagai berikut :
3,7 5, 2 6,9 7,2 6,4 9,3 10
4,3 8,4 6,5 8,1 7,3 6,1 5,8 12
Berdasarkan data tersebut akan dilakukan pengujian terhadap
hipotesis nol dengan tingkat = 5% bahwa median dari hasil
ujian tersebut lebih kecil atau sama dengan 6 melawan
alternatif bahwa mediannya lebih besar dari 6. Dari data
tersebut didapatkan nilai T = 11 dan dengan mengingat
bahwa T berdistribusi Binomial dengan parameter 15 dan ½
pada Lampiran 7 maka diperoleh nilai-p yaitu
PH0(T 11 ) = 1-PH0(T 10) = 0,059.
Contoh IX.2
Berdasarkan data inflasi bulanan kota Ambon untuk periode
bulan Januari 2009 sampai dengan bulan Mei 2013, akan
diuji apakah hipotesis nol yang menyatakan bahwa median
inflasi bulanan adalah 0 melawan hipotesis alternatif yang
menyatakan bahwa median inflasi bulanan lebih dari 0
dengan tingkat keberartian 5%. Dari data diperoleh T = 36
sehingga diperoleh nilai-p dengan anggapan bahwa T
berdistribusi Binomial dengan parameter n = 53 dan p = 0,5
adalah
PH0(T > 36 ) = 1- PH0(T 36 ) = 0,0027.
Karena nilai-p lebih kecil dari = 5 % maka H0 ditolak
sehingga median dari data inflasi bulanan berbeda secara
signifikan dengan 0.
Contoh IX.3
Misalkan dimiliki data
3,7 5, 2 6,9 7,2 6,4 9,3 10
4,3 8,4 6,5 8,1 7,3 6,1.
Akan diuji hipotesis bahwa distribusi data F simetris di
sekitar median 6 melawan hipotesis alternatif bahwa data F
simetris di sekitar median 6 dengan menggunakan uji
simetris Wilcoxon. Berdasarkan data tersebut maka dapat
dibuat barisan berurut dari nilai harga mutlak Xi – m0 yaitu
0,1, 0,2, 0,4 0,5, 0,8, 0,9, 1,2,
1,3 1,7, 2,1, 2,3, 2,4, 3,3.
Urutan tersebut menghasilkan vektor nomor rank berturut-
turut sesuai dengan data yaitu
(11, 5, 6, 7, 3, 13, 9, 12, 4, 10, 8, 1, 2).
Nilai statistik uji adalah v = 37 sehingga nilai-p yang diperoleh
dengan menggunakan pendekatan normal adalah
PH0( V 37) = 0,0980
dan berarti H0 diterima dengan tingkat keberartian 5%.
Contoh IX.4
Berdasarkan data inflasi bulanan kota Ambon untuk periode
bulan Januari 2009 sampai dengan bulan Mei 2013, akan
diuji apakah hipotesis nol yang menyatakan bahwa distribusi
data inflasi bulanan adalah simetris di sekitar median 0
melawan hipotesis alternatif bahwa distribusi data inflasi
bulanan tidak simetris di sekitar median 0 dengan tingkat
keberartian 5%. Dari data diperoleh V = 651 sehingga
diperoleh nilai-p adalah
PH0(V 651 ) = 1- PH0(V < 651 ) = 0,0025.
Karena nilai-p lebih kecil dari = 5 % maka H0 ditolak
sehingga distribusi data inflasi bulanan tidak simetris di
sekitar median 0.
Langkah 1
Hipotesis yang akan diuji adalah hipotesis nol H0 : F = G
melawan hipótesis alternatif H1 : F G.
Langkah 2
Memilih tingkat keberartian yang digunakan.
Langkah 3
Statistik uji yang digunakan adalah U = min(U1, U2) dengan
1
U1 mn m(n 1) S1 ,
2
1
U 2 mn m(n 1) S 2 ,
2
S1 = jumlah rangking kelompok 1,
S2 = jumlah rangking kelompok 2.
Langkah 4
Hipotesis nol ditolak jika U lebih kecil dari Utabel dengan
menggunakan Tabel Mann-Whitney (Lampiran 12).
Untuk memberikan gambaran hal tersebut, diberikan contoh
berikut ini.
i 1
Contoh IX.6
Berdasarkan data pada Contoh IX.5, apabila digunakan
anggapan ukuran sampel m dan n besar. Sampel total
berurut dari kedua sampel tersebut dapat dinyatakan sebagai
berikut :
64, 65, 65, 68, 70, 71, 71, 72, 72, 72, 76, 77, 77, 77, 80, 81,
86, 86, 87, 88, 90, 91, 91, 96.
i 1
Nilai-p untuk uji ini adalah PH0( |W| > 158,5 ) = 0,6236.
Hipotesis nol tidak ditolak untuk tingkat keberartian yang
biasa digunakan sehingga distribusi keagresifan pasangan
kembar yang lahir pertama sama dengan distribusi
keagresifan pasangan kembar yang lahir kedua.
Contoh IX.7
Sampel random ukuran 9 dari populasi pertama dan sampel
random ukuran 15 diambil dari populasi kedua. Hipotesis nol
yang akan diuji adalah bahwa kedua populasi mempunyai
distribusi yang identik. Bila dua sampel tersebut diurutkan
dari yang terkecil ke terbesar dan distribusi empirik dari
kedua sampel tersebut dibandingkan maka akan diperoleh
hasil seperti pada Tabel IX.3.
Berdasarkan pada Tabel IX.3 diperoleh nilai uji statistik
dua sisi Dm , n = 2/5 = 0,4. Bila digunakan Tabel Kolmogorov-
Smirnov dua sampel (Lampiran 13) untuk tingkat keberartian
= 0,05 maka akan diperoleh nilai kritisnya yaitu 8/15. Hal
itu berarti bahwa Dm , n = 0,4 lebih kecil dari nilai kritisnya
tidak ada alasan untuk menolak hipotesis nol.
Contoh IX.8
Seorang guru ingin mengetahui manfaat dari metode
pembelajaran yang digunakan. Untuk itu sebelum dan
sesudah pelaksanaan pembelajaran dilakukan pemberian tes
awal dan tes akhir bagi siswa yang mengikuti pembelajaran
tersebut. Hasil tes awal dan tes akhir dinyatakan dalam tabel
berikut ini :
Ujilah apakah median hasil tes awal dan median tes akhir
sama melawan median hasil tes awal dan median tes akhir
tidak sama dengan tingkat keberartian 5%.
Penyelesaian
Dalam hal ini, diinginkan untuk menguji hipotesis nol H0 :
median hasil tes awal dan median tes akhir sama melawan
hipotesis alternatif H1 : median hasil tes awal dan median tes
akhir tidak sama dengan menggunakan tingkat. Untuk
mencari Thitung Wilcoxon digunakan tabel penolong berikut
ini:
Uji Ketakbergantungan
Misalkan bahwa (X1, Y1), (X2, Y2), ..., (Xn, Yn) adalah
vektor stokastik yang saling tak bergantung dari distribusi
bivariat. Pertanyaan yang sering muncul adalah apakah
kedua peubah tersebut tidak saling bergantung (independent).
Misalkan S1, S2, ...., Sn adalah nomor rank dari X1,
X2, ...., Xn dalam urutan X(1), X(2), ...., X(n) dan didefinisikan
analog R1, R2, ...., Rn untuk Y1, Y2, ...., Yn. Jika Xi dan Yi tidak
bergantung maka nomor rank untuk dua kelompok Si dan Ri
akan saling tidak bergantung. Bila tidak ada ulangan maka
akan memuat permutasi dari bilangan { 1, 2, ..., n }. Dua
sampel tersebut akan saling bergantung positif sehingga
diharapkan bahwa 2 baris nomor rank akan paralel satu
(r r )(s
i 1
i i s)
l 1/ 2
n n
i ( si s ) 2
2
( r r )
i 1 i 1
dengan
n 1
.rs
2
Bila tidak ada ulangan dalam 2 sampel tersebut maka
{ r1, r2, ..., rn } = { s1, s2, ..., sn } = { 1, 2, ..., n }
dan memenuhi :
n
r n(2n 1)(n 1) / 6
2
i
i 1
n
(r
i 1
i r ) 2 (n 3 n) / 12
i 1
l
2 AB
n3 n n3 n
dengan A U X , B UY dan U X adalah
12 12
banyaknya ulangan dalam masing-masing kelompok ulangan
u3 u
dari variabel X dan U .
12
Contoh IX.9
Misalkan bahwa dimiliki data bivariat sebagai berikut (1,2),
(0,1), (0,2) dan (1,4). Hal itu berarti data X adalah { 1, 0, 0, 0,
1 } sehingga ranking untuk data X yaitu R(Xi) adalah { 4,5,
2, 2, 2, 4,5 }. Karena terdapat 2 ulangan yaitu pada rangking
4,5 dan 3 pada rangking 2 maka diperoleh
(4,5)3 4,5 23 2
U X 12 12 2,5.
Selanjutnya data Y adalah { 2, 1, 2, 2, 4 } sehingga R(Yi) adalah
{ 3, 1, 3, 3, 5 } dan
33 3
U Y 12
2.
n3 n 53 5
Akibatnya, diperoleh A U X 2,5 7,5 dan
12 12
n3 n 53 5
A U X 2 8
12 12
sehingga diperoleh koefisien korelasi Spearman
n
A B R( X i ) R(Yi )
2
i 1 7,5 8 5,5
l 0,6455.
2 AB 2 7,5(8)
Contoh IX.11
Berdasarkan data pada Contoh IX.8 diperoleh data X
yaitu { 1, 0, 0, 0, 1 } dan data Y yaitu { 2, 1, 2, 2, 4} sehingga
fungsi sgn(xi-xj) sgn(yi-yj) untuk i = 1, 2, ...., 5 dan j = 1 2, ...,
5 dapat dinyatakan pada matriks
0 1 0 0 0
1 0 0 0 1
0 0 0 0 1 .
0 0 0 0 1
0 1 1 1 0
Akibatnya
K= sgn( xi x j ) sgn( yi y j ) 4
i j
Uji Kruskal-Wallis
Uji ini digunakan untuk menguji hipotesis komparatif
apabila data berskala ordinal atau dapat dinyatakan dalam
skala ordinal pada data yang terdiri dari lebih dari 2 sampel
yang saling bebas. Untuk menggunakan uji ini digunakan
langkah-langah sebagai berikut:
Langkah 1
Tentukan hipotesis nol dan hipotesis alternatifnya. Dalam hal
ini, hipotesis nolnya adalah median populasi semua sama
dan hipotesis alternatifnya adalah ada median yang berbeda
dengan yang lain.
Langkah 2
Dipilih tingkat keberartian .
dengan
n = ukuran sampel,
k = banyaknya kelompok,
ni = ukuran sampel dalam kelompok ke-i,
Ri = jumlah peringkat dalam kelompok ke-i,
i = 1, 2,..., k.
Langkah 4
Aturan pengambilan keputusan yaitu bahwa H0 ditolak jika
Hhitung > ;k 1 dengan tingkat keberartian dan derajat
2
Contoh IX.13
Seorang guru SMA mengadakan penelitian tentang keunggulan
metode pembelajaran dengan menggunakan 3 metode dan
diperoleh hasil ujian seperti dinyatakan pada tabel berikut
ini:
Metode A Metode B Metode C
70 65 67
76 70 66
77 74 50
76 67 57
67 57
89
Metode Metode
Metode A Peringkat Peringkat Peringkat
B C
70 9,5 65 4 67 7
76 12 70 9,5 66 5
77 13 74 11 50 1
76 14 67 7 57 2,5
67 7 57 2,5
89 15
R1 = 70,5 R2 = 34 R3 = 15,5
=10% dan derajat bebas k-1 = 3-1 = 2. Karena lebih besar dari
titik kritis yaitu 4,6052 maka H0 ditolak sehingga ada median
yang berbeda dengan yang lain.
Uji Friedman
Uji Friedman digunakan untuk menguji hipotesis
apabila datanya berskala ordinal untuk data yang diperoleh
dari lebih dari 2 sampel yang berkaitan. Untuk memberikan
gambaran penggunaan metode ini, dijelaskan dalam langkah-
langkah berikut :
Langkah 1
Menentukan hipotesis nol dan hipotesis alternatif.
Langkah 2
Menentukan tingkat keberartian .
Langkah 3
Menghitung statistik uji Friedman yaitu X2hitung dengan
rumus:
k
12
X2 Ri 3n(k 1)
2
nk (k 1) i 1
dengan
N = ukuran sampel total,
Ri = jumlah peringkat dalam kelompok ke-i.
Langkah 4
Aturan penolakan H0 adalah jika Hhitung > ; k 1 . Pengambilan
2
Penyelesaian
Langkah 1
Hipotesis nolnya adalah median tes awal, tes tengah dan tes
akhir semua sama dan hipotesis alternatifnya adalah H0 tidak
benar.
Langkah 2
Dipilih tingkat keberartian = 1%.
Langkah 3
Metode Metode Metode
Peringkat Peringkat Peringkat
A B C
4 1 5 2 6 3
4 1 5 2 6 3
5 1 6 2 7 3
5 1 6 2 7 3
6 1 7 2,5 7 2,5
6 1 7 2,5 7 2,5
R1 = 6 R2 = 13 R3 = 17
k
12 12
X2 Ri 3n(k 1) 6 2 132 17 2 3(6)(3 1)
2
nk (k 1) i 1 6(3)(3 1)
sehingga diperoleh X2hitung = 10,3333.
Langkah 4
Aturan pengambilan keputusan yaitu bahwa H0 ditolak jika
Hhitung > ;k 1 0,01; 2 9,2103 dengan tingkat keberartian
2 2
Soal 1
Berdasarkan pada data inflasi bulanan kota Jayapura pada
Tabel II.2, akan diuji hipotesis nol bahwa median data inflasi
bulanan kota Jayapura sama dengan nol melawan median
data inflasi bulanan kota Jayapura lebih dari nol dengan
tingkat keberartian 5%.
Penyelesaian
Hipotesis nol yang akan diuji adalah bahwa median data
inflasi bulanan kota Jayapura sama dengan nol melawan
median data inflasi bulanan kota Jayapura lebih dari nol.
Statistik yang digunakan adalah
T # ( X i 0) 1{ X i 0}.
i
Hipotesis nol H0 akan ditolak jika nilai-p lebih kecil dari 5%.
Dari data diperoleh T = 37 sehingga nilai-p adalah
PH0(T > 37) = 0,0019
sehingga H0 ditolak artinya median data inflasi bulanan kota
Jayapura lebih dari nol.
Soal 2
Berdasarkan pada data inflasi bulanan kota Jayapura pada
Tabel II.2, akan diuji hipotesis nol bahwa distribusi data
inflasi bulanan kota Jayapura simetris di sekitar 0 melawan
distribusi data inflasi bulanan kota Jayapura tidak simetris
di sekitar 0 dengan uji simetri Wilcoxon dan tingkat
keberartian 5%.
Penyelesaian
Hipotesis nol bahwa distribusi data inflasi bulanan kota
Jayapura simetris di sekitar 0 melawan distribusi data inflasi
bulanan kota Jayapura tidak simetris di sekitar 0. Statistik
yang digunakan adalah
Hipotesis nol H0 akan ditolak jika nilai-p lebih kecil dari 5%.
Dari data diperoleh V = 520 sehingga nilai-p adalah
PH0(V > 520) = 0,0252
sehingga H0 ditolak artinya distribusi data inflasi bulanan
kota Jayapura tidak simetris di sekitar 0.
Soal 3
Berdasarkan pada data inflasi bulanan kota Ambon dan kota
Jayapura pada Tabel II.2, akan diuji hipotesis nol bahwa
distribusi data inflasi bulanan kota Ambon dan kota Jayapura
sama melawan distribusi data inflasi bulanan kota Ambon
dan kota Jayapura tidak sama dengan uji Mann-Whitney
untuk ukuran sampel besar dan tingkat keberartian 5%.
Penyelesaian
Karena m=n=54 maka dapat digunakan uji Mann-Whitney
pendekatan sehingga diperoleh W = 3088. Distribusi W
mendekati normal dengan mean 2943 dan simpangan baku
162,751 sehingga diperoleh nilai-p yaitu 0,3730 sehingga H0
diterima. Hal itu berarti distribusi data inflasi bulanan kota
Ambon dan kota Jayapura sama.
Soal 4
Berdasarkan pada data inflasi bulanan kota Ambon dan kota
Jayapura pada Tabel II.2, akan diuji hipotesis nol bahwa
distribusi data inflasi bulanan kota Ambon dan kota Jayapura
sama melawan distribusi data inflasi bulanan kota Ambon
dan kota Jayapura tidak sama dengan uji Kolmogorov-Smirnov
dengan tingkat keberartian 5%.
Penyelesaian
Dengan menggunakan statistik Kolmogorov-Smirnov dua
sampel diperoleh Dm,n = 0,1667 sedangkan titik kritis untuk
m=n=54 dan tingkat keberartian 5% adalah 0,2613. Hipotesis
Soal 5
Berdasarkan pada data inflasi bulanan kota Ambon dan kota
Jayapura pada Tabel II.2, akan diuji hipotesis nol bahwa data
inflasi bulanan kota Ambon dan kota Jayapura saling bebas
melawan data inflasi bulanan kota Ambon dan kota Jayapura
tidak saling bebas dengan uji koefisien korelasi Spearman
dengan tingkat keberartian 5%.
Penyelesaian
Dengan menggunakan rumus koefisien korelasi Spearman
diperoleh koefisien korelasi Spearman l = 0,1405. Dengan
tingkat keberartian 5%, hipotesis nol ditolak jika l lebih besar
dari 0,2679. Akibatnya data inflasi bulanan kota Ambon dan
kota Jayapura saling bebas.
Soal 6
Sebuah pelatihan metode penelitian dilakukan evaluasi awal,
tengah dan akhir. Gunakan tingkat keberartian 10% untuk
menguji apakah median evaluasi awal, tengah dan akhir
sama. Hasil evaluasi pelaihan metode penelitian tersebut
dinyatakan dalam tabel berikut:
Metode Metode
Metode A Peringkat Peringkat Peringkat
B C
7 1 8 2,5 8 2,5
7 1,5 9 3 7 1,5
8 2,5 7 1 8 2,5
9 2 10 3 8 1
7 1 10 3 8 2
8 1 9 2 10 3
R1 = 9 R2 = 14,5 R3 = 12,5
nk (k 1) i 1 6(3)(3 1)
sehingga diperoleh X2hitung = 2,5833.
Langkah 4
Aturan pengambilan keputusan yaitu bahwa H0 ditolak jika
X2hitung > ;k 1 0,01; 2 4,6052
2 2
dengan tingkat keberartian
=1% dan derajat bebas k-1 = 3-1 = 2. Karena X2hitung lebih
kecil dari titik kritis yaitu 4,6052 maka H0 diterima sehingga
median tes awal, tes tengah dan tes akhir semua sama.
Pengambilan keputusan juga dapat dilakukan dengan
menggunakan nilai-p yaitu bahwa jika nilai-p lebih kecil dari
***
(Xi 1
i X )(Yi Y )
r
n n
i 1
( X i X )2 i 1
(Yi Y ) 2
1 n 1 n
dengan X i
n i 1
X dan Y Yi .
n i 1
Contoh X.1
Seorang mahasiswa melakukan penelitian dengan meng-
gunakan alat ukur (kuesioner) untuk mengukur motivasi
Tabel X.1 Hasil skor instrument motivasi belajar dengan 10 item untuk
12 reseponden
Skor butir
Skor
Responden 1 2 3 4 5 6 7 8 9 10
Total
1 3 4 3 4 4 3 3 3 3 3 33
2 4 3 3 4 3 3 3 3 3 3 32
3 2 2 1 3 2 2 3 1 2 3 21
4 3 4 4 3 3 3 4 3 3 4 34
5 3 4 3 3 3 4 3 4 4 3 34
6 3 2 4 4 3 4 4 3 4 4 35
7 2 3 3 4 4 4 3 4 3 2 32
8 1 2 2 1 2 2 1 3 4 3 21
9 4 2 3 3 4 2 1 1 4 4 28
10 3 3 3 4 4 4 4 4 3 3 35
11 4 4 3 4 4 3 4 4 4 2 36
12 3 2 1 2 3 1 1 2 3 3 21
Korelasi 0,534 0,706 0,871 0,791 0,645 0,839 0,780 0,686 0,292 -0,027
i 1
bi
2
= total variansi butir,
xj 1
j
2
j 1 j
n
b2
,
n
sehingga untuk butir ke-2 diperoleh variansi
352
111
b2 12 0,7431.
12
Dengan cara yang sama diperoleh variansi untuk butir ke-
3, ke-4, ke-6, ke-7 dan ke-8 berturut-turut yaitu 0,8542,
0,8542, 0,8542, 0,9097, 1,3056, 1,0764 sehingga diperoleh
jumlah variansi butir
k
i 1
bi
2
5,7431.
12 X i
X i 1 (211) 2
2
i
12 3983
t 2 i 1 12 22,7431.
12 12
Responden 1 2 3 4 5
1 0 0 1 1 0
2 0 0 0 1 0
3 1 1 0 0 0
4 1 0 0 1 0
5 0 1 1 1 1
6 0 1 0 0 0
7 1 1 1 1 1
8 1 1 0 1 0
9 1 1 1 1 0
10 0 0 0 1 1
Langkah 1
Menyiapkan tabel bantu dengan menghitung jumlah baris,
jumlah baris dikuadratkan, jumlah kolom, p dan q untuk
masing-masing kolom. Tabel bantu perhitungan koefisien
korelasi point biserial. Dalam hal ini, p menyatakan proporsi
responden yang menjawab benar untuk butir soal tertentu
sedangkan q menyatakan proporsi responden yang menjawab
salah untuk butir soal tersebut.
Jumlah Kuadrat
5
X
5
X
2
i i
Responden 1 2 3 4 5 i 1 i 1
1 0 0 1 1 0 2 4
2 0 0 0 1 0 1 1
3 1 1 0 0 0 2 4
4 1 0 0 1 0 2 4
5 0 1 1 1 1 4 16
6 0 1 0 0 0 1 1
7 1 1 1 1 1 5 25
8 1 1 0 1 0 3 9
9 1 1 1 1 0 4 16
10 0 0 0 1 1 2 4
Jumlah N1 = 5 N2 = 6 N3 = 4 N4 = 8 N5 = 3 26 84
Langkah 2
Mencari mean dari jumlah baris atau skor total yaitu
1 n 26
M t X i 2,6.
n i 1 10
Langkah 3
Menentukan simpangan baku (populasi) yaitu dengan
menggunakan rumus
2
n
n
Xi Xi
2
s i 1 i 1
n n
sehingga diperoleh
Soal 1
Tabel X.5 berikut ini menyatakan skor dari kuosioner dari 10
responden dan 4 pertanyaan dalam kuesioner dengan skor
menggunakan skala Likert dari 1 sampai 5. Manakah
pertanyaan-pertanyaan yang valid ?
Penyelesaian
Soal 2
Apabila digunakan metode corrected item-total correlation,
manakah pertanyaan yang valid ?
Penyelesaian
Apabila digunakan metode corrected item-total correlation
maka akan diperoleh koefisien korelasi momen Pearson
terkoreksi berturut-turut yaitu 0,570, 0,885, 0,717 dan -
0,087. Dengan menggunakan titik kritis seperti pada Soal 1
maka pertanyaan yang valid adalah nomor 2 dan 3.
Soal 3
Tabel X.7 berikut ini menyatakan skor dari kuosioner dari 10
responden dan 4 pertanyaan dalam kuesioner dengan skor
menggunakan skala 0 atau 1 (0 = Tidak dan 1 = Ya). Manakah
pertanyaan-pertanyaan yang valid ?
Penyelesaian
Langkah 1
Menyiapkan tabel bantu dengan menghitung jumlah baris,
jumlah baris dikuadratkan, jumlah kolom, p dan q untuk
masing-masing kolom. Tabel ini digunakan untuk membantu
menghitung korelasi point biserial. Dalam hal ini, p menyatakan
proporsi responden yang menjawab Ya untuk pertanyaan
tertentu sedangkan q menyatakan proporsi responden yang
menjawab Tidak untuk pertanyaan butir tersebut.
Langkah 2
Mencari mean dari jumlah baris atau skor total yaitu
1 n 23
M t X i 2,3.
n i 1 10
Langkah 3
Menentukan simpangan baku (populasi) yaitu dengan
menggunakan rumus
2
n
n
Xi
2
X i
s i 1 i 1
n n
Langkah 4
Menentukan Mp untuk butir pertanyaan 1 sampai dengan
butir pernyataan 4. Untuk M1 dapat diperoleh dengan
mengalikan kolom butir pernyataan 1 dengan kolom jumlah
kemudian hasilnya dijumlahkan untuk seluruh responden
dan kemudian dibagi dengan banyaknya responden yang
menjawab Ya sehingga diperoleh
12
M 1 3.
4
Dengan cara yang sama diperoleh M2 = 3, M3 = 3 dan M4
= 2,1429.
Langkah 5
Menentukan koefisien korelasi point biserial dengan rumus
Soal 4
Lakukan uji Chronbach’s alfa untuk data pada Tabel X.7.
Penyelesaian
Untuk menguji apakah alat ukur yang digunakan
reliabel, digunakan statistik alfa Cronbach (Cronbach’s Alpha).
Tabel X.9 diperoleh dari Tabel X.7 dengan membuang butir 4
dan digunakan sebagai alat bantu untuk menghitung
statistik alfa Cronbach. Variansi untuk butir ke-1, ke-2 dan
ke-3 berturut-turut yaitu 0,24, 0,24 dan 0,24 sehingga
diperoleh jumlah variansi butir
k
0,72.
2
bi
i 1
12 X i
X i
2
i 1
n 40
(16) 2
t 2 i 1 10 1,44.
n 10
Karena statistic alfa Cronbach lebih dari 0,6 yaitu 0,75 maka
instrument tersebut reliabel.
Jumlah
Responden Item Item item Jumlah
Kuadrat
1 1 1 0 2 4
2 0 0 1 1 1
3 0 0 0 0 0
4 0 1 1 2 4
5 0 1 1 2 4
6 0 0 0 0 0
7 0 0 0 0 0
8 1 1 1 3 9
9 1 1 1 3 9
10 1 1 1 3 9
Total 4 6 6 16 40
Jumlah
Kuadrat 4 6 6 1,44
Sigma2B 0,24 0,24 0,24 0,72 0,75
Soal 5
Berdasarkan Tabel X.5 di atas, apabila digunakan koefisien
korelasi Spearman, manakah pertanyaan-pertanyaan yang
valid? Ulangi pertanyaan tersebut bila digunakan koefisien
korelasi Kendall.
1 2 3 4 5 6 7 8
A 0 1 0 0 0 1 0 0
B 1 0 1 0 1 0 1 1
C 0 1 0 1 1 0 0 1
D 1 1 1 1 1 1 1 1
E 1 0 1 1 0 1 0 1
F 0 1 0 0 0 1 0 1
G 1 0 0 1 1 1 1 1
H 1 0 1 1 1 1 1 1
I 0 1 0 1 0 1 0 1
J 1 1 1 1 1 1 1 1
K 0 1 1 1 1 1 1 0
L 0 1 1 0 1 0 1 0
M 0 1 0 0 1 0 1 1
N 1 0 1 1 0 1 0 1
O 1 0 0 1 1 1 1 1
P 0 1 0 1 0 1 0 1
Q 1 0 1 1 1 1 1 1
R 0 1 0 1 1 1 0 1
S 1 0 0 1 1 1 1 1
T 0 1 1 0 0 0 1 0
Nomer Item
Subjek
1 2 3 4 5 6 7 8 9 10
1 4 1 4 4 4 4 4 4 4 4
2 3 3 4 4 4 4 4 4 4 4
3 4 4 4 4 4 4 4 3 4 4
4 4 4 3 4 4 4 4 4 4 4
5 4 4 4 4 4 4 4 4 4 4
6 4 4 3 4 4 4 4 4 4 4
7 4 4 2 3 4 3 4 4 4 4
8 4 4 4 3 4 4 4 4 4 4
9 4 4 4 4 4 4 4 4 4 4
10 4 4 4 4 4 4 3 4 4 4
11 4 4 4 4 3 4 4 4 4 4
12 4 4 3 2 4 3 3 4 4 4
13 4 4 4 4 4 4 3 3 4 4
14 4 4 4 3 4 4 4 4 4 4
15 4 4 4 4 4 4 4 4 4 4
16 3 4 3 3 4 4 4 4 4 4
17 4 4 3 3 4 4 4 4 4 4
***
*****