Anda di halaman 1dari 232

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/320372456

ANALISIS DATA STATISTIK

Book · October 2017

CITATION READS

1 32,460

1 author:

Adi Setiawan
Universitas Kristen Satya Wacana
113 PUBLICATIONS   283 CITATIONS   

SEE PROFILE

Some of the authors of this publication are also working on these related projects:

fuzzy clustering View project

THE EVALUATION OF LAND AREA MEASUREMENT USING GPS TECHNOLOGY View project

All content following this page was uploaded by Adi Setiawan on 13 October 2017.

The user has requested enhancement of the downloaded file.


ANALISIS
DATA STATISTIK

Adi Setiawan

Penerbit
Tisara Grafika Salatiga
2017

i
Katalog Dalam Terbitan

519.5
ADI Adi Setiawan
a Analisis data statistik/ Adi Setiawan. -- Salatiga : Tisara Grafika, 2017.
v, 225 p. ; 25 cm.

ISBN 978-602-9493-52-8

1. Statistics. I. Title.

Cetakan pertama : September 2017


Hak Cipta : Pada Penulis
Disain Sampul : Tisara Grafika
Tata letak : Harrie Siswanto
Percetakan : Tisara Grafika
Penerbit : Tisara Grafika

Hak Cipta dilindungi oleh Undang-undang


Dilarang mengutip atau memperbanyak sebagian atau seluruh buku ini
tanpa seijin penulis

Diponegoro 98 D SALATIGA - JAWA TENGAH


Telp. 0298-321798 | Mobile: 0812 2859 8985
Email: harriesiswanto@gmail.com

ii
KATA PENGANTAR

Buku ini disusun berjudul Analisis Data Statistik untuk


memenuhi mata kuliah Statistika Lanjut. Statistik Dasar yang
dipelajari dalam 3 sks sering kali belumlah mencakup banyak
hal sehingga sangat kurangnya latar belakang teori yang
digunakan di dalam analisis data. Buku ini disusun berdasarkan
pengalaman mengajar maupun dalam penelitian serta membim-
bing mahasiswa dalam melakukan penelitian baik untuk
mahasiswa program studi S1 Matematika, S2 Magister Sains
Psikologi maupun S2 Magister Sistim Informasi.
Dalam abad data sekarang ini, metode ekstraksi data
menjadi informasi sangatlah penting sehingga akan dapat -
untuk menghadapi permasalahan-permasalahan yang akan
muncul di kemudian hari. Algoritma yang efisien dalam analisis
data sangatlah diperlukan di waktu mendatang, namun dasar-
dasar teori statistik yang kuat akan sangat bermanfaat dalam
menganalisis data-data yang makin banyak jenis dan besaran
datanya.
Kritik dan saran yang membangun akan sangat kami
harapkan agar buku ini menjadi semakin bermanfaat.

Salatiga, September 2017


Penulis

iii
iv
DAFTAR ISI

KATA PENGANTAR iii

DAFTAR ISI v

I PENDAHULUAN 1

II PENCARIAN DISTRIBUSI DATA SECARA 2


EKSPLORATIF

III UJI KECOCOKAN : DISTRIBUSI NORMAL 24

IV UJI KECOCOKAN:DISTRIBUSI MULTINOMIAL 41

V ANALISIS TABEL KONTINGENSI (TABEL k × r) 51

VI ANALISIS VARIANSI 67

VII ANALISIS REGRESI LINEAR SEDERHANA 87

VIII ANALISIS REGRESI LINEAR GANDA 110

IX STATISTIKA NON PARAMETRIK 153

X UJI VALIDITAS DAN UJI RELIABILITAS 184

XI PENUTUP 202
DAFTAR PUSTAKA 203
LAMPIRAN-LAMPIRAN 205

v
BAB I
PENDAHULUAN

Mata kuliah Statistika dalam penyajiannya dapat terbagi


ke dalam Statistika Dasar dan Statistika Lanjut. Dalam
Statistika Dasar dibahas tentang bagaimana meringkas data
baik menggunakan numerik maupun gambar atau grafik,
dasar-dasar teori probabilitas, distribusi sampling, estimasi
dan pengujian hipotesis. Dalam Statistika Lanjut pada buku
dibahas tentang pencarian distribusi baik secara eksploratif
maupun secara formal, pengujian kecocokan distribusi
multinomial, pengujian kecocokan distribusi normal, analisis
tabel kontingensi, analisis variansi, analisis regresi linear
baik sederhana maupun ganda, statistika non parametrik
dan statistika pendidikan yang membahas tentang uji
validitas dan uji reliabilitas.
Buku ini berjudul Analisis Data Statistik yang dapat
digunakan sebagai materi utama mata kuliah Statistika
Lanjut. Data-data yan digunakan berasal dari data-data
Badan Pusat Statistik (BPS), data tesis Magister Sains
Psikologi dan data-data fiktif yang digunakan sebagai ilustrasi.

***

Analisis Data Statistik |1


BAB II
PENCARIAN DISTRIBUSI DATA SECARA EKSPLORATIF

Apabila dimiliki suatu data maka selalu dapat ditanyakan


dari distribusi mana data tersebut berasal. Salah satu
jawaban yang sering dibuat adalah data sesuai dengan
distribusi yang biasa dikenal. Sebagai contoh adalah bahwa
data berasal dari distribusi normal dengan mean μ dan
variansi 2.
Masalah yang sering dihadapi adalah bagaimana
menentukan distribusi dari suatu data. Dalam hal ini sering
kali digunakan analisis data eksploratif dan juga kemudian
digunakan metode statistika formal. Dalam hal ini akan
dibahas metode untuk menentukan dari distribusi mana
suatu data berasal.

II.1 Fungsi kuantil dan keluarga Lokasi-Skala


Misalkan F fungsi distribusi dari suatu distribusi probabilitas
pada R. Jika diberikan   (0,1) maka terdapatlah dengan
tunggal x  R sehingga F (x )   maka x disebut kuantil-
 dari F. Dalam hal ini kuantil-  dari F digunakan notasi F-
1(). Berdasarkan pada notasi ini ditentukan fungsi kuantil

yaitu invers dari F asalkan fungsi tersebut terdefinisikan


dengan baik (well defined).
Fungsi kuantil dari F secara umum didefinisikan sebagai
F 1 ( )  inf { F ( x)   }
dengan   (0,1) . Dalam kalimat hal ini dapat dinyatakan
bahwa F-1() adalah nilai terkecil x dengan F(x)  .

Contoh II.1
Variabel random X mempunyai distribusi eksponensial
dengan mean 1 jika mempunyai fungsi kepadatan probabilitas

2| Adi Setiawan
f(x) = e-x
untuk x > 0. Fungsi distribusi kumulatif dari variabel random
X adalah
F(x) = 1- e-x
untuk x > 0 dan 0 untuk x  0. Gambar II.1 mempresentasikan
fungsi distribusi dari distribusi eskponensial dengan mean/
rata-rata 1 atau laju (rate) 1. Fungsi kuantil dari distribusi
eksponensial tersebut adalah
F 1 ( )   ln(1   )
dengan   (0,1). Sebagai contoh, untuk  = 0,2, diperoleh
kuantil 0,2 atau kuantil 20% adalah
F 1 (0,2)   ln(1  0,2)   ln( 0,8)  0,2231.
Gambar II.2 mempresentasikan fungsi kuantil dari distribusi
eksponensial yaitu
F 1 ( )   ln(1   )
dengan   (0,1).
1.0
0.8
0.6
0.4
0.2
0.0

0 2 4 6 8 10

Gambar II.1 Fungsi distribusi dari distribusi eskponensial dengan rate 1


atau mean/rata-rata 1

Analisis Data Statistik |3


4
3
2
1
0

0.0 0.2 0.4 0.6 0.8 1.0

Gambar II.2 Fungsi kuantil dari distribusi eskponensial dengan rata-rata 1.

Sebagai besaran stokastik X mempunyai distribusi F


dan fungsi distribusi dari a + bX dapat dinyatakan sebagai
 xa
Fa , b ( y )  F  
 b 
dengan a  R, b > 0. Keluarga distribusi probabilitas
{ Fa,b | a  R, b > 0 }
disebut keluarga skala-lokasi anggota F. Jika X mempunyai
mean E(X) = 0 dan variansi Var(X) = 1 maka mean dan
variansi dari F a,b masing-masing adalah a dan b2. Dapat
dibuktikan bahwa fungsi kuantil memenuhi
F 1a , b ( )  a  b F 1 ( ) .
Dengan kata lain titik-titik (F 1
( ) , F 1a ,b ( ) |   (0,1) 
terletak pada garis lurus y = a + bx .

Contoh II.2
Misalkan variabel random X mempunyai distribusi eksponensial
dengan rata-rata 1. Jika variabel random

4| Adi Setiawan
Y = a + bX
dengan a, b  R dan b > 0 maka fungsi distribusi dari Y adalah
 ya
FY ( y )  P( Y  y )  P( a  b X  y )  P( X  ( y  a) / b )  F  
 b 
yaitu
 ya
FY ( y ) 1  exp  
 b 
untuk y > a dan 0 untuk y  0. Fungsi kuantilnya adalah
F 1 ( )  (a  b ) ln(1   )
dengan   (0,1). Hal itu berarti memenuhi
F 1a , b ( )  a  b F 1 ( ) .

II.2 QQ-plot untuk pencocokan

Misalkan x 1 ,..., x n replikasi saling bebas (independent)


dari bentuk distribusi probabilitas F. Statistik berurut ke-i
yaitu x (i ) mempunyai suatu fraksi sekitar i/(n+1) dari
pengamatan atau sekitar kuantil i/(n+1) dari pengamatan.
Oleh karena itu titik
 1  i  
( F   , x( i ) ) | i 1,2,3,....,n 
  n 1 
diharapkan terletak pada sekitar garis lurus. Plot dari titik
itu dikenal dengan nama QQ-plot.

Contoh II.3
Dengan bantuan komputer dapat dibangkitkan 50 bilangan
random dari distribusi N(2,4). Gambar 3.2 memberikan QQ-
plot untuk 50 bilangan random dengan sumbu x menyatakan
kuantil N(0,1) dan sumbu y menyatakan statistik berurut
(ordered statistics) dari 50 bilangan random tersebut. QQplot
terhadap distribusi normal dari data dalam paket program
qqnorm(u) dengan u menyatakan vektor data. Terlihat bahwa

Analisis Data Statistik |5


grafik cenderung membentuk garis lurus sehingga data cenderung
berdistribusi normal.

Norm a l Q-Q Plot Norm a l Q-Q Plot Norm a l Q-Q Plot

6
6
6

4
4
Sample Quantiles

Sample Quantiles

Sample Quantiles
2

2
2

0
0

-2

-2
-4
-2

-2 -1 0 1 2 -2 -1 0 1 2 -2 -1 0 1 2

Theoretic al Quantiles Theoretic al Quantiles Theoretic al Quantiles

Gambar II.3 Tiga QQ-plot dari 50 titik data dari N(2,4) melawan N(0,1).

QQ-plot memberikan suatu metode pada mata untuk


menilai sampel berasal dari distribusi mana yaitu apabila plot
tersebut berada di sekitar garis y = x maka data berasal dari
distribusi F. Bila plot tersebut menyimpang dari garis y = x
maka hal itu memberikan suatu petunjuk bahwa data
berbeda dari distribusi F atau data berasal dari keluarga
lokasi skala yang lain. Jadi penilaian dari QQ-plot adalah
merupakan ketrampilan menggunakan mistar untuk melihat
hasil pengamatan kurang lebih terletak pada garis lurus. Hal
ini menyatakan bagaimana QQ-plot dinilai berdasarkan alasan
formal. Beberapa contoh QQ-plot diberikan pada Gambar II.4
Terlihat bahwa kuantil seragam U(0,1) melawan kuantil
N(0,1) dan kuantil chi-kuadrat melawan kuantil normal tidak
membentuk garis lurus sedangkan kuantil seragam U(0,1)
melawan kuantil seragam U(0,3) dan kuantil N(3,25) melawan
kuantil N(0,9) membentuk garis lurus. Hal itu berarti bahwa
QQplot dari data melawan kuantil yang mempunyai keluarga
skala-lokasi yang sama akan membentuk garis lurus.

6| Adi Setiawan
3.0
2
Kuantil N(0,1)

Kuantil U(0,3)
1

2.0
-2 -1 0

1.0
0.0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0

Kuantil U(0,1) Kuantil U(0,1)


0 10 20

6
Kuantil N(0,9)

Kuantil N(0,9)

2
-2
-6
-20

0.0 0.2 0.4 0.6 0.8 1.0 -5 0 5 10 15

Kuantil Chi-square 5 Kuantil N(3,25)

Gambar II.4 Plot dari pasangan kuantil.

Untuk sampel yang mempunyai ukuran kurang dari 30


sulit untuk menggunakan QQ-plot dalam penentuan distribusi
data. Hal itu digambarkan pada Gambar II.5. Terlihat bahwa
titik-titik pada ketiga gambar cenderung tidak membentuk
garis lurus.

Norma l Q-Q Plot Norma l Q-Q Plot Norma l Q-Q Plot


15

2.0
1.5

10
1.0

1.5
5
0.5

Eksponensial
Cauchy
N(0,1)

1.0
0
0.0
-0.5

-5

0.5
-1.0

-10

0.0

-2 -1 0 1 2 -2 -1 0 1 2 -2 -1 0 1 2

Theoretic al Quantiles Theoretic al Quantiles Theoretic al Quantiles

Gambar II.5 QQ-plot dari 20 pengamatan dari distribusi N(0,1), Cauchy


Standard dan Eksponesial dengan mean 1 melawan N(0,1).

Analisis Data Statistik |7


Contoh II.4
Tabel II.1 menyatakan data inflasi bulanan nasional
Indonesia mulai Januari 2009 sampai dengan Desember
2011. QQplot dari data inflasi bulanan tersebut dinyatakan
pada Gambar II.6, terlihat bahwa QQplotnya cenderung
membentuk garis lurus sehingga data inflasi bulanan
cenderung berdistribusi normal.

Tabel II.1 Data inflasi bulanan mulai Januari 2009 sampai dengan
Desember 2011
BULAN INFLASI BULAN INFLASI BULAN INFLASI
Januari 2009 -0.07 Januari 2010 0.84 Januari 2011 0.89
Februari 2009 0.21 Februari 2010 0.3 Februari 2011 0.13
Maret 2009 0.22 Maret 2010 -0.14 Maret 2011 -0.32
April 2009 -0.31 April 2010 0.15 April 2011 -0.31
Mei 2009 0.04 Mei 2010 0.29 Mei 2011 0.12
Juni 2009 0.11 Juni 2010 0.97 Juni 2011 0.55
Juli 2009 0.45 Juli 2010 1.57 Juli 2011 0.67
Agustus 2009 0.56 Agustus 2010 0.76 Agustus 2011 0.93
September 2009 1.05 September 2010 0.44 September 2011 0.27
Oktober 2009 0.19 Oktober 2010 0.06 Oktober 2011 -0.12
November 2009 -0.03 November 2010 0.6 November 2011 0.34
Desember 2009 0.33 Desember 2010 0.92 Desember 2011 0.57

Normal Q-Q Plot


1.5
Sample Quantiles

1.0
0.5
0.0

-2 -1 0 1 2

Theoretical Quantiles

Gambar II.6 QQplot data inflasi bulanan melawan distribusi normal

8| Adi Setiawan
II.3 QQ-plot untuk uji simetrik
Besaran stokastik X disebut mempunyai distribusi simetri
sekitar  jika X-  dan  -X mempunyai distribusi yang sama.
Jika X berdistribusi kontinu maka X berdistribusi simetri
sekitar  dan fungsi kepadatannya simetri sekitar  .
Distribusi simetri dipandang lebih sederhana dari pada
distribusi asimetri. Untuk menilai bahwa data berasal dari
distribusi simetri dapat digunakan bantuan histogram atau
stem-and-leaf plot. Demikian juga dengan menggunakan
parameter kemencengan merupakan petunjuk yang baik,
parameter kemencengan sama dengan nol belum berarti
bahwa suatu distribusi nampak simetri. Cara yang lebih kuat
adalah dengan menentukan selisih antara mean dan median
dari suatu distribusi yang menceng. Kemencengan dapat juga
dinilai dari fungsi kuantil, dengan mudah dapat ditunjukkan
bahwa fungsi kuantil memenuhi
F 1 (1   )  2  F 1 ( )
dengan   (0,1) . Kesamaan ini berlaku untuk setiap distribusi
simetri F. Hal ini berarti untuk suatu distribusi simetri
titik-titik
F 1
( ) , F 1 (1   ) |  (0,1) 
terletak pada garis lurus. Untuk data-data X 1 , X 2 ,..., X n
berasal dari suatu distribusi simetrik dan diharapkan bahwa
titik-titik { ( X (i ) , X ( ni 1) ) | i = 1, 2,..., n } akan terletak pada
suatu garis lurus juga. Plot dari titik tersebut dikenal dengan
nama plot simetrik (symmetric plot atau symplot).

Contoh II.5
Gambar II.7 mempresentasikan plot simetrik untuk data dari
distribusi eksponensial. Terlihat bahwa tidak mengikuti garis
lurus sehingga cenderung tidak simetris seperti juga ditunjuk-
kan dengan histogramnya.

Analisis Data Statistik |9


Histogram of x
20

4
15
Frequency

3
10

2
5

1
0

0
0 1 2 3 4 0 1 2 3 4

Gambar II.7 Histogram dan Plot simetrik dari data berdistribusi


eksponensial

Contoh II.6
Berdasarkan data pada Contoh II.4, dapat dibuat histogram
dan plot simetrik dari data inflasi bulanan tersebut yang
dinyatakan pada Gambar II.8. Terlihat bahwa data inflasi
bulanan tersebut kurang simetrik karena titik-titik cenderung
tidak terletak pada garis lurus, tetapi apabila kita membuang
outlier maka akan diperoleh hasil pada Gambar II.9 yang
cenderung lebih simetrik.
0 1 2 3 4 5 6 7

1.5
1.0
Frequency

0.5
0.0

0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5

Gambar II.8 Histogram dan Plot simetrik dari data pada Contoh II.4

10 | Adi Setiawan
7

1.0
6
5

0.6
Frequency

4
3

0.2
2
1

-0.2
0

0.0 0.5 1.0 -0.2 0.2 0.6 1.0

Gambar II.9 Histogram dan Plot simetrik dari data pada Contoh II.4
tanpa mengikutsertakan outlier

***

Analisis Data Statistik | 11


SOAL & PENYELESAIAN

Soal 1
Variabel random X berdistribusi eksponensial dengan mean b
sehingga mempunyai fungsi kepadatan probabilitas
1
f ( x)  e  x / b
b
untuk x > 0. Tentukan fungsi distribusi dan fungsi kuantilnya.
Penyelesaian
Fungsi distribusi dari variabel random X adalah F(x) = 0 untuk
x < 0 dan
x 1
F ( x)  
x
e t / b dt  e t / b  1  e  x / b
0 b 0

untuk x > 0. Akibatnya, fungsi kuantil dapat diperoleh dengan


y  1 e  x / b
sehingga
e  x / b 1  y
atau
x   b ln(1  y).
Akibatnya, diperoleh fungsi kuantil
F ( )   ln( 1  )
untuk   (0,1).

Soal 2
Variabel random X berdistribusi seragam pada (a,b) dengan a,b
 R dan b > a sehingga mempunyai fungsi kepadatan
probabilitas
1
f ( x) 
ba
untuk a < x < b. Tentukan fungsi distribusi dan fungsi
kuantilnya.

12 | Adi Setiawan
Penyelesaian
Fungsi distribusi dari variabel random X adalah F(x) = 0 untuk
x  a dan
xa
x
1 x t
F ( x)   dt  
aba ba 0 ba
untuk a < x < b serta F(x) = 1 untuk x  b. Akibatnya, fungsi
kuantil dapat diperoleh dengan
xa
y
ba
sehingga
(b  a) y  x  a
atau
x  a  (b  a) y.
Akibatnya, diperoleh fungsi kuantil
F ( )  a  (b  a)
untuk   (0,1).

Soal 3
Variabel random X mempunyai fungsi kepadatan probabilitas
f ( x)  k x
untuk 0 < x < 2. Tentukan k sehingga f(x) merupakan fungsi
kepadatan probabilitas, fungsi distribusi dan fungsi kuantilnya.
Penyelesaian
Konstanta k ditentukan sehingga

 
f ( x) dx  1
atau
2
2 x2
1   k x dx  k  2k
0 2 0

atau k = ½. Fungsi distribusi dari variabel random X adalah F(x)


= 0 untuk x  0 dan

Analisis Data Statistik | 13


x
2 t t2 x2
F ( x)   dt  
0 2 2 0
4
untuk 0 < x < 2 serta F(x) = 1 untuk x  2. Akibatnya, fungsi
kuantil dapat diperoleh dengan
x2
y
4
sehingga
4 y  x2
atau
x 4y .
Akibatnya, diperoleh fungsi kuantil
F ( )  4
untuk   (0,1).

Soal 4
Variabel random X berdistribusi N(0,1) dan Y = 2X + 1 maka
tentukan grafik fungsi distribusi dari X dan Y. Tentukan juga
grafik dari fungsi kuantil dari variabel random X dan fungsi
kuantil variabel random Y.
Penyelesaian
Karena variabel random X berdistribusi N(0,1) maka variabel
random Y berdistribusi normal dengan mean
E[Y] = E[ 2X + 1 ] = 2 E[X] + 1 = 2 (0) + 1 = 1
dan variansi adalah
V[Y] = V[ 2X + 1 ] = 4 V[X] = 4 (1) = 4.
Grafik fungsi distribusi X dan Y dinyatakan pada Gambar
II.10.

14 | Adi Setiawan
Gambar II.10 Grafik fungsi distribusi variabel random X dan Y
(grafik titik-titik)

Soal 5
Variabel random X mempunyai distribusi chi-kuadrat dengan
derajat bebas  sehingga mempunyai fungsi kepadatan
probabilitas dengan
1
f ( x)   / 2 x / 2 1 e  x / 2
2 ( / 2)
untuk x > 0. Gambarkan grafik dari f(x), F(x) dan fungsi kuanti
F-1().
Penyelesaian
Grafik fungsi kepadatan probabilitas chi-kuadrat dengan
derajat bebas 5 dan fungsi distribusinya dinyatakan pada
Gambar II.11.

Analisis Data Statistik | 15


1.0
0.15

0.8
0.10

0.6
F(x)
f(x)

0.4
0.05

0.2
0.00

0.0
0 5 10 15 20 0 5 10 15 20

x x

Gambar II.11 Grafik fungsi kepadatan probabilitas dari distribusi chi-


kuadrat dengan derajat bebas 5 dan fungsi distribusinya.
15
10
F-1(alfa)

5
0

0.0 0.2 0.4 0.6 0.8 1.0

alfa

Gambar II.12 Grafik fungsi kuantil dari distribusi chi-kuadrat dengan


derajat bebas 5.

Soal 6
Variabel random X mempunyai distribusi Beta dengan
parameter  = 3 dan  = 4 sehingga mempunyai fungsi
kepadatan probabilitas
 (7)
f ( x)  x 31 (1  x) 41  60 x 2 (1  x)3
(3) (4)
untuk 0 < x < 1. Gambarkan grafik dari f(x), F(x) dan fungsi
kuanti F-1().

16 | Adi Setiawan
Penyelesaian
Grafik fungsi kepadatan probabilitas dari distribusi Beta
dengan parameter  = 3 dan  = 4 dan fungsi distribusinya
dinyatakan pada Gambar II.13.

1.0
2.0

0.8
1.5

0.6
F(x)
f(x)

1.0

0.4
0.5

0.2
0.0

0.0 0.4 0.8


0.0 0.0 0.4 0.8

x x

Gambar II.13 Grafik fungsi kepadatan probabilitas dari distribusi Beta


dengan parameter  = 3 dan  = 4 dan fungsi distribusinya.
1.0
0.8
0.6
F-1(alfa)

0.4
0.2
0.0

0.0 0.2 0.4 0.6 0.8 1.0

alfa

Gambar II.14 Grafik fungsi kuantil dari distribusi Beta dengan


parameter  = 3 dan  = 4.

Soal 7
Apabila dibangkitkan sampel ukuran 50 dari distribusi
eksponensial dengan mean 3 maka bagaimanakah grafik QQ-
plot sampel melawan distribusi teoritisnya ?

Analisis Data Statistik | 17


Penyelesaian
Grafik pada Gambar II.15 menyatakan grafik QQ-plot sampel
ukuran 50 dari distribusi eksponensial dengan mean 3
melawan distribusi teoritisnya. Terlihat bahwa titik-titik
dalam QQ-plotnya cenderung membentuk garis y = x.
10
Sample Quantiles

5
0

0 5 10

Theoritial Quantiles

Gambar II.15 QQplot Sampel Ukuran 50 dari Distribusi Eksponensial


dengan mean 3 melawan distribusi Eksponesial dengan mean 3

Soal 8
Apabila dibangkitkan sampel ukuran 50 dari distribusi Beta
dengan parameter  = 3 dan  = 4 maka bagaimanakah grafik
QQ-plot sampel melawan distribusi teoritisnya ?
Penyelesaian
Grafik pada Gambar II.16 menyatakan grafik QQ-plot sampel
ukuran 50 dari distribusi Beta dengan parameter  = 3 dan
 = 4 melawan distribusi teoritisnya. Terlihat bahwa titik-titik
dalam QQ-plotnya cenderung membentuk garis y = x.

18 | Adi Setiawan
1.0
0.8
Sample Quantiles

0.6
0.4
0.2
0.0

0.0 0.2 0.4 0.6 0.8 1.0

Theoritial Quantiles

Gambar II.16 QQplot Sampel Ukuran 50 dari Distribusi Beta dengan


parameter  = 3 dan  = 4 melawan distribusi Beta dengan
parameter  = 3 dan  = 4

Soal 9
Gambarkan grafik dari fungsi kuantil dari distribusi N(5,4)
yaitu F ( ) melawan F (1   ) dengan   (0,1). Grafik ini
1 1

dinamakan plot simetrik.


Penyelesaian

Grafik dari fungsi kuantil dari distribusi N(5,4) yaitu F ( )


1

melawan F (1   ) dengan   (0,1) dinyatakan pada Gambar


1

II.17. Terlihat bahwa grafiknya membentuk dari lurus sehingga


terlihat bahwa disribusi N(5,4) simetrik.

Analisis Data Statistik | 19


10
Fungsi kuantil 1-alfa dari N(5,4)

8
6
4
2
0

0 2 4 6 8 10
Fungsi kuantil alfa dari N
(5,4)

Gambar II.17 Grafik plot simetrik.

Soal 10
Berikan contoh-contoh lain dari distribusi N(5,4) yang
simetrik maupun yang tidak simetrik dan gambarkan plot
simetrik masing-masing.
Penyelesaian
Fungsi kuantil 1-alfa chi-kuadrat dgn df=5

15
2
Fungsi kuantil
1-alfa N(0,1)

10
0

5
-2 -1

-2 -1 0 1 2 0 5 10 15

Fungsi kuantil alfa N(0,1) Fungsi kuantil alfa chi-kuadrat dgn df=5
Fungsi kuantil 1-alfa Beta(3,3)

Fungsi kuantil 1-alfa Exp(1/4)


0.8

15
10
0.4

5
0.0

0.0 0.2 0.4 0.6 0.8 1.0 0 5 10 15

Fungsi kuantil alfa Beta(3,3) Fungsi kuantil alfa Exp(1/4)

Gambar II.18 Grafik plot simetrik

20 | Adi Setiawan
Grafik dari fungsi kuantil F ( ) melawan fungsi kuantil
1

F 1 (1   ) dengan   (0,1) dari berbagai distribusi dinyatakan


pada Gambar II.18. Terlihat bahwa grafiknya membentuk
dari lurus untuk distribusi N(0,1) dan Beta(3,3) sehingga
kedua distribusi simetrik. Pada grafik distribusi chi-kuadrat
dengan derajat bebas 5 dan distribusi eksponensial dengan
mean 4 masing-masing grafiknya tidak membentuk garis
lurus sehingga kedua disribusi tidak simetrik.

Analisis Data Statistik | 21


LATIHAN

1. Variabel random X berdistribusi seragam pada (0,1).


Tentukan fungsi kepadatan probabilitas f(x), fungsi
distribusi F(x) dan fungsi kuantilnya.
2. Variabel random X berdistribusi eksponensial dengan
mean 3. Tentukan fungsi kepadatan probabilitas f(x),
fungsi distribusi F(x) dan fungsi kuantilnya.
3. Variabel random X mempunyai fungsi kepadatan
probabilitas
f ( x)  k x 2
dengan 0 < x < 3. Tentukan k sehingga f(x) merupakan
fungsi kepadatan probabilitas, fungsi distribusi F(x) dan
fungsi kuantilnya.
4. Variabel random X mempunyai distribusi Gamma
dengan parameter  = 4 dan  = 3. Berikan bentuk
fungsi kepadatan probabilitas dari variabel random X.
Gambarkan juga grafik fungsi kepadatan probabilitas,
fungsi distribusi dan fungsi kuantilnya.
5. Variabel random X mempunyai distribusi Beta dengan
parameter  = 4 dan  = 3. Berikan bentuk fungsi
kepadatan probabilitas dari variabel random X.
Gambarkan juga grafik fungsi kepadatan probabilitas,
fungsi distribusi dan fungsi kuantilnya.
6. Apabila dibangkitkan sampel ukuran 50 dari distribusi
Gamma dengan parameter  = 3 dan  = 4 maka
bagaimanakah grafik QQ-plot sampel melawan distribusi
teoritisnya ?
7. Apabila dibangkitkan sampel ukuran 50 dari distribusi
chi-kuadrat dengan derajat bebas 5 maka bagaimanakah
grafik QQ-plot sampel melawan distribusi teoritisnya ?
8. Gunakan plot simetrik untuk mengecek apakah
distribusi Beta (4,3) simetrik atau tidak.

22 | Adi Setiawan
9. Gunakan plot simetrik untuk mengecek apakah distribusi
Gamma(4,3) simetrik atau tidak.
10. Gunakan plot simetrik untuk mengecek apakah laju
inflasi bulanan Kota Ambon periode Januari 2009 sampai
dengan Juni 2013 simetrik. Ulangi pertanyaan yang
sama untuk Kota Jayapura.

Tabel II.2 Tabel laju inflasi Bulanan Kota Ambon dan Kota Jayapura
dari bulan Januari 2009 s/d Juni 2013.
BULAN AMBON JAYAPURA BULAN AMBON JAYAPURA

Januari 2009 1,22 -1,27 April 2011 0,09 -0,24


Februari 2009 0,71 -0,44 Mei 2011 1,66 0,5

Maret 2009 0,32 1,67 Juni 2011 3,76 0,6

April 2009 0,4 -0,03 Juli 2011 -1,2 0,22


Mei 2009 -0,11 -1,31 Agustus 2011 0,83 1,14

Juni 2009 -2,7 1 September 2011 -0,4 -1,07


Juli 2009 1,1 -0,56 Oktober 2011 -0,67 0,02

Agustus 2009 1,27 0,81 November 2011 -0,34 0,89

September 2009 -0,55 1,29 Desember 2011 0,43 0,36

Oktober 2009 0,76 -0,64 Januari 2012 1,62 0,06

November 2009 0,5 1,12 Februari 2012 1,31 0,93

Desember 2009 3,49 0,31 Maret 2012 1,33 -1,44

Januari 2010 3,23 1,28 April 2012 0,79 0,7

Februari 2010 -0,65 -0,52 Mei 2012 0,06 -0,94

Maret 2010 0,27 0,56 Juni 2012 2,39 0,96

April 2010 -0,51 -0,51 Juli 2012 1,7 0,63

Mei 2010 -0,07 0,71 Agustus 2012 0,19 0,65

Juni 2010 0,85 0,84 September 2012 -1,87 0,12

Juli 2010 1,28 0,24 Oktober 2012 -2,44 0,15

Agustus 2010 2,4 0,52 November 2012 0,63 0,1

September 2010 0,95 0,59 Desember 2012 0,94 2,57

Oktober 2010 -0,29 -1,52 Januari 2013 1,81 0,4

November 2010 -0,24 0,37 Februari 2013 -2,29 3,15

Desember 2010 1,3 1,87 Maret 2013 0,79 -2,63

Januari 2011 -0,83 1,79 April 2013 0,27 -0,6

Februari 2011 0,04 -0,79 Mei 2013 2,25 0,97

Maret 2011 -0,46 -0,03 Juni 2013 -0,15 0,52

Analisis Data Statistik | 23


BAB III
UJI KECOCOKAN : DISTRIBUSI NORMAL

Di samping QQ-plot seperti yang telah dijelaskan pada


Bab II, terdapat metode formal yang dapat digunakan untuk
menguji apakah suatu data berasal dari distribusi yang biasa
dikenal. Dalam pasal ini, akan dibahas tentang uji kecocokan.
Uji ini untuk menguji hipotesis nol bahwa data berasal dari
suatu keluarga distribusi, yaitu
H0: F  F0
melawan hipótesis alternatif A : F  F 0 . Beberapa uji yang
sering digunakan akan dibahas dalam pasal berikut ini.

III.1 Uji Kolmogorov-Smirnov

Misalkan X 1 ,..., X n independent dan berdistribusi


indentik. Distribusi fungsi empirik dari X 1 ,..., X n adalah
fungsi
^
F n ( x)  (1 / n) j 1 .
{ x j  x}

Fungsi indikator 1 { xj x} artinya 0 jika X j  x . Besaran stokastik


^
n F n ( x) sama dengan #( X j  x ) yaitu banyaknya datum yang
kurang dari atau sama dengan x.
Pengujian untuk hipotesis nol bahwa distribusi yang
sebenarnya dari X 1 ,..., X n sama dengan F didasarkan pada
^
ukuran jarak antara Fn dan F. Hipotesis nol ditolak
^
didasarkan pada jarak vertikal maksimal antara F n dan F n :
^
Dn  sup  x | F n ( x)  Fn ( x) | .

24 | Adi Setiawan
Hipotesis nol akan ditolak untuk D n nilai besar. Distribusi
Dn tidak terdistribusi seperti yang biasa dikenal dan nilai
kritiknya dapat dihitung dengan komputer. Secara praktis
statistic D n dapat dihitung dengan rumus
 i i 1 
Dn  maxmax{ F ( X (i ) )  , F ( X ( i ) )  } .
 n n 
Suatu sifat yang membuat uji Kolmogorov-Smirnov
sangat bernilai adalah bahwa distribusi D n di bawah hipotesis
nol untuk setiap fungsi distribusi kontinu akan sama. Karena
Dn bebas distribusi atas kelas dari fungsi distribusi kontinu
maka nilai kritik tidak tergantung pada F sehingga dengan
suatu tabel dapat ditentukan nilai kritiknya (Tabel Kolmogorov-
Smirnov pada Lampiran 1).
Gambar III.1 memberikan distribusi empirik dari
sampel yang diambil dari distribusi N(0,1) (dalam bentuk
fungsi tangga – step function) dan fungsi distribusi dari N(0,1)
yang sebenarnya.

ecdf(x)
1.0
0.8
0.6
Fn(x)

0.4
0.2
0.0

-4 -2 0 2 4

Gambar III.1 Distribusi empirik data hasil pengambilan sampel


ukuran 15 dari distribusi normal dan fungsi distribusi yang sebenarnya

Analisis Data Statistik | 25


Contoh III.1
Misalkan dibangkitkan sampel random ukuran 15 dari
distribusi eksponensial standard. Dengan uji Kolmogorov-
Smirnov dapat diuji apakah sampel random tersebut memang
berasal dari distribusi eksponensial standard. Sampel
random tersebut diberikan di bawah ini :
0.4568, 0.6690, 1.2043, 0.4441, 0.2175
1.0768 2.3655 0.2101 1.0593 3.0576
1.8560 0.6053 0.0175 1.4469 1.5702.
Untuk mendapatkan nilai statistik uji Kolmogorov-Smirnov
digunakan bantuan Tabel III.1. Pada kolom pertama, data
diurutkan dari nilai terkecil ke nilai terbesar. Dalam hal ini,
F(x) adalah fungsi distribusi dari distribusi eksponensial
dengan rata-rata 1 yaitu F(x) = 1-exp(-x) untuk x > 0.

Tabel III.1 Tabel perhitungan statistik Kolmogorov-Smirnov

i 1
a  F X (i )  b  F X ( i )  
i
X (i ) max { a , b }
n n
0,0175 0,0493 0,0173 0,0493
0,2101 0,0562 0,1228 0,1228
0,2175 0,0045 0,0621 0,0621
0,4441 0,0919 0,1586 0,1586
0,4568 0,0334 0,1000 0,1000
0,6053 0,0541 0,1208 0,1208
0,6690 0,0211 0,0878 0,0878
1,0593 0,1200 0,1866 0,1866
1,0768 0,0593 0,1260 0,1260
1,2043 0,0334 0,1000 0,1000
1,4469 0,0314 0,0980 0,0980
1,5702 0,0080 0,0587 0,0587
1,8560 0,0230 0,0437 0,0437
2,3655 0,0272 0,0394 0,0394
3,0576 0,0470 0,0197 0,0470
D n = 0,1866

26 | Adi Setiawan
Nilai statistik uji Kolmogorov-Smirnov tersebut dibanding-
kan dengan nilai kritik yang didapat dalam tabel Kolmogorov-
Smirnov dua sisi untuk ukuran n = 15 dengan memilih 
=0,05 yaitu 0,338. Karena D n = 0,1866 lebih kecil dari nilai
kritik yaitu 0,338 maka hipotesis yang menyatakan bahwa
nilai populasinya eksponensial standard adalah benar. Grafik
distribusi empirik dari data tersebut dapat dilihat pada
Gambar III.2.

ecdf(x)
1.0
0.8
0.6
Fn(x)

0.4
0.2
0.0

0 1 2 3 4 5

Gambar III.2 Distribusi empirik data hasil pengambilan sampel


ukuran 15 dari distribusi eskponensial dan fungsi distribusinya

Uji Kolmogorov-Smirnov dapat digunakan untuk menguji


normalitas dari data. Hal itu dapat dinyatakan dalam contoh
berikut ini.

Contoh III.2
Misalkan dimiliki data
42, 46, 44, 48, 47, 48, 48, 57, 55, 55

Analisis Data Statistik | 27


dan akan diuji apakah data mengikuti distribusi normal dengan
menggunakan uji Kolmogorov-Smirnov. Untuk membantu
menentukan Dn digunakan Tabel III.2. Dalam hal ini, F(x)
adalah fungsi distribusi normal dengan mean 49 dan sim-
pangan baku 5,0111. Diperoleh bahwa Dn = 0,2791 sedangkan
titik kritisnya adalah 0,409 dengan tingkat keberartian  =
5% sehingga H0 diterima. Hal itu berarti bahwa data ber-
distribusi normal dengan mean 49 dan simpangan baku
5,0111.

Tabel III.2 Tabel perhitungan statistik uji Kolmogorov-Smirnov.

i 1
F ( x(i ) ) a  F X (i )  n b  F X (i )   n
i
Data
No Max{a, b}
Terurut

1 42 0.0812 0.0188 0.0812 0.0812


2 44 0.1592 0.0408 0.0592 0.0592
3 46 0.2747 0.0253 0.0747 0.0747
4 47 0.3449 0.0551 0.0449 0.0551
5 48 0.4209 0.0791 0.0209 0.0791
6 48 0.4209 0.1791 0.0791 0.1791
7 48 0.4209 0.2791 0.1791 0.2791
8 55 0.8844 0.0844 0.1844 0.1844
9 55 0.8844 0.0156 0.0844 0.0844
10 57 0.9448 0.0552 0.0448 0.0552
Dn =
0,2791

Contoh III.3
Berdasarkan data pada Contoh II.4, diperoleh statistik hitung
uji Kolmogorov-Smirnov Dn = 0,1086 dan dengan tingkat
keberartian 5% diperoleh titik kritis 0,221 sehingga H0
diterima berarti data inflasi bulanan nasional Indonesia
periode Januari 2009 sampai dengan Desember 2011
berdistribusi normal dengan rata-rata 0,3675 dan simpangan
baku 0,4337.

28 | Adi Setiawan
III.2 Uji Chi-kuadrat
Selain uji Kolmogorov-Smirnov dapat juga digunakan
uji Chi-Kuadrat. Uji ini dilakukan dengan mulai membagi
garis dalam sejumlah interval tertutup I 1 ,…, I K
……I1……|……I2……|………………………………|…Ik……..
Selanjutnya didefinisikan N i sebagai jumlah pengamatan
pada interval I i dan dihitung statistik
k
[ N i  npi ]2

2
X i 1 npi
dengan pi probabilitas atas F pada I i . Bilangan npi adalah
harapan dari N i jika distribusi yang sebenarnya dari pengamatan
sama dengan F. Besaran X 2 dibawah hipotesis nol menentukan
berapa frekuensi pengamatan N i menyimpang dari harapan.
Hipotesis nol bahwa pengamatan berasal dari F ditolak untuk
nilai X 2 besar. Distribusi X 2 mendekati distribusi 2 dengan
derajat bebas k-1 untuk n besar.

Contoh III.4
Lima puluh dua digit diambil secara random dari buku
telepon. Bilangan-bilangan itu setelah diurutkan dapat dinyata-
kan sebagai berikut :
23 23 24 27 29 31 32 33 33 35
36 37 40 42 43 43 44 45 48 48
54 54 56 57 57 58 58 58 58 59
61 61 62 63 64 65 66 68 68 70
73 73 74 75 77 81 87 89 93 97.
Dengan menggunakan uji chi-kuadrat akan dilakukan pengu-
jian hipotesis bahwa distribusinya normal dengan meannya
55 dan deviasi standard 19. Apabila dilakukan dengan
pembagian 6 interval maka didapat pembagian interval
sebagai berikut:

Analisis Data Statistik | 29


(   , 34,5], ( 34,5 , 46,5 ], ( 46,5 , 59,5 ], ( 59,5 , 70,5 ] , ( 70,5 , 82,5 ] ,
( 82,5 ,  ).

Untuk mendapatkan nilai X 2 digunakan Tabel III.3. Hipotesis


akan ditolak untuk tingkat keberartian  = 0,05 jika X 2 lebih
besar dari nilai chi-kuadrat tabel dengan dengan derajat
bebas 5 yaitu 11,07 (lihat Lampiran 2). Karena X 2 lebih kecil
dari nilai tabel maka hipotesis nol tidak ditolak. Jadi hipotesis
yang menyatakan bahwa distribusi populasinya berdistribusi
N(55, (19) 2 ) tidak ditolak. Pada sisi lain, karena nilai harapan
kelas ke-6 kurang dari 5, bila kelas ke-6 digabung dengan
kelas ke-5 maka akan diperoleh X2 = 0,977 dan titik kritis
9,4878. Akibatnya H0 tetap diterima sehingga distribusi
sampel adalah normal.

2
No Interval Frekuensi (N i ) Harapan (np i ) (N i - np i ) / np i
1 (   , 34,5], 9 7 0,286
2 ( 34,5 , 46,5 ], 9 9,3 0,097
3 ( 46,5 , 59,5 ], 11 13,4 0,423
4 ( 59,5 , 70,5 ], 11 9,8 0,147
5 ( 70,5 , 82,5 ], 6 6,8 0,094
6 ( 82,5 ,  ) 4 3,7 0,024
X 2 = 1,071

III.3 Uji Lilliefors

Dengan uji chi-kuadrat, data yang dimiliki harus dikelom-


pokkan sehingga haruslah cukup banyak untuk dapat dikelom-
pokkan dengan baik. Satu kelemahan lain dari metode chi-
kuadrat adalah bahwa metode ini merupakan metode pen-
dekatan.
Uji Lilliefors dapat digunakan untuk sampel kecil dan
data tidak perlu dikelompokkan. Uji ini digunakan untuk
menguji normalitas dari data. Prosedur uji Lilliefors dapat
dijelaskan berikut ini. Misalkan dimiliki sampel random
berukuran n yaitu X1, X2, …, Xn yang diambil dari suatu

30 | Adi Setiawan
populasi yang distribusinya tidak diketahui. Dihitung mean
1 n
sampel X   X i sebagai estimasi dari  mean populasinya
n i 1
yang tidak diketahui dan deviasi standard sampel
1 n
s  ( X i  X )2
n  1 i 1
sebagai estimasi deviasi standard populasi  yang juga tidak
diketahui. Selanjutnya dihitung nilai variabel unit standard
Zi dengan rumus
Xi  X
Zi 
s
dengan i = 1, 2, …., n. Nilai statistik uji Lilliefors dihitung dari
nilai-nilai Zi, i = 1, 2, ….,, n dengan langkah-langkah sebagai
berikut :
a) Hipotesis :
H0 : Sampel random berasal dari populasi normal.
H1 : Distribusi populasinya tidak normal.
b) Dipilih tingkat keberartian α.
c) Digunakan statistik uji yang didefinisikan sebagai jarak
vertikal maksimum antara fungsi distribusi empirik
sampel X1, X2, …, Xn dengan fungsi distribusi normal
dengan mean X dan deviasi standard s yakni
T  max | F * ( x)  S ( x) | .
x

dengan F*(x) merupakan fungsi distribusi kumulatif


normal standard dan S(x) adalah fungsi distribusi
kumulatif empirik Zi. Daerah kritik uji normalitas ini
adalah Ho ditolak jika nilai statistik uji T lebih besar
dari nilai kuantil (1 - α).
d). Perhitungan
Berdasarkan data sampel X1, X2, …, Xn dihitung mean
X dan deviasi standard s. Selanjutnya data diurutkan
dari kecil ke besar. Untuk tiap-tiap Xi yang telah terurut

Analisis Data Statistik | 31


itu kita hitung harga Zi dan distribusi normal kumulatif
yaitu F*(xi) dan juga harga distribusi kumulatif empirik
S(xi). Kemudian dihitung statistik uji
T  max | F * ( x)  S ( x) |
x

yaitu dicari selisih antara F*(x) dan S(x) yang terbesar.


e). Kesimpulan
Dengan membandingkan T dengan daerah kritik maka
dapat diambil kesimpulan.

Contoh III.5

Tabel III.3 Tabel perhitungan statistik uji Lilliefors.

No Data Terurut Zi F (Z i ) S ( X (i ) ) F (Z i )  S ( X (i} )


1 42 -1.3969 0.0812 0.1000 0.0188
2 44 -0.9978 0.1592 0.2000 0.0408
3 46 -0.5987 0.2747 0.3000 0.0253
4 47 -0.3991 0.3449 0.4000 0.0551
5 48 -0.1996 0.4209 0.5000 0.0791
6 48 -0.1996 0.4209 0.6000 0.1791
7 48 -0.1996 0.4209 0.7000 0.2791
8 55 1.1973 0.8844 0.8000 0.0844
9 55 1.1973 0.8844 0.9000 0.0156
10 57 1.5965 0.9448 1.0000 0.0552
T = 0.2791

Dengan menggunakan data seperti pada Contoh III.2, akan


diuji apakah data berdistribusi normal dengan menggunakan
metode Lilliefors dan tingkat keberartian 5%. Dari data
diperoleh statistik uji Lilliefors yaitu T = 0,2791 dan titik kritis
adalah 0,258 sehingga H0 ditolak sehingga data tidak
berdistribusi normal (lihat Lampiran 3).

32 | Adi Setiawan
Contoh III.6
Berdasarkan data pada Contoh II.4, diperoleh statistik hitung
uji Lilliefors T = 0,1086 dan dengan tingkat keberartian 5 %
diperoleh titik kritis 0,1477 sehingga H0 diterima berarti data
inflasi bulanan nasional Indonesia periode Januari 2009
sampai dengan Desember 2011 berdistribusi normal dengan
rata-rata 0,3675 dan simpangan baku 0,4337. Kesimpulan
yang sama juga diperoleh jika digunakan uji Kolmogorov-
Smirnov.

***

Analisis Data Statistik | 33


SOAL & PENYELESAIAN

Soal 1
Dengan tingkat keberartian 5%, ujilah apakah data laju inflasi
bulanan di kota Ambon untuk periode Januari 2009 sampai
dengan Juni 2013 mempunyai distribusi normal dengan metode
Kolmogorov-Smirnov.
Penyelesaian
Dengan menggunakan data pada Tabel II.2, diperoleh statistik
Kolmogorov-Smirnov Dn = 0,0836 sedangkan titik kritis diperoleh
dari Tabel Kolmogorov-Smirnov (Lampiran 1) dengan ukuran
1,36
sampel n = 54 yaitu  0,1851 sehingga
54
Dn = 0,0836 < 0,1851.
Akibatnya H0 diterima sehingga data laju inflasi di kota
Ambon berdistribusi normal.

Soal 2
Dengan tingkat keberartian 5%, ujilah apakah data laju inflasi
bulanan di kota Ambon untuk periode Januari 2009 sampai
dengan Juni 2013 mempunyai distribusi normal dengan
metode Lilliefors.
Penyelesaian
Dengan menggunakan data pada Tabel II.2, diperoleh statistik
Lilliefors T = 0,0836 sedangkan titik kritis diperoleh dari Tabel
0,886
Lilliefors dengan ukuran sampel n = 54 yaitu  0,1206 .
54
Akibatnya H0 diterima sehingga data laju inflasi di kota
Ambon berdistribusi normal.

34 | Adi Setiawan
Soal 3
Tabel III.4 menyatakan data berkelompok. Dengan tingkat
keberartian 5% dan metode chi-kuadrat, tentukan apakah
data berkelompok pada Tabel III.4 berdistribusi normal.
Penyelesaian
Berdasarkan data pada Tabel III.4, mean untuk data ber-
kelompok 56,7 dan simpangan baku untuk data berkelompok
adalah 15,3645 sehingga dapat ditentukan nilai harapan
untuk masing-masing kelas seperti dinyatakan pada Tabel
III.5. Nilai harapan kelas pertama dapat diperoleh dari nilai
Z1 diperoleh dari tepi kelas atas pertama yaitu
19,5  x 19,5  56,7
Z1     2,4212
s 15,3645
sehingga diperoleh
p1  P(Z  z1 )  P(Z   2,4212)  0,0077
(lihat Lampiran 4) dan nilai harapan kelas pertama sebesar
np1 = 150(0,0077) = 1,1602.
Nilai Z2 diperoleh
29,5  x 29,5  56,7
Z2     1,7703
s 15,3645
sehingga diperoleh
p2  P( z1  Z  z2 )  P(Z   1,7703)  P(Z   2,4212)  0,0306
dan nilai harapan kelas kedua sebesar
np2 = 150(0,0306) = 4,5906.
Dengan cara yang sama, dapat diperoleh nilai harapan untuk
kelas ke-3 sampai dengan kelas ke-8. Selanjutnya, nilai Z8
diperoleh
89,5  x 89,5  56,7
Z8    2,1348
s 15,3645
sehingga
p9 1  P( Z  z8 ) 1  0,9836  0,0164
dan nilai harapan kelas ke-9 adalah
np9 = 150(0,0164) = 2,4584.

Analisis Data Statistik | 35


Namun demikian, karena nilai harapan kelas pertama dan
kelas kedua kurang dari 5 maka keduanya digabung menjadi
satu, demikian juga untuk nilai harapan dari kelas ke-9
kurang dari 5 sehingga digabungkan dengan nilai harapan
kelas ke-8 sehingga diperoleh hasil seperti pada Tabel III.6.
Akibatnya, diperoleh statistik uji chi-kuadrat adalah X2 =
3,5754 dan titik kritis untuk tingkat keberartian 5% adalah
distribusi chi-kuadrat dengan derajat bebas 6 adalah 12,5916
sehingga H0 diterima. Hal itu berarti bahwa data berkelompok
diperoleh dari sampel yang berasal dari distribusi normal.
Tabel III.4 Data Berkelompok pada Soal III.3

No Kelas Interval Frekuensi (f i)


1 10-19 1
2 20-29 6
3 30-39 9
4 40-49 31
5 50-59 42
6 60-69 32
7 70-79 17
8 80-89 10
9 90-99 2
Total 150

Tabel III.5 Data Berkelompok dan Nilai Harapannya pada Soal III.3

No Kelas Interval Frekuensi (f i) Nilai Harapan (npi)


1 10-19 1 1,1603
2 20-29 6 4,5904
3 30-39 9 13,9700
4 40-49 31 28,2303
5 50-59 42 37,8943
6 60-69 32 33,7951
7 70-79 17 20,0227
8 80-89 10 7,8785
9 90-99 2 2,4584
Total 150

36 | Adi Setiawan
Tabel III.6 Tabel Bantu Perhitungan Statistik X2 pada Soal III.3

Nilai ( f i  npi ) 2
Harapan (npi) npi
No Kelas Interval Frekuensi (f i)
1 20-29 6 5,7508 0,2714
2 30-39 9 13,9700 1,7682
3 40-49 31 28,2303 0,2717
4 50-59 42 37,8943 0,4448
5 60-69 32 33,7951 0,0954
6 70-79 17 20,0227 0,4563
7 80-89 10 10,3369 0,2676
Total 150 150 3,5754

Soal 5
Dengan tingkat keberartian 5% dan dengan menggunakan
metode chi-kuadrat, ujilah apakah data laju inflasi bulanan
di kota Ambon dari periode Januari 2009 sampai dengan Juni
2013 berdistribusi normal ?
Penyelesaian
Untuk memudahkan pemilihan interval yang digunakan dalam
penggunaan metode chi-kuadrat dibantu dengan grafik
histogram yang diperoleh dari paket program R yang dinyatakan
pada Gambar III.4 sehingga dapat diperoleh tabel data
berkelompok pada Tabel III.7. Nilai harapan diperoleh dari
anggapan bahwa sampelnya diambil dari distribusi normal.
Tetapi karena terdapat interval yang harga harapannya
kurang dari 5 maka digabungkan menjadi 1 yaitu interval 1
digabungkan dengan interval kedua sedangkan interval 6 dan
7 digabungkan dengan interval ke 5 sehingga diperoleh hasil
seperti pada Tabel III.8. Selanjutnya dapat dihitung
X2hitung = 11,4040.
Dengan menggunakan tingkat keberartian  = 5 % diperoleh
titik kritis dari distribusi Chi-kuadrat dengan derajat bebas 3

Analisis Data Statistik | 37


yaitu 7,81 (Lampiran 2) sehingga hipotesis nol yang menyatakan
bahwa data inflasi bulanan kota Ambon berdistribusi normal
ditolak.

Tabel III.7 Tabel Bantu Perhitungan Statistik X2 pada Soal III.5

No Kelas Interval Frekuensi (f i) Nilai Harapan (npi)


1 Kurang dari -2,00 3 1,2285
2 -1,99 s/d -1,00 2 7,3389
3 -0,99 s/d 0,00 13 18,4326
4 0,01 s/d 1,00 19 18,4326
5 1,01 s/d 2,00 11 7,3389
6 2,01 s/d 3,00 3 1,1556
7 Lebih dari 3 3 0,0729
Jumlah 54

Histogram of ambon
15
Frequency

10
5
0

-3 -2 -1 0 1 2 3 4

ambon

Gambar III.4 Histogram Data Inflasi Bulanan Kota Ambon Januari 2009
sampai dengan Juni 2013

38 | Adi Setiawan
Tabel III.8 Tabel Bantu Perhitungan Statistik X2 pada Soal III.5
Nilai ( f i  npi ) 2
Harapan npi
No Kelas Interval Frekuensi (f i) (npi)
1 Kurang dari -1,00 5 8,5674 1,4854
2 -0,99 s/d 0,00 13 18,4326 1,6011
3 0,01 s/d 1,00 19 18,4326 0,0175
4 Lebih dari 1,00 17 8,5674 8,3000
Total 54 54 11,4040

Analisis Data Statistik | 39


LATIHAN

1. Dengan tingkat keberartian 10%, ujilah dengan metode


Kolmogorov-Smirnov apakah data laju inflasi di kota
Jayapura pada Tabel II.2 berdistribusi normal.
2. Dengan tingkat keberartian 10%, ujilah dengan metode
Liliefors apakah data laju inflasi di kota Jayapura pada
Tabel II.2 berdistribusi normal.
3. Lakukan hal yang sama pada soal 2 dengan menggunakan
metode chi-kuadrat.
4. Gunakan tingkat signifikansi 10% untuk menguji
apakah data yang dinyatakan dalam Tabel III.7 mem-
punyai distribusi normal.

Tabel III.7 Tabel Distribusi Frekuensi

No Kelas Interval Frekuensi ( f i )


1 3-4 2
2 5-6 2
3 7-8 8
4 9-10 11
5 11-12 6
6 13-14 1

5. Berdasarkan pada soal 3, dengan menggunakan tingkat


keberartian yang berbeda yaitu 5% dan 1%, apakah
kesimpulan yang sama juga diperoleh ?

*****

40 | Adi Setiawan
BAB IV
UJI KECOCOKAN : DISTRIBUSI MULTINOMIAL

Distribusi Multinomial merupakan perumuman (generali-


zation) dari distribusi binomial yaitu dengan melonggarkan kriteria
banyaknya hasil (outcome) yang mungkin diperoleh menjadi
lebih dari 2. Dalam hal ini, percobaan (experiment) tersebut
dinamakan percobaan multinomial sedangkan distribusi proba-
bilitas yang diperoleh dinamakan distribusi multinomial.

Definisi IV.1
Percobaan multinomial terdiri dari n usaha (trial) dan tiap usaha
menghasilkan k hasil yang bereda yaitu E1, E2, ..., Ek serta
masing-masing dengan probabilitas p1, p2, ..., pk. Distribusi
multinomial akan memberikan probabilitas bahwa E1 akan muncul
sebanyak y1, E2 akan muncul sebanyak y2 kali dan seterusnya
dalam pengambilan saling bebas sebanyak n kali sehingga y1 +
y2 + .... + yk = n sehingga
 n  y1 y2
f ( y1 , y2 ,...., yk ; p1 , p2 ,...., pk )    p1 p2 ....pk yk
 y1 , y2 ,..., yk 
dengan p1 + p2 + .... + pk = 1 dan yi  0 untuk i = 1, 2, ...,k.

Contoh IV.1
Berdasarkan teori genetika, perbandingan seekor hamster betina
akan melahirkan anak dengan bulu merah, hitam dan putih adalah
8:4:4. Tentukan probabilitas bahwa akan lahir 8 ekor anak yang
terdiri dari 5 ekor merah, 2 ekor hitam dan 1 ekor putih.
Penyelesaian
Berdasarkan informasi di atas diperoleh
p1 = P( mendapatkan hamster merah) = 1/2,
p2 = P( mendapatkan hamster hitam) = 1/4,
p3 = P( mendapatkan hamster putih) = ½.

Analisis Data Statistik | 41


Akibatnya probabilitas bahwa dari 8 ekor anak yang dilahirkan
akan terdiri dari 5 ekor merah, 2 ekor hitam dan 1 ekor putih
adalah
 8 
f (5,2,1;0,5,0,25,0,25)   (0,5) 5 (0,25) 2 (0,25)1
 5,2,.1
= 0,0820.

Uji Kecocokan (Goodness of fit Test)


Untuk melakukan uji kecocokan bahwa sampel atau hasil
pengamatan mengikuti distribusi multiomial dengan parameter
n dan p = (p1, p2, .... ,pk) dengan
p1 + p2 + .... + pk = 1
digunakan langkah-langkah sebagai berikut :
Langkah 1
Nyatakan hipotesis nol dan hipotesis alternatifnya.
Langkah 2
Diambil sampel random dan ditentukan frekuensi pengamatan fi
untuk masing-masing k kategori.
Langkah 3
Dengan menganggap H0 benar, frekuensi harapan ei dihitung
untuk tiap kategori yaitu dengan mengalikan probabilitas tiap
kategori dengan ukuran sampel (sample size) n.
Langkah 4
Hitung statistik uji
k
( f i  ei ) 2
X 2 
i 1 ei
dengan
fi = frekuensi pengamatan untuk kategori i,
ei = frekuensi harapan untuk i,
k = banyaknya kategori.
Catatan : Statistik tersebut mempunyai distribusi Chi-
kuadrat dengan derajat bebas k-1 asalkan frekuensi harapan
untuk semua kategori lebih dari 5.

42 | Adi Setiawan
Langkah 5
Hipotesis nol H0 ditolak jika nilai-p <  dengan  tingkat
keberartian atau jika X2hitung >   ; k 1 dengan adalah kuantil
2

ke-(1-)  100 %.

Contoh IV.2
Misalkan seorang pengembang perumahan menjual 3 tipe
rumah yaitu tipe mawar, tipe menur dan tipe melati. Apabila
dari 100 rumah yang dimiliki, 25 rumah tipe mawar, 35 rumah
tipe menur dan 40 rumah tipe melati, apakah ada tipe rumah
yang lebih disukai dibandingkan dengan tipe yang lain?
Gunakan tingkat keberartian 5%.
Penyelesaian
Dalam permasalahan ini, diinginkan untuk menguji hipotesis
nol H0 : tidak ada tipe rumah yang lebih disukai dibandingkan
dengan tipe yang lain (p1 = p2 = p3 = 1/3), hipotesis alternatif
H1 : ada tipe rumah yang lebih disukai dibandingkan dengan
tipe yang lain, dengan tingkat keberartian 5%. Di bawah H0
benar maka
e1 = e2 = e3 = 33,3333
sehingga diperoleh statistik uji
k
( f i  ei ) 2 (25  33,3333) 2 (35  33,3333) 2 (40  33,3333) 2
X 2    
i 1 ei 33,3333 33,3333 33,3333
= 3,5000.
Hipotesis nol ditolak jika X2hitung lebih besar dari titik kritis
 2 ; k 1 yaitu 5,9915. Akibatnya hipotesis nol H0 diterima
sehingga tidak ada tipe rumah yang lebih disukai dibandingkan
dengan tipe yang lain.

Analisis Data Statistik | 43


SOAL & PENYELESAIAN

Soal 1
Dalam suatu populasi, 70% populasi tersebut mengunakan
tangan kanan, 20% menggunakan tangan kiri dan 10% dapat
menggunakan kedua tangannya. Jika 10 orang diambil dari
populasi tersebut maka :
a. Berapa probabilitasnya bahwa semuanya dapat meng-
gunakan tangan kanannya?
b. Berapa probabilitasnya bahwa 7 orang menggunakan
tangan kanan, 2 orang menggunakan tangan kiri dan 1
orang dapat menggunakan kedua tangannya?
Penyelesaian
Percobaan tersebut termasuk dalam percobaan multinomial
dengan parameter n =10, p1 = 0,7, p2 = 0,2 dan p3 = 0,1
sehingga jika dimisalkan X1 = banyaknya orang yang dapat
menggunakan tangan kanannya, X2 = banyaknya orang yang
dapat menggunakan tangan kirinya dan X3 = banyaknya
orang yang dapat menggunakan kedua tangannya maka
a. Probabilitasnya bahwa semuanya dapat menggunakan
kedua tangannya adalah
 10 
P(X1 = 10, X2 = 0, X3 = 0) =  (0,7)10  0,0282.
10,0,0 
b. Probabilitasnya bahwa semuanya dapat menggunakan
kedua tangannya adalah
 10 
P(X1 = 7, X2 = 2, X3 = 1) =  (0,7)7 (0,2) 2 (01)1  0,1186.
 7, 2,1 

Soal 2
Manusia dapat dikasifikasikan ke dalam golongan darah tipe
O, A, B dan AB. Dalam suatu populasi, proporsi masing-
masing golongan darah tersebut adalah 0,45, 0,40, 0,10 dan

44 | Adi Setiawan
0,05. Misalkan 6 orang diambil secara random dari populasi
tersebut :
a. Berapakah probabilitas bahwa terdapat 3 golongan
darah O dan 3 golongan darah A?
b. Berapa probabilitasnya tidak ada golongan darah AB?
Penyelesaian
a. Percobaan tersebut termasuk percobaan multinomial
dengan parameter n = 6, pO = 0,45, pA = 0,4, pB = 0,1
dan pAB=0,05 sehingga jika dimisalkan XO= banyaknya
orang golongan darah tipe O, XA = banyaknya orang
dengan golongan darah tipe A , XB = banyaknya orang
dengan golongan darah tipe B dan XAB = banyaknya
orang dengan golongan darah tipe B maka probabili-
tasnya bahwa semuanya dapat menggunakan kedua
tangannya adalah
P(XO = 3, XA = 3, XB = 0, XAB = 0)
 6 
=  (0,45)3 (0,4)3  0,1166.
 3,3,0,0 
b. Percobaan tersebut termasuk percobaan binomial dengan
parameter n = 6 dan pAB = 0,05 sehingga jika dimisalkan
X = banyaknya orang golongan darah tipe AB maka
probabilitasnya bahwa semuanya dapat menggunakan
kedua tangannya adalah

 6
P(X = 0) =  (0,95) (0,05)  0,7351.
6 0

 0

Soal 3
Gunakan statistik X2 dengan tingkat keberartian 10% untuk
menguji hipotesis nol H0 : pA = 0,4, pB = 0,4 dan pC = 0,2,
melawan hipotesis alternatif H1 : proporsi populasi tidak pA
= 0,4, pB = 0,4 dan pC = 0,2. Bila dimiliki sampel ukuran 200
dan menghasilkan 60 dalam kategori A, 120 dalam kategori
B dan 20 dalam kategori C.

Analisis Data Statistik | 45


Penyelesaian
Dalam permasalahan ini, diinginkan untuk menguji hipotesis
nol H0 : pA = 0,4, pB = 0,4 dan pC = 0,2, melawan hipotesis
alternatif H1 : proporsi populasi tidak pA = 0,4, pB = 0,4 dan
pC = 0,2 dengan tingkat keberartian 10 %. Di bawah H0 benar
maka
e1 = 200 (0,4) = 80,
e2 = 200 (0,4) = 80,
e3 = 200 (0,2) = 40,
sehingga diperoleh statistik uji
( f i  ei ) 2 (60  80) 2 (120  80) 2 (20  40) 2
k
X 
2
  
i 1 ei 80 80 40
= 35.
Hipotesis nol ditolak jika X2hitung lebih besar dari titik kritis
 2 ; k 1 yaitu 4,6052. Akibatnya hipotesis nol H0 ditolak
sehingga proporsi populasi tidak pA = 0,4, pB = 0,4 dan pC
= 0,2.

Soal 4
Tahun lalu, penilaian mahasiswa yang mengambil mata
kuliah Statistika adalah 3% A, 28% B, 45% C dan 24% E.
Apabila tahun ini, dari 400 mahasiswa yang mengambil mata
kuliah Statistika terdapat 24 yang mendapatkan A, 124 yang
mendapatkan B, 172 yang mendapatkan C dan sisanya
mendapatkan E, apakah penilaian tahun ini sama dengan
penilaian tahun lalu ? Gunakan tingkat keberartian 5%.
a. Gunakan cara nilai-p.
b. Gunakan cara titik kritis.
Penyelesaian
Dalam permasalahan ini, diinginkan untuk menguji hipotesis
nol H0 : pA = 0,03, pB = 0,28, pC = 0,45, pE = 0,24 melawan
hipotesis alternatif H1 : proporsi populasi tidak pA = 0,03,

46 | Adi Setiawan
pB = 0,28, pC = 0,45, pE = 0,24 dengan tingkat keberartian 5
%. Di bawah H0 benar maka
e1 = 400 (0,03) = 12,
e2 = 400 (0,28) = 112,
e3 = 400 (0,45) = 180,
e4 = 400 (0,24) = 96,
sehingga diperoleh statistik uji
k
( f i  ei ) 2 (24  12) 2 (124  112) 2 (172  180) 2 ( 80  96) 2
X 2     
i 1 ei 12 112 180 96
= 16,3079.
Hipotesis nol ditolak jika X2hitung lebih besar dari titik kritis
 2 ; k 1 yaitu 7,8147. Akibatnya hipotesis nol H0 ditolak
sehingga proporsi tidak pA = 0,03, pB = 0,28, pC = 0,45, dan
pE = 0,24.
Dalam hal ini, juga dapat digunakan cara nilai-p. Nilai-
p dapat dihitung dengan
nilai-p = P( 
2
3 > 16,3079) = 0,0010.
Akibatnya lebih kecil dari tingkat keberartian 5% sehingga H0
ditolak.

Soal 5
Dari survei 5 tahun lalu diperoleh hasil bahwa 20 persen
menjawab setuju, 70 persen menjawab tidak setuju dan sisanya
tidak menjawab untuk pertanyaan tentang aborsi. Pada
tahun ini diadakan survei dan dari 1600 responden, ternyata
400 responden menjawab setuju, 1100 responden dan sisanya
tidak menjawab. Gunakan tingkat keberartian 10% untuk
menguji apakah hasil survei tahun ini sama dengan hasil
survei 5 tahun lalu.
Penyelesaian
Diinginkan untuk menguji hipotesis nol : ps = 0,2, pts = 0,7
dan pa = 0,1 melawan hipotesis alternatif H1 : H0 tidak benar
dengan menggunakan tingkat keberartian 10 %. Hipotesis nol

Analisis Data Statistik | 47


ditolak jika X2hitung >   ; k 1   0,1; 2  4,6052 . Di bawah H0 benar
2 2

maka
e1 = 1600 (0,2) = 320,
e2 = 1600 (0,7) = 1120,
e3 = 1600 (0,1) = 160,
sehingga diperoleh statistik uji
k
( f i  ei ) 2 (400  320) 2 (110  1120) 2 (100  160) 2
X 
2
  
i 1 ei 320 1120 160
= 42,8571.
Karena X2hitung lebih besar dari 4,6052 maka hipotesis nol H0
ditolak sehingga proporsi tidak ps = 0,2, pts = 0,7 dan pa =
0,1.

48 | Adi Setiawan
LATIHAN

1. Probabilitas seseorang yang menderita sakit akan men-


jadi sembuh, bertambah parah sakitnya atau tidak ada
perubahan, masing-masing adalah 0,5, 0,3 dan 0,2. Apabila
ada 5 orang yang diamati maka berapakah probabili-
tasnya bahwa 2 orang diantaranya sembuh, 2 orang ber-
tambah arah sakitnya dan seorang tidak ada perubahan?
Gunakan tingkat keberartian 5%.
2. Menurut teori hasil persilangan 2 macam tanaman akan
menghasilkan tanaman dengan sifat A, B dan C dengan
perbandingan 1:2:1. Dari persilangan 90 pasang tanaman
diperoleh hasil tanaman dengan sifat A, B dan C berturut-
turut adalah 20, 50 dan 20. Apakah hasil tersebut
mendukung teori ? Gunakan tingkat keberartian 10%.
3. Sebuah survei tahun 2003 di suatu negara menyatakan
bahwa pembayaran transaksi dengan menggunakan kartu
kredit, kartu debet, cek dan cash masing-masing adalah
22, 21, 18 dan 39 (dalam persen). Pada tahun 2015
dilakukan survei kembali dan dari 220 responden yang
diberi pertanyaan untuk hal tersebut di atas masing-
masing adalah 46 responden dengan kartu kredit, 67
reponden dengan kartu debet, 33 dengan cek dan sisanya
dengan cash. Apakah telah terjadi pergeseran cara
pembayaran dari tahun 2003? Gunakan tingkat keberartian
1%.
4. Gunakan tingkat keberartian 10% untuk menguji apakah
terdapat kesesuaian antara harapan dengan kenyataan
pada tabel berikut ini:

Kategori Harapan Kenyataan


A 40 % 19
B 20 % 11
C 20 % 10
D 10 % 5
E 10 % 5

Analisis Data Statistik | 49


5. Sebuah survei dilakukan untuk menguji apakah ada mini
market yang lebih disukai dibandingkan dengan yang lain.
Dari 5000 responden ternyata menghasilkan pengamatan
2000 menyukai betamart, 1500 gammamart, 1000
deltamart dan sisanya kappamart. Gunakan tingkat
keberartian 10%.

***

50 | Adi Setiawan
BAB V
ANALISIS TABEL KONTINGENSI (TABEL k  r )

Secara umum tabel kontingensi dinyatakan pada Tabel


V.1. Tabel V.1 menggambarkan bahwa sejumlah n obyek
penelitian atau pengamatan terbagi dalam 2 kategori. Besaran
Nij adalah banyaknya obyek pengamatan dari kategori i dalam
peubah baris dan kategori j dalam peubah kolom. Dalam hal
ini Ni. berarti jumlah frekuensi dalam baris ke-i, N.j berarti
jumlah frekuensi dalam kolom ke-j dan N.. adalah jumlah
obyek total dalam seluruh pengamatan.
Uji yang dilakukan pada tabel kontingensi adalah
untuk menguji apakah ada ketergantungan antara dua
kategori yang berbeda dari peubah baris dan peubah kolom.
Untuk memberikan gambaran tentang penggunaan tabel
k  r dalam analisis data berikut ini diberikan contoh
permasalahannya.

Tabel V.1 Tabel kontingensi k  r.

B1 …………… Bj ……..……….…. Br Total


A1 . .
A2 . .
. . .
. . .
Ai ………………... Nij ………….. N i.
. . .
Ak . .
N.j N..

Analisis Data Statistik | 51


Contoh V.1
Tabel V.1 mempresentasikan hasil penelitian terhadap pengaruh
kesukaan akan makanan manis terhadap keriputan di wajah
pada usia 50 tahun dari 1000 orang yang diteliti. Akan
ditentukan apakah ada keterkaitan dengan kesukaan akan
makanan manis-manis dengan kemunculan keriput pada
wajah.

Tabel V.2 Tabel Data Contoh V.1

Ada
Tidak Ada keriput Jumlah
Keriput
Suka manis 200 100 300
Tidak Suka Manis 200 500 700
Jumlah 400 600 1000

Contoh V.2
Seorang sosiolog tertarik untuk mengetahui apakah anak
mempunyai ketergantungan untuk memilih pekerjaan yang
sama dengan ayahnya. Untuk meneliti hal ini diambil sampel
500 laki-laki dan ditanya pekerjaannya dan pekerjaan ayahnya.
Ringkasan data yang berkenaan dengan jawaban pertanyaan
itu dapat dilihat pada Tabel V.3.

Tabel V.3 Tabel kontingensi hubungan antara pekerjaan laki-laki


dan pekerjaan ayahnya

Anak
Tanpa
Bisnis Kecakapan Tani
Kecakapan
Bisnis 55 38 7 0
Ayah Kecakapan 79 71 25 0
Tanpa 22 75 38 10
kecakapan
Tani 15 23 10 32

52 | Adi Setiawan
V.1. Uji Chi-kuadrat Untuk Tabel k  r

Syarat awal dari analisis ini adalah objek pengamatan


n besar. Sifat berikut ini digunakan sebagai dasar dalam
melakukan uji k  r untuk tabel kontingensi. Misalkan k
vektor stokastik berdistribusi multinominal dengan parameter n,
k
p1, p2, ..., pk yang memenuhi pj > 0 untuk semua j dan p
j 1
j 1

, maka untuk n   berlaku


k ( N  np ) 2
j

j

j 1 np j
konvergen dalam distribusi ke distribusi 2 dengan derajat
bebas k-1.

Analisis yang dilakukan dalam tabel k  r tidak dapat


dilepaskan dari distribusi multinomial. Dalam analisis tabel
kontingensi ini dikembangkan tiga model yang dapat dijelaskan
sebagai berikut:

Model A
Berdasarkan pada Contoh V.2 dipunyai sampel sebesar
n=500 yang digolongkan ke dalam dua kategori yaitu
pekerjaan orang tua dan pekerjaan anak. Di bawah model ini
matriks dari frekuensi sel mempunyai distribusi kr-multinomial
dengan parameter n, p11, ...., pkr
k r

N
i 1
i.  N
j 1
j.  n.

Dalam model ini semua frekuensi Ni. dan N.j adalah besaran
stokastik.

Model B
Tabel k  r dapat juga dipandang sebagai k sampel
independen yang digolongkan ke dalam peubah kolom. Di

Analisis Data Statistik | 53


bawah ini tabel k  r mengandung k sampel independen dari
distribusi r-nomial dengan sampel ke-i mempunyai parameter
Ni, pi1, ..., pir untuk i=1, 2, ..., k. Dalam hal ini N1., N2., ...., Nk.
tidak lagi merupakan besaran stokastik.

Model C
Dalam model ini data dalam tabel berasal dari r sampel
independen dari distribusi k-nomial dengan parameter
sampel ke-j adalah N.j, p1j, ..., pkj untuk j = 1,2, ..., r dan N.j
sampel yang tidak stokastik.

Berdasarkan ketiga model di atas berlaku :


k r
Model A : 
i 1 j 1
pij  1

r
Model B : pi.   p j untuk i = 1, 2, ..., k.
j 1

k
Model C : p. j   pi untuk j = 1, 2, ..., r.
i 1

Dalam hal ini diuji apakah ada ketergantungan antara peubah.


Untuk model A hal ini merupakan hipotesis dari ketakbergan-
tungan peubah
H0A : pij  pi. p. j
untuk i = 1, 2, ..., k dan j=1,2, ..., r. Dalam model B adalah
hipotesis dari k distribusi r-nomial yang identik
H0B : p1 j  p2 j  ...... pkj  p j
untuk j = 1, 2, ..., r. Dalam model C adalah hipotesis dari r
distribusi k-nomial yang identik
H0C : pi1  pi 2.  ...... pir  pi
untuk i = 1, 2, ..., k.
Apabila sampel yang dimiliki cukup besar maka untuk
tiga model di atas dapat digunakan uji chi-kuadrat. Di bawah
H0, dalam model A, H0A mempunyai besaran uji

54 | Adi Setiawan
k r ( N ij  npij ) 2
X 2  
i 1 j 1 npij
yang untuk n besar akan mendekati distribusi chi-kuadrat
dengan derajat bebas kr-1. Teorema berikut ini digunakan
secara praktis dalam melakukan uji chi-kuadrat pada tabel
kontingensi.

Teorema V.1
Di bawah hipotesis nol H0A, H0B dan H0C masing-masing
dalam model A, B dan C mempunyai besaran uji
^
k r ( N ij  n p ij ) 2
X2  ^
i 1 j 1 n p ij
dengan pij didefinisikan sebagai
^ N i . N. j
p ij 
n2
untuk n cukup besar maka X2 mendekati distribusi 2 dengan
derajat bebas (k-1)(r-1).

Contoh V.3
Berdasarkan pada Contoh V.2, diperoleh statistik uji X2
adalah 126,9841 dengan titik kritis 3,81 jika digunakan tingkat
keberartian 5%. Hipotesis nol menyatakan bahwa tidak ada
keterkaitan antara kesukaan akan makanan manis dengan
munculnya keriput pada wajah. Karena X2 hitung lebih besar
dari titik kritis maka H0 ditolak sehingga ada keterkaitan
antara kesukaan akan makanan manis dengan munculnya
keriput pada wajah.
Contoh V.4
Dalam Contoh V.2, dapat diketahui bahwa data berasal dari
satu sampel dan akan dilakukan pengujian terhadap hipotesis
nol bahwa tidak ada keterkaitan antara pemilihan pekerjaan
anak dengan pekerjaan orang tua sehingga model yang tepat
adalah model A. Hasil perhitungan untuk statistik uji X2

Analisis Data Statistik | 55


adalah X2 = 180,874 dan nilai-p-nya adalah 4,486  10-7.
Dengan menggunakan tingkat keberartian yang beralasan
maka hipotesis nol ditolak. Jadi ada keterkaitan antara
pemilihan pekerjaan anak dengan pekerjaan orang tua.

V.2. Identifikasi sel-sel dengan nilai ekstrim

Apabila hipotesis nol dari ketidak-bergantungan antara


dua kategori ditolak maka biasanya dilakukan analisis ber-
bentuk kebergantungannya yaitu dengan melihat sel mana
yang merupakan sel dengan nilai ekstrim. Suatu sel dengan
nilai ekstrim besar akan menjelaskan bahwa ada keterkaitan
positif antara kategori dari peubah baris dan peubah kolom,
sedangkan suatu sel dengan nilai ekstrem menjelaskan
bahwa anggota kategori tertutup satu sama lain.
Untuk melihat sel mana yang bernilai ekstrim dapat
didasarkan pada residu berdasarkan penaksir kemungkinan
maksimum (MLE-maximum likelihood estimator). Residu ternor-
ma (kontribusi) didefinisikan sebagai
^
N ij  n p ij
Cij 
^
n p ij
dengan i = 1,2, ..., k dan j = 1, 2, ..., r. Dengan melihat
kontribusi tersebut akan dapat diketahui sel mana yang
memberikan sumbangan besar pada besaran uji. Dalam tabel
kontingensi dengan k  r besar, untuk sel mana yang mem-
punyai kontribusi yang bernilai ekstrim dapat digunakan
box-plot sehingga data yang digambarkan sebagai titik
ekstrim oleh boxplot akan merupakan nilai ekstrem dalam
analisis ini.

Contoh V.5
Pada analisis tabel kontingensi dapat dilakukan juga per-
hitungan residu ternorma untuk melihat kecenderungan

56 | Adi Setiawan
kategori mana yang sangat berkaitan erat. Pada tabel berikut
ini diberikan residu ternormanya untuk tiap-tiap sel. Dengan
bantuan boxplot dari residu ternorma maka dapat dilihat
bahwa sel (4,4) mempunyai residu ternorma yang ekstrim
(outlier). Hal ini berarti bahwa pemilihan pekerjaan petani
oleh anak sangat erat kaitannya dengan pekerjaan ayah
sebagai petani.

Tabel V.4 Residu terstandard dari tabel kontingensi Contoh V.3.

Anak
Tanpa
Bisnis Kecakapan Tani
Kecakapan
Bisnis 3,56 -0,53 -2,90 -2,90
Ayah Kecakapan 2,47 -0,17 -0,57 -3,83
Tanpa 3,92 -2,36 3,07 -0,62
kecakapan
Tani -2,36 -1,76 -0,78 9,76

Gambar V.2 Boxplot dari residu terstandard

***

Analisis Data Statistik | 57


SOAL & PENYELESAIAN

Soal 1
Sampel dari 100 orang laki-laki usia 45 sampai dengan 65
yang mempunyai tekanan darah tinggi dan berpenyakit jantung
dinyatakan pada Tabel V.5. Ujilah apakah ada keterkaitan
antara orang laki-laki yang mempunyai tekanan darah tinggi
dengan orang berpenyakit jantung dengan tingkat
keberartian 5%.

Tabel V.5 Tabel Data Soal V.1

Penyakit Jantung
Ada Tidak Ada Jumlah
Tekanan darah tinggi
Ada 32 39 71
Tidak Ada 64 264 328
Jumlah 96 303 399

Penyelesaian
Untuk menguji apakah ada keterkaitan antara orang laki-laki
yang mempunyai tekanan darah tinggi dengan orang ber-
penyakit jantung dengan tingkat keberartian 5% digunakan
langkah-langkah berikut ini :
a. Hipotesis nol H0: tidak ada keterkaitan antara orang
laki-laki yang mempunyai tekanan darah tinggi dengan
orang berpenyakit jantung, melawan hipotesis alternatif
H1: ada keterkaitan antara orang laki-laki yang mem-
punyai tekanan darah tinggi dengan orang berpenyakit
jantung.
b. Tingkat keberartian  = 5 %.
c. Statistik Uji X2.
d. Hipotesis nol ditolak jika X2 hitung > kuantil 95% dari
distribusi chi-kuadrat dengan derajat bebas 1 yaitu 3,84.

58 | Adi Setiawan
e. Dari Tabel V.5 diperoleh X2 hitung adalah 20,8667
sehingga lebih besar dari 3,84 dan berarti H0 ditolak.
Dengan kata lain, ada keterkaitan antara orang laki-
laki yang mempunyai tekanan darah tinggi dengan
orang berpenyakit jantung. Tabel V.6 menyatakan
kontribusi Cij untuk setiap sel terhadap X2 hitung.
Terlihat bahwa sel (1,1) bernilai positif dan relatif besar
terhadap nilai sel lain sehingga terdapat keterkaitan
positif antara adanya tekanan darah tinggi dan penyakit
jantung.

Tabel V.6 Tabel Kontribusi Cij Soal V.1

Penyakit Jantung
Ada Tidak Ada
Tekanan darah tinggi
Ada 3,6092 -2,0315
Tidak Ada -1,6792 0,9452

Soal 2
Ujilah keterkaitan antara variabel A dengan variabel B untuk
setiap kasus berikut ini:
a. Kasus 1
10 16
16 10
b. Kasus 2
100 106
106 100

c. Kasus 3
100 160
160 100

Analisis Data Statistik | 59


Penyelesaian
Pada kasus 1, selisih sel (1,1) dengan sel (1,2) adalah 6
tetapi sel (1,2) 60% relatif lebih banyak dari sel (1,1) sehingga
diperoleh nilai-p 0,0961. Hal itu berarti, hipotesis nol ditolak
jika digunakan tingkat keberartian 10% tetapi jika digunakan
tingkat keberartian 5%, hipotesis nol diterima. Dalam hal ini
nilai-p yang diperoleh tidak terlalu kecil karena ukuran sampel
hanya n=52.
Pada kasus 2, selisih sel (1,1) dengan sel (1,2) hanya 6
tetapi sel (1,2) dan hal itu hanya 6 % relatif lebih banyak dari
sel (1,1) sehingga diperoleh nilai-p 0,5544. Hal itu berarti,
hipotesis nol diterima jika digunakan tingkat keberartian
yang biasa digunakan yaitu 1%, 5% atau 10%.
Pada kasus 3, selisih sel (1,1) dengan sel (1,2) cukup
besar yaitu 60 sehingga sel (1,2) nilainya 60 % relatif lebih
banyak dari sel (1,1) sehingga diperoleh nilai-p 1,4223 × 10-7.
Hal itu berarti, hipotesis nol ditolak jika digunakan tingkat
keberartian yang biasa digunakan yaitu 1%, 5% atau 10%.
Dalam hal ini nilai-p yang diperoleh sangat kecil karena
ukuran sampel cukup besar yaitu n=520.

Soal 3
Berikut ini diberikan data tentang hasil penelitian kategori
nilai Matematika dan nilai Kimia dari 528 siswa yang
dinyatakan pada Tabel V.7. Ujilah dengan tingkat keberartian
1% apakah ada keterkaitan antara nilai Matematika dengan
nilai Kimia.
Tabel V.7 Tabel Data Soal V.3

Matematika
Tinggi Sedang Rendah
Kimia Tinggi 54 70 13
Sedang 48 164 40
Rendah 15 42 82

60 | Adi Setiawan
Penyelesaian
Untuk menguji apakah ada keterkaitan antara nilai Matematika
dengan nilai Kimia pada siswa dengan tingkat keberartian 1%
digunakan langkah-langkah berikut ini :
a. Hipotesis nol H0 : tidak ada keterkaitan antara nilai
Matematika dan nilai Kimia, melawan hipotesis alternatif
H1 : ada keterkaitan antara nilai Matematika dan nilai
Kimia.
b. Tingkat keberartian  = 5 %.
c. Statistik Uji X2.
d. Hipotesis nol ditolak jika X2 hitung > kuantil 99% dari
distribusi chi-kuadrat dengan derajat bebas 4 yaitu
13,2767.
e. Dari Tabel V.5 diperoleh X2 hitung adalah 132,3524
sehingga lebih besar dari 13,2767 dan berarti H0
ditolak. Dengan kata lain, ada keterkaitan antara nilai
Matematika dan nilai Kimia. Tabel V.8 menyatakan
kontribusi Cij untuk setiap sel terhadap X2 hitung.
Terlihat bahwa sel (1,1) dan (3,3) bernilai positif dan
relatif besar terhadap nilai sel lain sehingga terdapat
keterkaitan positif antara nilai tinggi pada Matematika
dengan nilai tinggi pada Kimia serta nilai rendah pada
Matematika dan nilai rendah pada nilai Kimia.

Tabel V.8 Tabel Kontribusi Cij Soal V.3

Matematika
Tinggi Sedang Rendah
Kimia Tinggi 4,2909 -0,1907 -3,7220
Sedang -1,0493 2,8119 -3,0437
Rendah -2,8471 -3,5968 7,7933

Soal 4
Tabel V.9 menyatakan apakah ada saling keterkaitan antara
pengambil keputusan pinjaman di suatu bank dengan keputus-

Analisis Data Statistik | 61


an diterima atau ditolaknya pinjaman dengan menggunakan
tingkat keberartian 10%.

Tabel V.9 Tabel Data Soal V.4

Keputusan
Disetujui Tidak Disetujui
Pengambil Keputusan
A 24 16
B 17 13
C 35 15
D 11 9

Penyelesaian
Untuk menguji apakah ada keterkaitan antara pengambil
keputusan dan keputusan yang diambil dengan tingkat
keberartian 10 % digunakan langkah-langkah berikut ini :
a. Hipotesis nol H0: tidak ada keterkaitan antara pengambil
keputusan dan keputusan yang diambil, melawan
hipotesis alternatif H1: ada keterkaitan antara pengambil
keputusan dan keputusan yang diambil.
b. Tingkat keberartian  = 10%.
c. Statistik Uji X2.
d. Hipotesis nol ditolak jika X2 hitung > kuantil 90% dari
distribusi chi-kuadrat dengan derajat bebas 3 yaitu
6,2514.
e. Dari Tabel V.5 diperoleh X2 hitung adalah 2,2063
sehingga lebih kecil dari 6,2514 dan berarti H0 diterima.
Dengan kata lain, tidak ada keterkaitan antara
pengambil keputusan dan keputusan yang diambil.

Soal 5
Data pada Tabel V.10 merupakan hasil pengumpulan selama
waktu tertentu tentang banyaknya panggilan mobil ambulan
di suatu rumah sakit untuk setiap harinya dari hari Senin

62 | Adi Setiawan
sampai hari Minggu dan terbagi ke dalam asal panggilan yaiu
dari desa atau kota. Ujilah apakah ada keterkaitan antara
asal dengan hari panggilan mobil ambulan dengan tingkat
keberartian 10%.

Tabel V.10 Tabel Data Soal V.5

Minggu Senin Selasa Rabu Kamis Jumat Sabtu


Kota 61 48 50 55 63 73 43
Desa 7 9 16 13 9 14 10
68 57 66 68 72 87 53

Penyelesaian
Untuk menguji apakah ada keterkaitan antara pengambil
keputusan dan keputusan yang diambil dengan tingkat
keberartian 10% digunakan langkah-langkah berikut ini:
a. Hipotesis nol H0 : tidak ada keterkaitan antara hari
dengan asal panggilan ambulan, melawan hipotesis
alternatif H1 : ada keterkaitan antara hari dengan asal
panggilan ambulan.
b. Tingkat keberartian  = 10%.
c. Statistik Uji X2.
d. Hipotesis nol ditolak jika X2 hitung > kuantil 90% dari
distribusi chi-kuadrat dengan derajat bebas 6 yaitu
10,6446.
e. Dari Tabel V.5 diperoleh X2 hitung adalah 6,1745
sehingga lebih kecil dari 10,6446 dan berarti H0
diterima. Dengan kata lain, tidak ada keterkaitan
antara hari dengan asal panggilan ambulan. Jika
digunakan cara nilai-p maka diperoleh nilai-p adalah
0,4039 sehingga H0 diterima. Hal itu berarti, keputusan
yang sama bila digunakan cara titik kritis.

Analisis Data Statistik | 63


LATIHAN

1. Ujilah keterkaitan antara variabel A dengan variabel B


untuk setiap kasus berikut ini :
a. Kasus 1
8 8
8 16
b. Kasus 2
8 8
8 32
c. Kasus 3
8 8
8 48
d. Kasus 4
8 8 8
8 8 8
8 8 16
e. Kasus 5
8 8 8
8 8 8
8 8 32
f. Kasus 6
8 8 8
8 8 8
8 8 48

2. Dengan menggunakan Tabel V.11, buktikan bahwa uji


keterkaitan dari tabel kontingensi 2 × 2 dapat digunakan
n(ad  bc) 2
statistik uji W .
m1m2 n1n2

64 | Adi Setiawan
Tabel V.11 Tabel Data Soal Latihan V.2

B Bc Jumlah
A a b n1
Ac c d n2
m1 m2 n

3. Tabel V.12 berikut ini data dari hasil penelitian untuk menguji
apakah rajin atau tidaknya orang beribadah akan tergantung
pada usia. Ujilah dengan tingkat keberartian 5 %.

Tabel V.12 Tabel Data Soal Latihan V.3

Rajin Tidak Jumlah


20 s/d 29 31 69 100
30 s/d 39 63 87 150
40 s/d 49 94 106 200
50 s/d 59 72 78 150
Jumlah 260 340 600

4. Tabel V.13 menyatakan hasil penelitian banyaknya barang


yang rusak dan yang tidak rusak dari setiap shift yang
diperoleh dari suatu industri rumah tangga.

Tabel V.13 Tabel Data Soal Latihan V.4

Banyak barang Banyak Barang


Shift
tidak cacat Cacat
Pertama 368 32
Kedua 285 15
Ketiga 176 24

5. Tabel V.14 menyatakan data tentang lebih suka tinggal di


daerah yang irama kehidupannya cepat atau lambat atau
tidak ada yang lebih dipilih dari 150 laki-laki dan 150
perempuan.
a. Gabungkan data laki-laki dan perempuan untuk mem-
perkirakan persentase dari masing-masing bagian.
Kesimpulan apa yang anda peroleh ?

Analisis Data Statistik | 65


b. Apakah ada keterkaitan antara jenis kelamin dengan
kesukaan tinggal ? Gunakan tingkat keberartian 5%.

Tabel V. 14 Tabel Data Soal Latihan V.5

Tidak ada yang


Lambat Cepat
Responden lebih disukai
Laki-laki 102 9 39
Perempuan 111 12 27

*****

66 | Adi Setiawan
BAB VI
ANALISIS VARIANSI

Dalam bab ini, akan dibahas tentang analisis variansi


satu arah (one-way analysis of variance), analisis variansi dua
arah (two-way analysis of variance) dan analisis variansi tiga
arah (three-way analysis of variance). Analisis variansi
merupakan suatu metode untuk menguji hipotesis kesamaan
rata-rata dari tiga atau lebih populasi.

VI.1 Analisis Variansi Satu Arah

Tabel VI.1 Tabel data untuk analisis variansi satu arah

Sampel Jumlah
1 2 .... i ... k
x11 x21 .... xi1 .... xk1
x12 x22 .... xi2 .... xk2
....
x1n x1n ...
Jumlah T1. T2 . ... Ti . .... Tk . T..

Misalkan dimiliki k populasi yang saling bebas dan


berdistribusi normal dengan rata-rata 1, 2, ..., k dan
variansi mereka sama yaitu 2. Diinginkan untuk menguji
hipotesis nol
H0 : 1 = 2 = ... = k
melawan hipotesis alternatif
H1 : H0 tidak benar.
Untuk menguji hipotesis nol, digunakan k sampel dari k
populasi seperti dinyatakan pada Tabel VI.1. Dalam hal ini,
Ti .
adalah jumlah semua pengamatan sampel ke-i untuk i = 1,
2, ..., k sedangkan

Analisis Data Statistik | 67


T..
adalah jumlah semua pengamatan. Selanjutnya, dapat
dihitung Jumlah Kuadrat Total (JKT) yaitu
k n 2
T
JKT   xij  .. ,
2

i 1 ij 1 nk
Jumlah Kuadrat Perlakuan (JKP) yaitu
k

T
2
i. 2
T i 1
JKP   .. ,
n nk
dan Jumlah Kuadrat Galat (JKG) yaitu JKG = JKT – JKP.
Tabel analisis variansi dapat dinyatakan pada Tabel VI.2.
Dalam hal ini, KRP adalah Kuadrat Rata-rata Perlakuan dan
KRG adalah Kuadrat Rata-rata Galat. Dengan menggunakan
tingkat keberartian (level of significance), hipotesis nol ditolak
jika Fhitung > F ; k 1; k ( n1) atau nilai-p < . Dalam hal ini, nilai-p
dihitung dengan
nilai  p  P( Fk 1; k ( n1)  Fhitung ).

Tabel VI.2 Tabel Analisis Variansi Satu Arah

Sumber Derajat Jumlah Kuadrat Statistik F


Variasi Bebas Kuadrat Rata-rata
Perlakuan k-1 JKP KRP = F=
JKP/(k-1) KRP/KRG
Galat k(n-1) JKG KRG =
JKG/(k(n-
1))
Total nk-1 JKT

Contoh VI.1
Misalkan seorang guru mengadakan penelitian tentang
keunggulan metode pembelajaran. Apabila data yang diperoleh
dinyatakan pada Tabel VI.3, dengan menggunakan tingkat
keberartian  = 5 % apakah ketiga metode pembelajaran
mempunyai rata-rata yang sama ?

68 | Adi Setiawan
Tabel VI.3 Hasil nilai dari 3 metode pembelajaran.

Metode 1 Metode 2 Metode 3


6 7 8
6 7 8
5 6 7
5 6 7

Penyelesaian
Analisis variansi satu arah digunakan untuk menguji
hipotesis nol
H0 : 1 = 2 = 3
melawan hipotesis alternatif
H1 : H0 tidak benar.
Hipotesis alternatif juga dapat dinyatakan dengan
H1 : 1  2 atau 2  3 atau 1  3.
Hipotesis nol akan ditolak dengan tingkat keberartian =5%
jika Fhitung > F ; k 1; k ( n1)  F0, 05; 2, 9  4,2565 atau nilai-p <  = 0,05.
Tabel VI.4 digunakan untuk membantu perhitungan JKT, JKP
dan JKG. Tabel distribusi F yang digunakan ada pada
Lampiran 6.

Tabel VI.4 Bantuan Perhitungan

Metode 1 Metode 2 Metode 3 Jumlah


6 7 8
6 7 8
5 6 7
5 6 7
Jumlah T1.  22 T2 .  26 T3.  30 T..  78

Jumlah Kuadrat Total (JKT) dapat dihitung dengan


2
k n
T.. 782
JKT   xij   518   518  507 11,
2

i 1 ij 1 nk 4(3)

Analisis Data Statistik | 69


Jumlah Kuadrat Perlakuan (JKP)
k

T
2

22 2  26 2  282
i. 2
T..
i 1
JKP     507  515  507  8,
n nk 4
sehingga JKG = JKT – JKP = 11 - 8 = 3. Tabel analisis variansi
dapat dinyatakan dalam Tabel VI.5. Karena
Fhitung = 12 > 4,2565
maka H0 ditolak sehingga H0 tidak benar. Dalam hal ini, juga
dapat diperoleh
nilai-p = P( Fk 1; k ( n1)  Fhitung )  P( F2,9 12)  0,0029.
Karena nilai-p <  = 5 % maka H0 ditolak sehingga
kesimpulan yang sama juga diperoleh apabila menggunakan
cara titik kritis.

Tabel VI.5 Tabel Analisis Variansi Satu Arah

Sumber Derajat Jumlah Kuadrat Statistik F


Variasi Bebas Kuadrat Rata-rata
Perlakuan 2 8 KRP = 4 F = 4/(1/3)
= 12
Galat 9 3 KRG = 1/3
Total 11 11

Apabila H0 ditolak maka langkah selanjutnya adalah


melakukan analisis pasca anava untuk mencari pasangan
manakah yang berbeda yaitu 1  2 atau 2  3 atau 1  3.
Untuk itu dilakukan pembandingan ganda menggunakan
metode Scheffe yang digunakan untuk menguji hipotesis:
H0 : 1 = 2 atau H0 : 1 - 2 = 0
melawan hipotesis alternatif yaitu
H0 : 1  2 atau H0 : 1 - 2  0.
Statistik uji yang dapat digunakan yaitu
X1  X 2
S
SE
dengan

70 | Adi Setiawan
1 1  1 1
SE  s 2     s 
 n1 n2  n1 n2
dan s2 adalah Kuadrat Rata-rata Galat (Mean Square of Error).
Hipotesis nol ditolak jika Shitung > S dengan
S  (k  1) F ; k 1;n( k 1)
dan F;k-1,n-k menyatakan kuantil ke-(1-) dari distribusi F
dengan derajat bebas pembilang k-1 dan derajat bebas
penyebut n-k.

Contoh VI.2
Dalam Contoh VI.1, diperoleh bahwa H0 ditolak. Manakah
yang berbeda yaitu 1  2 atau 2  3 atau 1  3.
Penyelesaian
Berdasarkan data pada Tabel VI.3, diperoleh
n1 = n2 = n3 = 4,
X 1  5,5, X 2  6,5 dan X 3  7,5. Dari tabel anava (Tabel VI.5),
diperoleh s2 = 1/3 dan
S  (k  1) F ; k 1;n( k 1)  (3  1) F0,05; 31,123  2(4,26)  2,92.
Berdasarkan perhitungan, diperoleh
1 1 1 1
SE  s 2     (1 / 3)    0,4082
 n1 n2  4 4
dan
X1  X 2 | 5,5  6,5|
S hitung    2,4495.
SE 0,4082
Hal itu berarti bahwa H0 : 1 = 2 tidak ditolak. Demikian
juga dapat diperoleh
X1  X 3 | 5,5  7,5 |
S hitung    4,8990
SE 0,4082
sehingga H0 : 1 = 3 ditolak dan berarti 1  3. Selanjutnya

Analisis Data Statistik | 71


X2  X3 | 6,5  7,5|
S hitung    2,4495
SE 0,4082
sehingga H0 : 2 = 3 tidak ditolak.

Apabila ukuran sampel dalam setiap sampel tidak sama


maka perhitungan JKT, JKP dan JKG dapat diperoleh sebagai
berikut :
k n 2
T..
JKT   xij 
2
,
i 1 ij 1 N
2 2
k Ti . T..
JKP    ,
i 1 ni N
k
dan JKG = JKT – JKP dengan N   ni . Selanjutnya diperoleh
i 1

tabel analisis variansi untuk kasus tersebut pada Tabel VI.5.


Dengan menggunakan tingkat keberartian , hipotesis nol
ditolak jika Fhitung > F ; k 1; N k atau nilai-p < . Dalam hal ini,
nilai-p dihitung dengan
nilai  p  P( Fk 1; N k  Fhitung ).

Tabel VI.6 Tabel Analisis Variansi Satu Arah

Sumber Derajat Jumlah Kuadrat Statistik F


Variasi Bebas Kuadrat Rata-rata
Perlakuan k-1 JKP KRP = F=
JKP/(k-1) KRP/KRG
Galat N-k JKG KRG =
JKG/(N-k)
Total N-1 JKT

Contoh VI.3
Misalkan seorang guru mengadakan penelitian tentang
keunggulan metode pembelajaran. Apabila data yang diperoleh
dinyatakan pada Tabel VI.7, dengan menggunakan tingkat

72 | Adi Setiawan
keberartian  = 5% apakah ketiga metode pembelajaran
mempunyai rata-rata yang sama ?

Tabel VI.7 Hasil nilai dari 3 metode pembelajaran

Metode 1 Metode 2 Metode 3


6 7 8
6 7 8
5 6 7
5 6
5

Penyelesaian
Dalam hal ini, diinginkan untuk menguji hipotesis nol
H0 : 1 = 2 = 3
melawan hipotesis alternatif
H1 : H0 tidak benar.
Hipotesis alternatif juga dapat dinyatakan dengan
H1 : 1  2 atau 2  3 atau 1  3.
Berdasarkan Tabel VI.7, diperoleh k = 3,
k
N   ni  5  4  3 12,
i 1

dan N-k = 12-3 = 9. Hipotesis nol akan ditolak dengan tingkat


keberartian  = 5% jika
Fhitung > F ; k 1; N k  F0,05; 2, 9  4,2565
atau nilai-p <  = 0,05. Tabel VI.4 digunakan untuk
membantu perhitungan JKT, JKP dan JKG.

Analisis Data Statistik | 73


Tabel VI.8 Bantuan Perhitungan

Metode 1 Metode 2 Metode 3 Jumlah


6 7 8
6 6 7
5 6 7
5 6
5
Jumlah T1.  27 T2 .  25 T3.  22
T..  74

Jumlah Kuadrat Total (JKT) dapat dihitung dengan


2
k n
T.. 74 2
JKT   xij   466   466  456,3333  9,6667,
2

i 1 ij 1 N 12
Jumlah Kuadrat Perlakuan (JKP)
2 2
k Ti . T.. 27 2 252 22 2 74 2
JKP         463,3833  456,3333  7,0500 ,
i 1 ni N 5 4 3 12

sehingga JKG = JKT – JKP = 9,6667 – 7,0500 = 2,6167. Tabel


analisis variansi dapat dinyatakan dalam Tabel VI.9. Karena
Fhitung = 12,12 > 4,2565
maka H0 ditolak sehingga H0 tidak benar. Dalam hal ini, juga
dapat diperoleh
nilai-p = P( Fk 1; k ( n1)  Fhitung )  P( F2,9 12,12)  0,0028.
Karena nilai-p <  = 5 % maka H0 ditolak sehingga
kesimpulan yang sama juga diperoleh apabila menggunakan
cara titik kritis.

Tabel VI.9 Tabel Analisis Variansi Satu Arah

Sumber Derajat Jumlah Kuadrat Rata- Statistik F


Variasi Bebas Kuadrat rata
Perlakuan 2 7,05 KRP = 3,525 F=
Galat 9 2,617 KRG = 0,291 3,525/0,291
Total 11 11 = 12,12

74 | Adi Setiawan
Contoh VI.4
Dalam Contoh VI.3, diperoleh bahwa H0 ditolak. Dengan
menggunakan tingkat keberartian 5 %, manakah yang
berbeda yaitu 1  2 atau 2  3 atau 1  3.
Penyelesaian
Berdasarkan data pada Tabel VI.8, diperoleh n1 = 5, n2 = 4, n3
= 3, X 1  6,75, X 2  6,25 dan X 3  5,5. Dari tabel anava,
diperoleh s2 = 0,291 dan
S  (k  1) F ; k 1;nk k  (3  1) F0,05; 31,123  2(4,26)  2,92.
Berdasarkan perhitungan, diperoleh
1 1 1 1
SE  s 2     (0,291)    0,3619
 n1 n2  5 4
dan
X1  X 2 | 6,75  6,25|
S hitung   1,3817.
SE 0,3619
Karena Shitung = 1,3817 < S = 2,92 maka H0 : 1 = 2 tidak
ditolak. Demikian juga dapat diperoleh
X1  X 3 | 6,75  5,5|
S hitung    3,4543
SE 0,3619
sehingga H0 : 1 = 3 ditolak dan berarti 1  3. Selanjutnya
X2  X3 | 6,25  5,5|
S hitung    2,0726
SE 0,3619
sehingga H0 : 2 = 3 tidak ditolak.

VI.2 Analisis Variansi Dua Arah

Analisis variansi dua arah didasarkan pada model data


yang dapat dijelaskan berikut ini. Misalkan Xij1, Xij2, ...., XijK
untuk i = 1, 2, ..., I dan j = 1, 2, ..., J adalah sampel-sampel
yang saling bebas dan diambil dari populasi yang mempunyai

Analisis Data Statistik | 75


mean ij dan variansi 2. Dedefinisikan rumus-rumus berikut
ini :

I J K
T2
T   X ijk , C ,
i 1 j 1 k 1 IJK
K J K
Tij   X ijk , Ti.   X ijk ,
k 1 j 1 k 1

I K I
1
T. j   X JKA  T  C,
2
ijk , i.
i 1 k 1 JK i 1

1 J 2 I J K
1 I J
JKB   T. j  C , JKG 
IK j 1
 X
i 1 j 1 k 1
ijk
2

K
 T
i 1 j 1
ij
2
,

I J K
JKG   X
i 1 j 1 k 1
ijk
2
 C,

JKAB = JK – JKA –JKB – JKG.

Tabel analisis variansi dua arah dinyatakan pada Tabel VI.10.


Tabel VI.10 Tabel Analisis Variansi Dua Arah

Jmlh
Sumber Derajat
Kuadra Kuadrat Rata-rata Statistik F
Variasi Bebas
t
Faktor A I-1 JKA KRA = JKA/(I-1) FA =
KRA/KRG
Faktor B J-1 JKB KRB = JKB/(J-1) FB =
KRB/KRG
Interaksi (I-1)(J-1) JKAB KRAB = JKAB/(I-1) FAB =
AB KRAB/KRG
Galat IJ(K-1) JKG KRG = JKG/(IJ(K-1))

Dalam analisis variansi dua arah, diinginkan untuk menguji


hipotesis nol – hipotesis nol berikut ini :
H0A : tidak ada pengaruh faktor A,
H0B : tidak ada pengaruh faktor B,
H0AB : tidak ada interaksi antara faktor A dan faktor B,
melawan hipotesis alternatif – hipotesis alternatif :

76 | Adi Setiawan
H1A : ada pengaruh faktor A,
H1B : ada pengaruh faktor B,
H1AB : ada interaksi antara faktor A dan faktor B.
Hipotesis nol H0A ditolak jika FA hitung > F ; I 1, IJ ( K 1) dengan
F ; I 1, IJ ( K 1) menyatakan kuantil ke-(1-) dari distribusi F
dengan derajat bebas pembilang I-1 dan derajat bebas
penyebut IJ(K-1). Selanjutnya, hipotesis nol H0B ditolak jika
FB hitung > F ; J 1, IJ ( K 1) dengan F ; J 1, IJ ( K 1) menyatakan kuantil
ke-(1-) dari distribusi F dengan derajat bebas pembilang J-
1 dan derajat bebas penyebut IJ(K-1). Demikian juga,
hipotesis nol H0AB ditolak jika FAB hitung > F ;( I 1)( J 1), IJ ( K 1)
dengan F ;( I 1)( J 1), IJ ( K 1) menyatakan kuantil ke-(1-) dari
distribusi F dengan derajat bebas pembilang (I-1)(J-1) dan
derajat bebas penyebut IJ(K-1).

Contoh VI.4
Misalkan diberikan hasil penilaian dari 3 siswa untuk tiap-
tiap sel pada analisis variansi dua arah. Faktor (variabel) yang
pertama adalah metode pembelajaran yaitu ada 2 metode
pembelajaran (metode 1 dan metode 2) sedangkan faktor
kedua adalah motivasi belajar yang terdiri dari 3 kategori
yaitu Tinggi, Sedang dan Rendah. Tabel VI.11 menyatakan
data hasil nilai-nilai siswa.

Tabel VI.11 Tabel Analisis Variansi Dua Arah Contoh VI.4


Motivasi
Tinggi Sedang Rendah
Metode
Metode 1 9 8 7 8 7 6 7 6 6
Metode 2 7 6 7 6 5 6 5 4 4

Ujilah dengan tingkat signifikansi 5% untuk pertanyaan


berikut:

Analisis Data Statistik | 77


a. apakah ada pengaruh metode pembelajaran terhadap
hasil nilai siswa ?
b. apakah ada pengaruh motivasi belajar siswa terhadap
hasil nilai siswa ?
c. apakah ada interaksi antara metode pembelajaran dan
motivasi belajar siswa terhadap hasil nilai siswa ?
Penyelesaian
Dalam analisis variansi dua arah, diinginkan untuk menguji
hipotesis nol – hipotesis nol berikut ini :
H0A : tidak ada metode pembelajaran terhadap hasil nilai
siswa,
H0B : tidak ada pengaruh motivasi belajar siswa terhadap
hasil nilai siswa,
H0AB : tidak ada interaksi antara metode pembelajaran dan
motivasi belajar siswa terhadap hasil nilai siswa,
melawan hipotesis alternatif – hipotesis alternatif :
H0A : ada metode pembelajaran terhadap hasil nilai siswa,
H0B : ada pengaruh motivasi belajar siswa terhadap hasil nilai
siswa,
H0AB : tidak ada interaksi antara metode pembelajaran dan
motivasi belajar siswa terhadap hasil nilai siswa,
Hipotesis nol H0A ditolak jika
FA hitung > F ; I 1, IJ ( K 1)  F0, 05; 1, 12  4,7472.
Hipotesis nol H0B ditolak jika
FB hitung > F ; J 1, IJ ( K 1)  F0, 05; 2, 12  3,8852.
Hipotesis nol H0AB ditolak jika
FAB hitung > F ; ( I 1)( J 1), IJ ( K 1)  F0, 05; 2, 12  3,8852.
Tabel analisis variansi dua arah dari permasalahan di atas
dapat dinyatakan pada Tabel VI.12. Berdasarkan Tabel VI.12,
H0A dan H0B ditolak sedangkan H0AB diterima. Hal itu berarti,
ada pengaruh metode pembelajaran terhadap hasil nilai
siswa, dan ada pengaruh motivasi belajar siswa terhadap
hasil nilai siswa, tetapi tidak ada interaksi antara metode

78 | Adi Setiawan
pembelajaran dan motivasi belajar siswa terhadap hasil nilai
siswa.

Tabel VI.12 Tabel Analisis Variansi Dua Arah

Sumber Derajat Jumlah Kuadrat Rata-rata Statistik F


Variasi Bebas Kuadrat
Metode 1 9,389 9,389 16,9
Motivasi 2 10,111 5,056 9,1
Interaksi 2 0,111 0,056 0,1
Galat 12 6,667 0,556

Langkah selanjutnya, adalah mencari diantara kedua


metode, manakah yang memberikan rata-rata hasil nilai
siswa yang lebih tinggi. Metode 1 memberikan rata-rata nilai
siswa sebesar 7,11 sedangkan metode 2 memberikan rata-
rata nilai siswa sebesar 5,67. Hal itu berarti bahwa Metode 1
lebih baik (secara signifikan) terhadap Metode 2.

Contoh VI.5
Tabel VI.13 mempresentasikan hasil nilai siswa di kota lain
dalam kasus yang sama seperti pada Contoh VI.4. Ujilah
dengan tingkat signifikansi 5% apakah terdapat interaksi
antara metode pembelajaran dengan motivasi belajar?

Tabel VI.13 Tabel Data pada Contoh VI.5

Motivasi
Tinggi Sedang Rendah
Metode
Metode 1 9 8 7 8 7 6 7 6 6
Metode 2 5 4 4 6 5 6 7 6 7

Penyelesaian
Berdasarkan Tabel VI.14, terlihat bahwa FAB hitung adalah
9,1 sehingga lebih besar dari titik kritis 3,8852 dan berarti
H0AB ditolak. Akibatnya, terdapat interaksi antara metode
pembelajaran dan motivasi belajar siswa terhadap hasil nilai

Analisis Data Statistik | 79


siswa. Interaksi tersebut dijelaskan pada Gambar VI.1. Dari
Gambar VI.1 terlihat bahwa, metode pembelajaran Metode 2
lebih cocok digunakan pada siswa dengan motivasi belajar
rendah sedangkan Metode 1 lebih cocok untuk siswa lainnya.

Tabel VI.14 Tabel Analisis Variansi Dua Arah

Sumber Derajat Jumlah Kuadrat Rata-rata Statistik F


Variasi Bebas Kuadrat
Metode 1 9,389 9,389 16,9
Motivasi 2 0,111 0,056 0,1
Interaksi 2 10,111 5,056 9,1
Galat 12 6,667 0,556

Gambar VI.1 Grafik Hubungan Antara Metode Pembelajaran dan


Rata-rata Sel

80 | Adi Setiawan
SOAL & PENYELESAIAN

Soal 1
Gunakan tabel distribusi F untuk menghitung :
a. F0, 05; 3, 5
b. F0,10; 6, 8
c. F0,90; 10 , 8
Penyelesaian
Dari tabel distribusi F diperoleh
a. F0, 05; 3, 5  5,4095.
b. F0,10; 6, 8  2,6683.
c. F0,90; 10, 8  0,4207.

Soal 2
Berdasarkan distribusi F dengan derajat bebas pembilang v1
dan derajat bebas penyebut v2, tentukan :
a. P( F < 3,84) untuk v1 = 5, v2 = 8.
b. P( F > 3,19) untuk v1 = 15, v2 = 20.
c. P( F  1,84) untuk v1 = 8, v2 = 4.
Penyelesaian
Dengan menggunakan paket program R, diperoleh
a. P( F < 3,84) untuk v1 = 5, v2 = 8 adalah 0,9548.
b. P( F > 3,19) untuk v1 = 15, v2 = 20 adalah 0,0084.
c. P( F  1,84) untuk v1 = 8, v2 = 4 adalah 0,7091.

Soal 3
Diadakan suatu percobaan untuk mengetahui apakah suhu
pembakaran batu bata jenis tertentu berpengaruh terhadap
kepadatan batu bata tersebut. Densitas untuk 4 suhu pem-
bakaran yang diperhatikan dapat dilihat pada Tabel VI.15.
Gunakan tingkat keberartian 10% !

Analisis Data Statistik | 81


Tabel VI.15 Tabel Data pada Soal VI.3

Suhu Suhu Suhu Suhu


100o 125o 150o 175o
20,8 22,8 22,8 21,8
20,9 22,9 22,9 21,9
21,7 22,3 22,3 21,7
20,9 23 23 21,9
20,8 22,1 21,8

Penyelesaian
Dalam analisis variansi satu arah, diinginkan untuk menguji
hipotesis nol berikut ini :
H0A : tidak ada pengaruh suhu terhadap terhadap kepadatan
batu bata atau
H0 : 1 = 2 = 3 = 4,
melawan hipotesis aleternatif bahwa H1 : tidak ada pengaruh
suhu terhadap terhadap kepadatan batu bata. Dari
perhitungan diperoleh tabel analisis variansi satu arah pada
Tabel VI.16. Dari Tabel VI.16 terlihat bahwa
Fhitung = 2,498
lebih besar dari 2,498 sehingga H0 ditolak. Hal itu berarti,
Fhitung lebih dari Ftabel = 2,498 sehingga tidak ada apakah
suhu pembakaran batu bata jenis tertentu berpengaruh
terhadap kepadatan batu bata tersebut

Tabel VI.16 Tabel Analisis Variansi Satu Arah

Sumber Derajat Jumlah Kuadrat Rata- Statistik F


Variasi Bebas Kuadrat rata
Antar 10 18,737 KRP = 3,525 F=
grup 18,737/0,291
Dalam 8 2,617 KRG = 0,291 = 2,498
grup
Total 11 11

82 | Adi Setiawan
Soal 4
Misalkan diberikan hasil penilaian dari 3 siswa untuk tiap-
tiap sel pada analisis variansi dua arah. Faktor yang pertama
adalah metode pembelajaran yaitu ada 2 metode pembelajaran
sedangkan faktor kedua adalah motivasi belajar yang terdiri
dari 3 kategori yaitu Tinggi, Sedang dan Rendah. Tabel VI.17
menyatakan data hasil nilai-nilai siswa.

Tabel VI.17 Tabel Data pada Soal VI.4

Motivasi
Tinggi Sedang Rendah
Metode
Metode 1 9 8 7 8 7 6 7 6 6
Metode 2 8 8 7 7 7 6 6 6 6

Ujilah dengan tingkat signifikansi 5% untuk pertanyaan


berikut:
a. apakah ada pengaruh metode pembelajaran terhadap
hasil nilai siswa ?
b. apakah ada pengaruh motivasi belajar siswa terhadap
hasil nilai siswa ?
c. apakah ada interaksi antara metode pembelajaran dan
motivasi belajar siswa terhadap hasil nilai siswa ?
Penyelesaian
Dalam analisis variansi dua arah, diinginkan untuk menguji
hipotesis nol – hipotesis nol berikut ini:
H0A: tidak ada metode pembelajaran terhadap hasil nilai
siswa,
H0B: tidak ada pengaruh motivasi belajar siswa terhadap hasil
nilai siswa,
H0AB: tidak ada interaksi antara metode pembelajaran dan
motivasi belajar siswa terhadap hasil nilai siswa,
melawan hipotesis alternatif – hipotesis alternatif,
H1A: ada pengaruh metode pembelajaran terhadap hasil nilai
siswa,

Analisis Data Statistik | 83


H1B : ada pengaruh motivasi belajar siswa terhadap hasil
nilai siswa,
H1AB : tidak ada interaksi antara metode pembelajaran dan
motivasi belajar siswa terhadap hasil nilai siswa,
Hipotesis nol H1A ditolak jika
FA hitung > F ; I 1, IJ ( K 1)  F0, 05; 1, 12  4,7472.
Hipotesis nol H1B ditolak jika
FB hitung > F ; J 1, IJ ( K 1)  F0, 05; 2, 12  3,8852.
Hipotesis nol H1AB ditolak jika
FAB hitung > F ; ( I 1)( J 1), IJ ( K 1)  F0, 05; 2, 12  3,8852.
Tabel analisis variansi dua arah dari permasalahan di atas
dapat dinyatakan pada Tabel VI.18. Berdasarkan Tabel VI.18,
H0A dan H0AB diterima tetapi H0B ditolak. Hal itu berarti, tidak
ada pengaruh metode pembelajaran terhadap hasil nilai
siswa, tidak ada pengaruh interaksi antara metode pem-
belajaran dan motivasi belajar siswa terhadap hasil nilai
siswa tetapi ada pengaruh motivasi belajar siswa terhadap
hasil nilai siswa.

Tabel VI.18 Tabel Analisis Variansi Dua Arah

Sumber Derajat Jumlah


Kuadrat Rata-rata Statistik F
Variasi Bebas Kuadrat
Metode 1 0,889 0,889 1,6
Motivasi 2 10,111 5,056 9,1
Interaksi 2 0,111 0,056 0,1
Galat 12 6,667 0,556

Langkah selanjutnya, adalah mencari diantara ketiga


motivasi belajar siswa, manakah yang memberikan rata-rata
hasil nilai siswa yang lebih tinggi.

84 | Adi Setiawan
LATIHAN

1. Gunakan tabel distribusi F untuk menghitung:


a. F0, 01; 13, 15
b. F0,10; 18, 12
c. F0,99; 4, 8
2. Berdasarkan distribusi F dengan derajat bebas
pembilang v1 dan derajat bebas penyebut v2, tentukan
:
a. P( F < 3,84) untuk v1 = 5, v2 = 8.
b. P( F > 3,19) untuk v1 = 15, v2 = 20.
c. P( F  1,84) untuk v1 = 8, v2 = 4.
3. Seorang peneliti ingin menentukan apakah ada pengaruh
suatu obat terhadap lamanya waktu tidur (dalam jam).
Untuk itu diberikan dosis obat tersebut pada sekelompok
orang dan dicek berapa lama waktu tidur masing-
masing. Dengan tingkat keberartian 10%, ujilah apakah
ada pengaruh banyaknya dosis (Dosis 0 ml, 5 ml, 10
ml, 15 ml) yang diberikan terhadap lama waktu tidur.
Jika ada pengaruh, manakah pasangan yang berbeda
secara signifikan?
Tidak minum : 4, 6, 5, 8, 3, 2,
5 ml : 6, 8, 9, 6, 8, 4,
10 ml : 7, 9, 6, 5, 4,
15 ml : 9, 8, 7, 6.
4. Misalkan diberikan hasil penilaian dari 3 siswa untuk
tiap-tiap sel pada analisis variansi dua arah. Faktor
yang pertama adalah metode pembelajaran yaitu ada 2
metode pembelajaran sedangkan faktor kedua adalah
motivasi belajar yang terdiri dari 3 kategori yaitu Tinggi,
Sedang dan Rendah. Tabel VI.19 menyatakan data
hasil nilai-nilai siswa.

Analisis Data Statistik | 85


Tabel VI.19 Tabel Data pada Soal Latihan VI.4

Motivasi
Tinggi Sedang Rendah
Metode
Metode 1 9 9 9 9 8 9 5 6 5
Metode 2 5 6 5 6 7 6 7 8 7

Ujilah dengan tingkat signifikansi 5% untuk


pertanyaan berikut :
a. apakah ada pengaruh metode pembelajaran terhadap
hasil nilai siswa ?
b. apakah ada pengaruh motivasi belajar siswa terhadap
hasil nilai siswa ?
c. apakah ada interaksi antara metode pembelajaran dan
motivasi belajar siswa terhadap hasil nilai siswa ?
d. Gambarkan interaksi yang muncul.
5. Kekurangan Vitamin A (KVA) merupakan masalah gizi
yang sering ditemukan pada anak-anak pra seolah.
Keberadaan KVA dari 10 desa dan 8 desa dihitung
dalam Tabel V.20.

Tabel V.20 Tabel Data pada Soal Latihan VI.5

Letak Desa Prevalensi KVA (%) Jumlah


Desa pantai 3,4 6,1 2,8 5,6 4,5 37,9
1,9 2,7 3,6 1 4,1
Desa Pedalaman 2,1 1,8 3,4 1,9 18,8
4,5 1,1 1,7 2,3

******

86 | Adi Setiawan
BAB VII
ANALISIS REGRESI LINEAR SEDERHANA

Analisis regresi, biasanya digunakan untuk memodelkan


respon kontinu pada data eksperimen. Dianggap bahwa
peubah respon (respons variable), tergantung pada nilai dari
satu atau sejumlah peubah yang lain, yang dinamakan
peubah penjelas (explanatory variable). Respons yang diamati
dianggap tidak tepat benar nilainya seperti pada pengamatan
tetapi mengandung suatu galat (error), sedangkan nilai-nilai
pada peubah penjelas dianggap eksak. Hubungan antara
peubah respon dan peubah penjelas, dinyatakan dalam
hubungan linear yang tergantung pada vektor parameter.
Nilai parameter ini ditaksir dengan menggunakan metode
kuadrat terkecil (least square error method). Dalam analisis
regresi linear, dianggap bahwa respon mempunyai distribusi
normal.

ANALISIS REGRESI LINEAR SEDERHANA

Analisis regresi adalah suatu teknik statistik untuk


pemodelan dan investigasi hubungan dua atau lebih peubah.
Dalam analisis regresi linear, ada satu atau lebih peubah
bebas, prediktor, atau penjelas yang biasa diwakili dengan
notasi X dan satu peubah respon yang biasa diwakili dengan
notasi Y. Jika banyaknya peubah penjelas yang digunakan
hanya satu maka model yang digunakan model regresi linear
sederhana.
Model regresi linear sederhana untuk n pengamatan
dan satu peubah penjelas adalah sebagai berikut:
Yi   0  X i 1  ei ,
i=1,2,..., n. Dalam hal ini Yi adalah pengamatan ke-i dan X i
adalah peubah penjelas ke-i, sedangkan 0 dan 1

Analisis Data Statistik | 87


merupakan parameter dan ei adalah error stokastik dari
pengamatan ke-i.

Asumsi yang digunakan adalah ei berdistribusi N 0,  2  untuk


semua i dengan masing-masing error tidak bergantung
dengan error yang lain. Untuk mendapatkan estimasi dari
parameter regresi  0 dan 1 , digunakan metode kuadrat
terkecil (least square method). Untuk setiap pasangan
observasi ( X i , Yi ), dibentuk:
n n
D   ei   Yi   0  X i 1  .
2 2

i 1 i 1

Menurut metode kuadrat terkecil, estimasi parameter  0 dan


1 adalah harga dari b0 dan b1 yang membuat D minimum.
Nilai D minimum jika derivatif parsial D terhadap  0 dan 1 ,
yaitu:
D n
 2 Yi   0  X i 1 
 0 i 1

D n
 2 X i Yi   0  X i 1 
1 i 1

sama dengan nol, sehingga:


n

 Y
i 1
i  b0  X i b1   0
n

 X Y  b
i 1
i i 0  X ib1   0 .

Sistem persamaan ini dinamakan persamaan normal. Dengan


menyelesaikan persamaan normal tersebut diperoleh:
n
 n  n 
n X i Yi    X i   Yi 
b1  ̂1  i 1  i 1  i 1 
2
n
 n 
n X i    X i 
2

i 1  i 1 
dan

88 | Adi Setiawan
n n
1 1
b0  ˆ0   Yi  b1  X i  Y  b1 X .
n i1 n i1
Untuk memudahkan perhitungan, seringkali didefinisikan
2
 n 
 Xi 
 i 1 
  ( X i  X )2   X i    ,
n n
2
SS XX
i 1 i 1 n
 n  n 
  X i   Yi 
 i 1  i 1 
  ( X i  X )(Yi  Y )   X i Yi    
n n
SS XY
i 1 i 1 n
maka
SS
b1  ˆ1  XY .
SS XX
Jika harga-harga b0 dan b1 telah diperoleh, maka persamaan
estimasinya sebagai berikut:
Yˆ  b0  b1 X .

Parameter variansi  2 dapat diestimasi dengan Sisaan


Kuadrat Rata- rata (SKR) s2 dengan rumus
JKS
ˆ 2  s 2 
n2
dengan Jumlah Kuadrat Sisaan (JKS)

 
n
JKS   Yi  Yˆi
2
.
i 1

Untuk menghitung s2 dapat digunakan:


n n n

Yi  b0 Yi  b1
i 1
2

i 1
X Yi 1
i i

ˆ  s 
2 2
.
n2

Contoh VII.1:
Data tentang hubungan antara IPK (Indeks Prestasi Komu-
latif) dan IQ (Inteligent Quotient) mahasiswa dinyatakan pada
Tabel VII.1.

Analisis Data Statistik | 89


Tabel VII.1 Tabel Hubungan antara IPK dan IQ

Mahasiswa (i) 1 2 3 4 5 6 7 8
IQ 105 110 115 120 125 140 145 150
IP 2,2 1,9 2,6 2,7 3,1 3,3 3,5 3,9

Scatter plot dari data tersebut digunakan untuk melihat


apakah cukup beralasan untuk menggunakan persamaan
regresi garis lurus dalam memodelkan data. Gambar VII.1
menyatakan scatter plot dari data tersebut dan terlihat bahwa
terdapat hubungan linear antara IQ dan IP mahasiswa.
3.5
3.0
IPK

2.5
2.0

110 120 130 140 150

IQ

Gambar VII.1 Scatter plot data hubungan antara IQ dan IP mahasiswa

Untuk menghitung b1 dan b2 digunakan langkah-


langkah pada Tabel VII.1.

90 | Adi Setiawan
Tabel VII.1 Tabel perhitungan jumlah kuadrat

Xi Yi Xi Yi Xi2 Yi2
105 2,2 231 11025 4,84
110 1,9 209 12100 3,61
115 2,6 229 13225 6,76
120 2,7 324 14400 7,29
125 3,1 387,5 15625 9,61
140 3,3 462 19600 10,89
145 3,5 507,5 21025 12,25
150 3,9 585 22500 15,21
1010 23,2 3005 129500 70,46

Hasil tersebut digunakan untuk menghitung b1 dan b2


berikut:

8 ( 3005 ) 1010 (23,2)


b1   0,038239 ,
8 (129500  1010 2 )
23,2 1010
b0 
 0,038239   1,927673 .
8 8
Persamaan regresi estimasinya adalah
^
Y  0,038239 x 1,927673
dengan x = IQ dan y = IP. Untuk menghitung s2 dapat
digunakan rumus

n n n

Y  b0 Yi  b1  X i Yi
2
i
i 1 i 1 i 1 70.46  (1.927673) 23,2  0,038239(3005)
s2    0,04563941.
n2 82

Inferensi dalam Analisis Regresi Sederhana

Apabila digunakan asumsi ei ~ N 0,  yaitu error berdistribusi


2
 
normal maka:

a. yi berdistribusi N i ,  dengan i   0  X i 1 .
2

b. b0 berdistribusi N 0 , var( b0 )  dengan

Analisis Data Statistik | 91


 n

  Xi
2

var(b0 )   n  2 .
i 1

 2
n (Xi  X ) 
 i 1 
c. b1 berdistribusi N1 , var( b1 ) dengan
 
 
1  2 .
var(b1 )  
 n

  ( X i  X )2 
 i 1 
^
 ^

d. Y k berdistribusi Nk , var(Y k )  dengan
 
 
^  ( X  X )  2
2
1
var(Y k )    n k  ,
n 2
  (Xi  X ) 
 i  1 
^
Y k  b0  b1 X k dan  k   0  1 X k .
Karena 2 tidak diketahui maka biasanya digunakan sebagai
s2 estimasinya. Untuk mengestimasi parameter  1 dapat
digunakan sifat bahwa statistik
b  1
t 1
s(b1 )
1
dengan s(b1 )  n
s2 , mempunyai distribusi t
(Xi 1
i  X) 2

dengan derajat bebas n-2. Interval konfidensi 95 % untuk 1


adalah
b1 – t 6; 0,025 s(b1) < 1 < b1 + t 6; 0,025 s(b1).
Dalam hal ini b1  0,038239 , t 6; 0,025 = 2,447 dan
s2 0,0463941
s(b1 )  n
  0,004792 .
( X
1987,5
i  X )2
i 1

92 | Adi Setiawan
sehingga diperoleh
b1 – t 0,025 s(b1) <  1 < b1 + t 0,025 s(b1)
0,038239 - 2,447 (0,04792) < 1 < 0,038239 + 2,447 (0,004792)
0,02651 <  1 < 0,04997.

Dalam hal ini, apabila ingin menguji H0 :  1 = 0 yaitu


tidak terdapat hubungan linear antara IP dan IQ mahasiswa
melawan H1 :  1  0 yaitu terdapat hubungan linear antara
IP dan IQ mahasiswa maka dapat digunakan statistik
b  1
t 1
s(b1 )
untuk melakukan pengujian hipotesis. Hipotesis nol H0
ditolak dengan tingkat keberartian  = 0,05 jika thitung lebih
besar dari t 0,025 = 2,447 atau lebih kecil dari - t 0,025
= - 2,447 (Lampiran 5). Dalam hal ini :
s2 0,0463941
s(b1 )  n
  0,004792 .
( X
1987,5
i  X )2
i 1

Dari perhitungan diperoleh


b  1 0,038239  0
t 1   7,98
s(b1 ) 0,004792
sehingga H0 ditolak atau terdapat hubungan linear antara IP
dan IQ mahasiswa.

Dari persamaan regresi estimasinya yaitu


^
Y  0,038239 X  1,927673
dengan x = IQ dan y = IP. Apabila diinginkan untuk
mengestimasi IP dari mahasiswa yang mempunyai IQ sebesar
130 maka Xk = 130 sehingga
^
Yk  0,038239 (130)  1,927673  3,04
dan variansi untuk diestimasi dengan

Analisis Data Statistik | 93


^  1 (130  1010 / 8) 2 
s 2 (Y k )     0,0456391  0,006027887
8 1987 
sehingga standard deviasinya adalah
^
s( Y k )  0,07763947 .
Interval kepercayaan 95 % untuk IP tersebut adalah
^
3,04 – 2,447 (0,07763947) < Yk < 3,04 + 2,447
(0,07763947)
atau
^
2,85 < Yk < 3,23.

Pendekatan Analisis Variansi

Seringkali analisis tentang kualitas regresi dilakukan


dengan analisis variansi. Untuk itu jumlah total deviasi
kuadrat variabel bergantung/respons) dipecah menjadi
Jumlah Kuadrat Galat (JKG) dan Jumlah Kuadrat Regresi
(JKR) sehingga
n n ^ n ^
 (Y Y )   (Y Y )   (Y
i 1
i
2

i 1
i i
2

i 1
i  Y )2

yaitu JK = JKG + JKR. Dalam hal ini, JKG adalah besaran


variasi data pengamatan terhadap garis regresi sedangkan
JKR adalah besaran variasi dalam data pengamatan yang
dijelaskan oleh model regresinya. Karena JKG/2 dan JKR/2
masing-masing adalah variabel chi-kuadrat saling bebas
dengan derajat bebas n-2 dan 1 maka JK/2 juga merupakan
variabel chi-kuadrat dengan derajat bebas n-1.
Dapat ditunjukkan bahwa
E[ JKG /(n  2) ]  E[ S 2 ]   2
dan
n
E[ JKR / 1]   2  1  ( X i  X ) 2 .
i 1

94 | Adi Setiawan
Apabila ingin menguji H0 :  1 = 0 melawan H1 :  1  0 maka
digunakan transformasi
JKG / 1 JKG
F  2
JKS /(n  2) S
yang berdistribusi F dengan derajat bebas pembilang 1 dan
derajat bebas penyebut n-2. Akibatnya H0 ditolak jika
Fhitung > F(1, n-2; 1-).
Karena E[ JKR / 1] akan cenderung lebih besar dari E[ S2 ]
jika  1 tidak nol. Hal tersebut dapat diringkas dalam bentuk
tabel analisis variansi berikut ini.

Tabel VII.2 Anava untuk uji H0 : 1 = 0 melawan H1 : 1  0.

Sumber Derajat Jumlah Kudrat Rata- F-Rasio


Variansi bebas Kuadrat rata
Regresi 1 JKR KRR = JKR/1 F =
Galat n-2 JKG S2 = JKG/(n-2) KRR/S2
Total n-1 JK

Untuk mempermudah perhitungan JKR dan JKS dapat


digunakan cara berikut ini :
  n  n 
 i    Yi  
n  X  
JKR  b1  X i Yi    
i  1 i  1

i 1 n 
 
 
n n n
dan JKG   X i  b0  Yi  b1  X i Yi .
2

i 1 i 1 i 1

Contoh VII.2 :
Berdasarkan data pada contoh di atas dapat dihitung JKR
dan JKG berikut ini :
 1010 (23,2) 
JKR  0,0382 3005    2,9062
 8 

Analisis Data Statistik | 95


dan JKG  70,46  (1,9277) (23,2)  0,0382 (3005)  0,2738. Selanjut-
nya, diperoleh tabel anava pada Tabel VII.3

Tabel VII.3 Anava untuk uji H0 : 1 = 0 melawan H1 : 1  0 pada


Contoh VII.2.

Sumber Derajat Jumlah Kudrat Rata-rata F-Rasio


Variansi bebas Kuadrat
Regresi 1 2,9062 2,9062 Fhitung
Sesatan 6 0,2738 0,0456 = 2,9062/0,0456
Total 7 = 63,6760

Karena Fhitung = 63,6760 > 5,99 = F(1, 6; 0,95) = F(1, n-2; 1-) maka
H0 ditolak sehingga terdapat hubungan linear antara IP dan
IQ mahasiswa. Dapat juga dihitung nilai-p dari statistik
hitungnya yaitu :
Nilai-p = P( F(1, 6) > Fhitung )
= 1 - P( F(1, 6)  Fhitung )
= 1- 0,9998
= 0,0002.
Akibatnya karena nilai-p < 0,05 maka H0 ditolak.

Analisis Korelasi pada Analisis Regresi Linear Sederhana

Dalam analisis regresi dianggap bahwa variabel X


konstan artinya bukan variabel random. Jika variabel X dan
Y dianggap mempunyai distribusi bersama maka dapat
didefinisikan koefisien korelasi antara X dan Y berikut ini
Cov ( X , Y ) E[ ( X  E ( X )) (Y  E (Y )) ]
  .
[ var( X ) var(Y ) ]1/ 2
[ E ( X  E ( X ))2 E ( Y  E (Y ))2 ]1/ 2
Dapat ditunjukkan bahwa -1    1. Kuantitas ini
menunjukkan tingkat hubungan linear antara variabel
random X dan variabel random Y. Jika korelasinya positif
maka makin besar nilai X akan makin besar nilai Y dan
sebaliknya jika korelasinya negatif maka makin besar nilai X
akan makin kecil nilai Y.

96 | Adi Setiawan
Jika dimiliki sampel random (X1, Y1), (X2, Y2), ….......,
(Xn, Yn), dari suatu populasi maka
n

( X
i 1
i  X ) ( Yi  Y )
r 1/ 2
n n 
 ( X i  X )  ( Yi  Y ) 
2 2

 i 1 i 1 
dinamakan koefisien korelasi sampel antara X dan Y yang
merupakan estimasi titik dari koefisien korelasi populasi .
Demikian juga, dapat dibuktikan bahwa
JKS JKR
r 2  1 
JK JK
yang dinamakan koefisien determinasi. Akibatnya
0  r2  1.
Koefisien determinasi dikalikan 100 % mengukur besarnya
prosentase data yang tidak dapat dijelaskan model regresi
sehingga (1 - r2 ) 100% menyatakan besarnya persentase
data yang dapat dijelaskan model regresi.

Contoh VII.3:
Berdasarkan data di atas, koefisien determinasi :
JKS JKR 2,90616
r 2  1    0,9139
JK JK 2,90616  0,27384
artinya hubungan antara IQ dan IP mahasiswa dapat
dijelaskan dengan model regresi linear antara IQ dan IP
mahasiswa sebesar 91,39% sedangkan sisanya sebesar
8,61% tidak dapat dijelaskan oleh model regresi linear antara
IQ dan IP mahasiswa. Dengan kata lain 91,39% variasi dari
IP karena hubungannya dengan IQ.
Apabila diinginkan untuk menguji hipotesis H0 :  = 0
melawan H1 :   0 dapat digunakan statistik
n  3  (1  r ) (1   0 ) 
Z ln  
2  (1  r ) (1   0 ) 

Analisis Data Statistik | 97


yang dianggap berdistribusi normal baku. Akibatnya untuk
menguji ada tidaknya korelasi antara variabel X dan variabel
Y dapat digunakan statistik
n  3 1  r 
Z ln 
2 1  r 
yang lebih sederhana dan berdistribusi normal baku.

Contoh VII.3 :
Berdasarkan data di atas, inginkan menguji hipotesis ada
atau tidaknya korelasi antara IQ dan IP mahasiswa. Untuk
itu dilakukan pengujian hipotesis H0 :  = 0 melawan H1:
  0. Hipotesis H0 akan ditolak tingkat keberartian 
= 0,05 jika Zhitung > 1,96 atau Zhitung < - 1,96.
Berdasarkan perhitungan diperoleh bahwa r = 0,956
sehingga
n  3 1  r  8  5  1  0,956 
Z ln   ln    4,242 .
2 1  r  2  1  0,956 
Karena Zhitung = 4,242 maka terdapat korelasi antara IQ dan
IP mahasiswa atau IQ secara signifikan berkorelasi dengan
IP mahasiswa.

*****

98 | Adi Setiawan
SOAL & PENYELESAIAN

Soal 1
Tabel berikut ini digunakan sebagai alat bantu dalam
menghitung b1 dan b0. Selanjutnya jawablah pertanyaan
berikut ini :
a. Lengkapi tabel.
b. Tentukan SSXY.
c. Tentukan SSXX.
d. Tentukan b1.
e. Tentukan X dan Y .
f. Tentukan b0.
g. Tentukan persamaan garis regresinya.
Xi Yi Xi2 XiYi
7 2
4 4
5 2
2 5
1 7
1 6
3 4
n n n n

 Xi   Yi   Xi  XY 
2
i i
i 1 i 1 i 1 i 1

Penyelesaian
a. Tabel perhitungan.
Xi Yi Xi2 XiYi
7 2 49 14
4 4 16 16
5 2 25 10
2 5 4 10
1 7 1 7
1 6 1 6
3 4 9 12
n n n n

 X i  23
i 1
 Yi  30
i 1
 X i 105
i 1
2
 X Y  75
i 1
i i

Analisis Data Statistik | 99


 n  n 
  X i   Yi 
 i 1  i 1 
  X iYi      75  23(30)   23,5714 .
n
b. SS XY
i 1 n 7
2
 n 
 Xi 
 i 1  2
  Xi    105  23  29,4286.
n
c. SS XX
2

i 1 n 7
SS  23,5714
d. b1  ˆ1  XY    0,8010 .
SS XX 29,4286
1 n 23 1 n 30
e. X  
n i 1
X i 
7
 3, 2857 , Y  
n i 1
Yi   4,2857.
7

f. b0  ˆ0  Y  b1 X  4,2857  (0,8010) (4,2857)


=6,9175.
g. Persamaan garis regresi : Y = 6,9175 – 0,8010 X.

Soal 2
Berdasarkan Soal 1 dan tabel berikut ini :
a. Lengkapilah tabel.
b. Gambarkan scatter plot dan garis regresi least square.
Gambarkan persamaan Y = 8 - 0,5 X pada bidang
gambar yang sama.
c. Tunjukkan bahwa JKG yang diperoleh lebih besar dari
pada JKG garis regresi least square.

Xi Yi ^ ^ ^
Yi Yi  Yi (Yi  Yi ) 2
7 2
4 4
5 2
2 5
1 7
1 6
3 4
n ^ n ^
 (Yi  Y i ) 
i 1
 (Yi  Y i )2 
i 1

100 | Adi Setiawan


Penyelesaian
a.

^ ^ ^
Xi Yi Yi Yi  Yi (Yi  Yi ) 2
7 2 1,3105 0,6895 0,4754
4 4 3,7135 0,2865 0,0821
5 2 2,9125 -0,9125 0,8327
2 5 5,3155 -0,3155 0,0995
1 7 6,1165 0,8835 0,7806
1 6 6,1165 -0,1165 0,0136
3 4 4,5145 -0,5145 0,2647
n ^ n ^
 (Yi  Y i )  0
i 1
 (Yi  Y i )2  2,5485
i 1

b. Gambar VIII.2 menyatakan scatter plot, grafik garis


regresi least square (garis tanpa putus) dan grafik garis
Y = 8-0,5 X (garis putus-putus). Dari Gambar VIII.
terlihat bahwa JKG garis putus-putus lebih besar dari
JKG garis least square.

Gambar VIII.2 Tabel Data pada Soal Latihan VI.5

Analisis Data Statistik | 101


c. Dari tabel terlihat bahwa JKG untuk garis regresi Y
= 8 – 0,5 X adalah 35,35 sedangkan JKG untuk garis
regresi least square adalah 2,5485.

Xi Yi ^ ^ ^
Yi Yi  Yi (Yi  Yi ) 2
7 2 4,5 -2,5 6,25
4 4 6 -2 4
5 2 5,5 -3 12,25
2 5 7 -2 4
1 7 7,5 -0,5 0,25
1 6 7,5 -1,5 2,25
3 4 6,5 -2,5 6,25
n ^ n ^
 (Y  Y
i 1
i i ) 0  (Y  Y
i 1
i i ) 2  35,25

Soal 3
Hitunglah JKG dan s2 untuk masing-masing kasus berikut
ini :
^
a. n = 30, SSYY = 95, SSXY = 50, 1  0,75 .

Yi  860 , Yi  50 , SSXY = 2700, 1  0,2 .


^
2
b. n = 40,
c. n = 10,  (Y  Y )
i
2
 58 , Y  50 , SSXY = 91, SSXX = 170.
i

Penyelesaian
a. Berdasarkan rumus JKG diperoleh
^
JKG  SSYY   1 SS XY  95  (0,75)(50)  95  37,5  57,5
sehingga s2 = JKG/(n-2) = 57,5/28 = 2,0536.
b. Dihitung
2
 n 
  Yi 
 i 1  2
SSYY   Yi     860  50  797,5.
n
2

i 1 n 40
Akibatnya

102 | Adi Setiawan


^
JKG  SSYY   1 SS XY  797,5  (0,2)(2700)  797,5  540  257,5
sehingga s2 = JKG/(n-2) = 257,5/38 = 6,7763.
c. Berdasarkan rumus b1 diperoleh
SS 91
b1  ˆ1  XY   0,3370 .
SS XX 270
Selanjutnya,
SSYY   (Yi  Y )2  58
akibatnya
^
JKG  SSYY   1 SS XY  58  (0,3370)(91)  58  30,6670  27,3330
sehingga s2 = JKG/(n-2) = 27,3330/8 = 3,4166.

Soal 4
Konstruksikan interval kepercayaan 95% untuk  1 pada
masing-masing kasus berikut ini :
a. ˆ  31 , s = 3, SSXX = 35, n = 12.
1

b. ˆ1  64 , SSE = 1960, SSXX = 30, n = 18.


c. ˆ1  8,4 , SSE = 146, SSXX = 64, n = 24.

Penyelesaian
a. Interval kepercayaan 95% untuk 1 adalah (a,b) dengan
^ s 3
a   1  t / 2; n  2  31  2,2281  28,0107
SS XX 35
dan
^ s 3
b   1  t / 2; n  2  31  2,2281  33,9893.
SS XX 35
b. Karena JKG = 1960 maka
s2 = JKG/(n-2) = 1960/16 = 122,5
sehingga s = 11,0680. Akibatnya interval kepercayaan
95% untuk 1 adalah (a,b) dengan
^ s 11,068
a   1  t / 2; n  2  64  2,1199  59,7163
SS XX 30

Analisis Data Statistik | 103


dan
^ s 11,068
b   1  t / 2; n  2  64  2,1199  68,2838.
SS XX 30

Soal 5
Kontruksikan scatterplot dari data berikut ini, kemudian
hitunglah r dan r2 untuk masing-masing.
a.
x -2 -1 0 1 2
y -2 1 2 5 6

b.
x -2 -1 0 1 2
y 6 5 3 2 0

Penyelesaian
a. Korelasi antara x dan y adalah r = 0,8835 dan koefisien
determinasi r2 = 0,7805. Dari scatter plot dan nilai r
terdapat hubungan positif antara x dan y.
6
4
y1

2
0
-2

-2 -1 0 1 2

x
Gambar VII.3 Grafik scatter plot antara x dan y pada Soal VII.5.a

b. Korelasi antara x dan y adalah r = -0,7871 dan koefisien


determinasi r2 = 0,6196. Dari scatter plot dan nilai r
terdapat hubungan negatif antara x dan y.

104 | Adi Setiawan


6
5
4
y2

3
2
1
0

-2 -1 0 1 2

Gambar VII.4 Grafik scatter plot antara x dan y pada Soal VII.5.b

Analisis Data Statistik | 105


LATIHAN

1. Diketahui hubungan x dan y dinyatakan dalam tabel :

x 0,5 1 1,5
y 2 1 3

a. Buatlah scatter plot dan garis regresi y = 3 – x dan


y=1+x!
b. Yang manakah garis yang seharusnya dipilih untuk
menggambarkan hubungan antara x dan y ?
Jelaskan !
c. Tunjukkan bahwa jumlah error dari kedua garis
tersebut sama dengan 0.
d. Garis yang manakah yang mempunyai JKG lebih
kecil ?
e. Carilah garis regresi least square !
2. Misalkan diketahui data tentang hubungan antara x
dan y yang dinyatakan pada tabel :

x 5 3 -1 2 7 6 4
y 4 3 0 1 8 5 3

a. Konstruksikan scatter plot dari data.


b. Apakah scatter plot menyarankan adanya
hubungan antara x dan y ?
c. Apabila diberikan bahwa SSXX = 43,4286, SSXY =
39,8571, Y  3,4286 dan X  3,7143 , hitunglah
estimasi least square dari ̂1 dan ̂ 0 .
d. Buatlah scatter plot dan garis regresi least square.
Apakah garis yang diperoleh sesuai. Berikan
penjelasan.
e. Interpretasikan pada interval mana akan mempunyai
arti.

106 | Adi Setiawan


3. Konstruksikan interval kepercayaan 95% untuk 1 jika
ˆ1  8,4 , JKG = 146, SSXX = 64, n = 24.
4. Jelaskan apakah korelasi r berikut ini menyatakan
hubungan antara y dan x jika
a. r = 1,
b. r = -1,
c. r = 0,
d. r = 0,1,
e. r = 0,9,
f. r = - 0,88.
5. Kontruksikan scatterplot dari data berikut ini,
kemudian hitunglah r dan r2 untuk masing-masing.
a.
x -2 -1 0 1 2
y -2 1 2 5 6

b.
x -2 -1 0 1 2
y -2 1 2 5 6

6. Gambarkan gradien dari garis regresi least square jika:


a. r = 0,7
b. r = -0,7,
c. r = 0,
d. r2 = 0,64.
7. Diketahui n = 10, SSXY = 32, SSYY = 26, SSXY = 28.
a. Tentukan persamaan garis regresinya.
b. Gambarkan garis regresinya.
c. Hitung JKG.
d. Tentukan interval kepercayaan 90% untuk rata-rata
nilai y jika xp = 2,5.
e. Tentukan interval prediksi 99% untuk y bila xp = 4.

Analisis Data Statistik | 107


8. Banyaknya bakteri per satuan volume dinyatakan
dalam suatu kultur setelah x jam dinyatakan dalam
tabel berikut ini:
Banyaknya jam (x) 0 1 2 3 4 5
Banyaknya bakteri 28 37 50 120 170 250
per satuan volume

Apabila digunakan model y=a x maka gunakan regresi


linear untuk menentukan a dan b.
Perkirakan y bila x = 7.
9. Tabel berikut ini hubungan antara nilai Matematika
dan nilai Kimia dari mahasiswa tahun pertama
Fakultas Sains dan Matematika UKSW.
b. Apabila nilai Matematika mahasiswa 70 maka
berapakah nilai Kimia yang dharapkan untuk
diperoleh.
Nilai Matematika 70 75 85 65 70 90 80 95

Nilai Kimia 60 70 70 60 60 80 70 90

10. Berikut ini pendapatan dari tim bola basket nasional dan
kekayaan yang dimiliki tim tersebut.
a. Buatlah scatter plot dari data tersebut.
b. Estimasi garis regresi yang menyatakan hubungan
antara pendapatan yang diperoleh dengan kekayaan
yang dimiliki.
c. Apakah regresi yang anda peroleh memenuhi asumsi
normalitas dari residu ?

108 | Adi Setiawan


Pendapatan (dalam Kekayaan (dalam
Nama Tim
miliyar rupiah) miliyar rupiah)

Elang 2 10

Rajawali 3 11

Bintang Timur 3 13

Bintang Pagi 4 15

Permata Bumi 5 20

Jamrud Nusantara 4 22

Intan Merdeka 5 23

Nusa Merdeka 6 24

Nusa Cendana 7 21

Nusa Antara 6 22

***

Analisis Data Statistik | 109


BAB VIII
ANALISIS REGRESI LINEAR GANDA

Analisis regresi ganda biasanya digunakan untuk


memodelkan respons kontinu pada data eksperimen. Dalam
pemodelan ini dianggap bahwa peubah respons (response
variable) tergantung pada nilai dari sejumlah peubah yang
lain. Dalam analisis regresi ganda, peubah terakhir ini biasa
dinamakan peubah penjelas (explanatory variable).
Dalam model linear, dilakukan penganggapan bahwa
respon mempunyai distribusi normal sedangkan dalam kasus
yang lebih umum ditemukan juga bahwa respon berasal dari
distribusi yang merupakan anggota keluarga eskponensial.
Hal ini dipelajari dalam model linear rampat (generalized
linear models).

VIII.1 Model Regresi Linear Ganda

Model regresi linear ganda untuk n pengamatan dan


p peubah penjelas dengan p < n adalah
Yi   0  X i1 1  .... X ip  p  ei
dengan E( ei ) = 0 dan E( ei ej ) = untuk i = j dan 0 untuk i  j
dengan i, j = 1, 2, ..., n. Dalam hal ini Yi adalah pengamatan
ke-i dan Xij adalah pengamatan ke-i dan peubah penjelas ke-
j, sedangkan merupakan parameter dan ei merupakan
kesalahan stokastik dalam pengamatan ke-i.
Model tersebut dapat dinyatakan dalam notasi matriks
:
Y  X  e
dengan E( e ) = dan Cov( e ) = 2 I nn. Dalam hal ini
Y = (Y1, Y2, ..., Yp)T
adalah vektor pengamatan dan X adalah matrix n  (p+1)
dengan baris ke-i adalah

110 | Adi Setiawan


X iT = (1, xi1, xi2, ..., xip)T.
Vektor  = (0, 1, …, p)T adalah vektor parameter yang
tidak diketahui dan e = ( e1, e2, ..., en ) adalah vektor
stokastik dari kesalahan dan Inn adalah matriks identitas.
Dalam pembahasan ini dibatasi hanya pada rank(X) = p + 1.
Untuk menaksir vektor parameter digunakan metode
kuadrat terkecil. Bila kesalahan mempunyai distribusi selain
normal seperti distribusi Poisson, Gamma dan distribusi yang
simetrik dengan ekor tebal maka dapat digunakan metode
penaksir kemungkinan maksimum (maximum likelihood
estimator method). Penaksir kuadrat terkecil untuk vektor
parameter  akan meminimumkan jumlah kuadrat residu
S( ) = (Y – X  )T (Y – X  ).
^ ^ ^
Berarti  memenuhi X T (Y  X  )  0 atau X T X   X T Y
sehingga diperoleh
^
  ( X T X ) 1 X T Y .
^ ^ ^
Vektor residu R Y Y dengan Y  X  dan berarti elemen
ke-i adalah
^ ^
Ri  Yi  Y i  Yi  X i  .
T

^
Fungsi S di titik  dinamakan jumlah kuadrat galat (JKG –
residual sum of square) yaitu
^ ^ ^
JKG  S (  )  ( Y  X  )T (Y  X  )  RT R .
^
Dapat dibuktikan bahwa  merupakan penaksir tak bias
untuk  dan berlaku
^
Cov (  )   2 ( X T X ) 1 .
Jika digunakan
^ 2 JKG
 
n  p 1

Analisis Data Statistik | 111


sebagai penaksir 2 maka matriks kovariansi dari  dapat
ditaksir dengan
^ ^ ^ 2
Cov (  )  ( X T X ) 1 .
Di bawah anggapan bahwa e berdistribusi normal maka
^ 2
(n  p 1) /  2
mempunyai distribusi chi-kuadrat dengan derajat bebas (n-
p-1). Berikut ini diberikan contoh penggunaan metode
kuadrat terkecil dalam penaksiran parameter-parameter
dalam analisis regresi linear ganda.

Contoh VIII.1
IPK ternyata tidak hanya dipengaruhi oleh IQ tetapi juga KE
(Kecerdasan Emosional) mahasiswa. Tabel VIII.1 menyatakan
hubungan antara skor IQ, skor KE dan IPK. Tentukan
estimasi parameter  dengan menggunakan perkalian matriks.

Tabel VIII.1 Tabel Hubungan antara IPK, IQ dan KE.


Mahasiswa (i) 1 2 3 4 5 6 7 8
IQ 105 110 115 120 125 140 145 150
IP 2,2 1,9 2,6 2,7 3,1 3,3 3,5 3,9
KE 80 80 80 90 130 130 130 130

Penyelesaian
3.5

3.5
3.0

3.0
IP

IP
2.5

2.5
2.0

2.0

110 120 130 140 150 80 90 100 110 120 130

IQ KE

Gambar VIII.1 Scatter plot hubungan antara IP dengan IQ dan IP


dengan KE.

112 | Adi Setiawan


Gambar VIII.1 menyatakan scatter plot hubungan
antara IP dengan IQ dan IP dengan KE. Terlihat bahwa
cenderung terdapat hubungan linear antara IQ dan IP
sedangkan untuk KE dan IP tidak menunjukkan hubungan
yang linear. Dalam perhitungan estimasi parameter dengan
menggunakan matriks, maka didefinisikan matriks
 2,2 
 
 1,9 
 2,6 
 
 2,7 
 3,1 
 
 3,3 
 
 3,5 
 3,9 
 
dan matriks X sebagai
1 105 80 
 
1 110 80 
1 115 80 
 
1 120 90 
1 125 130 .
 
1 140 130 
 
1 145 130 
1 150 130 
 
Akibatnya, diperoleh estimasi matriks parameter  sebagai
berikut:
  1,5739 
^  
   0,0308  .
 0,0054 
 
Di samping itu, diperoleh JKG = 0,2451 dan
^ 2 JKG 0,2451 0,2451
     0,0490.
n  p 1 8  2 1 5

Analisis Data Statistik | 113


^
Demikian juga, diperoleh Y  2,9 dan Y i dapat dinyatakan
dengan
 2,1011 
 
 2,2551 
 2,4092 
 
^  2,6182 
Yi  .
 2,9918 
 3,4541 
 
 3,6082 
 3,7623 
 
n n ^
Akibatnya JK   (Yi  Y )  3,18 , JKG   (Yi  Y i )  0,2451 dan
2 2

i 1 i 1

JKR = JK-JKG = 3,18-0,2451 = 2,9349. Selanjutnya diperoleh


tabel analisis variansi dalam analisis regresi linear ganda.

Tabel VIII.1. Anava untuk uji H0 : 1 = 2 = 0 melawan H1 : 1  0 atau 2


 0.

Sumber Derajat Jumlah Kudrat Rata-


F-Rasio
Variansi bebas Kuadrat rata
Regresi 2 JKR = 2,9349 KRR = 1,4675 F = KRR/S2
Galat 5 JKG = 0,2450 S2 = 0,049 = 29.948
Total 7 JK = 3,1800

Berdasarkan tabel analisis variansi pada Tabel VIII.1,


diperoleh Fhitung = 29,948 sedangkan Ftabel adalah
F0,05; 2,5  5,7861 sehingga H0 ditolak. Hal itu berarti 1  0 atau
2  0 sehingga model regresi berarti. Nilai-p dari uji adalah
Nilai-p = P(F2,5 > Fhitung) = 1 – P(F2,5  29,948) = 0,0016
sehingga H0 juga ditolak dengan menggunakan metode nilai-
p.
Pada sisi lain, estimasi matriks kovariansi dari parameter 
yaitu

114 | Adi Setiawan


 0,6127  7,5924 103 3,3130 103 
^ ^ ^ 2  
Cov (  )   ( X X )    7,5924 10 3
T 1
1,1862 10 4  6,9492 10 5 .
 3,3130 10 3  6,9492 10 5 5,1392 10 5 

Standard error dari estimasi parameter 0, 1 dan  2 berturut-


turut adalah akar dari elemen diagonal matriks kovariansi
tersebut di atas yaitu 0,7463, 0,0109 dan 0,007.
Akibatnya, dapat diperoleh tabel perhitungan uji-t untuk
masing-masing koefisien parameter  pada Tabel VIII.2.
Terlihat bahwa koefisien yang signifikan hanyalah koefisien
IQ sehingga variabel yang masuk ke dalam model seharusnya
hanyalah variabel IQ. Apabila hanya digunakan variabel IQ
dalam model maka akan diperoleh hasil seperti pada Tabel
VII.1.

Tabel VIII.2 Tabel Estimasi Parameter dan Uji-t.

Standard
Koefisien Estimasi t Nilai-p
Error
Konstanta -1,5739 0,7827 -2,0109 0,1005
IQ 0,0308 0,0109 2,8257 0,0369
KE 0,0055 0,0072 0,7639 0,4794

Dalam suatu kasus, perhitungan besaran uji tidak


selalu sesuai, sebab seringkali sudah dapat diperkirakan
beberapa peubah penjelas yang penting sehingga diharapkan
Fhitung besar. Hal yang menarik untuk dilakukan adalah
menguji hipotesis untuk melihat apakah semua peubah
bersama-sama penting artinya apakah semua di samping X1,
X2, ..., Xp juga Xp+1, Xp+2, ..., Xq dengan q > p dapat digunakan
sebagai peubah penjelas dalam model ?
Masalah ini sama artinya dengan menguji hipotesis
H0 :  p+1 =  p+2 = ..... =  q = 0 dan  0 ,  1 , ..... ,  q
sebarang melawan alternatif

Analisis Data Statistik | 115


H1 : model (*) yang benar atau  j  0 untuk j
tertentu dengan p+1  j  q dan 0 , 1 , ..... ,  q sebarang.
Dalam hal ini, model (*) adalah
Y   0 1  1 X 1  ....  p X p  e (*).
Untuk melakukan pengujian terhadap hipotesis tersebut
digunakan prosedur berikut ini.
 Gunakan model dengan X1, X2, ..., Xp tetapi tanpa Xp+1,
Xp+2, ..., Xq dan tentukan jumlah kuadrat residu JKGp.
 Gunakan model dengan X1, X2, ..., Xp dan Xp+1, Xp+2,
..., Xq kemudian tentukan jumlah kuadrat residu JKGq.

Dalam hal ini (JKGp-JKGq) menyatakan bagian jumlah


kuadrat dari Y yang dijelaskan oleh Xp+1, Xp+2, ..., Xq dan
bukan oleh X1, X2, ..., Xp. Jika didefinisikan
F p,q = (n-q-1) ( JKGp – JKGq)/[(q-p) JKGq]
dan e1, e2, ..., ep independen dan berdistribusi identik
normal maka di bawah hipotesis F p,q berdistribusi F dengan
derajat bebas q-p dan n-p-1. Dengan menggunakan tingkat
kepentingan (level of significance), hipotesis nol akan ditolak
jika
F p,q  F (q-p), (n-q-p); 1- 
Uji ini dikenal dengan nama uji F parsial.

Contoh VIII.2
Apabila dalam Contoh VIII.1, hanya digunakan dengan
peubah penjelas yang berpengaruh hanyalah peubah IQ
maka didapat JKGp = 0,2738 sedangkan apabila digunakan
peubah penjelas IQ dan KE maka didapat JKGq = 0,2450.
Dalam hal ini Fhitung parsial adalah
(10-2-1) (0,2738 – 0,2450)/[(2-1) 0,2450]
= (7) 0,0288 / 0,2450 = 0,0288
dan nilai-p-nya adalah 1-P(F7,1  0,0581) = 0,9957. Berarti
hipotesis nol diterima untuk tingkat kepentingan  = 0,05

116 | Adi Setiawan


sehingga variabel KE tidak berpengaruh besar dalam penentuan
IP.

Contoh VIII.3
Berdasarkan pada Contoh VIII.1, diperoleh koefisien deter-
minasi R2 = 0,9229 dan b0 = -1,5739, b1 = 0,0308 dan b2 =
0,0055. Sumbangan efektif variabel IQ terhadap koefisien
determinasi R2 dapat dihitung dengan rumus
n
bX 1 R 2  ( X 1i  X 1 )( Yi  Y )
i 1 76
SE X 1   0,0308 (0,9229)  0,7361,
JK Re g 2,9349
dan sumbangan efektif variabel KE terhadap koefisien deter-
minasi R2 adalah
n
bX 2 R 2  ( X 2i  X 2 )( Yi  Y )
i 1 108
SE X 2   0,0055 (0,9229)  0,1868
JK Re g 2,9349
sehingga R  SEX1  SEX 2 .
2

Contoh VIII.4
Data pada Tabel VIII.3 menyatakan data tentang pengukuran
Psychological Well Being (PWB) remaja di SMPN 1 Kupang
dikaitkan dengan variabel Religiusitas (RELIGI), Parent
Adolescent Relationship (PAR), usia (UMUR) dan jenis kelamin
(JK1). Variabel PWB mengukur kebahagiaan remaja, variabel
RELIGI mengukur ketaatan beragama, PAR mengukur
hubungan antara remaja dengan orang tuanya, variabel
UMUR adalah usia remaja pada saat pengukuran dan variabel
JK1 bernilai 1 jika remaja laki-laki dan 0 jika remaja
perempuan.
a. Jika digunakan tingkat keberartian 5% maka variabel
manakah yang diperlukan dalam penyusunan model
regresi ganda yang paling sederhana?
b. Berikan model regresi terpilih!

Analisis Data Statistik | 117


c. Berapa persen kontribusi tiap-tiap variabel dalam
koefisien determinasi ?
Penyelesaian
a. Dalam pemilihan model, perlu dihitung terlebih dahulu
korelasi antara variabel penjelas dengan variabel
respon. Korelasi antara variabel PWB dengan RELIGI,
PAR, UMUR dan JK1 berturut-turut adalah 0,558,
0,511, 0,027 dan -0,027 dengan nilai-p berturut-turut
adalah 0, 0, 0,772 dan 0,746. Misalkan diketahui
model-model yang akan dipilih adalah

Model 1 : PWB = 0 + ,
Model 2 : PWB = 0 +  1 RELIGI + ,
Model 3 : PWB = 0 +  1 RELIGI + 2 PAR + .
Model 1, Model 2 dan Model 3 berturut-turut
mempunyai JKG1 = 14065,33, JKG2 = 9685,168 dan
JKG3 = 8656,048.

Tabel VIII.3 Tabel Hasil Pengukuran Psikologi

NO PWB RELEGI PAR UMUR JK1 NO PWB RELEGI PAR UMUR JK1
1 124 112 110 14 1 73 139 117 106 14 1
2 138 111 120 14 1 74 109 106 70 13 1
3 130 116 111 13 1 75 99 108 106 13 1
4 135 117 124 14 1 76 120 104 107 12 0
5 139 118 124 13 0 77 132 122 124 13 1
6 113 111 101 14 1 78 112 108 115 13 0
7 113 108 98 12 0 79 113 108 99 13 0
8 123 112 116 13 0 80 125 116 115 14 1
9 127 113 120 14 1 81 124 114 112 13 1
10 127 110 120 14 0 82 132 115 113 14 1
11 114 119 119 13 0 83 114 109 106 14 0
12 116 112 119 15 0 84 129 114 116 13 1
13 121 120 111 15 1 85 136 116 110 14 0
14 127 120 120 13 1 86 126 113 121 12 0
15 122 106 117 13 1 87 108 106 104 14 0
16 126 117 114 13 1 88 103 106 95 14 1
17 120 105 105 14 1 89 125 122 124 14 0

118 | Adi Setiawan


18 120 105 106 13 1 90 124 117 93 13 0
19 120 115 85 12 0 91 120 116 96 14 1
20 126 117 112 13 0 92 119 114 116 13 0
21 102 105 94 13 1 93 103 108 116 13 0
22 113 109 118 13 1 94 128 114 100 14 1
23 121 107 109 13 1 95 110 114 107 13 1
24 112 107 86 13 1 96 125 111 122 13 0
25 112 107 101 13 1 97 142 120 117 13 0
26 116 112 99 14 1 98 127 117 110 14 0
27 124 117 118 13 1 99 127 117 106 13 0
28 121 106 103 13 1 100 122 119 118 14 0
29 137 113 118 13 1 101 105 107 101 13 0
30 127 99 111 13 1 102 131 116 106 13 1
31 114 116 92 14 1 103 103 106 108 13 1
32 132 119 123 13 1 104 133 118 118 14 1
33 121 116 105 15 0 105 122 113 111 13 1
34 108 108 106 14 0 106 108 97 104 13 0
35 141 124 123 13 0 107 131 125 125 13 0
36 121 114 110 13 0 108 117 112 113 13 0
37 129 117 73 13 0 109 137 123 119 13 1
38 126 118 102 13 0 110 113 108 111 14 1
39 134 119 123 13 0 111 122 111 116 14 1
40 117 107 98 14 0 112 105 115 108 14 1
41 130 116 117 13 1 113 116 110 101 15 0
42 116 115 112 14 1 114 97 95 98 14 0
43 114 123 109 13 1 115 130 125 125 13 0
44 114 108 106 13 1 116 120 112 114 14 0
45 133 116 115 14 0 117 138 113 118 13 0
46 134 120 116 14 0 118 134 111 111 15 1
47 124 119 103 13 1 119 139 106 102 14 1
48 123 109 112 13 0 120 122 107 113 13 1
49 118 104 108 13 1 121 139 117 123 13 1
50 107 112 107 14 0 122 117 98 100 13 0
51 113 93 100 14 1 123 115 118 111 14 1
52 134 121 116 14 1 124 133 117 124 13 1
53 124 107 108 14 0 125 137 125 125 14 0
54 120 111 108 13 1 126 147 121 117 14 0
55 120 107 98 13 0 127 129 113 120 14 0
56 130 118 119 14 1 128 124 112 112 14 0
57 114 118 117 14 0 129 133 113 110 13 0
58 127 121 114 14 0 130 131 116 109 13 0
59 117 117 111 14 1 131 123 106 87 14 0

Analisis Data Statistik | 119


60 118 115 104 12 0 132 127 111 111 13 1
61 123 107 112 13 1 133 118 111 113 13 1
62 117 94 95 12 1 134 120 111 104 14 1
63 114 101 90 13 1 135 105 100 97 15 1
64 118 94 100 14 1 136 120 107 115 14 0
65 126 116 116 14 1 137 124 117 123 14 1
66 105 93 94 13 0 138 116 111 114 13 1
67 106 114 76 13 0 139 121 99 96 13 1
68 118 110 108 13 0 140 129 116 125 14 1
69 133 117 118 14 1 141 120 117 110 13 0
70 126 119 123 13 0 142 128 102 112 13 0
71 121 113 109 14 1 143 120 112 114 13 1
72 141 121 118 13 1 144 112 111 118 13 0

Misalkan diinginkan menguji hipotesis nol H0 : Model 1


yang baik digunakan melawan hipotesis H1 : Model 2
yang baik digunakan dengan menggunakan tingkat
keberartian 5%. Uji statistik yang digunakan adalah uji
F parsial. H0 ditolak jika
Fhitung > F ;1,144 11  F0, 05;1,142  3,9078.
Dari perhitungan diperoleh
F p,q = (n-q-1) ( JKGp – JKGq)/[(q-p) JKGq]
= (144-1-1)(14065,33-9685,168)/[(2-1)*9685,168]
= 64,2202.
Karena Fhitung = 64,2202 > Ftabel = 3,9078 maka H0
ditolak sehingga Model 2 yang lebih baik.
Selanjutnya, akan dibandingkan manakah yang
akan dipilih antara Model 2 dan Model 3 sehingga diuji
hipotesis nol H0 : Model 2 yang baik digunakan melawan
hipotesis H1 : Model 3 yang baik digunakan dengan
menggunakan tingkat keberartian 5%. Hipotesis H0
ditolak jika
Fhitung > F ;1,144  2 1  F0, 05;1,141  3,9083.
Dari perhitungan diperoleh
F p,q = (n-q-1) ( JKGp – JKGq)/[(q-p) JKGq]
= (144-2-1)( 9685,168-8656,048)/[(2-1)*9685,168]

120 | Adi Setiawan


= 16,7635.
Karena Fhitung = 16,7635 > Ftabel = 3,9083 maka H0
ditolak sehingga Model 3 yang lebih baik.
Selanjutnya, didefinisikan
Model 4 :
PWB = 0 + 1 RELIGI +  2 PAR + 3 UMUR + ,
Model 5 :
PWB = 0 + 1 RELIGI +  2 PAR + 3 JK1 + .
Berdasarkan perhitungan, diperoleh JKG4 = 8643,196
dan JKG5 = 8497,717. Untuk memilih model terbaik,
selanjutnya dilakukan pengujian hipotesis nol H0 :
Model 3 yang baik digunakan melawan hipotesis H1 :
Model 4 yang baik digunakan dengan menggunakan
tingkat keberartian 5%. Hipotesis H0 ditolak jika
Fhitung > F ;1,144 31  F0, 05;1,140  3,9087.
Dari perhitungan diperoleh
F p,q = (n-q-1) ( JKGp – JKGq)/[(q-p) JKGq]
= (144-3-1)( 8656,048-8643,196)/[(3-2)* 8643,196]
= 0,2126.
Karena Fhitung = 0,2126 < Ftabel = 3,9087 maka H0
diterima sehingga Model 3 yang lebih baik digunakan.
Demikian juga, dilakukan pengujian hipotesis nol H0 :
Model 3 yang baik digunakan melawan hipotesis H1 :
Model 5 yang baik digunakan dengan menggunakan
tingkat keberartian 5%. Hipotesis H0 ditolak jika
Fhitung > F ;1,144 31  F0, 05;1,140  3,9087.
Dari perhitungan diperoleh
F p,q = (n-q-1) ( JKGp – JKGq)/[(q-p) JKGq]
= (144-3-1)( 8656,048-8497,717)/[(3-2)* 8497,717]
= 2,6085.
Karena Fhitung = 2,6085 < Ftabel = 3,9087 maka H0
diterima sehingga Model 3 yang lebih baik digunakan.
Hal itu berarti bahwa variabel yang perlu dimasukkan
ke dalam model adalah RELIGI dan PAR.

Analisis Data Statistik | 121


b. Model yang terpilih adalah :
PWB = 23,819 + 0,590 RELIGI + 0,293 PAR.
Hal itu berarti, PWB dipengaruhi secara positif oleh
RELIGI dan PAR artinya jika skor religiusitas siswa naik
maka psychological well being juga akan naik atau kese-
jahteraan akan naik dan jika skor parent adolescent
relationship naik maka PWB atau kesejahteraan siswa
pun akan naik.
c. Koefisien determinasi R2 = 38,46% artinya model dapat
menjelaskan data sedangkan sisanya yaitu 61,54%
tidak dapat dijelaskan oleh model regresi linear ganda
tersebut. Sumbangan efektif variabel RELIGI terhadap
koefisien determinasi R2 adalah 22,57 % sedangkan
sumbangan efektif variabel PAR terhadap koefisien
determinasi R2 adalah 15,89% sehingga total R2 adalah
38,46%.

VIII.2 Diagnosis dalam Regresi


Scatter Plot dan Regresi
Ilustrasi berikut ini menggambarkan bahwa scatter plot
sangat bermanfaat dalam pemilihan suatu model yang
beralasan.

Contoh VIII.5
Misalkan dipunyai 4 kelompok data berurut berikut ini :
Himpunan Data X1 – X3
10 8 13 9 11 14 6 4 12 7 5
Himpunan data Y1
8,04 6,95 7,58 8,81 8,33 9,96 7,24 4,26 1 0,84 4,82 5,86
Himpunan data Y2
9,14 8,14 8,74 8,77 9,26 8,10 6,13 3,10 9,13 7,26 4,74
Himpunan data Y3
7,46 6,77 12,74 7,11 7,81 8,84 6,08 5,39 8,15 6,42 5,73
Himpunan data X4
8 8 8 8 8 8 8 8 19 8 8
Himpunan data Y4
6,58 5,76 7,71 8,84 8,47 7,04 5,25 12,50 5,56 7,91 6,89

122 | Adi Setiawan


15

15
10

10
y

y
5

5
0

0
0 5 10 15 20 0 5 10 15 20

x x
15

15
10

10
y

y
5

5
0

0 5 10 15 20 0 5 10 15 20
x x

Gambar VIII.2 Scatter plot dari data-data yang selalu menghasilkan


slope dan intercept yang sama.

Bila digunakan model regresi linear sederhana


Y =  0 + 1 X1 + e.
Untuk memodelkan tiap pasang data maka akan didapat
bahwa semua pasang data tersebut akan mempunyai  0
= 3,0,  1 = 0,5, 2 = 1,5 dan R2 = 0,67. Nampaknya dengan
hanya melihat nilai besaran R2 model regresi linear sederhana
sesuai untuk keempat pasang data tersebut. Tetapi dengan
menggunakan scatter-plot, hal ini tidak merestui kesimpulan
tersebut. Gambar VIII.2 menyatakan scatter plot untuk
keempat kasus tersebut di atas.
Pada kasus pertama, model regresi linear sesuai dengan
yang diharapkan dan untuk kasus yang kedua model regresi
linear sederhana tidaklah sesuai dan dengan melihat scatter-
plot akan dipilih model alternatif polinomial kuadratik. Pada

Analisis Data Statistik | 123


kasus ketiga menunjukkan bahwa model regresi sederhana
akan menjadi lebih baik bila dibuat tanpa mengikutsertakan
satu titik tertentu sehingga didapatkan model
Y = 4,0 + 0,34 X,
sedangkan pada kasus keempat tidaklah cukup informasi
untuk mengatakan kualitas dari model. Gradien garis regresi
hanya ditentukan oleh Y8, tetapi bila pengamatan ke-8
dihilangkan maka parameter tidak dapat ditaksir. Hal ini
berarti bahwa pada kasus keempat analisis hanya tergantung
pada salah satu titik pengamatan.
Terlihat jelas bahwa scatter-plot merupakan alat bantu
yang sangat penting dalam pemilihan model. Seberapa baik
model untuk menggambarkan data dapat dilihat dari koefisien
determinasi R2 dan juga melihat sejumlah scatter-plotnya.
Pada regresi linear sederhana hal ini dapat dibuat scatter-plot
Y melawan X = X1 untuk melihat apakah ada hubungan
antara peubah respon Y dan peubah X=X1, sedangkan dalam
regresi linear ganda tidaklah sesederhana seperti pada regresi
linear sederhana. Biasanya digunakan scatterplot antara Y
dengan setiap peubah penjelas untuk melihat apakah suatu
peubah penjelas berpengaruh pada peubah respon.

Plot Variabel Tambahan (Added Variable Plots)

Misalkan dimiliki model


Y =  0 1 + 0 X1 + 0 X2 + ..... +  p Xp + e
dan akan diamati dengan bantuan grafik untuk melihat
apakah ada hubungan yang kuat antara variabel Xk dan Y
yang dikorelasikan dengan variabel Xj yang lain dengan 1
 k  p. Prosedur yang dilakukan untuk membuat plot
variabel tambahan adalah sebagai berikut:
 Gunakan model regresi linear dari Y dengan mengguna-
kan semua peubah Xj kecuali Xk dan hitung residunya
dan gunakan notasi vektor RY(Xk). Vektor menyatakan

124 | Adi Setiawan


bagian dari Y yang tidak dijelaskan oleh semua Xj
kecuali oleh Xk.
 Gunakan model regresi linear dari Xk dengan variabel
penjelas Xj yang lain dan residunya dinotasikan dengan
R X k . Vektor R X k menyatakan bagian dari Xk yang tidak
dijelaskan oleh Xj yang lain.

Relasi antara 2 himpunan residu tersebut diartikan sebagai


hubungan antara Y dan Xk berkorelasi dengan Xj yang lain.
Grafik RY(Xk) melawan R X k dinamakan plot variabel tambahan
untuk Xk. Kaitan yang kuat antara besaran tersebut
menjelaskan bahwa ada kaitan yang erat antara Y dan Xk.
Misalkan akan dilihat hubungan antara dan dengan
model berikut :
RY(Xk) = 0 + 1 R X k + e
dengan menggunakan metode kuadrat terkecil parameter 0
akan diestimasi dengan 0 = 0 dan 1 =  k dengan merupakan
estimator kuadrat terkecil dalam model
Y =  0 1 + 0 X1 + 0 X2 + ..... +  p Xp + e.
Bila digunakan model tersebut maka plot variabel tambahan
dapat diartikan dengan cara yang sama seperti scatter plot
untuk regresi linear sederhana. Untuk menentukan apakah
suatu peubah pengaruh harus ditambahkan dalam model,
plot peubah tambahan merupakan alat bantu yang sangat
informatif yang sesuai dengan besaran uji Fp,q yang mengan-
dung efek menyeluruh dari penambahan satu variabel
sehingga dalam konteks besran uji untuk q = 1, plot variabel
tambahan menunjukkan efek setiap pengamatan secara
tersendiri. Gambar VIII.3 adalah plot variabel tambahan
untuk plot variabel tambahan untuk RY(variabel bebas)
melawan Rvariabel bebas pada Contoh VIII.1. Terlihat bahwa
plot peubah tambahan tersebut tidak menunjukkan hubungan
linear antara keduanya sehingga variabel KE tidak perlu
dimasukkan dalam model.

Analisis Data Statistik | 125


20
10
R2

0
-10

-0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2

R1

Gambar VIII.3 Plot Peubah Tambahan RY(KE) versus R(KE).

Residu
Di samping scatter plot dari Y melawan Xi yang berbeda,
scatter plot dari Xi dan plot variabel tambahan juga
memberikan kajian informasi residu atas kualitas dari model
yang sesuai. Residu merupakan realisasi dari kesalahan
(error) e1, e2, ..., en sehingga QQplot dari residu melawan
distribusi normal merupakan anggapan yang masuk akal.
Berikut ini diberikan scatter plot lain yang sangat
informatif dalam pemilihan variabel bebas yang perlu
dimasukkan ke dalam model.
 Residu melawan setiap peubah tak bebas dalam model.
Apabila adanya grafik kurvalinear memberikan suatu
petunjuk bahwa model harus menggunakan orde yang
lebih tinggi.
 Residu melawan variabel bebas yang tidak berada
dalam model. Apabila grafik memperlihatkan kaitan

126 | Adi Setiawan


yang jelas maka variabel bebas tersebut harus
ditambahkan pada model.
 Residu melawan variabel tak bebas. Apabila grafik
memperlihatkan relasi non linear maka model yang
digunakan perlu ditinjau lagi.

Contoh VIII.6
Gambar VIII.4 memperlihatkan scatter plot residu melawan
IQ, residu melawan KE dan residu melawan IP dari data pada
Contoh VIII.1. Terlihat bahwa tidak terdapat hubungan linear
maupun non linear dalam scatter plot – scatter plot tersebut
sehingga variabel KE tidak perlu dimasukan dalam model
terpilih.
150

130
120

3.5
140

110
130

3.0
KE
IQ

IP
100
120

2.5
90
110

2.0
80

-0.4 -0.2 0.0 0.1 0.2 -0.4 -0.2 0.0 0.1 0.2 -0.4 -0.2 0.0 0.1 0.2

r r r

Gambar VIII.4 Grafik scatter plot antara x dan y pada Soal VII.5.b

Pengacau (Outlier)
Pada analisis regresi dilakukan penganggapan bahwa model
yang digunakan sesuai untuk semua titik pengamatan. Akan
tetapi seringkali bahwa 1 atau lebih titik pengamatan
mempunyai respon yang tidak nampak berhubungan dengan
model untuk sebagian besar titik-titik yang lain. Salah satu
diagnosis yang dilakukan dalam analisis regresi adalah
mengidentifikasi titik pengacau.

Analisis Data Statistik | 127


Contoh VIII.7
Seorang ahli Fisika Skotlandia sekitar tahun 1850 mengumpul-
kan data mengenai titik didih air pada tekanan yang berbeda
di pegunungan Alpen. Tujuan dari percobaan ini adalah
untuk meneliti hubungan antara tekanan dengan titik didih
air yang lebih sederhana cara mengukurnya dibandingkan
cara mengukur tekanan sehingga dengan mengetahui titik
didih air akan dapat ditentukan ketinggian tempat percobaan
tersebut dilakukan. Apabila variabel x menyatakan titik didih
air dalam derajat Fahrenheit dan variabel y menyatakan 100
ln(tekanan) dalam inchi3 sehingga dalam hal ini variabel
bebas tekanan ditransformasikan dengan fungsi 100 ln
(tekanan) dan data tersebut dinyatakan pada Tabel VIII.4.

Tabel VIII.4 Tabel Data pada Contoh VIII.7


Titik didih 194,5 194,3 197,9 198,4 199,4 199,9 200,9 201,1 201,4
ln(tekanan) 131,79 131,79 135,02 135,55 136,46 136,83 137,82 138 138,06
Titik didih 201,3 203,6 204,6 209,5 208,6 210,7 211,9 212,2
ln(tekanan) 138,04 140,04 142,44 145,47 144,34 146,3 147,54 147,8

Gambar VIII.5 Menyatakan grafik yang sesuai untuk data-


data tersebut. Dari grafik jelas terlihat hubungan linear yang
kuat antara 2 variabel dan hanya ada satu titik yang tidak
berada pada garis. Pada grafik residu melawan nilai x dapat
dilihat bahwa sebagian residu kecil kecuali pada pengamatan
ke-12 demikian juga grafik hubungan antara residu dengan
variabel y menghasilkan kesimpulan yang sama. Akhirnya
dengan QQplot normal dari residu memberikan restu untuk
menghilangkan pengamatan ke-12.
Pada Contoh VIII.7 Di atas menunjukkan bahwa
sangatlah penting untuk terlebih dahulu membuat grafik-
grafik yang dapat digunakan untuk melihat ada tidaknya ata
pengacau. Dalam masalah regresi sederhana seperti pada
contoh tersebut dapat dilakukan dengan membuat scatter
plot antara variabel bebas dengan variabel respon. Dalam
masalah analisis regresi ganda, hal ini dilakukan dengan

128 | Adi Setiawan


membuat scatter plot antara variabel bebas dan variabel tak
bebas serta membuat plot variabel tambahan tetapi hal itu
masih sedikit informasi yang diberikan untuk menentukan
pengacau. Di samping penggunaan grafik dapat juga diberikan
informasi tentang ada tidaknya pengacau dalam data dengan
menggunakan uji pengacau. Sebelum didefinisikan secara
formal uji tersebut, terlebih dahulu didefisikan apa yang
dinamakan pengacau. Misalkan bahwa untuk yang memenuhi
Yj = (xj)T  + ej untuk j  i,
= (xj)T  +  + ej untuk j = i,
maka pengamatan ke-i dinamakan pengacau. Model tersebut
dinamakan mean shift outlier model.
145

1.0
log.tekanan

r
135

0.0

195 200 205 210 195 200 205 210

titik.didih titik.didih

Normal Q-Q Plot


Sample Quantiles
1.0

1.0
r

0.0

0.0

135 140 145 -2 -1 0 1 2

log.tekanan Theoretical Quantiles

Gambar VIII.5 Scatter plot data Forbes, residu melawan x, residu meawan
y dan QQplot dari residu melawan distribusi normal baku.
Untuk mendefinisikan secara formal uji pengacau,
sebelumnya didefinisikan vektor u dengan uj = 0 untuk j  i
dan ui = 1 sehingga model menjadi

Analisis Data Statistik | 129


Y = X + u + e.
Parameter  dan  ditaksir dengan menggunakan metode
kuadrat terkecil dan kemudian digunakan untuk menguji
hipotesis nol H0 :  = 0 dengan  sebarang melawan hipotesis
alternatif H1 :   0 dengan  sebarang. Untuk menguji
hipotesis tersebut digunakan uji t. Hasil output paket
program R untuk penggunaan uji t dinyatakan dalam Gambar
VIII.6 Terlihat bahwa nilai-p untuk parameter  adalah 6,09 
10-9 sehingga lebih kecil dari tingkat keberartian  yang biasa
digunakan. Hal itu berarti,   0 dengan  sebarang sehingga
pengamatan ke-12 merupakan titik pengacau. Dengan cara
yang sama, juga dapat diperoleh nilai-p untuk pengujian
pengamatan pertama yaitu 0,489 sehingga H0 diterima berarti
 = 0 dengan  sebarang. Hasil kesimpulan yang sama juga
diperoleh untuk pengamatan yang lain.

Gambar VIII.6 Hasil output paket program R.

Titik Potensial dan Matriks hat

Pada data Forbes di atas, mudah dilihat bahwa pengamat-


an ke-12 dikeluarkan dari analisis data. Akan tetapi, sulit
dilihat satu titik dengan nilai ekstrim pada variabel bebas.

130 | Adi Setiawan


Contoh VIII.8

Data Huber diberikan pada Tabel VIII.4 Gambar VIII.7


menunjukkan beberapa grafik dari data yait scatter plot dari
x melawan y yang menyarankan untuk membuang pengamatan
ke-6 dengan garis lurus sekitar 5 titik yang lain merupakan
model yang beralasan. Bila digunakan garis lurus untuk
mencocokan model dengan 6 titik pengamatan diperoleh gambar
atas tengah. Grafik kanan atas adalah garis regresi bila
digunakan hanya 5 titik pertama. Garis kiri bawah adalah
residu melawan nilai x. Dapat dilihat bahwa residu terbesar
ada pada pengamatan pertama. Berdasarkan pada hasil
tersebut beralasan untuk menambahkan kuadrat variabel
bebas x ke dalam model. Grafik residu model terakhir
melawan x dinyatakan pada grafik tengah bawah. Tetapi
residu pengamatan keenam masih kecil. Grafik QQplot dari
residu melawan distribusi normal model terakir masih baik.
Tabel VIII.4 Hubungan antara x dan y dalam data Huber.

x -4 -3 -2 -1 0 10
y 2,48 0,73 0,04 -1,44 -1,32 0,00
2

2
1

1
y

y
0

0
-1

-1

-1

-4 -2 0 2 4 6 8 10 -4 -2 0 2 4 6 8 10 -4 -2 0 2 4 6 8 10

x x x

Normal Q-Q Plot


2

-0.2 0.0 0.2 0.4

-0.2 0.0 0.2 0.4


Sample Quantiles
1
r

0
-1

-0.6

-0.6

-4 -2 0 2 4 6 8 10 -4 -2 0 2 4 6 8 10 -1.0 -0.5 0.0 0.5 1.0

x x Theoretical Quantiles

Gambar VIII.7 Berbagai macam grafik untuk data Huber.

Analisis Data Statistik | 131


Contoh di atas menjelaskan bahwa besarnya nilai
residu tidaklah cukup. Sesungguhnya pengamatan keenam
layak untuk disisihkan dalam analisis data. Pengamatan
keenam yang mempunyai nilai residu yang kecil. Misalkan
dimiliki model
Y = X + e
dengan E[e] = 0 dan Cov[ e ] = 2Inn. Dengan menggunakan
metode kuadrat terkecil diperoleh
^ ^
Y  X   X ( X T X ) 1 X T Y
^
1 T
atau Y  H Y dengan H  X ( X X ) X Y . Oleh karena itu vektor
T

^
Y ditransformasikan oleh H menjadi vektor estimasi Y yaitu
sehingga matriks H dinamakan matriks hat (hat matrix).
Dalam hal ini, berlaku sifat
n

h
i 1
ii  rank ( X )  p 1

dan
1
 hii  1.
n
^
Untuk vektor residu berlaku, R Y Y  ( I n  n  H )Y . Jika e1, e2,
..., en saling bebas dan berdistribusi normal maka R
berdistribusi normal dan E[R] = 0 serta mariks kovariansinya
Cov(R) = 2 (I-H). Dalam hal ini,
V ( Rii ) 1  hii
dengan
hii  ( xi )T ( X T X ) 1 xi
adalah elemen diagonal ke-i dari matriks hat H.
Dari persamaan terlihat bahwa nilai besar dari hii yaitu
yang dekat dengan 1 menyebahkan V(Rii) kecil. Karena E[ Ri ]
= 0 maka titik-titik yang mempunyai nilai residu kecil
dianggap tidak dihiraukan. Titik-titik dengan nilai hii besar
menjadi titik potensial (potential point) sedangkan hii

132 | Adi Setiawan


dinamakan potensial dari pengamatan ke-i. Jika hii sama
dengan 1 maka sehingga regresi sangat dipengaruhi oleh titik
^
ini. Jika hii dekat dengan 1 maka Y i dekat dengan Yi. Secara
umum berlaku
^
Y i  hiiYi   hijYij
j i

sehingga jika hii besar tetapi tidak tepat sama dengan 1 maka
regresi sangat dipengaruhi oleh titik ke-i. Oleh karena itu titik
dengan potensial besar tidak harus berpengaruh besar akan
tetapi mempunyai potensi besar untuk berpengaruh.

Contoh VIII.9
Berdasarkan data Huber, matriks hat akan digunakan untuk
mendeteksi titik potensial. Dalam regresi linear sederhana
berlaku
1 ( x  x) 2
hii   n i
 ( xi  x)2
n
i 1

n
1
dengan x  xi . Bila xi  x
n i 1
maka hii mempunyai nilai

minimum yaitu 1/n. Bila jarak antara xi dan x menjadi besar


maka hii juga akan menjadi besar. Matriks hat dari data
Huber dinyatakan sebagai berikut
 0,290 0,259 0,228 0,197 0,167  0,141 
 
 0,259 0,236 0,213 0,190 0,167  0,064 
 0,228 0,213 0,197 0,182 0,167 0,013 
H  .
 0,197 0,190 0,182 0,174 0,167 0,090 
 0,167 0,167 0,167 0,167 0,167 0,167 

  0,141  0,064 0,013 0,090 0,167 0,936 
 
Dapat dilihat bahwa h66 dekat dengan 1, pengamatan yang
bersesuaian yaitu pengamatan ke-6. Karena xi  x maka h55
mempunyai nilai minimum yaitu 1/n = 1/6. Sebagai contoh,

Analisis Data Statistik | 133


Hal itu berarti bahwa nilai estimasi dari yi tergantung pada
nilai-nilai y sedangkan nilai estimasi y6 hanya tergantung
pada y6. Untuk himpunan data yang besar akan lebih
sederhana membuat plot dari nilai potensialnya. Gambar VIII.
menyatakan grafik dari titik potensial ini.
Di samping, hal di atas, masih ada alat yang berguna
untuk mencari titik yang perlu disisihkan dalam analisis
^ 2
data. Didefinisikan residu terstandar yaitu dengan  adalah
estimator dari 2. Di bawah anggapan model benar maka
Ri
Rbaku, i 
^ 2
 (1  hii )
mempuyai distribusi Beta dengan parameter ½ dan (n-
p-2)/2. QQplot dari residu tersandard melawan distribusi
Beta akan memberikan informasi tentang kecocokan model.
0.8
Nilai Potensial

0.6
0.4
0.2

1 2 3 4 5 6

Index

Gambar VIII.8 Grafik nilai potensial untuk data Huber.

Titik Pengaruh

Suatu alasan untuk mencari efek titik potensial pada


prosedur pencocokan adalah mencari model yang sesuai atau

134 | Adi Setiawan


tidak menggunakan titik tersebut. Bila salah satu dari titik
pertama sampai dengan titik kelima diabaikan maka hampir
tidak ada pengaruhnya pada model sedangkan bila titik
keenam diabaikan maka hal itu sangat berpengaruh pada
model. Suatu titik yang sangat berpengaruh pada model
dinamakan titi pengaruh (influence point). Telah dicatat di
depan bahwa titik dengan potensial tinggi tidak harus
merupakan titik potensial.
Untuk mempelajari pengaruh dari titik-titik tertentu
pada analisis statistik digunakan suatu besaran yang
dihitung dengan mengikutsertakan pengamatan yang menjadi
perhatian dan dibandingkan dengan besarn yang sama tetapi
perhitungannya tidak mengikutsertakan titik yang menjadi
perhatian. Besran yang memenuhi sifat ini adalah jarak Cook.
Dalam pembahasan selanjutnya, (i) berarti titik pe-
ngamatan ke-i diabaikan sebagai contoh (i) adalah estimator
dari  yang dihitung tanpa menggunakan titik ke-i. Hal itu
berarti

 ( i )  X ( i )T X ( i ) 
1 T
X (i ) Y(i ) .
Pengaruh dari titik ke-i dapat ditentukan dengan mem-
bandingkan  dan  (i). Untuk itu digunakan jarak Cook. Jarak
Cook dari titik ke-i didefinisikan sebagai
^ ^ ^ ^
(  (i )   )T ( X T X )(  (i )   ) (Y(i )  Y )T (Y(i )  Y )
Di  ^ 2
 ^ 2
( p  1)  ( p  1) 
^ ^ ^ ^
dengan Y  X  dan Y (i )  X  (i ) . Titik-titik dengan jarak Cook
besr mempunyai pengaruh yang substansial pada  . Dengan
mengabaikan titik ini, kesimpulan analisis statistik akan
berbeda. Untuk itu sangatlah berguna untuk membuat tabel
jarak ook untuk semua titiknya.
Pertanyaan yang biasa diajukan adalah kapan nilai Di
besar? Biasanya jarak Cook yang lebih besar dari 1

Analisis Data Statistik | 135


dipandang sebagai titik pengaruh. Secara intuitif, hal itu
diargumentasikan sebagai berikut
 ^ ^ 
 (    )T ( X T X )(   ) 
: ^ 2
 F( p 1), ( n  p 1);1   .
 ( p  1)  
 
Bidang kepercayaan untuk  dengan koefisien kepercayaan
sebesar (1 - )  100%. Secara umum adalah bijaksana untuk
menghasilkan regresi yang mengabaikan titik pengamatan
yang mempunyai jarak Cook besar.

Contoh VIII.10
Jara Cook untuk beberapa himpunan data dinyatakan
berikut ini :

Data Forbes
0,062 0,005 0,002 0,000 0,001 0,001 0,001 0,006,
0,002, 0,005, 0,470, 0,000, 0,055, 0,051, 0,007, 0,009.

Data Huber
0,513 0,014 0,003 0,315 0,099 26,431.

Terlihat bahwa pada titik ke-12 data Forbes sulit


ditemukan bahwa pengamatan tersebut merupakan pengacau
sedangkan untuk data Huber jelas bahwa pengamatan ke-6
merupakan pengacau.

136 | Adi Setiawan


SOAL & PENYELESAIAN

Soal 1
Misalkan diketahui persamaan regresi yang digunakan untuk
estimasi 10 titik pengamatan dinyatakan dengan
^
y  29,127  0,5906 x1  0,498 x2
JK = 6724,125, JKR = 6216,375, sb1  0,0813 dan sb1  0,0567 .
a. Hitung RKR dan RKG.
b. Hitung Fhitung dan lakukan uji F untuk tingkat
keberartian  = 0,05.
c. Lakukan uji t untuk menguji pentingnya koefisien 1
dengan tingkat keberartian  = 0,05.
d. Lakukan uji t untuk menguji pentingnya koefisien 2
dengan tingkat keberartian  = 0,05.
Penyelesaian
a. JKG = JK-JKR = 6724,125-6216,375 = 507,75.
RKR = JKR/2 = 6216,375/2 = 3108,188.
RKG = JKG/(n-2-1) = 6216,375/7 = 72,5357.
b. Fhitung = RKR/RKG = 3108,188/72,5357 = 42,8505.
Ftabel dengan tingkat keberartian 5% adalah
F0, 05 ; 2, 7  4,7374 sehingga H0 ditolak artinya 1  0 atau 2
 0.
c. Thitung diperoleh dengan rumus
b 0,5906
Thitung  1   7,2645
sb1 0,0813
sedangkan ttabel adalah t0,025; 7  2,3646. Akibatnya H0
ditolak artinya koefisien b1 merupakan koefisien yang
penting.
d. Thitung diperoleh dengan rumus
b 0,4980
Thitung  2   8,7831
sb2 0,0567

Analisis Data Statistik | 137


sedangkan ttabel adalah t0,025; 7  2,3646. Akibatnya H0
ditolak artinya koefisien b2 merupakan koefisien yang
penting.

Soal 2

Gambar VIII.9 Hasil Perhitungan Data pada Soal VIII.2

Gambar VIII.9 menyatakan hasil perhitungan data untuk


memperoleh model regresi linear ganda yang menyatakan
hubungan antara pendapatan (revenue) dengan iklan pada tv
dan iklan pada surat kabar (news). Berdasarkan output paket
program R pada Gambar VIII.9, jawablah pertanyaan berikut
ini:
a. Bagaimanakah model regresi ganda yang anda peroleh ?
b. Tentukan koefisien determinasi ! Apakah artinya?
c. Apakah asumsi residu berdistribusi normal dipenuhi ?
Penyelesaian
a. Model regresi yang diperoleh adalah
Revenue = 83,2301 + 2,2902 TV + 1,3010 News.
Hal itu berarti iklan pada TV berpengaruh positif
terhadap revenue dan demikian juga iklan pada

138 | Adi Setiawan


newspaper berpengaruh positif terhadap revenue. Jika
iklan TV naik sebesar 1 satuan maka akan menaikkan
revenue sebesar 2,2902 satuan sedangkan jika iklan
pada Newspaper naik sebesar 1 satuan maka akan
menaikan revenue sebesar 1,3010 satuan.
b. Koefisien determinasi sebesar 91,9%. Hal itu berarti
bahwa model dapat menggambarkan datanya sebesar
91,9% sedangkan sisanya yaitu sebesar 8,1% tidak bisa
dijelaskan oleh model.
c. Dengan menggunakan uji Kolmogorov-Smirnov dengan
tingkat keberartian 5% diperoleh nilai-p = 0,501 sehingga
asumsi normalitas dari residu dipenuhi.

Soal 3
Data pada Tabel VIII.4 menyatakan data tentang hubungan
skor self-estem SE, dukungan sosial teman sebaya DSTS dan
school connectedness SC serta jenis kelamin JK1 terhadap
skor subjective well-being SWB dari siswa-siswa SMPN 2
Tuntang Kabupaten Semarang. Dalam hal ini, 1 berarti siswa
laki-laki sedangkan 0 berarti siswa perempuan. Tentukan
model terbaik yang menyatakan hubungan antara variabel-
variabel tersebut. Tentukan koefisien determinasi dari model
terbaik tersebut dan kontribusi dari masing-masing variabel.
Penyelesaian
Korelasi Pearson antara SWB dan SE adalah 0,526 sehingga
dengan ukuran sampel n= 210 signifikan. Dipilih
Model 1 : SWB =  0 + 1 SE + ,
Model 2 : SWB =  0 + 1 SE + 2 DSTS + ,
Model 3 : SWB =  0 + 1 SE + 2 SC + ,
Model 4 : SWB =  0 + 1 SE + 2 JK1 + .
Model 1, Model 2, Model 3, Model 4 mempunyai R2 berturut-
turut adalah R12 = 0,276, R22 = 0,276, R32 = 0,289 dan R42
= 0,553. Di samping itu, Model 1, Model 2, Model 3, Model 4
mempunyai JKG berturut-turut adalah JKG1 = 78949,138,

Analisis Data Statistik | 139


JKG2 = 78948,952, JKG3 = 77515,399 dan JKG4 =
48750,029.
Untuk memilih model terbaik digunakan langkah-langkah
berikut ini.

Langkah 1
Dilakukan pengujian hipotesis nol H0 : Model 1 yang dipilih,
melawan hipotesis alternatif H1 : Model 2 yang dipilih, dengan
tingkat keberartian 5%. Statistik yang digunakan adalah
Fparsial. Hipotesis H0 ditolak jika Fhitung lebih besar dari
F ;1, n  p 1  F0,05;1, 207  3,8868. Dari perhitungan diperoleh
(n  q  1) ( JKG1  JKG2 ) (210  2  1)(78949,138  78948,952)
Fhitung  
(q  p) JKG2 (2  1) (78948,952)
atau
Fhitung = 0,0005 sehingga H0 diterima artinya Model 1 yang
dipilih.

Langkah 2
Dilakukan pengujian hipotesis nol H0 : Model 1 yang dipilih,
melawan hipotesis alternatif H1 : Model 3 yang dipilih, dengan
tingkat keberartian 5%. Statistik yang digunakan adalah F
parsial. Hipotesis H0 ditolak jika Fhitung lebih besar dari
F ;1, n  p 1  F0,05;1, 207  3,8868. Dari perhitungan diperoleh
(n  q  1) ( JKG1  JKG3 ) (210  2  1)(78949,138  77515,399)
Fhitung  
(q  p) JKG3 (2  1) (77515,399)
atau
Fhitung = 3,8287 sehingga H0 diterima artinya Model 1 yang
dipilih.

Langkah 3
Dilakukan pengujian hipotesis nol H0 : Model 1 yang dipilih,
melawan hipotesis alternatif H1 : Model 4 yang dipilih, dengan
tingkat keberartian 5%. Statistik yang digunakan adalah F

140 | Adi Setiawan


parsial. Hipotesis H0 ditolak jika Fhitung lebih besar dari
F ;1, n  p 1  F0,05;1, 207  3,8868. Dari perhitungan diperoleh
(n  q  1) ( JKG1  JKG4 ) (210  2  1)(78949,138  48750,029)
Fhitung  
(q  p) JKG4 (2  1) (48750,029)
atau
Fhitung = 128,23 sehingga H0 ditolak artinya Model 4 yang
dipilih.
Selanjutnya didefinisikan
Model 5 : SWB =  0 + 1 SE + 2 JK1 +  3 SC + ,
Model 6 : SWB =  0 + 1 SE + 2 JK1 +  3 SC + 4 DSTS + .
Model 5 dan Model 6 mempunyai R2 berturut-turut adalah
R52 = 0,569 dan R62 = 0,570. Di samping itu, Model 5 dan
Model 6 mempunyai JKG berturut-turut adalah JKG5 =
46956,222 dan JKG6 = 46889,671.

Langkah 4
Dilakukan pengujian hipotesis nol H0 : Model 4 yang dipilih,
melawan hipotesis alternatif H1 : Model 5 yang dipilih, dengan
tingkat keberartian 5%. Statistik yang digunakan adalah F
parsial. Hipotesis H0 ditolak jika Fhitung lebih besar dari
F ;1, n  p 1  F0,05;1, 206  3,8870. Dari perhitungan diperoleh
(n  q  1) ( JKG4  JKG5 ) (210  2  1)(48750,29  46956,222)
Fhitung  
(q  p) JKG5 (2  1) (46956,222)
atau
Fhitung = 7,8695 sehingga H0 ditolak artinya Model 5 yang
dipilih.

Langkah 5
Dilakukan pengujian hipotesis nol H0 : Model 5 yang dipilih,
melawan hipotesis alternatif H1 : Model 6 yang dipilih, dengan
tingkat keberartian 5%. Statistik yang digunakan adalah F
parsial. Hipotesis H0 ditolak jika Fhitung lebih besar dari
F ;1, n  p 1  F0,05;1, 205  3,8872. Dari perhitungan diperoleh

Analisis Data Statistik | 141


(n  q  1) ( JKG5  JKG6 ) (210  4  1)(46956,222  46889,671)
Fhitung  
(q  p) JKG6 (2  1) (46889,671)
atau
Fhitung = 0,29096 sehingga H0 diterima artinya Model 5 yang
dipilih. Hal itu berarti model yang terpilih adalah
SWB = 109,989 + 0,486 SE - 25,738 JK1 + 0,353 SC
dengan koefisien determinasi R52 = 0,569. Koefisien negatif
pada variabel JK1 berarti bahwa siswa perempuan cenderung
mempunyai SWB yang lebih tinggi dibandingkan siswa laki-
laki. Masing-masing variabel, mempunyai sumbangan efektif
terhadap koefisien determinasi untuk masing-masing variabel
SE, JK1 dan SC berturut-turut adalah 14,3%, 37,5% dan
5,1%.

Tabel VIII.4 Tabel Data pada Soal Latihan VIII.2

NO SE DSTS SWB JK1 SC NO SE DSTS SWB JK1 SC


1 123 103 200 0 86 106 110 97 197 0 81
2 117 105 195 0 78 107 106 82 160 1 83
3 100 87 191 0 72 108 97 77 151 1 65
4 104 90 190 0 71 109 130 112 168 1 94
5 114 97 192 0 84 110 116 100 191 0 78
6 110 95 201 0 85 111 110 86 177 1 95
7 108 83 179 0 78 112 87 76 150 1 72
8 101 77 174 0 71 113 123 93 210 0 89
9 129 105 196 0 97 114 118 99 191 0 91
10 116 100 173 0 86 115 123 105 159 1 97
11 111 88 202 0 90 116 116 97 180 1 77
12 91 73 199 0 76 117 126 101 194 0 94
13 119 89 191 0 84 118 130 109 209 0 70
14 120 99 198 0 92 119 116 99 175 1 93
15 128 100 203 0 88 120 113 102 178 1 76
16 117 88 186 0 78 121 114 102 152 1 98
17 128 98 193 0 89 122 110 78 177 1 78
18 129 113 189 0 76 123 114 97 183 1 80
19 116 98 197 0 87 124 117 98 191 0 81

142 | Adi Setiawan


20 113 93 172 0 74 125 95 83 157 1 75
21 117 100 207 0 93 126 147 122 208 0 98
22 109 83 184 0 76 127 117 105 206 1 81
23 113 93 184 0 82 128 117 95 182 1 70
24 118 95 201 0 85 129 111 95 176 1 87
25 98 81 174 1 71 130 111 90 141 1 72
26 147 111 212 0 98 131 135 117 206 1 90
27 117 100 210 0 83 132 122 99 212 0 78
28 117 97 187 1 76 133 121 106 181 1 81
29 111 93 179 1 82 134 114 95 206 1 87
30 112 86 201 0 73 135 96 94 137 0 80
31 134 107 201 0 93 136 111 98 180 1 80
32 120 95 189 0 82 137 112 99 214 0 75
33 121 102 196 0 81 138 125 110 203 0 77
34 111 89 165 1 77 139 120 100 168 1 87
35 100 89 208 0 85 140 118 91 206 0 65
36 111 89 170 1 82 141 147 123 210 0 95
37 108 93 167 1 76 142 85 88 114 1 63
38 122 107 147 1 81 143 132 112 186 1 100
39 123 97 196 0 88 144 107 101 193 0 58
40 116 89 154 1 72 145 107 86 150 1 79
41 148 117 213 0 98 146 91 74 140 1 65
42 90 88 126 1 58 147 105 86 214 0 88
43 132 115 210 0 97 148 112 95 193 0 85
44 107 101 160 1 75 149 105 91 150 1 78
45 108 83 163 1 71 150 103 82 151 1 89
46 92 75 171 1 69 151 110 81 172 1 72
47 104 88 198 0 89 152 106 93 187 1 65
48 113 92 199 0 85 153 113 93 191 1 93
49 106 86 177 1 71 154 106 85 140 1 83
50 105 85 196 0 82 155 114 98 201 0 79
51 111 86 184 0 81 156 140 121 209 0 82
52 104 87 164 0 62 157 122 96 174 1 69
53 114 85 198 0 84 158 103 90 127 1 61
54 107 87 151 1 78 159 114 96 195 0 92
55 114 88 177 1 77 160 134 113 203 0 91

Analisis Data Statistik | 143


56 139 110 223 0 95 161 112 103 167 1 79
57 122 102 185 0 77 162 122 113 201 0 76
58 106 92 191 0 63 163 124 114 212 0 80
59 111 93 151 1 82 164 136 117 207 0 84
60 132 101 204 0 82 165 106 90 151 1 68
61 112 102 138 1 79 166 132 110 222 0 80
62 121 108 170 1 84 167 101 83 153 1 93
63 121 102 147 1 73 168 124 101 205 0 93
64 133 107 179 1 80 169 107 81 176 1 86
65 107 94 173 1 68 170 92 79 154 1 86
66 130 106 149 1 85 171 142 124 217 0 85
67 105 79 202 0 87 172 102 87 149 1 85
68 124 102 210 0 89 173 120 96 201 0 62
69 105 80 148 1 71 174 137 100 190 0 94
70 93 75 169 1 77 175 100 81 175 1 74
71 141 119 210 0 95 176 122 94 174 1 91
72 107 85 209 0 79 177 135 117 190 0 81
73 119 99 191 0 74 178 130 108 211 0 91
74 139 102 223 0 73 179 94 71 148 1 86
75 100 78 173 1 74 180 122 106 176 1 92
76 123 99 179 1 93 181 101 84 155 1 76
77 134 100 149 1 67 182 106 84 156 1 74
78 129 110 216 0 89 183 125 104 161 1 91
79 101 73 180 0 88 184 90 65 154 1 69
80 124 101 216 0 90 185 98 106 144 1 74
81 101 84 181 0 71 186 105 94 181 1 70
82 108 83 181 0 63 187 99 92 152 1 73
83 127 91 210 0 83 188 118 104 207 0 77
84 93 67 181 0 71 189 116 104 182 1 84
85 99 98 144 1 70 190 91 71 148 1 61
86 105 89 192 0 69 191 111 93 195 0 67
87 100 89 169 0 67 192 114 104 176 1 74
88 116 97 195 0 84 193 132 115 223 0 83
89 116 100 196 1 82 194 101 87 158 1 94
90 94 77 168 1 62 195 102 88 196 0 82
91 111 89 147 1 66 196 90 83 156 1 82

144 | Adi Setiawan


92 113 91 148 0 71 197 123 103 216 0 90
93 132 115 203 0 92 198 108 91 214 0 77
94 107 93 198 0 94 199 112 99 206 0 66
95 102 84 196 0 77 200 124 110 198 0 66
96 92 86 201 0 75 201 124 88 161 1 76
97 124 101 212 0 94 202 124 103 199 0 71
98 109 89 199 0 82 203 120 98 202 0 71
99 112 97 171 0 72 204 126 99 212 1 75
100 119 101 167 1 75 205 119 97 180 0 70
101 122 104 180 0 85 206 123 93 182 0 76
102 119 94 200 0 68 207 128 92 144 0 79
103 98 84 191 0 70 208 125 96 147 0 63
104 103 88 182 0 66 209 120 98 161 0 77
105 115 99 191 1 76 210 126 105 185 1 75

Soal 4
Diketahui data hubungan antara x dan y berikut ini :
x 22 24 26 28 40
y 12 21 31 35 70

a. Gambarkan scatter plot dari data tersebut.


b. Tentukan estimasi regresi linear untuk hal itu.
c. Hitung leverage untuk masing-masing titik.
d. Hitung jarak Cook untuk masing-masing titik. Adakah
titik yang perlu dibuang ?

Analisis Data Statistik | 145


Penyelesaian
a. Scatter plot :

70
60
50
y

40
30
20
10

25 30 35 40

Terlihat bahwa ada satu titik yang cenderung jauh dari


titik-titik yang lain.
b. Model regresi yang diperoleh adalah
y = 1934,42 + 24,38 x
dengan koefisien determinasi R2 = 0,9876. Nilai
intercept dan slope secara berarti (significant) berbeda
dengan 0.
c. Leverage untuk masing-masing titik berturut-turut
adalah 0,38, 0,28, 0,22, 0,20 dan 0,92. Titik terakhir
dapat dipandang sebagai titik yang mempunyai nilai
potensial jauh lebih besar dari yang lain.
d. Jarak Cook dari masing-masing titik berturut-turut
adalah 0,5994, 0,0043, 0,2601, 0,0277 dan 11,0898.
Hal itu berarti, titik terakhir atau titik ke-5 perlu
dibuang dalam analisis karena mempunyai jarak Cook
yang lebih dari 1.

146 | Adi Setiawan


Soal 5
Diketahui data hubungan antara x dan y berikut ini :
x 1 2 3 4 5
y 3 7 5 11 14

a. Gambarkan scatter plot dari data tersebut. Dapatkah


ditentukan adanya titik pengacau ?
b. Gunakan uji formal untuk mencari titik pengacau.
Penyelesaian
a. Scatter plot :
14
12
10
y

8
6
4

1 2 3 4 5

Adanya titik pengacau sulit ditentukan dari scatter plot


tersebut. Leverage dari masing-masing titik berturut-turut
adalah 0,6, 0,3, 0,2, 0,3 dan 0,6 sedangkan jarak Cook dari
masing-masing titik berturut-turut adalah 0,0181, 0,1896,
0,3402, 0,0119 dan 0,2903 sehingga tidak bisa ditentukan
titik pengacau.
b. Apabila digunakan uji formal untuk menentukan adanya
titik pengacau digunakan langkah-langkah berikut:
Model yang digunakan adalah
Y = X + u + e.
Parameter  dan  ditaksir dengan menggunakan
metode kuadrat terkecil dan kemudian digunakan untuk

Analisis Data Statistik | 147


menguji hipotesis nol H0 :  = 0 dengan  sebarang melawan
hipotesis alternatif H1 :   0 dengan  sebarang. Untuk
menguji hipotesis tersebut digunakan uji t. Hasil output
paket program R untuk masing-masing titik berturut-turut
adalah 0,910, 0,4569, 0,0475, 0,8642 dan 0,6410. Hal itu
berarti bahwa titik ke-3 dapat dipandang sebagai titik
pengacau jika digunakan uji hipotesis secara formal dengan
langkah-langkah di atas.

148 | Adi Setiawan


LATIHAN

1. Misalkan diketahui persamaan regresi yang digunakan


untuk estimasi 10 titik pengamatan dinyatakan dengan
^
y   18,37  2,01 x1  0,474 x2
JK = 15.182,9, JKR = 14.052,2, sb1  0,2471 dan sb1  0,9484
a. Ujilah keberartian hubungan antara y dan x1 dan x2.
b. Lakukan uji t untuk menguji pentingnya koefisien 1
dengan tingkat keberartian  = 0,05.
c. Lakukan uji t untuk menguji pentingnya koefisien 2
dengan tingkat keberartian  = 0,05.
2. Seorang fisiologis akan meneliti hubungan antara
karakteristik fisik (usia, tinggi badan, berat badan dan
lebar dada) dari anak laki-laki dan pengambilan oksigen
maksimal (diukur dalam mililiter oksigen per kilogram
berat badan). Tabel VIII.1 menunjukkan data hasil sampel
random dari 10 anak laki-laki. Buatlah model yang sesuai
untuk permasalahan tersebut dan gunakan tingkat
keberartian 5%.

Tabel VIII.5 Tabel Data pada Soal Latihan VII.2

Pengambilan
Usia Tinggi Berat
Oksigen Lebar Dada
(Tahun) Badan Badan
Maksimal
1.54 8.4 132 29.1 14.4
1.74 8.7 135.5 29.7 14.5
1.32 8.9 127.7 28.4 14
1.5 9.9 131.1 28.8 14.2
1.46 9 130 25.9 13.6
1.35 7.7 127.6 27.6 13.9
1.53 7.3 129.9 29 14
1.71 9.9 138.1 33.6 14.6
1.27 9.3 126.6 27.7 13.9
1.5 8.1 131.8 30.8 14.5

Analisis Data Statistik | 149


3. Data pada Tabel VIII.5 menyatakan data hubungan
antara skor Pola Asuh Otoriter (PAO), Konsep diri (KS)
dan jenis kelamin JK1 dengan skor perilaku agresif (PA)
siswa SMAN 4 Ambon Maluku. Tentukan model terbaik
tentang hubungan tersebut, koefisien determinasi dan
sumbangan efektif masing-masing variabel bebas dalam
model terbaik terhadap variabel tak bebas.

NO PAO KS PA JK1 NO PAO KS PA JK1


1 114 133 118 0 76 109 121 102 0
2 90 107 95 0 77 107 113 107 0
3 93 89 101 0 78 118 134 114 0
4 93 142 99 0 79 105 127 107 0
5 75 105 79 0 80 104 117 107 0
6 90 104 89 0 81 111 140 102 0
7 79 100 83 0 82 98 114 101 0
8 73 100 83 0 83 112 143 115 0
9 62 102 78 0 84 98 143 112 0
10 92 116 88 0 85 95 123 110 0
11 93 106 99 0 86 98 126 108 0
12 104 118 94 0 87 103 123 100 0
13 101 102 90 0 88 90 115 100 0
14 89 128 97 0 89 100 117 108 0
15 95 148 94 0 90 97 113 102 0
16 75 116 80 0 91 106 122 100 0
17 87 108 95 0 92 108 123 107 0
18 94 145 100 0 93 103 119 107 0
19 102 145 108 0 94 114 135 110 0
20 91 107 98 0 95 120 99 134 0
21 99 114 92 0 96 103 142 107 0
22 99 118 107 0 97 119 121 122 0
23 107 119 111 0 98 118 139 112 0
24 104 112 107 0 99 117 128 124 0
25 102 126 105 0 100 128 132 131 0
26 99 112 108 0 101 95 127 107 0
27 110 116 112 0 102 98 112 102 0
28 129 110 119 0 103 103 127 101 0
29 108 120 106 0 104 111 102 95 0
30 96 116 102 0 105 106 116 101 0
31 98 147 103 0 106 118 106 99 0
32 91 124 94 0 107 109 118 79 0
33 94 129 99 0 108 107 102 89 0
34 110 130 116 0 109 107 128 83 0

150 | Adi Setiawan


35 100 141 108 0 110 119 148 83 0
36 97 115 107 0 111 113 116 78 0
37 104 125 112 0 112 101 108 88 0
38 99 126 114 0 113 108 145 99 0
39 111 119 117 0 114 92 118 94 0
40 106 127 113 0 115 129 123 90 0
41 107 126 109 0 116 117 124 97 0
42 119 129 115 0 117 128 150 94 0
43 113 104 120 1 118 95 141 80 1
44 101 132 104 1 119 98 128 95 1
45 108 121 107 1 120 103 118 100 1
46 92 122 100 1 121 111 135 108 1
47 129 147 123 1 122 106 99 98 1
48 117 122 113 1 123 92 142 92 1
49 114 125 120 1 124 129 121 107 1
50 123 121 123 1 125 117 139 111 1
51 106 122 113 1 126 114 128 107 1
52 109 123 113 1 127 123 129 105 1
53 103 120 103 1 128 106 130 108 1
54 99 127 100 1 129 109 141 112 1
55 103 118 109 1 130 92 115 119 1
56 99 130 106 1 131 129 125 106 1
57 132 150 137 1 132 117 126 102 1
58 99 127 105 1 133 128 119 103 1
59 100 112 100 1 134 95 120 94 1
60 105 127 113 1 135 98 123 99 1
61 92 105 102 1 136 103 132 116 1
62 96 129 99 1 137 111 124 108 1
63 107 121 113 1 138 106 128 107 1
64 107 117 109 1 139 92 125 108 1
65 107 136 106 1 140 129 134 113 1
66 103 114 105 1 141 117 141 119 1
67 103 118 99 1 142 114 126 113 1
68 113 123 128 1 143 90 119 111 1
69 99 124 117 1 144 93 126 110 1
70 108 150 116 1 145 93 115 102 1
71 103 141 116 1 146 75 122 113 1
72 119 128 128 1 147 90 126 111 1
73 111 118 105 1 148 79 123 128 1
74 106 112 107 1 149 73 117 108 1
75 118 136 110 0 150 129 126 98 1

Analisis Data Statistik | 151


4. Diketahui data hubungan antara x dan y berikut ini :

x 1 1 2 3 4 4 5 15
y 18 21 22 21 23 24 26 39

a. Gambarkan scatter plot dari data tersebut.


b. Tentukan estimasi regresi linear untuk hal itu. Apakah
ada perbedaan besar hasil estimasi regresi linear jika
titik ke-8 tidak diikutkan dalam model ?
c. Hitung nilai potensial ( leverage ) untuk masing-masing
titik.
d. Hitung jarak Cook untuk masing-masing titik. Adakah
titik yang perlu dibuang ?
5. Tabel berikut ini menyatakan hubungan antara
pendapatan REV dengan biaya iklan pada televisi TV
dan biaya iklan pada surat kabar NEWS (semuanya
dalam jutaan rupiah).
a. Buat scatter plot dari masing-masing variabel bebas
melawan variabel tak bebas.
b. Adakah titik pengacau dalam data tersebut ?
c. Pilihlah model terbaik. Jika digunakan biaya iklan 3
juta dan biaya iklan surat kabar 4 juta maka
berapakah pendapatan yang bisa diharapkan?
d. Apakah residunya memenuhi asumsi normalitas dan
tidak berkorelasi ?
Pendapatan Biaya Iklan TV Biaya Iklan
Surat kabar
96 5 1,5
90 2 2
95 4 1,5
92 2,5 2,5
95 3 3,3
94 3,5 2,3
94 2,5 4,2
94 3 2,5

***

152 | Adi Setiawan


BAB IX
STATISTIKA NON PARAMETRIK

Apabila distribusi populasi berbeda dengan distribusi


normal maka metode bebas distribusi merupakan salah satu
alternatif di dalam melakukan pengujian suatu hipotesis.
Dalam hal ini berturut-turut akan dibahas pengujian
hipotesis untuk satu sampel dan dua sampel.

IX.1. Pengujian Hipotesis Satu Sampel

Misalkan X1, X2, ..., Xn besaran stokastik yang


independen dan berdistribusi identik. Masalah ini berkenaan
dengan pengujian dari hipotesis mengenai lokasi dari
distribusi. Model klasik dari masalah ini adalah bahwa
populasi berdistribusi normal N(m, 2 ) dan hipotesis nolnya
adalah H0 : m = m0. Uji yang paling banyak digunakan
didasarkan pada besaran
t  n ( X  m0 ) / S .
Apabila anggapan normalitas dari distribusi populasi tidak
dipenuhi maka digunakan uji berikut ini.

Uji Tanda
Misalkan bahwa distribusi yang sebenarnya dari
pengamatan mempunyai median tunggal m dan bahwa setiap
pengamatan mempunyai probabilitas nol untuk sama dengan
median. Hal itu berarti diambil bilangan tunggal m dengan
sifat
P( Xi < m ) = P( Xi > m) = ½.
Akan dilakukan pengujian H0 : m = m0 melawan H0 : m  m0
untuk suatu m0. Uji ini didasarkan pada besaran uji

Analisis Data Statistik | 153


T  # ( X i  m0 )   1{ Xi  m0 } .
i
Di bawah hipotesis nol, X mempunyai median m sehingga T
di bawah hipotesis nol mempunyai distribusi Binomial
dengan parameter n dan ½. Dalam hal ini terlihat bahwa
besaran uji sama untuk setiap kemungkinan distribusi populasi
sehingga dinamakan bebas distribusi. Jadi T bebas distribusi
di bawah hipotesis nol.
Nilai T yang relatif besar menjelaskan bahwa median
yang sebenarnya lebih besar dari m0 sedangkan nilai T yang
kecil menunjukkan bahwa median yang sebenarnya lebih
kecil dari m0. Hipotesis ditolak untuk nilai T yang terlalu besar
atau terlalu kecil. Dalam terminologi probabilitas penolakan, H0
ditolak jika nilai pengamatan t memenuhi:
PH 0 (T t )  / 2
atau
PH 0 (T  t )   / 2
Besaran yang ekuivalen dengan besaran uji T adalah
n
T    sign ( X i  mo )  2 T  n .
i 1

Contoh IX.1
Dalam suatu ujian yang diikuti oleh 15 anak didapatkan nilai
ujian sebagai berikut :
3,7 5, 2 6,9 7,2 6,4 9,3 10
4,3 8,4 6,5 8,1 7,3 6,1 5,8 12
Berdasarkan data tersebut akan dilakukan pengujian terhadap
hipotesis nol dengan tingkat  = 5% bahwa median dari hasil
ujian tersebut lebih kecil atau sama dengan 6 melawan
alternatif bahwa mediannya lebih besar dari 6. Dari data
tersebut didapatkan nilai T = 11 dan dengan mengingat
bahwa T berdistribusi Binomial dengan parameter 15 dan ½
pada Lampiran 7 maka diperoleh nilai-p yaitu
PH0(T  11 ) = 1-PH0(T  10) = 0,059.

154 | Adi Setiawan


Karena nilai-p lebih besar dari  = 5 % maka H0 tidak ditolak.

Contoh IX.2
Berdasarkan data inflasi bulanan kota Ambon untuk periode
bulan Januari 2009 sampai dengan bulan Mei 2013, akan
diuji apakah hipotesis nol yang menyatakan bahwa median
inflasi bulanan adalah 0 melawan hipotesis alternatif yang
menyatakan bahwa median inflasi bulanan lebih dari 0
dengan tingkat keberartian 5%. Dari data diperoleh T = 36
sehingga diperoleh nilai-p dengan anggapan bahwa T
berdistribusi Binomial dengan parameter n = 53 dan p = 0,5
adalah
PH0(T > 36 ) = 1- PH0(T  36 ) = 0,0027.
Karena nilai-p lebih kecil dari  = 5 % maka H0 ditolak
sehingga median dari data inflasi bulanan berbeda secara
signifikan dengan 0.

Uji Simetri Wilcoxon (Uji Tanda Peringkat)

Dalam uji tanda nilai absolut dari simpangan Xi – m0


tidak berperan. Uji simetri Wilcoxon menggunakan lebih
banyak informasi dalam pengamatan yaitu dengan
menggunakan peringkat (rank) dari simpangan Xi – m0 .
Misalkan bahwa X1, X2, ..., Xn mempunyai distribusi
kontinu F dan akan dilakukan pengujian terhadap hipotesis
H0 : F simetri di sekitar m0
melawan
H0 : F simetri di sekitar m0.
Dalam hal ini dibentuk Zi = Xi – m0. Karena F kontinu maka
nilai-nilai |Z1|, |Z2|, ..., |Zn| berbeda dengan probabilitas 1.
Misalkan vektor dari nomor peringkat |Z1|, |Z2|, ..., |Zn|
adalah (R1, R2, ..., Rn). Uji tanda peringkat didasarkan pada
besaran uji

Analisis Data Statistik | 155


n
V   Ri sign ( X i  mo ).
i 1

Setiap tanda sign(Xi – m0 ) bernilai 1 atau -1. Nilai 1 berarti


bahwa median yang sebenarnya lebih besar dari m0 dan
petunjuk ini diperkuat dengan ukuran |Xi – m0 | dan dalam
hal ini berarti Ri besar. Nilai V yang relatif besar menjelaskan
bahwa distribusi yang sebenarnya dari X1, X2, ..., Xn
mempunyai median yang lebih besar dari m0 sedangkan nilai
V yang relatif kecil akan menunjukkan sebaliknya. Titik kritik
dan probabilitas penolakan dari uji tanda peringkat telah
ditabelkan. Untuk n besar dapat digunakan pendekatan
normal dengan mengingat bahwa
Vn
n(n  1)(2n  1) / 6
berdistribusi normal standard.

Contoh IX.3
Misalkan dimiliki data
3,7 5, 2 6,9 7,2 6,4 9,3 10
4,3 8,4 6,5 8,1 7,3 6,1.
Akan diuji hipotesis bahwa distribusi data F simetris di
sekitar median 6 melawan hipotesis alternatif bahwa data F
simetris di sekitar median 6 dengan menggunakan uji
simetris Wilcoxon. Berdasarkan data tersebut maka dapat
dibuat barisan berurut dari nilai harga mutlak Xi – m0 yaitu
0,1, 0,2, 0,4 0,5, 0,8, 0,9, 1,2,
1,3 1,7, 2,1, 2,3, 2,4, 3,3.
Urutan tersebut menghasilkan vektor nomor rank berturut-
turut sesuai dengan data yaitu
(11, 5, 6, 7, 3, 13, 9, 12, 4, 10, 8, 1, 2).
Nilai statistik uji adalah v = 37 sehingga nilai-p yang diperoleh
dengan menggunakan pendekatan normal adalah
PH0( V  37) = 0,0980
dan berarti H0 diterima dengan tingkat keberartian 5%.

156 | Adi Setiawan


Dalam kasus terjadinya ulangan maka semua pengamat-
an yang bernilai Zi = 0 diabaikan. Nilai-nilai yang tertinggal
dikenakan nomor rank dan setiap elemen dari kelompok
(ulangan) akan mendapatkan nomor rank semu yaitu rata-
rata bila mereka diberi nomor rank yang berbeda. Sebagai
contoh nomor rank dari (3, 2, 2, 5, 3, 3) adalah anggota dari
urutan (2, 2, 3, 3, 3, 5) menjadi (4, 3/2, 3/2, 6, 4, 4). Uji
Wilcoxon digunakan dengan V berdasarkan hasil di atas.

Contoh IX.4
Berdasarkan data inflasi bulanan kota Ambon untuk periode
bulan Januari 2009 sampai dengan bulan Mei 2013, akan
diuji apakah hipotesis nol yang menyatakan bahwa distribusi
data inflasi bulanan adalah simetris di sekitar median 0
melawan hipotesis alternatif bahwa distribusi data inflasi
bulanan tidak simetris di sekitar median 0 dengan tingkat
keberartian 5%. Dari data diperoleh V = 651 sehingga
diperoleh nilai-p adalah
PH0(V  651 ) = 1- PH0(V < 651 ) = 0,0025.
Karena nilai-p lebih kecil dari  = 5 % maka H0 ditolak
sehingga distribusi data inflasi bulanan tidak simetris di
sekitar median 0.

IX.2. Pengujian Dua Sampel

Misalkan dimililiki data yang tidak berpasangan dan


saling bebas yaitu X1, X2, ..., Xn dan Y1, Y2, ..., Yn . Misalkan
X1, X2, ..., Xm dan Y1, Y2, ..., Yn masing-masing mempunyai
distribusi yang sebenarnya F dan G. Akan diuji hipotesis
H0 : F = G
melawan H1 : F  G apabila anggapan normalitas dari
distribusi populasinya tidak dipenuhi maka digunakan uji
berikut.

Analisis Data Statistik | 157


Uji Mann-Whitney
Pada uji ini dilakukan penggabungan 2 sampel menjadi
satu sampel X1, X2, ..., Xm, Y1, Y2, ...,Yn dengan ukuran
sebesar N = m + n dan misalkan nomor peringkat dari Y1, Y2,
..., Yn dalam sampel gabungan adalah R1, R2, ..., Rn. Jadi
membentuk himpunan bagian dari { 1, 2, ..., N }. Uji Mann-
Whitney didasarkan pada besaran
n
W   Ri .
i1

Hipotesis nol akan ditolak jika W terlalu besar atau terlalu


kecil. Nilai kritik ditentukan dengan bantuan tabel. Berikut
ini langkah-langkah dalam uji Mann-Whitney.

Langkah 1
Hipotesis yang akan diuji adalah hipotesis nol H0 : F = G
melawan hipótesis alternatif H1 : F  G.
Langkah 2
Memilih tingkat keberartian  yang digunakan.
Langkah 3
Statistik uji yang digunakan adalah U = min(U1, U2) dengan
1
U1  mn  m(n  1)  S1 ,
2
1
U 2  mn  m(n  1)  S 2 ,
2
S1 = jumlah rangking kelompok 1,
S2 = jumlah rangking kelompok 2.
Langkah 4
Hipotesis nol ditolak jika U lebih kecil dari Utabel dengan
menggunakan Tabel Mann-Whitney (Lampiran 12).
Untuk memberikan gambaran hal tersebut, diberikan contoh
berikut ini.

158 | Adi Setiawan


Contoh IX.5

Tabel IX.1 Tabel Hasil Tes Psikologi


Himpunan kembar i 1 2 3 4 5 6 7 8 9 10 11 12
Lahir pertama Xi 86 71 77 68 91 72 77 91 70 71 88 87
Lahir kedua Yi 86 77 76 64 96 72 65 90 65 80 81 72

Tabel IX.2 Tabel Bantu Perhitungan Statistik Mann-Whitney

Lahir Pertama Lahir Kedua


No Nilai Peringkat No Nilai Peringkat
1 86 17 1 88 19,5
2 71 6,5 2 77 13
3 77 13 3 76 11
4 68 4 4 64 1
5 91 22,5 5 96 24
6 72 9 6 72 9
7 77 13 7 65 2,5
8 91 22,5 8 90 21
9 70 5 9 65 2,5
10 71 6,5 10 80 15
11 88 19,5 11 81 16
12 87 18 12 72 9
S1 = 156,5 S2 = 143,5

Dua belas pasang kembar identik diberi tes psikologi


untuk mengukur keagresifan mereka. Hasil tes tersebut
dinyatakan pada Tabel IX.1. Akan diuji apakah distribusi nilai
tes psikologi pasangan kembar yang lahir pertama sama
dengan distribusi nilai tes pasangan kembar yang lahir kedua.
Berdasarkan data tersebut, dapat dibuat tabel penolong seperti
pada Tabel IX.2. Akibatnya, diperoleh
1 12(13)
U1  mn  m(n  1)  S1 12(12)  156,5  65,5,
2 2
1 12(13)
U 2  mn  m(n  1)  S 2 12(12)  143,5  78,5,
2 2
sehingga U = min{ 65,5, 78,5 } = 65,5. H0 ditolak jika U lebih
kecil dari 37 (titik kritis dari Tabel Mann-Whitney dengan

Analisis Data Statistik | 159


m=n=12). Hal itu berarti H0 diterima sehingga distribusi nilai
tes psikologi pasangan kembar yang lahir pertama sama
dengan distribusi nilai tes pasangan kembar yang lahir
kedua.
Uji Mann-Whitney untuk m dan n besar juga dapat
dilakukan berikut ini. Pada uji ini dilakukan penggabungan
2 sampel menjadi satu sampel X1, X2, ..., Xm, Y1, Y2, ...,Yn
dengan ukuran sebesar N = m + n dan misalkan nomor
peringkat dari Y1, Y2, ..., Yn dalam sampel gabungan adalah
R1, R2, ..., Rn. Jadi membentuk himpunan bagian dari { 1, 2,
..., N }. Uji Mann-Whitney didasarkan pada besaran
n
W   Ri .
i1

Hipotesis nol akan ditolak jika W terlalu besar atau terlalu


kecil. Nilai kritik ditentukan dengan bantuan tabel.
Untuk m dan n besar dapat digunakan pendekatan
bahwa statistik
W  n( N  1) / 2
mn( N  1) / 12
mendekati distribusi N(0,1) asalkan 0 < P( Xi < Yj ) < 1. Besaran
uji yang ekuivalen dengan besaran itu adalah
m n
U  1{ X i  Y j } W  n(n  1) / 2
i 1 j 1

Di bawah hipotesis nol U berdistribusi simetrik di sekitar ½


mn.

Apabila didapati perulangan dalam sampel total X1, X2,


..., Xm, Y1, Y2, ..., Yn maka dapat dilakukan pengujian dengan
langkah-langkah berikut. Pertama-tama pada sampel total
ditandai dengan nomor rank semu. Setiap elemen dari
ulangan mendapat nomor rank dari rata-rata bila elemen
tersebut berbeda. Misalkan R1, R2, ..., Rn adalah nomor rank
semu dari R1, R2, ..., Rn dalam sampel total X1, X2, ..., Xm, Y1,
Y2, ..., Yn. Besaran uji untuk

160 | Adi Setiawan


n
W   Ri
i1

di bawah hipotesis nol akan bebas distribusi. Misalkan


ditemui K nilai yang berbeda dalam sampel total X1, X2, ...,
Xm, Y1, Y2, ..., Yn dengan nilai terkecil muncul T1 kali, satu
sesudah terkecil muncul T2 kali, ..., dan yang terbesar
muncul TK kali. Distribusi bersyarat dari (R1, R2, ..., Rn)
diberikan (K, T1, T2, ..., TK ) di bawah Ho : F = G sama seperti
distribusi dari pemilihan sebanyak n tanpa pengembalian
bilangan-bilangan dari populasi :
T1 kali nomor rank kecil,
T2 kali nomor rank terkecil kedua,
...................................
TK kali nomor rank terbesar.
n
Distribusi bersyarat dari W   Ri diberikan (K, T1, T2, ..., TK)
i1

di bawah hipotesis nol akan mempunyai distribusi tertentu.


Untuk m dan n besar dapat digunakan pendekatan normal
yaitu bila k = K, T1=t1, T2=t2, ..., TK = tK) maka
W  n( N  1) / 2
k
mn( N 3   ti ) /(12 N ( N  1))
3

i 1

konvergen dalam distribusi ke distribusi normal standard.


Berikut ini diberikan ilustrasi untuk metode di atas.

Contoh IX.6
Berdasarkan data pada Contoh IX.5, apabila digunakan
anggapan ukuran sampel m dan n besar. Sampel total
berurut dari kedua sampel tersebut dapat dinyatakan sebagai
berikut :
64, 65, 65, 68, 70, 71, 71, 72, 72, 72, 76, 77, 77, 77, 80, 81,
86, 86, 87, 88, 90, 91, 91, 96.

Analisis Data Statistik | 161


Daftar dari data pasangan kembar yang lahir pertama dan
nomor peringkat (rank) dari pasangan kembar yang lahir
pertama serta banyaknya data berulang berturut-turut adalah
86, 71, 77, 68, 91, 72, 77, 91, 70, 71, 88, 87
dan
17.5, 6.5, 13.0, 4.0, 22.5, 9.0, 13.0, 22.5, 5.0, 6.5, 20.0, 19.0,
serta
1, 2, 2, 1, 2, 1, 1, 1, 1.

Besaran uji W=158,5. Di bawah hipotesis nol maka W


berdistribusi normal dengan mean n(N+1)/2 yaitu 150 dan
variansinya adalah
k
mn( N 3   ti ) /(12 N ( N  1))  23,0324 .
3

i 1

Nilai-p untuk uji ini adalah PH0( |W| > 158,5 ) = 0,6236.
Hipotesis nol tidak ditolak untuk tingkat keberartian yang
biasa digunakan sehingga distribusi keagresifan pasangan
kembar yang lahir pertama sama dengan distribusi
keagresifan pasangan kembar yang lahir kedua.

Uji Kolmogorov-Smirnov (Dua Sampel)

Misalkan Fm dan Gn masing-masing adalah fungsi


distribusi empirik dari X1, X2,...., Xm dan Y1, Y2, ...., Yn. Uji
dua sampel Kolmogorov-Smirnov yang didasarkan pada
besaran
Dm, n  sup    x   | Fm ( x)  Gn ( x) | .
Cara yang lebih mudah untuk menghitung besaran uji ini
adalah sebagai berikut :
 ^ ^ ^
^ 1 
Dm, n  max max  | F m (Y(i ) )  G n (Y(i ) ) | , | F m (Y(i ) )   G n (Y(i )   | 
1  i n
  n 
Di bawah ini hipotesis-hipotesis nol distribusi Dm , n tidak
tergantung pada distribusi populasi. Oleh karena itu uji ini

162 | Adi Setiawan


dikatakan uji bebas distribusi. H0 ditolak untuk nilai besar
dari Dm , n .

Contoh IX.7
Sampel random ukuran 9 dari populasi pertama dan sampel
random ukuran 15 diambil dari populasi kedua. Hipotesis nol
yang akan diuji adalah bahwa kedua populasi mempunyai
distribusi yang identik. Bila dua sampel tersebut diurutkan
dari yang terkecil ke terbesar dan distribusi empirik dari
kedua sampel tersebut dibandingkan maka akan diperoleh
hasil seperti pada Tabel IX.3.
Berdasarkan pada Tabel IX.3 diperoleh nilai uji statistik
dua sisi Dm , n = 2/5 = 0,4. Bila digunakan Tabel Kolmogorov-
Smirnov dua sampel (Lampiran 13) untuk tingkat keberartian
 = 0,05 maka akan diperoleh nilai kritisnya yaitu 8/15. Hal
itu berarti bahwa Dm , n = 0,4 lebih kecil dari nilai kritisnya
tidak ada alasan untuk menolak hipotesis nol.

Tabel IX.3 Tabel perhitungan statistik Kolmogorov-Smirnov.


Xi Yi S1(x)-S2(x) Xi Yi S1(x)-S2(x)
5,2 0-(1/15) = -1/15 9,8 (5/9)-(8/15) = 1/45
5,7 0-(2/15) = -2/15 9,9 (6/9)-(8/15) = 2/15
5,9 0-(3/15) = -1/5 10,1 (7/9)-(8/15) = 11/45
6,5 0-(4/15) = -4/15 10,6 (8/9)-(8/15) = 1/45
6,8 0-(5/15) = 1/3 10,8 (8/9)-(9/15) = 13/45
7,6 1/9-(5/15) = -2/9 11,2 1-(9/15) = 2/5
8,2 (1/9)-(6/15) = -13/15 11,3 1-(10/15) = 1/3
8,4 (2/9)-(6/15) = -8/45 11,5 1-(11/15) = 4/15
8,7 (3/9)-(6/15) = -1/15 12,3 1-(12/15) = 1/5
9,1 (4/9)-(6/15) = 2/45 12,5 1-(13/15) = 2/15
9,3 (5/9)-(7/15) = 4/15 13,4 1-(14/15) = 1/15
14,6 1-1 = 0

Analisis Data Statistik | 163


Uji T Wilcoxon (Wilcoxon Match Pairs Test)

Uji T Wilcoxon digunakan pada data yang berskala


ordinal pada dua sampel yang saling terkait (related sample).
Dua sampel dikatakan saling terkait apabila sampel pertama
merupakan sampel yang diperoleh sebelum adanya perlakuan
(treatment) sedangkan sampel yang lain diperoleh sesudah
adanya perlakuan. Sebagai contoh, diinginkan untuk menge-
tahui manfaat sebuah metode pembelajaran yang dikenakan
pada sekelompok mahasiswa. Kelompok mahasiswa tersebut
diberi 2 macam tes yaitu tes awal (posttest) dan tes akhir
(posttest). Untuk itu akan dibandingkan apakah hasil tes
awal dan tes akhir sama atau tidak. Uji yang digunakan ini
bukanlah uji Mann-Whitney karena sampel yang dimiliki
tidak saling bebas tetapi menggunakan uji T Wilcoxon.
Langkah-langkah yang digunakan dalam uji ini adalah
sebagai berikut :
Langkah 1
Ditentukan hipotesis nol H0 dan hipotesis alternatif H1.
Dalam hal ini, hipotesis nol adalah median sebelum dan
sesudah perlakuan sama melawan hipotesis alternatif bahwa
median sebelum dan sesudah populasi tidak sama.
Langkah 2
Menentukan tingkat keberartian .
Langkah 3
Menghitung statistik uji T Wilcoxon dengan cara :
a. Menentukan selisih pasangan data.
b. Menentukan urutan dari selisih pasangan data tanpa
memperhatikan tanda.
c. Membedakan tanda selisih positif dan selisih negatif.
d. Menentukan jumlah peringkat yang bertanda positif
(T1) dan yang bertanda negatif (T2).
e. Menentukan nilai terkecil dari T1 atau T2 sebagai Thitung.

164 | Adi Setiawan


Langkah 4
Menentukan aturan pengambilan keputusan yaitu bahwa H0
ditolak jika Thitung lebih kecil dari atau sama dengan Ttabel
dengan Ttabel diperoleh dari Tabel uji T Wilcoxon (Lampiran 8).

Contoh IX.8
Seorang guru ingin mengetahui manfaat dari metode
pembelajaran yang digunakan. Untuk itu sebelum dan
sesudah pelaksanaan pembelajaran dilakukan pemberian tes
awal dan tes akhir bagi siswa yang mengikuti pembelajaran
tersebut. Hasil tes awal dan tes akhir dinyatakan dalam tabel
berikut ini :

Tes Awal Tes Akhir


5 4
5 6
6 7
6 8
6 9
7 10
6 10

Ujilah apakah median hasil tes awal dan median tes akhir
sama melawan median hasil tes awal dan median tes akhir
tidak sama dengan tingkat keberartian 5%.
Penyelesaian
Dalam hal ini, diinginkan untuk menguji hipotesis nol H0 :
median hasil tes awal dan median tes akhir sama melawan
hipotesis alternatif H1 : median hasil tes awal dan median tes
akhir tidak sama dengan menggunakan tingkat. Untuk
mencari Thitung Wilcoxon digunakan tabel penolong berikut
ini:

Analisis Data Statistik | 165


Tes Tes
No. Awal Akhir S2-S1 Peringkat Positif Negatif
S1 S2
1 5 4 -1 2 2
2 5 6 1 2 2
3 6 7 1 2 2
4 6 8 2 4 4
5 6 9 3 5,5 5,5
6 7 10 3 5,5 5,5
7 6 10 4 7 7
T1 = 26 T2 = 2

Kolom peringkat diperoleh dengan mengurutkan nilai-


nilai pada kolom selisih S2-S1 tanpa melihat tanda positif atau
negatif dan dengan mengabaikan nilai 0. Selanjutnya, diperoleh
T = min(T1, T2) = min(26,2) = 2. Dari Tabel uji T Wilcoxon
diperoleh titik kritis untuk n=7 dan tingkat keberartian 5 %
adalah 2 sehingga H0 artinya median hasil tes awal dan
median tes akhir tidak sama.

Uji Ketakbergantungan

Misalkan bahwa (X1, Y1), (X2, Y2), ..., (Xn, Yn) adalah
vektor stokastik yang saling tak bergantung dari distribusi
bivariat. Pertanyaan yang sering muncul adalah apakah
kedua peubah tersebut tidak saling bergantung (independent).
Misalkan S1, S2, ...., Sn adalah nomor rank dari X1,
X2, ...., Xn dalam urutan X(1), X(2), ...., X(n) dan didefinisikan
analog R1, R2, ...., Rn untuk Y1, Y2, ...., Yn. Jika Xi dan Yi tidak
bergantung maka nomor rank untuk dua kelompok Si dan Ri
akan saling tidak bergantung. Bila tidak ada ulangan maka
akan memuat permutasi dari bilangan { 1, 2, ..., n }. Dua
sampel tersebut akan saling bergantung positif sehingga
diharapkan bahwa 2 baris nomor rank akan paralel satu

166 | Adi Setiawan


sama lain. Berarti dalam hal ini dilakukan pengujian untuk
masalah :
H0 : Xi dan Yi tidak saling bergantung untuk i = 1, 2, ..., n,
H1 : Xi dan Yi saling bergantung untuk i = 1, 2, ..., n.
Jika tidak ditemukan ulangan maka setiap uji hanya
didasarkan pada vektor S1, S2, ..., Sn dan R1, R2, ..., Rn yang
bebas distribusi di bawah H0. dalam kasus terjadinya ulangan
maka uji tersebut akan bebas distribusi asalkan mengandung
formula ulangan.

Uji korelasi peringkat Spearman

Uji ini didasarkan pada koefisien korelasi dari nomor


rank untuk dua kelompok. Hipotesis nol akan ditolak untuk
nilai yang dekat dengan -1 atau 1 untuk besaran statistik
n

 (r  r )(s
i 1
i i  s)
l 1/ 2
 n n 
 i   ( si  s ) 2 
2
( r r )
 i 1 i 1 
dengan
n 1
.rs
2
Bila tidak ada ulangan dalam 2 sampel tersebut maka
{ r1, r2, ..., rn } = { s1, s2, ..., sn } = { 1, 2, ..., n }
dan memenuhi :
n

r  n(2n  1)(n  1) / 6
2
i
i 1
n

 (r
i 1
i  r ) 2  (n 3  n) / 12

Dapat dibuktikan bahwa


n
6 (ri  si ) 2
i 1
l 1  .
n3  n

Analisis Data Statistik | 167


Apabila ada data berulang, koefisien korelasi Spearman
didefinisikan sebagai
n
A  B   R( X i )  R(Yi )
2

i 1
l
2 AB
n3  n n3  n
dengan A  U X , B   UY dan U X adalah
12 12
banyaknya ulangan dalam masing-masing kelompok ulangan
u3  u
dari variabel X dan U  .
12

Contoh IX.9
Misalkan bahwa dimiliki data bivariat sebagai berikut (1,2),
(0,1), (0,2) dan (1,4). Hal itu berarti data X adalah { 1, 0, 0, 0,
1 } sehingga ranking untuk data X yaitu R(Xi) adalah { 4,5,
2, 2, 2, 4,5 }. Karena terdapat 2 ulangan yaitu pada rangking
4,5 dan 3 pada rangking 2 maka diperoleh
(4,5)3  4,5 23  2
U X  12  12  2,5.
Selanjutnya data Y adalah { 2, 1, 2, 2, 4 } sehingga R(Yi) adalah
{ 3, 1, 3, 3, 5 } dan
33  3
U Y  12
 2.

n3  n 53  5
Akibatnya, diperoleh A   U X   2,5  7,5 dan
12 12
n3  n 53  5
A  U X   2 8
12 12
sehingga diperoleh koefisien korelasi Spearman
n
A  B   R( X i )  R(Yi )
2

i 1 7,5  8  5,5
l   0,6455.
2 AB 2 7,5(8)

168 | Adi Setiawan


Contoh IX.10
Berdasarkan data pada Tabel IX.1, diinginkan untuk menguji
hipotesis nol bahwa ukuran keagresifan di antara dua orang
bersaudara kembar saling bebas melawan hipotesis alternatif
bahwa ukuran keagresifan di antara dua orang bersaudara
kembar saling bebas dengan tingkat keberartian  = 5%.
Kembar yang lahir pertama diberi peringkat diantara mereka
dan juga untuk kembar yang lahir kedua. Hasil yang
diperoleh diberikan pada Tabel IX.4.

Tabel IX.4 Tabel Perhitungan Statistik Uji T


Himpunan kembar 1 2 3 4 5 6 7 8 9 10 11 12
R(Xi) 8 3,5 6,5 1 11,5 5 6,5 11,5 2 3,5 10 9
R(Xi) 10 7 6 1 12 4,5 2,5 11 2,5 8 9 4,5
[ R(Xi) – R(Yi) ]2 4 12,25 0,25 0 0,25 0,25 16 0,25 0,25 20,25 1 20,25

Koefisien korelasi Spearmannya adalah 0,7355 dengan titik


kritis 0,5804 (Lampiran 10). Hal itu berarti bahwa hipotesis
nol ditolak sehingga tidak benar adanya kesaling-bebasan
antara keagresifan kembar yang lahir pertama dan yang lahir
kedua.
Di samping koefisien korelasi Spearman juga terdapat
koefisien korelasi Kendall yang dapat dijelaskan sebagai
berikut. Koefisien korelasi Kendall tanpa pengulangan (ties)
dapat dihitung dengan menggunakan rumus
2K
 (*)
n(n  1)
dengan
K=  sgn( xi  x j ) sgn( yi  y j )
i j

dan sgn(x) = 1 jika x > 0, sgn(x) = 0 jika x = 0 dan sgn(x) = 1


jika x < 0. Apabila terdapat pengulangan maka koefisien
korelasi Kendall dihitung dengan menggunakan rumus

Analisis Data Statistik | 169


K

1 1
n(n  1)  U X n(n  1) U Y
2 2
dengan
i = 1, 2, ...., n,
m = banyaknya pengulangan,
n = ukuran sampel,
U X adalah banyaknya ulangan dalam masing-masing
u3  u
kelompok ulangan dari variabel X dan U  .
12

Contoh IX.11
Berdasarkan data pada Contoh IX.8 diperoleh data X
yaitu { 1, 0, 0, 0, 1 } dan data Y yaitu { 2, 1, 2, 2, 4} sehingga
fungsi sgn(xi-xj) sgn(yi-yj) untuk i = 1, 2, ...., 5 dan j = 1 2, ...,
5 dapat dinyatakan pada matriks
0 1 0 0 0
 
1 0 0 0 1
0 0 0 0 1 .
 
0 0 0 0 1
0 1 1 1 0
 
Akibatnya
K=  sgn( xi  x j ) sgn( yi  y j )  4
i j

diperoleh yaitu jumlah semua elemen matriks yang berada di


bawah diagonal utama. Selanjutnya, dengan menggunakan
persamaan (*), diperoleh koefisien korelasi Kendall yaitu
0,6172. Dengan menggunakan ukuran sampel 5 dan tingkat
keberartian 5%, dari tabel titik kritis koefisien korelasi
Kendall (Lampiran 11) diperoleh titik kritis 0,8000 sehingga
koefisien korelasi Kendall tersebut tidak signifikan.

170 | Adi Setiawan


Contoh IX.12
Berdasarkan data pada Contoh IX.9 dan tingkat berartian 5%,
tentukan apakah ada kesaling-bebasan antara keagresifan
kembar yang lahir pertama dan yang lahir kedua.
Penyelesaian
Dari data, diperoleh koefisien korelasi Kendall adalah 0,5581
dengan titik kritis 0,394 (dengan ukuran sampel n=12 dan
tingkat keberartian 5%). Hal itu berarti bahwa hipotesis nol
ditolak sehingga tidak benar adanya kesaling-bebasan antara
keagresifan kembar yang lahir pertama dan yang lahir kedua.

IX.3 Pengujian Lebih dari Dua Sampel


Dalam pasal ini akan dibahas tentang pengujian
hipotesis untuk data yang diperoleh dari lebih dari dua
sampel yaitu untuk sampel yang saling bebas dengan
menggunakan uji Kruskal-Wallis dan untuk sampel yang
tidak saling bebas dengan menggunakan uji Friedman.

Uji Kruskal-Wallis
Uji ini digunakan untuk menguji hipotesis komparatif
apabila data berskala ordinal atau dapat dinyatakan dalam
skala ordinal pada data yang terdiri dari lebih dari 2 sampel
yang saling bebas. Untuk menggunakan uji ini digunakan
langkah-langah sebagai berikut:
Langkah 1
Tentukan hipotesis nol dan hipotesis alternatifnya. Dalam hal
ini, hipotesis nolnya adalah median populasi semua sama
dan hipotesis alternatifnya adalah ada median yang berbeda
dengan yang lain.
Langkah 2
Dipilih tingkat keberartian .

Analisis Data Statistik | 171


Langkah 3
Dihitung statistik uji Kruskal-Wallis dengan rumus
k
12 Ri
H 
N ( N  1) i 1 ni
 3( N  1)

dengan
n = ukuran sampel,
k = banyaknya kelompok,
ni = ukuran sampel dalam kelompok ke-i,
Ri = jumlah peringkat dalam kelompok ke-i,
i = 1, 2,..., k.

Langkah 4
Aturan pengambilan keputusan yaitu bahwa H0 ditolak jika
Hhitung >   ;k 1 dengan tingkat keberartian  dan derajat
2

bebas k-1. Pengambilan keputusan juga dapat dilakukan


dengan menggunakan nilai-p yaitu bahwa jika nilai-p lebih
kecil dari  maka H0 ditolak. Dalam hal ini, nilai-p dapat
diperoleh dengan rumus
nilai-p = P( 
2
k 1 > Hhitung).

Contoh IX.13
Seorang guru SMA mengadakan penelitian tentang keunggulan
metode pembelajaran dengan menggunakan 3 metode dan
diperoleh hasil ujian seperti dinyatakan pada tabel berikut
ini:
Metode A Metode B Metode C
70 65 67
76 70 66
77 74 50
76 67 57
67 57
89

Apabila dianggap distribusi hasil ujian tidak berdistribusi


normal maka gunakan statistik Kruskal-Wallis dengan tingkat

172 | Adi Setiawan


keberartian 10% untuk menguji apakah ketiga median hasil
pembelajaran tersebut sama.
Penyelesaian
Langkah 1
Hipotesis nolnya adalah median populasi semua sama dan
hipotesis alternatifnya adalah ada median yang berbeda
dengan yang lain.
Langkah 2
Dipilih tingkat keberartian  = 10%.
Langkah 3

Metode Metode
Metode A Peringkat Peringkat Peringkat
B C
70 9,5 65 4 67 7
76 12 70 9,5 66 5
77 13 74 11 50 1
76 14 67 7 57 2,5
67 7 57 2,5
89 15
R1 = 70,5 R2 = 34 R3 = 15,5

Tabel di atas digunakan untuk membantu menghitung R1, R2


dan R3. Dalam hal ini, n1 = 6, n2 = 5 , n3 = 4 dan N = 15,
selanjutnya dihitung statistik uji Kruskal-Wallis dengan
rumus
k
12 Ri
H 
N ( N  1) i 1 ni
 3( N  1)

sehingga diperoleh Hhitung = 7,9819.


Langkah 4
Aturan pengambilan keputusan yaitu bahwa H0 ditolak jika
Hhitung >   ; k 1   0,1; 2  4,6052 dengan tingkat keberartian 
2 2

=10% dan derajat bebas k-1 = 3-1 = 2. Karena lebih besar dari
titik kritis yaitu 4,6052 maka H0 ditolak sehingga ada median
yang berbeda dengan yang lain.

Analisis Data Statistik | 173


Pengambilan keputusan juga dapat dilakukan dengan
menggunakan nilai-p yaitu bahwa jika nilai-p lebih kecil dari
 = 10% maka H0 ditolak. Dalam hal ini, nilai-p dapat
diperoleh dengan rumus
nilai-p = P(  > Hhitung) = P( 
2 2
k 1 2 > 7,9819) = 0,0185
sehingga H0 ditolak.

Uji Friedman
Uji Friedman digunakan untuk menguji hipotesis
apabila datanya berskala ordinal untuk data yang diperoleh
dari lebih dari 2 sampel yang berkaitan. Untuk memberikan
gambaran penggunaan metode ini, dijelaskan dalam langkah-
langkah berikut :
Langkah 1
Menentukan hipotesis nol dan hipotesis alternatif.
Langkah 2
Menentukan tingkat keberartian .
Langkah 3
Menghitung statistik uji Friedman yaitu X2hitung dengan
rumus:
k
12
X2  Ri  3n(k  1)
2

nk (k  1) i 1
dengan
N = ukuran sampel total,
Ri = jumlah peringkat dalam kelompok ke-i.

Langkah 4
Aturan penolakan H0 adalah jika Hhitung >   ; k 1 . Pengambilan
2

keputusan juga dapat dilakukan dengan menggunakan nilai-


p yaitu bahwa jika nilai-p lebih kecil dari tingkat keberartian
 maka H0 ditolak.

174 | Adi Setiawan


Contoh IX.14
Misalkan dalam sebuah pelatihan yang diikuti oleh 6 orang
dilakukan tes awal, tes tengah dan tes akhir. Ujilah apakah
median tes awal, tes tengah dan tes akhir sama atau tidak
dengan menggunakan tingkat keberartian  = 1%. Hasil yang
diperoleh dinyatakan pada tabel berikut ini:

Tes Awal Tes Tengah Tes Tengah


4 5 6
4 5 6
5 6 7
5 6 7
6 7 7
6 7 7

Penyelesaian
Langkah 1
Hipotesis nolnya adalah median tes awal, tes tengah dan tes
akhir semua sama dan hipotesis alternatifnya adalah H0 tidak
benar.
Langkah 2
Dipilih tingkat keberartian  = 1%.
Langkah 3
Metode Metode Metode
Peringkat Peringkat Peringkat
A B C
4 1 5 2 6 3
4 1 5 2 6 3
5 1 6 2 7 3
5 1 6 2 7 3
6 1 7 2,5 7 2,5
6 1 7 2,5 7 2,5
R1 = 6 R2 = 13 R3 = 17

Analisis Data Statistik | 175


Tabel di atas digunakan untuk membantu menghitung R1, R2
dan R3. Dalam hal ini, n = 6, k = 3 dan N = nk = 18,
selanjutnya dihitung statistik uji Friedman dengan rumus

 
k
12 12
X2  Ri  3n(k  1)  6 2  132  17 2  3(6)(3  1)
2

nk (k  1) i 1 6(3)(3  1)
sehingga diperoleh X2hitung = 10,3333.

Langkah 4
Aturan pengambilan keputusan yaitu bahwa H0 ditolak jika
Hhitung >   ;k 1   0,01; 2  9,2103 dengan tingkat keberartian 
2 2

=1 % dan derajat bebas k-1 = 3-1 = 2. Karena lebih besar dari


titik kritis yaitu 9,2103 maka H0 ditolak sehingga tidak benar
bahwa median tes awal, tes tengah dan tes akhir semua
sama.
Pengambilan keputusan juga dapat dilakukan dengan
menggunakan nilai-p yaitu bahwa jika nilai-p lebih kecil dari
 = 1% maka H0 ditolak. Dalam hal ini, nilai-p dapat diperoleh
dengan rumus
nilai-p = P(  > X2hitung) = P( 
2 2
k 1 2 > 10,3333) = 0,0057
sehingga H0 ditolak.

176 | Adi Setiawan


SOAL & PENYELESAIAN

Soal 1
Berdasarkan pada data inflasi bulanan kota Jayapura pada
Tabel II.2, akan diuji hipotesis nol bahwa median data inflasi
bulanan kota Jayapura sama dengan nol melawan median
data inflasi bulanan kota Jayapura lebih dari nol dengan
tingkat keberartian 5%.
Penyelesaian
Hipotesis nol yang akan diuji adalah bahwa median data
inflasi bulanan kota Jayapura sama dengan nol melawan
median data inflasi bulanan kota Jayapura lebih dari nol.
Statistik yang digunakan adalah
T  # ( X i  0)   1{ X i  0}.
i
Hipotesis nol H0 akan ditolak jika nilai-p lebih kecil dari 5%.
Dari data diperoleh T = 37 sehingga nilai-p adalah
PH0(T > 37) = 0,0019
sehingga H0 ditolak artinya median data inflasi bulanan kota
Jayapura lebih dari nol.

Soal 2
Berdasarkan pada data inflasi bulanan kota Jayapura pada
Tabel II.2, akan diuji hipotesis nol bahwa distribusi data
inflasi bulanan kota Jayapura simetris di sekitar 0 melawan
distribusi data inflasi bulanan kota Jayapura tidak simetris
di sekitar 0 dengan uji simetri Wilcoxon dan tingkat
keberartian 5%.
Penyelesaian
Hipotesis nol bahwa distribusi data inflasi bulanan kota
Jayapura simetris di sekitar 0 melawan distribusi data inflasi
bulanan kota Jayapura tidak simetris di sekitar 0. Statistik
yang digunakan adalah

Analisis Data Statistik | 177


n
V   Ri sign ( X i  mo ).
i 1

Hipotesis nol H0 akan ditolak jika nilai-p lebih kecil dari 5%.
Dari data diperoleh V = 520 sehingga nilai-p adalah
PH0(V > 520) = 0,0252
sehingga H0 ditolak artinya distribusi data inflasi bulanan
kota Jayapura tidak simetris di sekitar 0.

Soal 3
Berdasarkan pada data inflasi bulanan kota Ambon dan kota
Jayapura pada Tabel II.2, akan diuji hipotesis nol bahwa
distribusi data inflasi bulanan kota Ambon dan kota Jayapura
sama melawan distribusi data inflasi bulanan kota Ambon
dan kota Jayapura tidak sama dengan uji Mann-Whitney
untuk ukuran sampel besar dan tingkat keberartian 5%.
Penyelesaian
Karena m=n=54 maka dapat digunakan uji Mann-Whitney
pendekatan sehingga diperoleh W = 3088. Distribusi W
mendekati normal dengan mean 2943 dan simpangan baku
162,751 sehingga diperoleh nilai-p yaitu 0,3730 sehingga H0
diterima. Hal itu berarti distribusi data inflasi bulanan kota
Ambon dan kota Jayapura sama.

Soal 4
Berdasarkan pada data inflasi bulanan kota Ambon dan kota
Jayapura pada Tabel II.2, akan diuji hipotesis nol bahwa
distribusi data inflasi bulanan kota Ambon dan kota Jayapura
sama melawan distribusi data inflasi bulanan kota Ambon
dan kota Jayapura tidak sama dengan uji Kolmogorov-Smirnov
dengan tingkat keberartian 5%.
Penyelesaian
Dengan menggunakan statistik Kolmogorov-Smirnov dua
sampel diperoleh Dm,n = 0,1667 sedangkan titik kritis untuk
m=n=54 dan tingkat keberartian 5% adalah 0,2613. Hipotesis

178 | Adi Setiawan


nol H0 ditolak jika lebih besar dari 0,2613. Akibatnya H0
diterima artinya dengan menggunakan statistik Kolmogorov-
Smirnov, distribusi data inflasi bulanan kota Ambon dan kota
Jayapura sama.

Soal 5
Berdasarkan pada data inflasi bulanan kota Ambon dan kota
Jayapura pada Tabel II.2, akan diuji hipotesis nol bahwa data
inflasi bulanan kota Ambon dan kota Jayapura saling bebas
melawan data inflasi bulanan kota Ambon dan kota Jayapura
tidak saling bebas dengan uji koefisien korelasi Spearman
dengan tingkat keberartian 5%.
Penyelesaian
Dengan menggunakan rumus koefisien korelasi Spearman
diperoleh koefisien korelasi Spearman l = 0,1405. Dengan
tingkat keberartian 5%, hipotesis nol ditolak jika l lebih besar
dari 0,2679. Akibatnya data inflasi bulanan kota Ambon dan
kota Jayapura saling bebas.

Soal 6
Sebuah pelatihan metode penelitian dilakukan evaluasi awal,
tengah dan akhir. Gunakan tingkat keberartian 10% untuk
menguji apakah median evaluasi awal, tengah dan akhir
sama. Hasil evaluasi pelaihan metode penelitian tersebut
dinyatakan dalam tabel berikut:

Tes Awal Tes Tengah Tes Tengah


7 8 8
7 9 7
8 7 8
9 10 8
7 10 8
8 9 10

Analisis Data Statistik | 179


Penyelesaian
Langkah 1
Hipotesis nolnya adalah median evaluasi awal, evaluasi
tengah dan evaluasi akhir semua sama dan hipotesis
alternatifnya adalah H0 tidak benar.
Langkah 2
Dipilih tingkat keberartian  = 10%.
Langkah 3

Metode Metode
Metode A Peringkat Peringkat Peringkat
B C
7 1 8 2,5 8 2,5
7 1,5 9 3 7 1,5
8 2,5 7 1 8 2,5
9 2 10 3 8 1
7 1 10 3 8 2
8 1 9 2 10 3
R1 = 9 R2 = 14,5 R3 = 12,5

Tabel di atas digunakan untuk membantu menghitung R1, R2


dan R3. Dalam hal ini, n = 6, k = 3 dan N = nk = 18, selanjutnya
dihitung statistik uji Friedman dengan rumus
 
k
12 12
X2  Ri  3n(k  1)  9 2  (15,5) 2  (12,5) 2  3(6)(3  1)
2

nk (k  1) i 1 6(3)(3  1)
sehingga diperoleh X2hitung = 2,5833.
Langkah 4
Aturan pengambilan keputusan yaitu bahwa H0 ditolak jika
X2hitung >   ;k 1   0,01; 2  4,6052
2 2
dengan tingkat keberartian
 =1% dan derajat bebas k-1 = 3-1 = 2. Karena X2hitung lebih
kecil dari titik kritis yaitu 4,6052 maka H0 diterima sehingga
median tes awal, tes tengah dan tes akhir semua sama.
Pengambilan keputusan juga dapat dilakukan dengan
menggunakan nilai-p yaitu bahwa jika nilai-p lebih kecil dari

180 | Adi Setiawan


 = 10% maka H0 ditolak. Dalam hal ini, nilai-p dapat
diperoleh dengan rumus
nilai-p = P(  > X2hitung) = P( 
2 2
k 1 2 > 2,5833) = 0,2748
sehingga nilai-p = 0,2748 lebih besar dari tingkat keberartian
 = 10 % dan berarti H0 diterima.

Analisis Data Statistik | 181


LATIHAN

1. Berikut ini data hubungan antara tinggi ayah dan tinggi


anak (dalam cm):
Tinggi ayah 165 160 170 163 173 157 178 168 173 170 175 180
Tinggi anak 173 168 173 165 175 168 173 165 180 170 173 178

Ujilah apakah ada keterkaitan antara tinggi anak dengan


tinggi ayah dengan menggunakan uji koefisien korelasi
Spearman dengan tingkat keberartian 1%.
2. Berdasarkan data pada no 1, ujilah dengan uji Mann-Whitney
apakah distribusi tinggi ayah dan distribusi tinggi anak
sama dengan tingkat keberartian 5%.
3. Berdasarkan data pada no 1, ujilah dengan uji Kolmogorov-
Smirnov apakah distribusi tinggi ayah dan distribusi tinggi
anak sama dengan tingkat keberartian 5%.
4. Ujilah dengan uji simetri Wilcoxon bahwa data tinggi ayah
simetris di sekitar 160 cm dengan tingkat keberartian
10% untuk data tinggi ayah pada data no 1.
5. Ujilah dengan uji tanda bahwa median data tinggi ayah
adalah 160 cm dengan tingkat keberartian 5% untuk data
tinggi ayah pada data no 1.
6. Misalkan diberikan data bivariat (x,y) yaitu (33, 26), (61,
36), (20, 65), (19,25) dan (40,35). Ujilah hipotesis tentang
koefisien korelasi Spearman berikut ini:
a. H0 :   0 dengan tingkat keberartian  = 5%.
b. H0 :  > 0 dengan tingkat keberartian  = 1%.
c. H0 :  < 0 dengan tingkat keberartian  = 10%.
7. Ujilah dengan uji simetri Wilcoxon bahwa data inflasi
bulanan Indonesia simetris di sekitar 0 persen dengan
tingkat keberartian 10% untuk data pada Tabel II.1.
8. Ujilah dengan uji tanda bahwa median data inflasi bulanan
Indonesia adalah 0 persen dengan tingkat keberartian 5%
untuk data pada Tabel II.1.

182 | Adi Setiawan


9. Ujilah dengan uji Komogorov-Smirnov bahwa distribusi
data inflasi bulanan Indonesia sama dengan distribusi
data inflasi bulan kota Ambon untuk periode Januari
2009 sampai dengan Desember 2011 pada Tabel II.1 dan
pada Tabel II.2 dengan tingkat keberartian 5%.
10. Enam orang siswa mengikuti suatu penelitian untuk
menguji apakah metode pembelajaran dengan mengguna-
kan pembuatan portofolio dapat meningkatkan pema-
haman siswa akan pembelajaran dengan menggunakan
tingkat keberartian 5%. Hasil penilaian yang diperoleh
dinyatakan dalam tabel berikut ini:
Penilaian 1 Penilaian 2 Penilaian 3 Penilaian 4
4 6 6 6
4 6 6 6
5 4 6 7
5 4 6 7
5 5 5 6
5 5 5 6

***

Analisis Data Statistik | 183


BAB X
UJI VALIDITAS DAN UJI RELIABILITAS

Dalam bab ini, akan dibahas tentang uji validitas dan


uji reliabilitas yang banyak digunakan dalam penelitian ilmu
sosial seperti di ilmu pendidikan dan ilmu psikologi. Dalam
penelitian di bidang pendidikan, seringkali diinginkan untuk
mengukur motivasi belajar, kecerdasan emosional, kecerdasan
sosial dan lain-lain. Untuk itu perlu dibuat alat ukur yang
mampu mengukur variabel tersebut. Sebelum alat ukur ter-
sebut digunakan, perlu diuji validitas dan reliabilitasnya.
Hasil penelitian yang valid apabila terdapat kesamaan
antara data yang terkumpul dengan data yang sesungguhnya
terjadi pada objek yang diteliti. Hasil penelitian yang reliabel
adalah apabila terdapat kesamaan data dalam waktu yang
berbeda. Alat ukur (instrument) dikatakan valid adalah apabila
alat ukur yang digunakan untuk mendapatkan mengukur
apa yang akan diukur tersebut valid. Dalam hal ini, valid
berarti instrumen tersebut dapat digunakan untuk mengukur
apa yang seharusnya diukur. Meteran yang valid dapat diguna-
kan untuk mengukur panjang dengan teliti karena meteran
memang alat untuk mengukur panjang.
Alat ukur yang reliabel adalah alat ukur yang bila
digunakan beberapa kali untuk mengukur obyek yang sama
akan menghasilkan data yang sama. Alat ukur panjang dari
karet merupakan salah satu contoh alat ukur yang tidak
reliabel/konsisten. Instrumen yang valid dan reliabel merupa-
kan syarat mutlak untuk mendapatkan hasil penelitian yang
valid dan reliabel. Instrumen yang berbentuk tes digunakan
untuk mengukur prestasi belajar dan instrumen yang nontest
untuk mengukur skala sikap. Instrumen yang berupa test
jawabannya adalah “salah atau benar” sedangkan instrumen

184 | Adi Setiawan


sikap jawabannya tidak ada yang “salah atau benar” tetapi
bersifat “positif atau negatif”.

PENGUJIAN VALIDITAS DAN RELIABILITAS


Pengujian Validitas Alat Ukur (Instrumen)
Pada setiap instrumen baik tes maupun bukan tes
terdapat butir-butir (item) pertanyaan atau pernyataan. Untuk
menguji validitas butir-butir instrumen lebih lanjut maka
setelah dikonsultasikan dengan ahli (expert) yang terkait
dengan topik yang ingin diteliti dengan menggunakan
instrumen tersebut, selanjutnya diujicobakan dan dianalisis
dengan menggunakan analisis butir (ítem analysis). Analisis
butir dilakukan dengan menghitung koefisien korelasi
Pearson antara skor butir instrumen dengan skor total.
Koefisien korelasi Pearson didefinisikan sebagai berikut.
Misalkan (X1, Y1), (X2, Y2), ...., (Xn,Yn) adalah sampel random
bivariat berukuran n yang diambil dari suatu populasi.
Koefisien korelasi Pearson dari populasi didefinisikan sebagai
E[ ( X   X )(Y  Y )]

 X Y
dengan  X  E[X ] , Y  E[Y ] ,  X  V (X ) ,  X  V (X ) dan
estimasi koefisien korelasi Pearson berdasarkan sampel
tersebut adalah sebagai berikut
n

(Xi 1
i  X )(Yi  Y )
r
 
n n
i 1
( X i  X )2 i 1
(Yi  Y ) 2

1 n 1 n
dengan X   i
n i 1
X dan Y   Yi .
n i 1

Contoh X.1
Seorang mahasiswa melakukan penelitian dengan meng-
gunakan alat ukur (kuesioner) untuk mengukur motivasi

Analisis Data Statistik | 185


belajar 12 responden. Alat ukur tersebut terdiri dari 10 butir
yang menggunakan skala Likert yaitu :
1 jika pilihannya adalah sangat setuju,
2 jika pilihannya tidak setuju,
3 jika pilihannya setuju,
4 jika pilihannya sangat setuju.

Tabel X.1 Hasil skor instrument motivasi belajar dengan 10 item untuk
12 reseponden

Skor butir
Skor
Responden 1 2 3 4 5 6 7 8 9 10
Total
1 3 4 3 4 4 3 3 3 3 3 33
2 4 3 3 4 3 3 3 3 3 3 32
3 2 2 1 3 2 2 3 1 2 3 21
4 3 4 4 3 3 3 4 3 3 4 34
5 3 4 3 3 3 4 3 4 4 3 34
6 3 2 4 4 3 4 4 3 4 4 35
7 2 3 3 4 4 4 3 4 3 2 32
8 1 2 2 1 2 2 1 3 4 3 21
9 4 2 3 3 4 2 1 1 4 4 28
10 3 3 3 4 4 4 4 4 3 3 35
11 4 4 3 4 4 3 4 4 4 2 36
12 3 2 1 2 3 1 1 2 3 3 21
Korelasi 0,534 0,706 0,871 0,791 0,645 0,839 0,780 0,686 0,292 -0,027

Setelah alat ukur diisi oleh 12 responden diperoleh data


yang dinyatakan pada Tabel X.1. Diperoleh koefisien korelasi
antara skor butir pertama sampai dengan skor butir kesepuluh
dengan skor total berturut-turut adalah 0,534, 0,706, 0,871,
0,791, 0,645, 0,780, 0,686, 0,292 dan -0,027. Apabila
digunakan tingkat keberartian 5% dengan menggunakan uji
2 sisi dan ukuran sampel n = 12 maka diperoleh titik kritis
0,576 (lihat Tabel Korelasi Pearson). Akibatnya koefisien
korelasi Pearson butir 1, 9 dan 10 kurang dari titik kritis yaitu
0,576 sehingga dapat disimpulkan bahwa butir tersebut tidak
valid sehingga perlu dibuang (asalkan tidak mengurangi manfaat
alat ukur tersebut secara keseluruhan) atau diubah dengan

186 | Adi Setiawan


melakukan uji coba alat ukur kembali sebelum digunakan
dalam penelitian.
Apabila banyaknya butir yang digunakan dalam alat
ukur tidak banyak maka seringkali dilakukan koreksi dalam
perhitungan koefisien korelasi yang digunakan dalam penen-
tuan apakah butir tersebut vaid atau tidak. Hal ini dilakukan
dengan cara mengkorelasikan antara tiap butir dengan skor
total tanpa menghitung skor pada butir tersebut. Cara tersebut
sering dinamakan dengan corrected item-total correlation.
Sebagai contoh, koefisien korelasi butir pertama dapat dihitung
dengan menggunakan data pada kolom pertama pada Tabel
X.1 dan selisih antara data pada kolom terakhir (skor total)
dikurangi dengan data pada kolom pertama sehingga diperoleh
corrected item-total correlation sebesar 0,411. Dengan cara
yang sama juga diperoleh untuk butir kedua sampai dengan
kesepuluh berturut-turut yaitu 0,615, 0,622, 0,718, 0,560,
0,776, 0,676, 0,568, 0,187 dan -0,138. Akibatnya, jika
digunakan tingkat keberartian 5% maka akan dapat disimpul-
kan bahwa butir 1, butir 5 dan butir 10 tidak valid.
Meskipun tabel korelasi Pearson dapat digunakan
untuk menentukan apakah koefisien korelasi Pearson suatu
butir valid atau tidak, tetapi kebiasaan yang digunakan
dalam penelitian yaitu menggunakan batas titik kritis 0,3
tanpa memperhatikan ukuran sampel atau banyaknya respon-
den yang digunakan dalam penelitian.

Pengujian Reliabilitas Instrumen

Untuk menguji apakah alat ukur yang digunakan reliabel,


digunakan statistik alfa Cronbach (Cronbach’s Alpha). Tabel X.2
diperoleh dari Tabel X.1 dengan membuang butir 1, 5, 9 dan
10 dan digunakan sebagai alat bantu untuk menghitung
statistik alfa Cronbach. Statistik alfa Cronbach dihitung
dengan terlebih dahulu membuang butir yang tidak valid.

Analisis Data Statistik | 187


Rumus yang digunakan untuk menghitung statistik alfa
Cronbach adalah
 k

 k 

  bi 2 
r   1
i 1

 k  1  t2 
 
 
dengan
r = koefisien reliabilitas alat ukur (statistik alfa Cronbach),
k = banyaknya butir yang valid pada alat ukur,
k


i 1
bi
2
= total variansi butir,

 t 2 = variansi skor total.


Dalam hal ini, untuk menghitung variansi butir (untuk kasus
ini digunakan variansi populasi bukan variansi sampel)
digunakan rumus
n  n
x 
2

xj 1
j
2
 j 1 j

n
 b2 
,
n
sehingga untuk butir ke-2 diperoleh variansi
352
111 
 b2  12  0,7431.
12
Dengan cara yang sama diperoleh variansi untuk butir ke-
3, ke-4, ke-6, ke-7 dan ke-8 berturut-turut yaitu 0,8542,
0,8542, 0,8542, 0,9097, 1,3056, 1,0764 sehingga diperoleh
jumlah variansi butir
k


i 1
bi
2
 5,7431.

Selanjutnya diperoleh variansi dari skor total yaitu


12

12 X i

X  i 1 (211) 2
2
i
12 3983 
 t 2  i 1  12  22,7431.
12 12

188 | Adi Setiawan


Akibatnya diperoleh statistik alfa Cronbach
 k

   bi 2 
 k   i 1
r   1    6  1  5,7431   0,8970.
 k  1   t   6  1   22,7431
2

 
 

Tabel X.2 Tabel Alat Bantu Perhitungan Statistik Alfa Cronbach


Respon- Skor Total
den 2 3 4 6 7 8 Total kuadrat
1 4 3 4 3 3 3 20 400
2 3 3 4 3 3 3 19 361
3 2 1 3 2 3 1 12 144
4 4 4 3 3 4 3 21 441
5 4 3 3 4 3 4 21 441
6 2 4 4 4 4 3 21 441
7 3 3 4 4 3 4 21 441
8 2 2 1 2 1 3 11 121
9 2 3 3 2 1 1 12 144
10 3 3 4 4 4 4 22 484
11 4 3 4 3 4 4 22 484
12 2 1 2 1 1 2 9 81
Total 35 33 39 35 34 35 211 3983
Jumlah
Kuadrat 111 101 137 113 112 115 22,7431

Sigma2B 0,7431 0,8542 0,8542 0,9097 1,3056 1,0764 5,7431 0,8970

Untuk menentukan apakah alat ukur yang digunakan


reliabel atau tidak sering batas titik kritis 0,6 sehingga jika
statistik alfa Cronbach bernilai lebih dari atau sama dengan
0,6 maka alat ukur yang digunakan reliabel. Hal itu berarti
pada contoh di atas instrument yang digunakan reliable
karena mempunyai statistik alfa Cronbach sebesar 0,897
sehingga lebih besar dari 0,6.

Analisis Data Statistik | 189


Tabel X.3 Hasil skor instrument dengan 5 item untuk 10 reseponden.

Responden 1 2 3 4 5
1 0 0 1 1 0
2 0 0 0 1 0
3 1 1 0 0 0
4 1 0 0 1 0
5 0 1 1 1 1
6 0 1 0 0 0
7 1 1 1 1 1
8 1 1 0 1 0
9 1 1 1 1 0
10 0 0 0 1 1

Uji validitas untuk tipe data 0 atau 1 yang diperoleh


dari data hasil evaluasi belajar seperti dinyatakan pada Tabel
X.3 dapat dijelaskan dalam langkah-langkah berikut ini. Pada
Tabel X.3, baris pertama menyatakan nomor butir soal-soal.
Akan diuji apakah butir soal pertama sampai dengan kelima
valid untuk menguji kemampuan siswa untuk mata pelajaran
yang diujikan. Skor 0 berarti responden salah menjawab butir
soal tersebut sedangkan skor 1 menyatakan bahwa responden
menjawab benar untuk butir soal tersebut.

Langkah 1
Menyiapkan tabel bantu dengan menghitung jumlah baris,
jumlah baris dikuadratkan, jumlah kolom, p dan q untuk
masing-masing kolom. Tabel bantu perhitungan koefisien
korelasi point biserial. Dalam hal ini, p menyatakan proporsi
responden yang menjawab benar untuk butir soal tertentu
sedangkan q menyatakan proporsi responden yang menjawab
salah untuk butir soal tersebut.

190 | Adi Setiawan


Tabel X.4 Tabel Alat Bantu Perhitungan Koefisien Korelasi Biserial

Jumlah Kuadrat
5

X
5

X
2
i i
Responden 1 2 3 4 5 i 1 i 1

1 0 0 1 1 0 2 4
2 0 0 0 1 0 1 1
3 1 1 0 0 0 2 4
4 1 0 0 1 0 2 4
5 0 1 1 1 1 4 16
6 0 1 0 0 0 1 1
7 1 1 1 1 1 5 25
8 1 1 0 1 0 3 9
9 1 1 1 1 0 4 16
10 0 0 0 1 1 2 4
Jumlah N1 = 5 N2 = 6 N3 = 4 N4 = 8 N5 = 3 26 84

p 0,5 0,6 0,4 0,8 0,3


q 0,5 0,4 0,6 0,2 0,7

Langkah 2
Mencari mean dari jumlah baris atau skor total yaitu
1 n 26
M t   X i   2,6.
n i 1 10

Langkah 3
Menentukan simpangan baku (populasi) yaitu dengan
menggunakan rumus
2
n
 n 
 Xi   Xi 
2

s  i 1   i 1 
n n
 
 
sehingga diperoleh

Analisis Data Statistik | 191


2
84  26 
s    1,2806.
10  10 
Langkah 4
Menentukan Mp untuk butir soal 1 sampai dengan butir soal
5. Untuk M1 dapat diperoleh dengan mengalikan kolom butir
soal 1 dengan kolom jumlah kemudian hasilnya dijumlahkan
untuk seluruh responden dan kemudian dibagi dengan
banyaknya responden sehingga diperoleh
16
M 1   3,2.
5
Dengan cara yang sama diperoleh M2 = 3,1667, M3 = 3,75, M4
= 2,875 dan M5 = 3,6667.
Langkah 5
Menentukan koefisien korelasi point biserial dengan rumus
M p  Mt p
r
s q
sehingga koefisien korelasi buserial untuk butir soal 1
adalah
3,2  2,6 0,5
r  0,4685.
1,2806 0,5
Dengan cara yang sama, juga diperoleh koefisien korelasi
point biserial untuk butir soal 2 sampai dengan 5 berturut-
turut adalah 0,5419, 0,7332, 0,4295 dan 0,5453. Ternyata,
hasil yang diperoleh sama dengan jika digunakan rumus
koefisien korelasi Pearson. Selanjutnya, untuk menguji valid
atau tidaknya butir soal digunakan cara yang sama untuk
data yang diperoleh dengan menggunakan skala Likert.

192 | Adi Setiawan


SOAL & PENYELESAIAN

Soal 1
Tabel X.5 berikut ini menyatakan skor dari kuosioner dari 10
responden dan 4 pertanyaan dalam kuesioner dengan skor
menggunakan skala Likert dari 1 sampai 5. Manakah
pertanyaan-pertanyaan yang valid ?

Tabel X.5 Tabel hasil skor dari koesioner

Responden Pertanyaan 1 Pertanyaan 2 Pertanyaan 3 Pertanyaan 4


1 4 4 3 4
2 3 3 4 4
3 2 2 1 4
4 3 4 4 4
5 3 4 4 5
6 1 3 3 4
7 2 3 3 5
8 4 4 4 4
9 4 4 4 4
10 4 4 4 4

Penyelesaian

Berdasarkan Tabel X.5, dapat dihitung skor total dan


koefisien korelasi momen Pearson antara skor pertanyaan ke-
i dan skor total untuk i = 1, 2, 3, 4 yaitu berturut-turut adalah
0,826, 0,940, 0,882 dan 0,087. Tabel X.6 menyatakan hasil
perhitungan untuk skor total. Titik kritis untuk ukuran
sampel n = 10 dari Tabel korelasi momen Pearson adalah
0,632 dengan tingkat keberartian  = 5%. Akibatnya perta-
nyaan-pertanyaan yang valid adalah pertanyaan 1, 2 dan 3
karena mempunyai koefisien korelasi momen Pearson lebih
besar dari titik kritis.

Analisis Data Statistik | 193


Tabel X.6 Tabel hasil skor dari koesioner

Pertanyaan Pertanyaan Pertanyaan Pertanyaan


Responden Total
1 2 3 4
1 4 4 3 4 15
2 3 3 4 4 14
3 2 2 1 4 9
4 3 4 4 4 15
5 3 4 4 5 16
6 1 3 3 4 11
7 2 3 3 5 13
8 4 4 4 4 16
9 4 4 4 4 16
10 4 4 4 4 16

Soal 2
Apabila digunakan metode corrected item-total correlation,
manakah pertanyaan yang valid ?
Penyelesaian
Apabila digunakan metode corrected item-total correlation
maka akan diperoleh koefisien korelasi momen Pearson
terkoreksi berturut-turut yaitu 0,570, 0,885, 0,717 dan -
0,087. Dengan menggunakan titik kritis seperti pada Soal 1
maka pertanyaan yang valid adalah nomor 2 dan 3.

Soal 3
Tabel X.7 berikut ini menyatakan skor dari kuosioner dari 10
responden dan 4 pertanyaan dalam kuesioner dengan skor
menggunakan skala 0 atau 1 (0 = Tidak dan 1 = Ya). Manakah
pertanyaan-pertanyaan yang valid ?

194 | Adi Setiawan


Tabel X.7 Tabel hasil skor dari koesioner
Responden Pertanyaan 1 Pertanyaan 2 Pertanyaan 3 Pertanyaan 4
1 1 1 0 1
2 0 0 1 1
3 0 0 0 1
4 0 1 1 1
5 0 1 1 1
6 0 0 0 1
7 0 0 0 1
8 1 1 1 0
9 1 1 1 0
10 1 1 1 0

Penyelesaian

Langkah 1
Menyiapkan tabel bantu dengan menghitung jumlah baris,
jumlah baris dikuadratkan, jumlah kolom, p dan q untuk
masing-masing kolom. Tabel ini digunakan untuk membantu
menghitung korelasi point biserial. Dalam hal ini, p menyatakan
proporsi responden yang menjawab Ya untuk pertanyaan
tertentu sedangkan q menyatakan proporsi responden yang
menjawab Tidak untuk pertanyaan butir tersebut.
Langkah 2
Mencari mean dari jumlah baris atau skor total yaitu
1 n 23
M t   X i   2,3.
n i 1 10
Langkah 3
Menentukan simpangan baku (populasi) yaitu dengan
menggunakan rumus
2
n
 n 
   Xi 
2
X i

s  i 1   i 1 
n n
 
 

Analisis Data Statistik | 195


sehingga diperoleh
2
61  23 
s     0,9.
10  10 

Tabel X.8 Tabel Bantu Perhitungan Koefisien korelasi point biserial


Pertanyaan
Responden Pertanyaan 1 Pertanyaan 2 Pertanyaan 3 Jml Kuadrat
4
1 1 1 0 1 3 9
2 0 0 1 1 2 4
3 0 0 0 1 1 1
4 0 1 1 1 3 9
5 0 1 1 1 3 9
6 0 0 0 1 1 1
7 0 0 0 1 1 1
8 1 1 1 0 3 9
9 1 1 1 0 3 9
10 1 1 1 0 3 9
Jumlah N1 = 4 N2 = 6 N3 = 6 N1 = 7 23 61
p 0,4 0,6 0,6 0,7
q 0,6 0,4 0,4 0,3

Langkah 4
Menentukan Mp untuk butir pertanyaan 1 sampai dengan
butir pernyataan 4. Untuk M1 dapat diperoleh dengan
mengalikan kolom butir pernyataan 1 dengan kolom jumlah
kemudian hasilnya dijumlahkan untuk seluruh responden
dan kemudian dibagi dengan banyaknya responden yang
menjawab Ya sehingga diperoleh
12
M 1   3.
4
Dengan cara yang sama diperoleh M2 = 3, M3 = 3 dan M4
= 2,1429.

Langkah 5
Menentukan koefisien korelasi point biserial dengan rumus

196 | Adi Setiawan


M p  Mt p
r
s q
sehingga koefisien korelasi biserial untuk butir pernyataan 1
adalah
3  2,3 0,4
r  0,6351.
0,9 0,6
Dengan cara yang sama, juga diperoleh koefisien korelasi
point biserial untuk butir soal 2 sampai dengan 4 berturut-
turut adalah 0,9526, 0,7258 dan -0,5092. Dengan menggunakan
tingkat keberartian  = 5 % maka titik kritisnya adalah 0,632
sehingga pernyataan yang valid adalah pernyataan 1 sampai
dengan 3.

Soal 4
Lakukan uji Chronbach’s alfa untuk data pada Tabel X.7.
Penyelesaian
Untuk menguji apakah alat ukur yang digunakan
reliabel, digunakan statistik alfa Cronbach (Cronbach’s Alpha).
Tabel X.9 diperoleh dari Tabel X.7 dengan membuang butir 4
dan digunakan sebagai alat bantu untuk menghitung
statistik alfa Cronbach. Variansi untuk butir ke-1, ke-2 dan
ke-3 berturut-turut yaitu 0,24, 0,24 dan 0,24 sehingga
diperoleh jumlah variansi butir
k

  0,72.
2
bi
i 1

Selanjutnya diperoleh variansi dari skor total yaitu


12

12 X i

X i
2
 i 1

n 40 
(16) 2
 t 2  i 1  10  1,44.
n 10

Analisis Data Statistik | 197


Akibatnya diperoleh statistik alfa Cronbach
 k

   bi 2 
 k  i 1
r   1    3  1  0,72   0,75.
 k  1   t   2  1   1,44 
2

 
 
Karena statistic alfa Cronbach lebih dari 0,6 yaitu 0,75 maka
instrument tersebut reliabel.

Tabel X.9 Tabel Alat Bantu Perhitungan Statistik Alfa Cronbach

Jumlah
Responden Item Item item Jumlah
Kuadrat
1 1 1 0 2 4
2 0 0 1 1 1
3 0 0 0 0 0
4 0 1 1 2 4
5 0 1 1 2 4
6 0 0 0 0 0
7 0 0 0 0 0
8 1 1 1 3 9
9 1 1 1 3 9
10 1 1 1 3 9
Total 4 6 6 16 40
Jumlah
Kuadrat 4 6 6 1,44
Sigma2B 0,24 0,24 0,24 0,72 0,75

Soal 5
Berdasarkan Tabel X.5 di atas, apabila digunakan koefisien
korelasi Spearman, manakah pertanyaan-pertanyaan yang
valid? Ulangi pertanyaan tersebut bila digunakan koefisien
korelasi Kendall.

198 | Adi Setiawan


Penyelesaian
Apabila digunakan koefisien korelasi Spearman maka akan
diperoleh 0,6506, 0,5286, 0,6913 dan -0,5216 berturut-turut
untuk pernyataan 1 sampai dengan 4. Untuk n = 10 dan
tingkat keberartian 5%, diperoleh titik kritis 0,564 sehingga
pernyataan yang valid adalah 1 dan 3. Hasil tersebut berbeda
dengan hasil yang diperoleh jika digunakan koefisien korelasi
Pearson.
Apabila digunakan koefisien korelasi Kendall maka
akan diperoleh 0,6285, 0,5107, 0,6678 dan -0,5039 berturut-
turut untuk pernyataan 1 sampai dengan 4. Untuk n = 10
dan tingkat keberartian 5 %, diperoleh titik kritis 0,551
sehingga pernyataan yang valid adalah 1 dan 3. Hasil tersebut
analog dengan hasil yang diperoleh jika digunakan koefisien
korelasi Spearman tetapi berbeda dengan hasil yang diperoleh
jika digunakan koefisien korelasi Pearson.

Analisis Data Statistik | 199


LATIHAN

1. Berdasarkan Tabel X.5 di atas, apabila digunakan


koefisien korelasi Spearman, manakah pertanyaan-
pertanyaan yang valid ?
2. Ujilah validitas dan reliabilitas tes yang terdiri dari 8
pertanyaan dan diujikan pada 20 responden.

Tabel X.9 Tabel Skor nilai 8 butir soal dari 20 responden.

1 2 3 4 5 6 7 8
A 0 1 0 0 0 1 0 0
B 1 0 1 0 1 0 1 1
C 0 1 0 1 1 0 0 1
D 1 1 1 1 1 1 1 1
E 1 0 1 1 0 1 0 1
F 0 1 0 0 0 1 0 1
G 1 0 0 1 1 1 1 1
H 1 0 1 1 1 1 1 1
I 0 1 0 1 0 1 0 1
J 1 1 1 1 1 1 1 1
K 0 1 1 1 1 1 1 0
L 0 1 1 0 1 0 1 0
M 0 1 0 0 1 0 1 1
N 1 0 1 1 0 1 0 1
O 1 0 0 1 1 1 1 1
P 0 1 0 1 0 1 0 1
Q 1 0 1 1 1 1 1 1
R 0 1 0 1 1 1 0 1
S 1 0 0 1 1 1 1 1
T 0 1 1 0 0 0 1 0

3. Apabila digunakan metode corrected item-total correlation


dan dengan menggunakan korelasi Spearman pada
Soal 1 dalam Soal dan Penyelesaian Bab X dan pada
Soal 1 di atas serta tingkat keberartian 5%, manakah
pertanyaan yang valid ?

200 | Adi Setiawan


4. Apabila digunakan metode corrected item-total correlation
dan dengan menggunakan korelasi Spearman pada
Soal 4 dan dilanjutnya dengan Soal 5 dalam Soal dan
Penyelesaian Bab X serta tingkat keberartian 5%,
manakah pertanyaan yang valid ?
5. Ujilah validitas dan reliabilitas tes yang terdiri dari 10
pertanyaan dan diujikan pada 17 responden.

Tabel X.10 Tabel Skor nilai 10 butir soal dari 17 responden

Nomer Item
Subjek
1 2 3 4 5 6 7 8 9 10
1 4 1 4 4 4 4 4 4 4 4
2 3 3 4 4 4 4 4 4 4 4
3 4 4 4 4 4 4 4 3 4 4
4 4 4 3 4 4 4 4 4 4 4
5 4 4 4 4 4 4 4 4 4 4
6 4 4 3 4 4 4 4 4 4 4
7 4 4 2 3 4 3 4 4 4 4
8 4 4 4 3 4 4 4 4 4 4
9 4 4 4 4 4 4 4 4 4 4
10 4 4 4 4 4 4 3 4 4 4
11 4 4 4 4 3 4 4 4 4 4
12 4 4 3 2 4 3 3 4 4 4
13 4 4 4 4 4 4 3 3 4 4
14 4 4 4 3 4 4 4 4 4 4
15 4 4 4 4 4 4 4 4 4 4
16 3 4 3 3 4 4 4 4 4 4
17 4 4 3 3 4 4 4 4 4 4

***

Analisis Data Statistik | 201


BAB XI
PENUTUP

Analisis Data Statistik yang telah dijabarkan dalam


buku ini hanyalah analisis data bivariat atau multivariat yang
dapat disimpan dalam memori yang kecil. Saat ini telah
banyak data multivariat dan yang tersimpan dalam memori
yang besar sehingga perlu analisis yang cepat dan perlu
algoritma efisien untuk analisis data sehingga informasi yang
terkandung dalam data mentah cepat dapat dipergunakan
untuk pengambilan keputusan.
Demikian juga berbagai software yang makin berkem-
bang seperti paket program R atau Python yang semakin
menuntut untuk mempelajari hal-hal baru sehingga tidak
ketinggalan jaman apa yang telah kita ketahui dan kita
kuasai. Diharapkan dengan makin lengkapnya kemampuan
mahasiswa dalam teori maupun praktikum maka akan
semakin mampu menghadapi persaingan global.

202 | Adi Setiawan


DAFTAR PUSTAKA

[1] Asmussen, S.. 2003. Applied Probability and Queues.


Springer-Verlag, New York Inc, New York.
[2] Bain, L. J dan M. Engelhardt. 1992. Introduction to
Probability and Mathematical Statistics. Duxbury, Pasific
Grove.
[3] Grossman, S. I dan J. E. Turner. 1974. Mathematics for
the Biological Science. Macmillan Publishing Co. Inc,
New York.
[4] de Gunst, M. C. M., 1994, Statistische Data Analyse,
Faculteit Wiskunde en Informatica, Vrije Universiteit,
Amsterdam.
[5] Mendenhall, W. dan R. J. Beaver. 1991. Introduction to
Probability and Statistics. PWS-Kent Pub. Co. , Boston.
[6] Martono, N., 2010, Statistik Sosial: Teori dan Aplikasi
Program SPSS, Penerbit Gava Media, Yogyakarta.
[7] Mahakena, A. N., 2015, Pola Asuh Otoriter dan Konsep
Diri Sebagai Prediktor Terhadap Perilaku Agresif Sisw
SMA Negri 4 Ambon, Tesis Program Magister Sains
Psikologi Fakultas Psikologi, Universitas Kristen Satya
Wacana Salatiga.
[8] Riada, M. R. Pengaruh Religiusitas dan Parent Adolescent
Relationship pada Psychological Well Being Remaja di
SMP Negeri 1 Kupang. Tesis Program Magister Sains
Psikologi Fakultas Psikologi, Universitas Kristen Satya
Wacana Salatiga.
[9] Spiegel, M. R, J. Schiller, R. A. Srinivasan. 2000.
Probabilitas dan Statistik Edisi Kedua (Terjemahan).
Penerbit Erlangga, Jakarta.
[10] Soejoetie, Z., 1984, Buku Materi Pokok Metode Statistik
II, Universitas Terbuka, Jakarta.

Analisis Data Statistik | 203


[11] Wackerly, D. D, W. Mendenhall III, R. L. Schaeffer. 2008.
Mathematical Statistics with Application. Thomson
Brooks/Cole, Duxbury.
[12] Wanda, M. A., 2016, Self-Esteem, Dukungan Sosial
Teman Sebaya dan School Connectedness sebagai
Prediktor Subjective Well-Being Siswa Kelas VIII SMP 2
Tuntang Ditinjau dari Jenis Kelamin, Tesis Program
Magister Sains Psikologi Fakultas Psikologi, Universitas
Kristen Satya Wacana Salatiga.

*****

204 | Adi Setiawan


LAMPIRAN-LAMPIRAN

Analisis Data Statistik | 205


206 | Adi Setiawan
Lampiran 1 Tabel Kolmogorov-Smirnov Satu Sampel.

Analisis Data Statistik | 207


Lampiran 2 Tabel Distribusi Chi-Kuadrat

208 | Adi Setiawan


Lampiran 3 Tabel Titik Kritis untuk Uji Liliefors untuk
Normalitas

Analisis Data Statistik | 209


Lampiran 4 Tabel Distribusi Normal

210 | Adi Setiawan


Lampiran 5 Tabel Distribusi t

Analisis Data Statistik | 211


Lampiran 6 Tabel Distribusi F

212 | Adi Setiawan


Analisis Data Statistik | 213
214 | Adi Setiawan
Analisis Data Statistik | 215
Lampiran 7. Tabel Distribusi Binomial

216 | Adi Setiawan


Analisis Data Statistik | 217
218 | Adi Setiawan
Lampiran 8 Tabel Titik Uji T Wilcoxon

Analisis Data Statistik | 219


Lampiran 9 Tabel Titik Kritis Koefisien Korelasi Pearson

220 | Adi Setiawan


Lampiran 10 Tabel Titik Kritis Koefisien Korelasi
Spearman

Analisis Data Statistik | 221


Lampiran 11 Tabel Titik Kritis Koefisien Korelasi Kendall

222 | Adi Setiawan


Lampiran 12 Tabel Titik Kritis Uji Mann-Whitney

Analisis Data Statistik | 223


Lampiran 13 Tabel Titik Kritis Kolmogorov-Smirnov 2
Sampel

224 | Adi Setiawan


Analisis Data Statistik | 225

View publication stats

Anda mungkin juga menyukai