STATISTIK INFERENSIAL :
PENGUJIAN HIPOTESIS MELALUI ANAVA
9.1 Pendahuluan
Bab ini menguraikan tentang penggunaan dan fungsi analisis varians
(ANAVA) serta teknik perhitungannya. Selain itu dipelajari juga tentang berbagai
uji pembeda lanjut.
Kompetensi Dasar
Setelah menyelesaikan materi ini, mahasiswa mampu menngunakan teknik
analisis varians (ANAVA) dan uji pembeda lanjut dengan baik dan benar
9.2 Penyajian
9.2.1 Pengantar
Seringkali dalam suatu penelitian digunakan satu atau lebih peubah
(variabel bebas), selain itu masing-masing peubah tersebut terkadang memiliki
dibagi menjadi kelompok-kelompok tertentu sehingga dalam satu peubah akan
terjadi pemisahan menjadi beberapa taraf atau level. Oleh karena itu biasanya
akan dihasilkan data pengamatan yang terdiri lebih dari dua kelompok rata-rata.
Untuk menganalisis data hasil penelitian yang seperti itu digunakan analysis of
varians (ANOVA atau ANAVA).
Sebagai suatu bentuk analsis statistika parametrik maka sebelum
menggunakan ANAVA sebagai alat analisis, data yang akan dianalisis harus
memenuhi beberapa asumsi prasyarat parametrik seperti : data harus berdistribusi
normal, data memiliki varians yang homogen serta data berdiri bebas/tidak terikat
(independen) baik dalam kelompok maupun antar kelompok. Oleh karena itu data
tersebut harus diuji dahulu untuk memenuhi asumsi-asumsi tersebut.
141
9.2.2 ANAVA Tunggal (one way anova)
Sesuai dengan namanya, maka ANAVA tunggal digunakan untuk
mengetahui perbedaan antara satu variabel bebas dan satu variabel terikat.
Variabel tersebut akan dipecah menjadi beberapa taraf dengan demikian apabila
data tersebut dimasukan dalam tabel data akan berbentuk seperti berikut :
Variabel bebas
JKkuadrat
R =
6. Hitung jumlah (JK) antar kelompok dengan rumus:
( 1 2 3 .... n ) 2
n1 n 2 n3 .... n n
( 1 ) 2 ( 2 ) 2 ( 3 ) 2 ... ( n ) 2
JKA = JK R
n1 n2 142 n3 ... nn
7. Hitunglah Jumlah kuadrat (JK) dalam kelompok dengan rumus:
JK D
RKD =
dK D
143
Ftabel = F(1 - ) (dkA. dkB)
18. Tentukan kriteria penilaian, yaitu : jika Ftabel < Fhitung < Ftabel maka Ho
diterima
19. Bandingkan Fhitung dengan Ftabel.
20. Buatlah kesimpulan
21. Seandainya Ho ditolak maka dilanjutkan dengan uji pembeda ganda (uji
lanjut)
144
1. Ujilah data untuk memenuhi asumsi normal dan homogen
2. Tuliskan hipotesis penelitian dalam bentuk kalimat yang tegas
3. Tuliskan hipotesis statistik, yaitu Ho : μ1 = μ2 = ... = μn
Hi : ada salah satu tanda ≠
4. Buat tabel penolong ANAVA ganda seperti pada tabel 8.1
5. Hitung jumlah kuadrat antar kelompok dengan rumus:
( ijk ) (2
ijk ) 2
k j i
JK =
i k i
n j. n.
A
145
Σxi221 Σxi222 N2
Σ Σxij1 Σ Σxij2 Σ Σ Σ xijk - -
j i j i k j i
x.1 x.2 x -
n.1 n.2 - n
Gambar 9.1
Tabel Penolong ANAVA Ganda
JKi = kji 2
k j i
Dimana nilai-nilai tersebut berasal dari:
( 2 i11 ) 2
2
11 2
i11
n11
( i12 ) 2
212 2 i12
n12
( i 21 ) 2
2
21 i 21
2
n21
( i 22 ) 2
2 22 2 i 22
n 22
9. Hitung derajat kebebasan rata-rata A dengan cara :
dkA = j – 1
dimana J adalah kelompok variable terikat (dari kiri ke kanan)
10. Hitung derajat kebebasan rata-rata B dengan cara :
dkA = k – 1
11. Hitung derajat kebebasan rata-rata AB dengan cara :
dkAB = (j - i)(k - 1)
146
12. Hitung derajat kebebasan rata-rata i dengan cara :
dki = jk (n – 1)
13. Hitung rata-rata jumlah kuadrat (RK) A dengan cara :
JKA
RKA =
dkA
JKAB
RKAB =
dkAB
JKi
RKi =
Dki
RKA
Fhitung A =
RKi
RKB
Fhitung B =
RKi
RKAB
Fhitung AB =
RKi
18. Tentukan taraf signifikan/derajat kepercayaan α
19. Carilah harga Ftabel dengan rumus :
Untuk Ho pertama (Ho1)
147
Ftabel = F(1 - α)(dkA, dki)
untuk
Untuk Ho kedua (Ho2)
20. Masukan semua nilai dalam tabel penolong ANAVA ganda berikut :
Jumlah varians Jumlah kuadrat dk Rata-rata kuadrat F
(JK) (RK)
Faktor A JKA dkA RKA Fhitung A
Faktor B JKB dkB RKB Fhitung B
Faktor AB JKAB dkAB RKAB Fhitung AB
Inter JKi dki RKi
21. Tentukan kriteria pengujiannya, yaitu jika Fhitung < Ftabel maka Ho
diterima
22. Buatlah kesimpulannya
23. Jika Ho ditolak bisa dilakukan uji pembanding ganda untuk setiap variabel
148
perkiraan tetapi untuk menghilangkan bias maka diperlukan suatu formula
tertentu agar data lebih representatif.
Suatu metode yang digunakan oleh Yates (Gaspersz, 211) mengemukakan
bahwa jika data yang hilang itu tunggal maka bisa diperkirakan harganya melalui
rumus :
rB + tT - G
Y=
(r -1)(t -1)
2
B – (t -1)Y
Bias =
t (t – 1)
Galat baku dari beda di antara kuadrat tengah perlakuan dengan adanya nilai
pengamatan yang hilang menjadi :
2
2 t
syi-yj = KTD +
r r(r – 1)(t – 1)
Sengan demikian terjadi koreksi nilai jumlah kuadrat (JK) perlakuan dari nilai asli
dikurangi nilai bias.
Apabila jumlah data hilang lebih dari satu maka prosedur yang harus
dilakukan ialah :
Y.i1. + Y.j
h1 =
149 2
1. Mencari nilai h1 dengan cara
150
Selanjutnya akan terjadi koreksi terhadap nilai jumlah kuadrat perlakuan (JK D)
yang asli dikurangi nilai bias.
Kriteria uji untuk menentukan beda antara nilai tengah (kuadrat tengah)
disebut beda nyata terkecil/least significant different (BNT atau LSD) dengan
formulasi : BNT = t α/2 S Yi – Yi’
2
= t α/2 S
r
151
harus besar akibatnya uji ini bersifat konservatif dan kuasanya rendah. Untuk
menghitung nilai kritis kontras dapat dilakukan dengan rumus :
S= ƒt Fα (ƒt, ƒe)
Dengan nilai ƒt dan ƒe menyatakan dk perlakuan dan dk galat dan F diperoleh dari
tabel dengan laju kesalahan sebesar α.
Nilai kritisnya adalah : Nilai Scheffe = SsQ
w = qα (p, ƒe)SY
Nilai qα diperoleh dari tabel titik persentase bagian atas bagi wilayah yang
distudentkan yang diperoleh dari (Ymaks – Ymin) / SY
152
Bila nilai tengahnya digunakan t = 2 maka α yang digunakan adalah 0,05
sedangkan bila tiga KT maka α yang digunakan adalah 1 - (1 – α) 2 = 0,0975.
Disarankan untuk 4 nilai KT menggunakan α sebesar 1 - (1 – α) 3 = 0,14. dan t
nilai tengah disarnkan menggunakan α sebesar 1 - (1 – α)t-1.
Perhitungan nilai wilayah nyata terkecil/least signifikcant range (LSR)
dicari dengan menggunakan rumus : Rp = qα’ SY dengan α’ = 1 - (1 – α)p-1 dan p =
1, 2, ...t
9.3 Penutup
Tes Formatif
1. Jelaskan definisi dan fungsi ANAVA !
2. Uraikan prasyarat suatu penelitian bisa dianalisis dengan menggunakan
ANAVA !
3. Jelaskan perbedaan ANAVA tunggal dengan ANAVA ganda !
4. Langkah apakah yang harus dilakukan bila unit eksperimen dalam
penelitian kita hilang !
5. Mengapa perlu dilakukan uji pembanding ganda ?
6. Suatu penelitian dengan menggunakan 3 perlakuan memberikan hasil
seperti pada tabel berikut :
Perlakuan
A B C
Data yang 2 8 3
dihasilkan 0 4 8
4 5 1
7 2 3
Umpan Balik
Cocokan jawaban saudara dengan kunci jawaban yang tersedia, untuk soal no. 1 –
5 apabila jawabannya sempurna diberi skor tertinggi 10 sedangkan untuk soal
no.6 apabila jawabannya sempurna diberi nilai 50. Hitunglah jawaban yang benar
153
kemudian gunakan rumus berikut untuk mengetahui tingkat penguasaan saudara
terhadap materi kegiatan belajar ini.
Rumus
Skor jawaban yang benar
Tingkat Penguasaan = X 100
100
Bila saudara mencapai tingkat penguasaan 80 % atau lebih maka saudara dapat
melanjutkan ke materi berikutnya, namun apabila tingkat penguasaan saudara di
bawah 80 % maka saudara harus mengulang kegiatan belajar ini terutama pada
bagian yang tidak dikuasai
Kunci Jawaban
1. Analisis varians atau ANAVA merupakan suatu teknik analisis statistika
parametrik yang digunakan untuk menguji perbedaan rata-rata beberapa
kelompok data. Berfungsi untuk menguji data hasil penelitian yang memiliki
lebih dari 2 rata-rata kelompok.
2. Sebagai suatu analisis statistika parametrik maka ANAVA memiliki
prasyarat sebelum penggunaan yaitu, data harus berdistribusi normal, data
memiliki varians yang homogen serta data berdiri bebas/tidak terikat
(independen) baik dalam kelompok maupun antar kelompok. Selain itu, data
yang akan dianalisis memiliki lebih dari dua nilai rata-rata.
3. ANAVA tunggal digunakan untuk data penelitian yang hanya memiliki
satu variabel bebas dan satu varibel terikat sedangkan ANAVA ganda
digunakan untuk menganalisis suatu penelitian yang memiliki satu atau lebih
variabel bebas yang memiliki taraf tertentu untuk setiap variabel tersebut serta
memiliki satu atau lebih variabel terikat dengan taraf tertentu pula.
4. Apabila dalam suatu penelitian ditemukan ada unit eksperimen yang
hilang sehingga data yang dibutuhkan tidak ada maka apabila unit-unit
eksperimen yang hilang tersebut jumlahnya banyak maka penelitian harus
diulang denganmempertimbangkan faktor penyebab hilangnya unit
eksperimen tersebut. Tetapi apabila unit eksperimen yang hilang tersebut
154
hanya sedikit maka nilai-nilai dari unit eksperimen yang hilang tersebut bisa
ditaksir dengan menggunakan aturan Yates.
5. Uji pembanding ganda perlu dilakukan untuk melihat perbedaan-
perbedaan yang signifikans dari setiap variabel sebab ANAVA hanya melihat
perbedaan secara umum untuk keseluruhan variabel yang ada.
6. Dari data tersebut diasumsikan bahwa data bersifat acak, normal dan
homogen.
Ho : μ1 = μ2 = μ3 dan hi : ada satu tanda ≠
Setelah dihitung maka diketahu xA = 2,35 xB = 6,5 xC = 4
dan sA2 = 8,92 sB2 = 5,67 sC2 = 8,67
JKR = (13 + 26 + 16)2 / (4 + 4 + 4) = 252,08
(13)2 + (13)2 + (13)2
JKA = - 252,08 = 23,17
4 + 4 + 4
JKD = 345 – 252,08 – 23,17 = 69,75
Dkrata-rata = 1 DkA = 3 – 1 = 2 dan DkD = 12 – 3 = 9
RKrata-rata= 252,08 / 1 = 252,08
RKA = 23,17 / 2 = 11,58
RKD = 69,75 / 9 = 7,75
Fhitung = 11,58 / 7,75 = 1,49
Dari tabel F diperoleh harga F(1 – 0,05 (2, 9) adalah sebesar 4,26 dengan demikian
Fhitung < Ftabel maka Ho diterima, kesimpulan : semua perlakuan memberikan
pengaruh yang sama .
Daftar Pustaka
155
Cohen Jacob, 1988, Statistical Power Analysisis for Behavioral Sciences, New
Jersey: Lawrence Elrlbaum Assosiate Publisers.
Gaspersz Vincent, 1995, Teknik Analisis dalam Penelitian Percobaan, Jilid 1-2,
Bandung: Tarsito
Torrie, James H,. 1995, Prinsip dan Prosedur Statistika, Suatu pendekatan
Biometrik, Jakarta: Gra
media
BAB X
ANALISIS KORELASI DAN REGRESI
156
10.1 Pendahuluan
Bab ini menguraikan tentang definisi dan fungsi analisis korelasi dan
analisis regresi pada suatu hasil penelitian.
Kompetensi Dasar
Setelah menyelesaikan materi ini, mahasiswa mampu menngunakan teknik
korelasi dan analisis regresi yang sesuai pada suatu hasil penelitian
10.2 Penyajian
10.2.1 Pengantar
Korelasi merupakan suatu istilah statistik yang menyatakan derajat
hubungan linier antara dua variabel atau lebih. Metode ini ditemukan oleh Karl
Pearson (1900). Metode ini mampu menghitung kaitan antar suatu peristiwa
dengan peristiwa lainnya.
Hubungan antara dua variabel atau lebih dalam teknik korelasi bukan
merupakan hubungan sebab akibat (timbal balik), misalnya tingkat kemiskinan
tinggi menyebabkan peningkatan tingkat kejahatan sebaliknya kalau kejahatan
meningkat kemiskinan pun akan meningkat, melainkan hanya merupakan
hubungan searah saja, misalnya tinggi badan bisa menyebabkan berat badan
meningkat tetapi peningkatan berat badan tidak dapat menyebabkan tinggi badan
meningkat.
Data yang merupakan implementasi dari faktor penyebab disebut variabel
bebas sedangkan data yang menunjukan akibat disebut variabel terikat. Istilah
bebas (independent) dilambangkan dengan X dan istilah terikat (dependent)
dilambangkan dengan Y. Variabel-variabel yang akan dihubungkan terdiri atas
beberapa tingkatan data, yang meliputi data nominal, ordinal, interval dan rasio.
Tingkatan data tersebut sangat menentukan jenis analisis korelasi yang harus
digunakan. Beberapa teknik korelasi yang biasa digunakan adalah :
Tabel 1 : Beberapa Teknik Analisis Korelasi dan Jumlah Variabel Bebas
157
Selain itu bisa dilihat pula beberapa teknik korelasi dua variabel
(bivariant) untuk berbagai variabel dalam tabel berikut serta beberapa koefisien
korelasi dengan variabel yang diukur untuk masing-masing koefisien dapat dilihat
dalam tabel berikut :
158
Selain teknik korelasi seringkali suatu penelitian dianalisis dengan
menggunakan teknik regresi untuk mencoba meramalkan atau memperkirakan
berbagai hubungan fungsional antar variabel yang berkaitan. Apabila hubungan
yang dipelajari hanya memiliki satu variabel yang mempengaruhi (X atau variabel
prediktor) maka disebut analisis regresi tunggal sedangkan untuk hubungan yang
memiliki lebih dari satu variabel prediktor disebut analisis regresi ganda.
Dalam bab ini hanya akan diuraikan satu model analisis korelasi, yaitu
analisis korelasi product moment Spearman serta analisis regresi tunggal dan
regresi ganda.
159
Analisis korelasi PPM yang merupakan teknik analisis korelasi yang
paling banyak digunkan memiliki nilai koefisien relasi yang disingkat r. Analisis
ini memiliki kegunaan untuk ;
1. Menyatakan ada dan tidaknya hubungan yang signifikans antara satu variabel
dengan lainnya
2. Melihat besarnya sumbangan variabel yang satu terhadap variabel yang lain
yang dinyatakan dalam persen dengan demikian r2 disebut koefisien
determinasi atau koefisien penentu. Hal ini disebabkan r2 x 100% terjadi
dalam variabel terikat Y yang ditentukan oleh besarnya variabel bebas X
Beberapa asumsi yang harus dipenuhi untuk melakukan analisis dengan
teknik PPM ialah :
1. variabel yang dihubungkan memiliki dua data yang berdistribusi normal
2. variabel yang dihubungkan memiliki dua data linier
3. variabel yang dihubungkan memiliki dua data yang dipilih secara acak
4. variabel yang dihubungkan memiliki pasangan yang sama dari subjek yang
sama pula (variasi skor yang dihubungkan harus sama)
5. variabel yang dihubungkan memiliki data interval atau rasio
Terdapat beberapa kelayakan untuk nilai r, antara lain :
1. Batas nilai r terbesar ialah +1 dan terkecil ialah -1 sehingga dapat dituliskan
persamaan matematikanya -1 ≤ r ≤ 1. Untuk r = 1 disebut hubungan positif
sempurna sebaliknya bila nilai r = -1 disebut hubungan negatif sempurna dan
hubungan tidak langsung (indirect) sangat tinggi, disebut juga invers.
2. Nilai r hanya berlaku untuk korelasi linier saja
3. Nilai r tidak berlaku untuk sampel dengan nilai varians nol karena nilai ztidak
dapat dihitung sehingga akhirnya nilai r tidak bisa dihitung juga
4. nilai r tidak memiliki satuan (dimensi)
5. Bila nilai r antara 0 dan 1 maka hubungannya dapat dilihat dalam tabel ;
r Interpretasi
0 Tidak berkorelasi
0,01 – 0,20 Korelasi sangat rendah
0,21 – 0,40 Korelasi rendah
0,41 – 0,60 Korelasi agak rendah
0,61 – 0,80 Cukup berkorelasi
160
0,81 – 0,99 Korelasi tinggi
1 Korelasi sangat tinggi
a).
xy
rxy =
x y
2 2
Atau
b).
X X Y Y
i i i i
r =
X X Y Y
2 2
i i i i
161
Atau
c).
r =
n X i Y X i Yi
n X i
2
X i
2
n Y Y
2
i i
2
Atau
d).
1 S 2y . x
r =
S 2y
Atau
e). Jika persamaan regresi y atas x sudah dihitung dapat digunakan rumus :
r2 =
b n X i Yi X Y
i i
n Y Y
2 2
i i
Atau
f).
b.Sx
r =
Sy
Atau
g).
r2 = b1b2
Atau
h). Jika kedua variabel yang diceri korelasinya memiliki nilai yang sangat
berbeda, maka r dihitung dengan cara mengubah data kedua variabel itu ke
dalam nilai z.
ZxZ y
r =
n
162
dimana;
X X
Zx =
sd x
Y-Y
Zy =
sdy
n2
thitung = r
1 r2
163
164
10.2.3 Analisis Regresi Tunggal
Beberapa asumsi yang harus dipenuhi untuk penggunaan analisis regresi
tunggal ialah ;
1. variabel yang dicari hubungan fungsionalnya harus memiliki data yang
berdistribusi normal
2. variabel X tidak acak sedangkan variabel Y harus acak
4. variabel yang dihubungkan memiliki pasangan yang sama dari subjek yang
sama pula
5. variabel yang dihubungkan memiliki data interval atau rasio
Apabila kita ingin melihat hubungan fungsional (pengaruh atau
meramalkan pengaruh) antara banyaknya pengunjung (variabel X) dengan
banyaknya pembeli di sebuah toko maka persamaan analisi regresinya adalah :
Ỷ = a + bX
165
Langkah-langkah untu menghitung persamaan regresi ialah :
1. Hitung beberapa persyaratan yang menjadi asumsi statistika parametric
2. Tulis hipotesisi penelitian dalam kalimat yang tegas
3. Tuliskan hipotesis statistiknya, yaitu Ho : r = 0 dan Hi : r ≠ 0
4. Buatlah tabel penolong untuk regresi tunggal sebagai berikut
166
No. Responden Xi Yi Xi Yi Xi2 Yi2
1
2
...
n
ΣXi ΣYi ΣXi Yi ΣXi2 ΣYi2
a =
Yi X X X Y
2
i i i i
n X X
2 2
i i
n X i Yi X i Yi
b =
n X 2i X i
2
Atau
Jika b sudah di ketahui lebih dahulu, maka a dapat dihitung denga rumus;
a = Y bX
Y = a + bX
167
9. Masukan angka-angka yang sesuai pada tabel tersebut berdasarkan
perhitungan
10. Tetapkan derajat kepercayaannya
11. Kriteria pengujian untuk hipotesis statisti ialah
Jika Fsign hitung ≤ F sign tabel maka Ho diterima
jika Fline hitung ≤ F line tabel maka Ho diterima
12. Carilah F sign tabel dengan rumus :
F sign tabel = F (1 – α)(dk reg), dk res) dengan melihat tabel distribusi F
13. Carilah F line tabel dengan rumus :
F line tabel = F (1 – α)(dk (TC)), dk (E)) dengan melihat tabel distribusi F
14. Bandingkan nilai Fhitung dengan Ftabel, lalu buat kesimpulannya
168
10.2.4 Analisis Regresi Ganda
Analisis ini digunakan untuk meramalkan pengaruh dua variabel prediktor
atau lebih terhadap satu variabel kriterium atau untuk membuktikan adanya
hubungan fungsional antara dua variabel bebas (X) atau lebih dengan sebuah
variabel terikat (Y).
Seluruh asumsi pada persamaan regresi linier tunggal berlaku juga untuk
regresi linear ganda. Bentuk persamaan garis regresi ganda ialah sebagai berikut :
Untuk 2 prediktor Y = a + b1X1 + b2 X2
Untuk 3 prediktor Y = a + b1X1 + b2 X2 + b3 X3
Untuk n prediktor Y = a + b1X1 + b2 X2 + b3 X3 + …. + b3 X3
Jika harga-harga b1, b2, b3, dan seterusnya sudah diketahui maka harga-harga
tersebut dapat pula digunakan untuk menghitung korelasi ganda dengan kata lain
dapat mengaitkan hasil-hasil perhitungan analisis regresi ganda dengan
perhitungan analisis korelasi ganda.. Hubungan tersebut bisa dihitung dengan
rumus :
b1 x1 y b2 x 2 y
Untuk 2 prediktorRy(1. 2) =
y 2
b1 x1 y b2 x 2 y b3 x3 y
Untuk 3 prediktorRy(1. 2. 3) =
y3
b1 x1 y b2 x yb x
2 3 3 y b4 x 4 y
Untuk 4 prediktorRy(1. 2. 3. 4) =
y 2
169
No. Y X1 X2 YX1 YX2 X1X2 X12 X22 Y2
1
2
3
...
Y = an + b1 X 1 b2 X 2
jika 2 prediktor YX1 = a X 1 b1 X 21 b2 X 1 X 2
YX2 = a X 2 b1 X 1 X 2 b2 X 2 2
jika 3 prediktor.
Hitung dahulu nilai-nilai berikut ini.
X 2
x X
1
2
1
2
1
n
X 2
x X
2
2
2
2
2
n
X 2
x X
3
2
3
2
3
n
X X
x x X1X 2
1 2
1 2
n
X X
x x X1X 3
1 2
1 3
n
X X
x x3 X 2 X 3
2 3
2
n
X XY
x y X Y
1
1 1
n
X Y
x y X 2Y
2
2
n
170
X Y
x y X 3Y
3
3
n
Y 2
y 2
Y 2
x y1 b1 x 21 b2 x1 x 2 b3 x1 x3 1
x y 2 b1 x1 x 2 b2 x 2 2 b3 x22 x3
x 3 y b1 x1 x3 b2 x 2 x 2 x3 b3 3 x3
X Y
x y X 2Y
2
(b). 2
n
Y 2
(c). y 2
Y 2
n
171
X Y
x y X nY
n
n
n
b1 x1 y b2 x 2 y
Ry(1. 2) = jika 2 prediktor
y2
R 2 n m 1
F =
m 1 R2
10.3 Penutup
Tes Formatif
1. Jelaskan perbedaan analisis korelasi dengan regresi !
2. Uraikan asumsi yang harus dipenuhi bila data ingin dianalisis secara
korelasi atau regresi !
172
3. Apa yang membedakan analisis regresi tunggal dengan ganda ?
4. Uraikan perbedaan analisis korelasi tunggal dengan ganda !
5. Jelaskan interpretasi nilai r dalam analisis regresi
6. Diketahui data sebagai berikut :
X 2 3 2 3 3 1
Y 3 12 2 1 1
Bila hipotesis bila hipotesis penelitian tersebut berbunyi tidak terdapat
hubungan yang positif, signifikans dan linier, buktikan hipotesis tersebut !
Umpan Balik
Cocokan jawaban saudara dengan kunci jawaban yang tersedia. Untuk soal no. 1 –
5 apabila jawabannya sempurna diberi skor tertinggi 10 sedangkan untuk soal
no.6 apabila jawabannya sempurna diberi nilai 50. Hitunglah jawaban yang benar
kemudian gunakan rumus berikut untuk mengetahui tingkat penguasaan saudara
terhadap materi kegiatan belajar ini.
Rumus
Skor jawaban yang benar
Tingkat Penguasaan = X 100
100
Bila saudara mencapai tingkat penguasaan 80 % atau lebih maka saudara dapat
melanjutkan ke materi berikutnya, namun apabila tingkat penguasaan saudara di
bawah 80 % maka saudara harus mengulang kegiatan belajar ini terutama pada
bagian yang tidak dikuasai
Kunci Jawaban
1. Analisis korelasi digunakan untuk melihat hubungan searah serta kuatnya
derjat hubungan antara dua variabel atau lebih sedangkan analisi regresi selain
melihat hubungan juga meramalkan hubungan fungsional antara variabel
prediktor dengan variabel kriterium
173
2. Asumsi yang harus dipenuhi untuk melakukan analisis korelasi atau
regresi ialah : data harus memenuhi prasyarat analisis statistika parametrik,
ada dua variabel yang berpasangan, data memiliki interval dan rasio
3. Regresi tunggal ialah suatu analisis regresi yang hanya bisa dilakukan bila
data hanya memiliki satu variabel prediktor dan satu variabel kriterium,
sedangkan regresi ganda bisa meramalkan hubungan antara lebih dari satu
variabel prediktor dengan satu variabel kriterium.
4. Korelasi tunggal digunakan untuk melihat hubungan dan derajat hubungan
antara satu variabel sebab dan satu variabel akibat sedangkan pada korelasi
ganda bisa dilihat hubungan beberapa variabel sebab dengan satu variabel
akibat
5. Interpretasi nilai r pada analisis korelasi adalah sebagai berikut :
R Interpretasi
0 Tidak berkorelasi
0,01 – 0,20 Korelasi sangat rendah
0,21 – 0,40 Korelasi rendah
0,41 – 0,60 Korelasi agak rendah
0,61 – 0,80 Cukup berkorelasi
0,81 – 0,99 Korelasi tinggi
1 Korelasi sangat tinggi
174
2 3 1 3 9 1
3 2 2 4 4 4
4 3 2 6 9 4
5 3 1 3 9 1
6 1 1 1 1 1
ΣXi = 14 ΣYi = 10 ΣXi Yi= 23 ΣXi2 = 36 ΣYi2 = 20
n=6
ΣY2 = 20
JK(reg a) = (ΣY)2 / n = (10)2 / 6 16,666
(ΣXi)( ΣYi)
JKreg(bia) = b ΣYiYi - = -0,10 (23 – (14 x 10) / 6) = 0,0333
n
JKres = ΣY2 - JK reg(bia) - JK(reg a) = 20 – (0,3333 – 16,6666) = 3,3001
RJK(reg a) = JK(reg a) = 16,6666
RJKreg(bia) = JKreg(bia) = 0,3333
RJKres = JKres / (n – 2) = 3,3001 / (6 – 2) = 0,8202
(ΣY)2
JK(E) = Σ ΣYi2 -
x n
Untuk mencarinya maka digunakan tabel penolong dari data X terendah
sampai tertinggi berikut pasangannya :
X Y
1 1
2 2
2 3
3 1
3 1
3 2
12 – (12 / 1) = 0
22 + 32 - ((2 + 3) 2 / 3) = 0,5000
12 + 12 + 22 - ( (1 + 1 + 2) 2 / 3 = 0,6667 +
JK(E) = 1,1667
JK(TC) = JKres - JK(E) = 3,6667 - 1,1667 = 2,5000
JK(TC) 2,5000
RJK(TC) = + = 2,5000
k–2 3–2
175
JK(E) 1,1667
RJK(E) = + = 0,3889
n-k 6 - 3
Fsign = RJKreg(bia) / RJKres = 0,0333 / 0,8202 = 0,0406
Fline = RJK(TC) / RJK(E) = 2,5000 / 0,3889 = 6,4284
Tarf signifikansi = 0,05
Dari tabel diketahui Fsign tabel = F(1-α)(dk reg (bia), dk res)) = F(1-0,05)(1, 4) = 7,71
Sedangkan nilai Fline tabel = F(1-α)(dk (TC), dk (E)) = F(1-0,05)(1, 3) = 10,13
Sehingga Fsign hitung < Fsign tabel dan Fline hitung < Fline tabel .maka Ho diterima
Kesimpulan : Tidak terdapat hubungan yang positif, signifikans dan linier
antara variabel X dengan variabel Y.
Daftar Pustaka
Cohen Jacob, 1988, Statistical Power Analysisis for Behavioral Sciences, New
Jersey: Lawrence Elrlbaum Assosiate Publisers.
Gaspersz Vincent, 1995, Teknik Analisis dalam Penelitian Percobaan, Jilid 1-2,
Bandung: Tarsito
176
Surakhmad Winarno, 1982, Pengantar Penelitian Ilmiah, Bandung: Tarsito
Torrie, James H,. 1995, Prinsip dan Prosedur Statistika, Suatu pendekatan
Biometrik, Jakarta: Gra
media
BAB XI
STATISTIK NON PARAMETRIK
177
11. 1 Pendahuluan
Bab ini menguraikan tentang penggunaan dan fungsi analisis statistika
Non parametrik serta teknik perhitungannya.
Kompetensi Dasar
Setelah menyelesaikan materi ini, mahasiswa mampu menngunakan
analisis statistika Non parametrik serta teknik perhitungannya dengan baik dan
benar
11.2 Penyajian
11.2.1 Pengantar
Analisis statistika inferensia mencakup semua metode yang berhubungan
dengan analisis sebagian data (sampel) untuk kemudian sampai pada peramalan
atau penarikan kesimpulan yang berlaku untuk seluruh anggota populasi.
Pada pengujian hipotesis melalui analisis parametrik, dibutuhkan asumsi-
asumsi tertentu yang harus dipenuhi oleh suatu data, seperti data harus
berdistribusi norma, homogen, acak dan independen. Kenyataannya sangatlah
sulit untuk memperoleh data yang memenuhi asum-asumsi tersebut. Oleh karena
itu dicari jalan keluar untuk memecahkan kasus dalam berbagai penelitian yang
datanya tidak memenuhi asumsi-asumsi tersebut. Alternatif yang dapat digunakan
ialah dengan menggunakan teknik analisis bebas asumsi di atas yang dikenal
dengan analisis statistika non parametrik.
Dengan demikian analisis statistika non parametrik digunakan apabila :
1. Sampel yang digunakan memiliki ukuran yang kecil
2. Data yang diperoleh bersifat ordinal yaitu data yang bisa diurutkan atau
diklasifikasikan berdasarkan ranking
3. Data yang diperoleh bersifat nominal yaitu data yang diklasifikasikan dalam
bentuk kategori dan dapat dihitung frekwensinya
178
4. Data tidak berdistribusi normal, mendekati normal atau memengikuti
distribusi tertentu
5. Dalam beberapa kasus, data tidak memiliki varians yang homogen atau
independen
6. Ingin menyelesaikan masalh statistik dengan cepat tanpa mengunakan
parameter sebagai alat ukur/hitung.
Langkah-langkah yang harus dilakukan untuk pengujian hipotesis melalui
statistik non parametrik ialah sebagai berikut :
1. Menentukan jenis analisis non parametrik yang sesuai dengan model
penelitian yang dibuat.
2. Menentukan formulasi hipotesis, baik hipotesis penelitian maupun hipotesis
statistiknya.
3. Menentukan derajat kepercayaan (taraf nyata/α)
4. Menentukan kriteria pengujian
5. Menentukan nilai uji statistik
6. Membuat kesimpulan
Berikut disajikan tabel tentang tingkat pengukuran dan uji statistiknya :
Skala Hubungan Statistik Uji
Nominal Ekivalensi Modus Non Parametrik
Frekwensi
Koefisien kontingensi
Ordinal Ekivalensi Median persentil Non Parametrik
>atau < Spearman (r)
Kendal (-τ)
Kendal (W)
Interval Ekivalensi Mean Parametrik dan
>atau < Deviasi standar Non Parametrik
Rasio sembarang Koef. Korelasi Pearson
(2 interval diketahu) Koef. Korelasi ganda
Rasio Ekivalensi Mean Parametrik dan
>atau < Deviasi standar Non Parametrik
Rasio sembarang Koef. Korelasi Pearson
(2 interval diketahu) Koef. Korelasi ganda
Mean geometrik
Koefisien variasi
179
Beberapa model analisis statistika non parametrik sudah banyak diketahui
dan digunakan. Namun demikian dalambab ini hanya akan diuraikan beberapa
model yang paling sering digunakan oleh mahasiswa dalam menganalisis data
hasil pengamatan pada penelitian skripsi mereka.
21
C =
2 n
m 1
Cmaks =
m
180
1. Jika rs = 1 maka data sampel menunjukan hubungan positif sempurna yaitu
urutan untuk setiap data sama
2. Jika rs = -1 maka data sampel menunjukan hubungan negatif sempurna yaitu
urutan untuk setiap data merupakan urutan terbalik
3. Jika rs = 0 maka data sampel menunjukan tidak adanya hubungan
Dengan demikian nilai rs berkisar antara -1 dan 1 atau -1 ≤ rs ≤ 1
Koefisien korelasi urutan Spearman dicari dengan rumus :
6 d2
rs 1
n n2 1
Dengan d = beda urutan dalam satu pasangan data
n = banyaknya pasangan data
Langkah untuk pengujian adalah sebagai berikut :
1. Nilai pengamatan dari dua variabel yang akn diukur hubungannya diberi
urutan. , jika ada yang sama dihitung rata-ratanya
2. Setiap pasangan dihitung perbedaannya
3. Perbedaan setiap pasangan tersebut dikuadratkan dan dihitung jumlahnya
kemudian hitung nilai rs .
181
Langkah yang harus dilakukan untuk menggunakan uji tanda ialah sebagai
berikut :
1. Menentukan formula hipotesis, yaitu :
Ho : Probabilitas terjadinya tanda positif dan tanda negatif adalah sama
atau Tidak ada perbedaan pengaruh antara dua perlakuan
Hi : Probabilitas terjadinya tanda positif dan tanda negatif adalah
berbeda
atau Terdapat perbedaan pengaruh antara dua perlakuan
2. Menentukan derjat kepercayaan α.
3. Menentukan kriteria pengujian, yaitu
Satu pihak : Ho diterima apabila α ≤ probabilitas hasil sampel
Ho ditolak apabila α > probabilitas hasil sampel
Dua pihak : Ho diterima apabila α ≤ 2 kali probabilitas hasil
sampel
Ho ditolak apabila α > 2 kali probabilitas hasil sampel
4. Menentukan nilai uji statistik, yaitu nilai dari probabilitas hasil sampel pada
tabel probabilitas dengan nilai n, r dan α tertentu. Nilai r adalah jumlah tanda
terkecil.
5. Membandingakan nilai tersebut dengan derajat kebebasan yang dipilih lalu
buatlah kesimpulan
Catatan : apabila sampel besar (n ≥ 30), uji statistiknya adalah
2r n
CR =
n
Keterangan :
182
Merupakan penyempurnaan dari uji tanda yang diperkenalkan oleh Frank
Wilcoxon tahun 1945. Uji ini disamping memperhatikan tanda perbedaan positif
dan negatif juga memperhatikan besaran beda dari selisih daata yang berpasangan
dalam menentukan ada tidaknya perbedaan nyata antara dua sampel yang
berhubungan.
Langkah-langkah pengujiannya adalah :
1. Menentukan formula hipotesis, yaitu :
Ho : Jumlah urutan tanda positif dengan negatif adalah sama
atau Tidak ada perbedaan pengaruh antara dua perlakuan
Hi : Jumlah urutan tanda positif dengan negatif adalah berbeda
atau Terdapat perbedaan pengaruh antara dua perlakuan
2. Menentukan derajat kepercayaan, dengan memperhatikan pengujian sepihak
atau dua pihak, pada tabel T Wilcoxon
3. Menentukan kriteria pengujian, yaitu Ho diterima apabila Thit ≥ T
4. Menentukan nilai uji statistikanya (niali To atau Thit), sebagai berikut :
Menentukan tanda beda dan besarnya tanda beda antara pasangan data
Mengurutkan bedanya tanpa memperhatikan tanda atau jenjang :
a. Angka 1 untuk beda yang terkecil dan seterusnya
b. Jika terdapat beda yang sama diambil rata-ratanya
c. Beda nol tidak diperhatikan
Memisahkan tanda beda postif dengan negatif atau tanda jenjang
Menjumlahkan semua angka positif dan negatif
Nilai terkecil dari nilai absolut hasil penjumlahan merupakan nilai Thit.
5. Bandingkan nilai Thit dengan Ttabel. Buat kesimpulan
Catatan : Untuk pasangan data lebih dari 25 dilakukan pengujian melalui rumus :
T E (T )
T
n( n 1)
E(T) =
4
n n 1 2n 1
T =
24
183
11.2.6 Uji Median
Digunakan untuk menguji dua atau lebih sampel independen memiliki
media yang sama. Langkah-langkahnya sebagai berikut :
1. Menentukan formula hipotesis, yaitu :
Ho : Beberapa populasi tempat sampel diambil memiliki median yang
sama
Hi : Beberapa populasi tempat sampel diambil memiliki median yang
berbeda
2. Menentukan derajat kepercayaan α dan nilai χ2tabel, dengan dengan derajat
kebebasan dk = n - 1
3. Menentukan kriteria pengujian, yaitu Ho diterima apabila χ2hitung ≤ χ2tabel,.
4. Menentukan nilai uji statistikanya (niali To atau Thit), sebagai berikut :
Menentukan median dari kombinasi distribusi sampelnya
Menghitung frekwensi nilai yang terletak di atas dan di bawah media
kombinasi untuk setiap kelompok yang tabelnya berbentuk :
Jumlah Nilai Kelompok I Kelompok II Total
Di atas median a b a+b
Kombinasi
Di bawah median c d c+d
Kombinasi
a + c = n1 b + d = n2 n1+ n2 = n
Rumus o :
2
n((ad bc ) 1 n) 2
o
2
2
(a b) (c d ) (a c) (b d )
184
112.7 Uji Mann-Whitney (U Test)
Uji ini digunakan untuk menguji rata-rata dua sampel dengan ukuran yang
tidak sama. Dikembangkan oleh H. B. Mann dan D. R. Whitney pada tahun 1947.
Langkah-langkahnya sebagai berikut :
n1 n1 1
U 1 n1 . n 2 R1
2
atau
n 2 n 2 1
U 1 n1 . n 2 R2
2
185
5. Buatlah kesimpulannya
Catatan : untuk n > 20 digunakan nilai statistic Z, yaitu :
U E (U )
Z = U
n1 .n 2
E(U) =
2
n1 .n 2 (n1 n2 1
u
12
1 N(N + 1)2
S2 = Σ Rij2 -
N–1 i,j 4
12 t
T= Σ (Ri)2 – 3 r(t + 1)
rt(t + 1) i=1
187
11.3 Penutup
Tes Formatif
1. Jelaskan definisi dan fungsi dari analisis statistika non parametrik !
2. Kenapa uji urutan bertanda Wilcoxon lebih baik digunakan dari pada uji
tanda biasa ?
3. Kapan anda menggunakan uji urutan bertanda Spearman!
4. Jelaskan fungsi dari uji Kruskall - Wallis!
5. Jelaskan fungsi uji Mann – Whitney ?
6. Dari suatu penelitian dengan data yang tidak berdistribusi normal
diperoleh hasil pengamatan sebagai berikut :
Kelompok Umur Perlakuan
A B C D
1 2 5 8 6
2 3 4 7 5
3 3 5 10 5
4 5 5 9 2
Total 13 19 34 18
Umpan Balik
Cocokan jawaban saudara dengan kunci jawaban yang tersedia, untuk soal no. 1 –
5 apabila jawabannya sempurna diberi skor tertinggi 10 sedangkan untuk soal
no.6 apabila jawabannya sempurna diberi nilai 50. Hitunglah jawaban yang benar
kemudian gunakan rumus berikut untuk mengetahui tingkat penguasaan saudara
terhadap materi kegiatan belajar ini.
Rumus
Skor jawaban yang benar
Tingkat Penguasaan = X 100
100
188
Bila saudara mencapai tingkat penguasaan 80 % atau lebih maka saudara dapat
melanjutkan ke materi berikutnya, namun apabila tingkat penguasaan saudara di
bawah 80 % maka saudara harus mengulang kegiatan belajar ini terutama pada
bagian yang tidak dikuasai
Kunci Jawaban
1. Analisis statistika non parametrik. Adalah suatu model analisis statistika
yang tidak mewajibkan datanya berdistribusi normal atau memenuhi asumsi-
asumsi untuk pengujian parametrik. Fungsinya ialah untuk memberikan solusi
bagi permasalahan statistika yang tidak bisa dipecahkan oleh analisis statistika
parametrik dan memberikan kemudahan bagi peneliti dalam menarik
kesimpulan tanpa memperhitungkan parameter tertentu.
2. Sebab pada uji urutan tanda Wilcoxon analisis data dilakukan tidak hanya
dengan memberikan tanda posifi dan negatif saja tetapi memberikan urutan
terhadap selisih kedua data yang berpasangan.dalam menentukan ada tidaknya
perbedaan dari dua data berpasangan tersebut.
3. Uji urutan bertanda Spearman digunakan apabila kita ingin melihat derajat
hubungan (korelasi) antara dua populasi tetapin data yang diperoleh tidak
berdistribusi normal dengan kata lain uji ini menolong peneliti memecahkan
masalah pada penelitian korelasi biasa yang memiliki data bebas distribusi
4. Uji Kruskall – Wallis digunakan untuk menganalisis data yang memiliki
lebih dari dua rata-rata populasi dengan desain penelitian rancangan acak
lengkap tetapi data tidak berdistribusi normal dan varians tidak homogen
5. Uji Mann – Whitney digunakan untuk menguji rata-rata dua sampel
dengan ukuran yang tidak sama dan tidak berdistribusi normal.
6. Data dalam soal tadi selanjutnya disusun dalam tabel rangking seperti
berikut :
Ke. Perlakuan Rangking
A B C D A B C D
1 2 5 8 6 1 2 4 3
2 3 4 7 5 1 2 4 3
3 3 5 10 5 1 2,5 4 2,5
189
4 5 5 9 2 2,5 2,5 4 1
Total 13 19 34 18 5,5 9 16 9,5
12
T = (5,52 + 92 + 162 + 9,52) - (3)(4)(4 + 1)
(4)(4)(4 + 1)
= 8,625
Daftar Pustaka
Cohen Jacob, 1988, Statistical Power Analysisis for Behavioral Sciences, New
Jersey: Lawrence Elrlbaum Assosiate Publisers.
Gaspersz Vincent, 1995, Teknik Analisis dalam Penelitian Percobaan, Jilid 1-2,
Bandung: Tarsito
Torrie, James H,. 1995, Prinsip dan Prosedur Statistika, Suatu pendekatan
Biometrik, Jakarta: Gra
190
media
BAB XII
ANALISIS MULTIVARIAT
12. 1 Pendahuluan
Bab ini menguraikan tentang penggunaan dan fungsi analisis statistika
multivariate serta teknik perhitungannya.
Kompetensi Dasar
Setelah menyelesaikan materi ini, mahasiswa mampu menngunakan
analisis statistika multivariate serta teknik perhitungannya dengan baik dan benar
11.2 Penyajian
11.2.1 Pengantar
ANALISIS STATISTIKA MULTIVARIATE
191
mungkin keragaman data yang
dijelaskan oleh variabel asal.
3 Cannonical Menganalisis hubungan antar dua Ada dua
Correlation kelompok variabel dengan cara kelompok
membangkitkan vari-abel baru pada variabel :
setiap kelompok. Variabel baru tersebut X dan Y
merupakan kombinasi linear dari variabel dibangkitkan
asal. Kombinasi linearnya ditentukan variabel baru :
sedemikian hingga korelasi antar variabel U i a' X dan
baru yang berasal dari dua ke-lompok Vi b' Y se-
menjadi maksimum hingga
corr( U i , Vi )
maks dan
corr( U i , V j )=0
4 Multivariate Memodelkan hubungan antara kelompok Y X
Regression variabel respon (Y) dengan kelompok
variabel (X) yang diduga mempengaruhi
variabel respon
5 MANOVA Menganalisis hubungan antara vektor va- Yijk k ik ijk
riabel respon (Y) yang diduga i=1,...,t
dipengaruhi oleh beberapa perlakuan j=1,...,ni
(treatment). k=1,...,p
6 Discriminan Membentuk fungsi yang memisahkan
t Analysis antar kelompok berdasarkan variabel
pembeda, fungsi tsb disusun sedemikian
nisbah kera-gaman data antar dan
kelompok maksimum.
7 Cluster Mengelompokkan data ke dalam
Analysis beberapa kelompok sedemikian hingga
data yang berada di dalam kelompok
yang sama cenderung mempunyai sifat
yang lebih homogen daripada data yang
berada di kelompok yang berbeda
Distribusi Multinormal
Beberapa metode statistika multivariate seperti : MANOVA, dan
discriminant analysis seringkali mensyaratkan terpenuhinya asumsi distribusi
multinormal. Asumsi ini diperlukan karena di dalam MANOVA dan discriminant
analysis dilakukan pengujian dengan menggunakan statistik uji Wilk. Kesimpulan
yang diambil berdasarkan statistik ini dikatakan sahih (valid), jika syarat
distribusi multinormal dipenuhi.
192
Variabel X i , X 2 ,..., X p dikatakan berditribusi normal multivariate dengan
parameter dan jika mempunyai probability density function :
1
1 ( X )' 1 ( X )
f ( X i , X 2 ,..., X p ) p/2
e 2
( 2 ) p / 2
Tahapan dari pembuatan q-q plot ini adalah sebagai berikut (Johnson,
1990)
1. Mulai
2. Tentukan nilai vektor rata-rata : X
3. Tentukan nilai matriks varians-kovarians : S
4. Tentukan nilai jarak Mahalanobis setiap titik pengamatan dengan
1
vektor rata-ratanya d i X i X)' S ( X i X , i 1,..., n
2
5. Urutkan nilai d i dari kecil ke besar : d (1) d ( 2) d (3) ... d ( n )
2 2 2 2 2
i 1/ 2
6. Tentukan nilai pi , i 1,..., n
n
qi
f ( ) d 2 p i
2
7. Tentukan nilai q i sedemikian hingga
2
8. Buat scatter-plot d (i ) dengan q i
9. Jika scatter-plot ini cenderung membentuk garis lurus dan lebih dari
50 % nilai d i p ,0.50
2 2
10. Selesai
Lampiran 1.
193
Selain dengan memeriksa nilai jarak Mahalanobis setiap pengamatan
dengan vektor rata-ratanya. Menurut Mardia (1974) di dalam Rencher (1995)
pemeriksaan kemultinormalan data dapat juga dikaji melalui nilai multivariate
skewnewss ( b1, p ) dan kurtosisnya ( b2, p )
n n
1 1 n 2
b1, p
n2
g
i 1 j 1
3
ij dan b2 , p g ii
n i 1
sedangkan
g ij ( X i X)' S 1 ( X j X)
( p 1)(n 1)(n 3)
z1 b1, p berditribusi p2 ( p 1)( p 2 ) / 6 dan
6 ( n 1)( p 1) 6
b2, p p ( p 2)
z2 berdistribusi normal baku.
8 p ( p 2) / n
Terima hipotesis Ho yang berarti antar variabel bersifat saling bebas jika
nilai hitung 1 p ( p 1) . Jika hipotesis ini yang diterima maka penggunanan
2 2
metode multivariate tidak layak terutama metode analisis komponen utama dan
194
analisis faktor. Penentuan nilai statistik uji Bartlett sphericity dengan bantuan
macro MINITAB disajikan pada Lampiran 3.
195
Kehomogenan Matriks Varians-Kovarians
Beberapa analisis statistika multivariate seperti discriminant analysis dan
MANOVA membutuhkan syarat matriks varians-kovarians yang homogen. Untuk
menguji syarat ini dapat dipergunakan statistik uji Box-M. Hipoteris dan statistik
uji Box-M adalah (Rencher, 1995) :
Hipotesis
Ho : 1 2 ... k
H1 : i j untuk i j
Statistik uji
1 k 1 k
2
hitung 2(1 c1 ) vi ln S i ln S pool v i
2 i 1 2 ii 1
dan
k
v S i i
k 1
1 2 p 2 3 p 1
S pool i 1
c1 v i ni 1
k
i 1 vi
k
6( p 1)( k 1)
vi
v
i 1
i i 1
hitung
2
12
( k 1) p ( p 1
2
196
Outlier
Data tidak bersitribusi multinormal atau matriks varians-variansnya tidak
homogen bisa saja disebabkan oleh sedikit pengamatan yang mempunyai pola
berbeda dengan sebagian besar pengamatan. Pengamatan yang mempunyai
perilaku seperti ini disebut outlier. Contoh pengamatan yang merupakan outlier
adalah negara Jepang (Gambar 1.) Statistik uji yang dapat dipakai untuk
mendeteksi adanya outlier adalah (Morrison, 2005)
n p 1 nd i2
Fi
p n 1 npd i2
2
10 Japan
Belgium
Netherland
7
Denmark
France
6
Italy
Germany
5 Sweden
Produktivitas
4
UK
US
3
1500 1600 1700 1800 1900 2000 2100 2200
197
Kegiatan Praktikum
Ketrangan variabel :
Variabel Penjelasan
Density Banyaknya penduduk per km persegi
Urban Persentase penduduk yang tinggal di perkotaan
Lifeexpf Harapan hidup penduduk perempuan (tahun)
Ligeexpm Harapan hidup penduduk laki-laki (tahun)
Literacy Persentase penduduk yang bisa baca-tulis
Babymort Banyaknya kematian bayi per 1000 kelahiran
Gdp_cap Penghasilan penduduk per kapita pertahun (US$)
d i2 X i X)' S 1 ( X i X , i 1,..., n
b. Menggunakan multivariate skewness dan multivariate kurtosis
2. Apakah data di atas layak dianalisis dengan menggunakan analisis
statistika multivariate
3. Tentukan negara-negara yang dianggap outlier, jika ada outlier maka
hapus negara yang paling outlier (Nilai sig_f paling kecil) kemudian
198
lakukan pengujian kemultinormalan melalui multivariate skewness dan
kurtosis.
4. Dengan menggunakan variabel yang sama, ujilah apakah matriks varians-
kovarians Afrika sama dengan Amerika Latin atau tidak , jika tidak sama,
coba lakukan penghapusan beberapa negara yang dianggap outlier
199
Penyelesaian
1a. 1
q-q plot dari nilai d i X i X)' S ( X i X , i 1,..., n untuk data
2
t 0.529412
distribusi data multinormal
1
q-q plot dari nilai d i X i X)' S ( X i X , i 1,..., n cenderung
2
200
2. Kelayakan penggunaan analisis statistika multivariate dapat dikaji melalui
dua sisi yaitu sisi terapan dan sisi statistika. Dari sisi terapan dapat
ditunjukkan bahwa berdasarkan referensi disiplin ilmu kependudukan,
variabel-variabel di atas memang saling terkait satu dengan yang lainnya.
Dari disiplin ilmu statistika, keeratan hubungan antar variabel dapat
dilakukan melalui pengujian terhadap matriks korelasi. Apakah matriks
korelasinya membentuk matriks identitas atau tidak, jika matriks
korelasinya setelah diuji berbeda secara significant dengan matriks
identitas maka dapat disimpulkan bahwa ada hubungan antar variabel.
Sehingga data ini layak di analisis dengan menggunakan analisis statistika
multivariate. Jika matriks korelasinya setelah diuji tidak berbeda dengan
matriks identitas, maka diduga sampel yang diperoleh tidak cukup,
sehingga disarankan untuk menambah sampel. Diharapkan setelah
dilakukan penambahan sampel maka hasil pengujian matriks korelasi
berbeda dengan matriks identitas. Karena dari hasil pengujian Bartlett
sphericity dapat disimpulkan perlunya penambahan sampel maka uji ini
disebut juga uji kecukupan sampel. Dengan bantuan MINITAB pengujian
ini dapat diilakukan dengan cara :
MTB > %bart.txt c2-c8
chis 178.398
pvalue 0
pvalue dari statistik uji Bartlett sphericity lebih kecil dari 5 %) sehingga
dapat disimpulkan matriks korelasi antar variabel berbeda dengan matriks
identitas. Karena matriks korelasi bukan merupakan matriks identitas
maka analisis statistika multivariate layak untuk digunakan.
201
n p 1 nd i2
3. Suatu pengamatan diakatakan outlier jika nilai Fi
p n 1 npd i2
2
Multivariate skewness
b1 30.1551
z1 99.8985
pvalue 0.113626
Multivariate kurtosis
b2 56.8194
z2 -1.10122
pvalue 0.270800
202
Setelah Jepang dikeluarkan, ternyata data kependudukan Negara-negara di
Asia berdistribusi multinormal. Dari contoh ini dapat ditunjukkan bahwa
adanya outlier dapat menyebabkan data tidak berdistribusi multinormal.
4. Pengujian kesamaan matriks varians-kovarian untuk region Afrika dan
Amerika Latin dapat dilakukan dengan cara :
- Memilih negara-negara di region Afrika dan Amerika Latin
klik Data, Select Cases
203
klik Continue kemudian OK
- Melakuan pengujian kehomogenan matriks varians-kovarians
klik Analyze, Clasify, Discriminant
klik Statistics
Nilai significance statistik uji Box-M lebih kecil dari 5%, sehingga
disimpulkan matriks varians-kovarians region Afrika dan Amerika Latin
tidak homogen, di duga ketidakhomogenan ini disebabkan adanya outlier.
204
Deteksi outlier Negara-negara di Afrika dan Amerika Latin adalah :
Test Results
Box's M 55.121
F Approx. 1.564
df1 28
df2 4741.799
Sig. .030
Tests null hypothesis of equal population covariance matrices.
Test Results
Box's M 51.217
F Approx. 1.441
df1 28
df2 4403.414
Sig. .062
Tests null hypothesis of equal population covariance matrices.
205
kovarians tidak bisa dihomogenkan maka dapat dilakukan metode
statistika yang lain yang tidak membutukan asumsi ini.
206
Lampiran 1. Macro MINITAB untuk memeriksa kemultinormalan DATA
1
dari q-q plot nilai d i X i X)' S ( X i X , i 1,..., n
2
macro
qq x.1-x.p
mconstant i n p t chis
mcolumn d x.1-x.p dd pi q ss tt
mmatrix s sinv ma mb mc md
let n=count(x.1)
cova x.1-x.p s
invert s sinv
do i=1:p
let x.i=x.i-mean(x.i)
enddo
do i=1:n
copy x.1-x.p ma;
use i.
transpose ma mb
multiply ma sinv mc
multiply mc mb md
copy md tt
let t=tt(1)
let d(i)=t
enddo
set pi
1:n
end
let pi=(pi-0.5)/n
sort d dd
invcdf pi q;
chis p.
plot q*dd
invcdf 0.5 chis;
chis p.
let ss=dd<chis
let t=sum(ss)/n
print t
if t>0.5
note distribusi data multinormal
endif
if t<=0.5
note distribusi data bukan multinormal
endif
endmacro
207
Lampiran 2. Macro MINITAB untuk menguji kemultinormalan data melalui
multivariate skewness dan multivariate kurtosis
macro
mardia y.1-y.p
mconstant i j n p g b1 b2 z1 z2 zz v pp pvalue
mcolumn x.1-x.p y.1-y.p z.1-z.p t
mmatrix s sinv mi mj mjt ma mat mb mc md
let n=count(y.1)
do i=1:p
let x.i=y.i-mean(y.i)
let z.i=x.i/sqrt(n)
enddo
copy z.1-z.p ma
transpose ma mat
multiply mat ma s
invert s sinv
let b1=0
let b2=0
do i=1:n
copy x.1-x.p mi;
use i.
do j=1:n
copy x.1-x.p mj;
use j.
transpose mj mjt
multiply mi sinv mc
multiply mc mjt md
copy md t
let g=t(1)
let b1=b1+g*g*g
if i=j
let b2=b2+g*g
endif
enddo
enddo
let b1=b1/(n*n)
let b2=b2/n
let z1=(p+1)*(n+1)*(n+3)*b1/(6*((n+1)*(p+1)-6))
let z2=(b2-p*(p+2))/sqrt(8*p*(p+2)/n)
let v=p*(p+1)*(p+2)/6
note Multivariate skewness
cdf z1 pp;
chis v.
let pvalue=1-pp
print b1 z1 pvalue
note Multivariate kurtosis
let zz=abs(z2)
cdf zz pp;
normal 0 1.
let pvalue=2*(1-pp)
print b2 z2 pvalue
endmacro
208
Lampiran 3. Macro MINITAB untuk menguji kebebasan antar variabel dengan
Bartlett sphericity test
macro
bart x.1-x.p
mconstant i n p d chis pp pvalue v
mcolumn x.1-x.p eigen
mmatrix r
let n=count(x.1)
corr x.1-x.p r
eigenvalues r eigen
let d=0
do i=1:p
let d=d+loge(eigen(i))
enddo
let chis=-(n-1-(2*p+5)/6)*d
let v=p*(p-1)/2
cdf chis pp;
chis v.
let pvalue=1-pp
print chis pvalue
endmacro
209
Lampiran 4. Macro MINITAB untuk mendeteksi adanya multivariete outlier
macro
outlier obs y.1-y.p
mconstant i n p df
mcolumn d x.1-x.p y.1-y.p dd pi f_value tt obs p1 sig_f
mmatrix s sinv ma mb mc md
let n=count(y.1)
cova y.1-y.p s
invert s sinv
do i=1:p
let x.i=y.i-mean(y.i)
enddo
do i=1:n
copy x.1-x.p ma;
use i.
transpose ma mb
multiply ma sinv mc
multiply mc mb md
copy md tt
let d(i)=tt(1)
enddo
let f_value=((n-p-1)*n*d)/(p*(n-1)**2-n*p*d)
let df=n-p-1
cdf f_value p1;
f p df.
let sig_f=1-p1
print obs d f_value sig_f
endmacro
210