Anda di halaman 1dari 70

BAB IX

STATISTIK INFERENSIAL :
PENGUJIAN HIPOTESIS MELALUI ANAVA

9.1 Pendahuluan
Bab ini menguraikan tentang penggunaan dan fungsi analisis varians
(ANAVA) serta teknik perhitungannya. Selain itu dipelajari juga tentang berbagai
uji pembeda lanjut.

Kompetensi Dasar
Setelah menyelesaikan materi ini, mahasiswa mampu menngunakan teknik
analisis varians (ANAVA) dan uji pembeda lanjut dengan baik dan benar

9.2 Penyajian
9.2.1 Pengantar
Seringkali dalam suatu penelitian digunakan satu atau lebih peubah
(variabel bebas), selain itu masing-masing peubah tersebut terkadang memiliki
dibagi menjadi kelompok-kelompok tertentu sehingga dalam satu peubah akan
terjadi pemisahan menjadi beberapa taraf atau level. Oleh karena itu biasanya
akan dihasilkan data pengamatan yang terdiri lebih dari dua kelompok rata-rata.
Untuk menganalisis data hasil penelitian yang seperti itu digunakan analysis of
varians (ANOVA atau ANAVA).
Sebagai suatu bentuk analsis statistika parametrik maka sebelum
menggunakan ANAVA sebagai alat analisis, data yang akan dianalisis harus
memenuhi beberapa asumsi prasyarat parametrik seperti : data harus berdistribusi
normal, data memiliki varians yang homogen serta data berdiri bebas/tidak terikat
(independen) baik dalam kelompok maupun antar kelompok. Oleh karena itu data
tersebut harus diuji dahulu untuk memenuhi asumsi-asumsi tersebut.

141
9.2.2 ANAVA Tunggal (one way anova)
Sesuai dengan namanya, maka ANAVA tunggal digunakan untuk
mengetahui perbedaan antara satu variabel bebas dan satu variabel terikat.
Variabel tersebut akan dipecah menjadi beberapa taraf dengan demikian apabila
data tersebut dimasukan dalam tabel data akan berbentuk seperti berikut :
Variabel bebas

variabel terikat ANAVA 1 x 4


Variabel bebas

variabel terikat ANAVA 1 x 3


Sebenarnya teknik menggunakan ANAVA tunggal sudah dibahas pada bab
sebelumnya, namun terdapat cara lain yang bisa digunakan dengan langkah-
langkah sebagai berikut :
1. Uji data dengan berbagai uji prasyarat parametrik
2. Tuliskan hipotesis penelitian dalam bentuk kalimat yang tegas
3. Tuliskan hipotesis statistik, yaitu Ho : μ1 = μ2 = ... = μn
Hi : ada salah satu tanda ≠
4. Buatlah tabel penolong ANAVA seperti berikut :
Sampel Variabel Bebas
x1 x2 x3 ..... xn
x11 x21 x31 ............ ... xn1
x12 x22 x32 ......... ...... xn2
x13 x23 x33 ...... xnn
n1 n2 n3 ............ nn N
Σ x1 Σ x3 Σ x2 ............ Σ xn Σx
x1 x2 x3 ............ xn
s12 s22 s3 2
............ sn2

5. Hitunglah jumlah kuadrat (JK) rata-rata dengan cara :

JKkuadrat
R =
6. Hitung jumlah (JK) antar kelompok dengan rumus:
(  1    2    3  ....    n ) 2
n1  n 2  n3  ....  n n

(   1 ) 2 (   2 ) 2 (  3 ) 2 ... (  n ) 2
JKA =      JK R
n1 n2 142 n3 ... nn
7. Hitunglah Jumlah kuadrat (JK) dalam kelompok dengan rumus:

JKD =   2  JKR – JKA

8. Hitung deraajat kebebasan rata-rata dengan rumus:


dkrata-rata =1
9. Hitung derajat kebebasan antara kelompok dengan rumus:

dkA = k – 1 Dimana k = banyak kelompok

10. Hitung derajat kebebasan dalam kelompok dengan rumus:

dkD = N – k Dimana N = jumlah seluruh anggota sampel.

11. Hitung rata-rata jumlah kuadrat antar kelompok dengan rumus:


JK R
RKrata-rata =
dK R

12. Hitung rata-rata jumlah kaudrat antar kelompok dengan rumus:


JK R
RKA =
dK A

13. Hitung rata-rata jumlah kuadrat dalam kelompok dengan rumus:

JK D
RKD =
dK D

14. Cari Fhitung dengan rumus:


RK A
Fhitung =
RK A

15. Tetapkan taraf signifikansi (  )


16. Cari Ftabel dengan rumus:

143
Ftabel = F(1 - ) (dkA. dkB)

17. Masukan nilai-nilai tersebut dalam tabel ANAVA berikut :


Jumlah varians jumlah kuadrat dk Rata-rata kuadrat F
(JK) (RK)
Rata-rata JKR 1 RKR
Antar kelompok JKA dkA RKA Fhitung
Dalam kelompok JKD dkD RKD
Jumlah

18. Tentukan kriteria penilaian, yaitu : jika Ftabel < Fhitung < Ftabel maka Ho
diterima
19. Bandingkan Fhitung dengan Ftabel.
20. Buatlah kesimpulan
21. Seandainya Ho ditolak maka dilanjutkan dengan uji pembeda ganda (uji
lanjut)

9.2.3 ANAVA Ganda (two way anova)


Jika pada ANAVA tunggal peneliti bisa mengetahui ada atau tidaknya
perbedaan beberapa taraf dalam variabel bebas dengan variabel terikatnya, maka
dalam ANAVA dua jalur peneliti bisa mengetahui perbedaan beberapa variabel
yang masing-masing memiliki taraf tertentu dengan variabel terikatnya untuk
masing-masing taraf. Misalnya seorang peneliti memiliki variabel bebas bertaraf 2
dengan 2 buah variabel terikat, maka teknik analisis yang digunakan adalah
ANAVA 2 x 2 (seperti desain bujur sangkar) namun mungkin saja peneliti
memiliki variabel bebas dengan 2 taraf tetapi variabel terikatnya 3 taraf sehingga
teknik analisis digunakan ANAVA 2 x 3.
Karena ANAVA ganda merupakan pengembangan dari ANAVA tunggal
maka seluruh prasyarat yang dimiliki ANAVA tunggal seperti data berdistribusi
normal, homogen dan independen berlaku juga untuk ANAVA ganda.
Beberapa langkah yang harus dilakukan untuk melakukan analisis data
dengan ANAVA ganda ialah sebagai berikut :

144
1. Ujilah data untuk memenuhi asumsi normal dan homogen
2. Tuliskan hipotesis penelitian dalam bentuk kalimat yang tegas
3. Tuliskan hipotesis statistik, yaitu Ho : μ1 = μ2 = ... = μn
Hi : ada salah satu tanda ≠
4. Buat tabel penolong ANAVA ganda seperti pada tabel 8.1
5. Hitung jumlah kuadrat antar kelompok dengan rumus:

(   ijk )  (2
   ijk ) 2
k j i
JK =
i k i

n j. n.
A

6. Hitung jumlah kuadrat A + B + AB dengan rumus:

(  ijk ) (  ijk )


2 2
k ji k ji
JKA+B+AB =

n jk n.
Variabel Bebas
1 2
x111 x112
x211 x212
x311 x312
......... .........
1 Xi11 Xi12
Σxi11 Σxi12 Σ Σxi1k
x11 x12 k i
n11 n12 x1
Σxi211 Σxi212 n1
x121 x122
x221 x222
x3211 x322
......... .........
2 Xi21 Xi22
Σxi21 Σxi22 Σ Σxi2k
x21 x22 k i
n21 n22 x2

145
Σxi221 Σxi222 N2
Σ Σxij1 Σ Σxij2 Σ Σ Σ xijk - -
j i j i k j i
x.1 x.2 x -
n.1 n.2 - n

Gambar 9.1
Tabel Penolong ANAVA Ganda

7. Hitung jumlah kuadrat AB dengan rumus:


JKA = JKA+B+AB – JKA – JKB

8. Hitung jumlah kuadrat i dengan rumus:

JKi =     kji 2
k j i
Dimana nilai-nilai tersebut berasal dari:
(  2 i11 ) 2
 2
11   2
i11 
n11

(   i12 ) 2
  212    2 i12 
n12

(  i 21 ) 2
 2
21    i 21 
2

n21

(  i 22 ) 2
  2 22    2 i 22 
n 22
9. Hitung derajat kebebasan rata-rata A dengan cara :

dkA = j – 1
dimana J adalah kelompok variable terikat (dari kiri ke kanan)
10. Hitung derajat kebebasan rata-rata B dengan cara :
dkA = k – 1
11. Hitung derajat kebebasan rata-rata AB dengan cara :
dkAB = (j - i)(k - 1)

146
12. Hitung derajat kebebasan rata-rata i dengan cara :
dki = jk (n – 1)
13. Hitung rata-rata jumlah kuadrat (RK) A dengan cara :
JKA
RKA =
dkA

14. Hitung rata-rata jumlah kuadrat (RK) B dengan cara


JKB
RKB =
dkB

15. Hitung rata-rata jumlah kuadrat (RK) AB dengan cara

JKAB
RKAB =
dkAB

16. Hitung rata-rata jumlah kuadrat (RK) i dengan cara

JKi
RKi =
Dki

17. Carilah nilai Fhitung dengan rumus :

RKA
Fhitung A =
RKi

RKB
Fhitung B =
RKi

RKAB
Fhitung AB =
RKi
18. Tentukan taraf signifikan/derajat kepercayaan α
19. Carilah harga Ftabel dengan rumus :
Untuk Ho pertama (Ho1)

147
Ftabel = F(1 - α)(dkA, dki)
untuk
Untuk Ho kedua (Ho2)

Ftabel = F(1 - α)(dkB, dki)

Untuk Ho ketiga (Ho3)

Ftabel = F(1 - α)(dkAB, dki)

20. Masukan semua nilai dalam tabel penolong ANAVA ganda berikut :
Jumlah varians Jumlah kuadrat dk Rata-rata kuadrat F
(JK) (RK)
Faktor A JKA dkA RKA Fhitung A
Faktor B JKB dkB RKB Fhitung B
Faktor AB JKAB dkAB RKAB Fhitung AB
Inter JKi dki RKi

21. Tentukan kriteria pengujiannya, yaitu jika Fhitung < Ftabel maka Ho
diterima
22. Buatlah kesimpulannya
23. Jika Ho ditolak bisa dilakukan uji pembanding ganda untuk setiap variabel

9.2.4 Penyelesaian ANAVA Data Hilang


Seringkali seorang peneliti menemui kenyataan pahi bahwa tidak seluruh
unit eksperimen dapat diambil datanya karena hilang, mati dan sebagainya,
misalnya seorang peneliti yang melakukan eksperimen di kebun pada sat
pengambilan data sebagian tanaman yang menjadi sampel hilang karena dimakan
oleh binatang. Kondisi ini biasa terjadi pada jenis penelitian eksperimental di
lapangan (RAB dan RBSL).
Untuk mengatasi hal tersebut apabila data yang hilang hanya sedikit maka
peneliti tidak usah mengulang penelitiannya tetapi cukup dengan melakukan
penaksiran terhadap harga yang mungkin dimiliki oleh unit-unit eksperimen yang
hilang tersebut. Penggunaan cara ini memang hanya menghasilkan harga

148
perkiraan tetapi untuk menghilangkan bias maka diperlukan suatu formula
tertentu agar data lebih representatif.
Suatu metode yang digunakan oleh Yates (Gaspersz, 211) mengemukakan
bahwa jika data yang hilang itu tunggal maka bisa diperkirakan harganya melalui
rumus :

rB + tT - G
Y=
(r -1)(t -1)

Dimana : r dan t = jumlah kelompok dan perlakuan


B dan T = total nilai pengamatan dalam kelompok dan
perlakuan yang kehilangan suatu unit
eksperimennya
G = totalitas semua nilai pengamatan
Selanjutnya nilai dugaan dimasukan dalam tabel ANAVA seperti biasa dengan
mengurangkan satu derajat kebebasan dari db total dan db kekliruan (galat). Nilai
dugaan yang digunakan harus sedemikian rupa sehingga jumlah kuadrat galat
dalam ANAVA menjadi minimum. Jumlah kuadrat perlakuan akan berbias dengan
nilai sebesar :

2
B – (t -1)Y
Bias =
t (t – 1)

Galat baku dari beda di antara kuadrat tengah perlakuan dengan adanya nilai
pengamatan yang hilang menjadi :
2
2 t
syi-yj = KTD +
r r(r – 1)(t – 1)

Sengan demikian terjadi koreksi nilai jumlah kuadrat (JK) perlakuan dari nilai asli
dikurangi nilai bias.

Apabila jumlah data hilang lebih dari satu maka prosedur yang harus
dilakukan ialah :
Y.i1. + Y.j
h1 =
149 2
1. Mencari nilai h1 dengan cara

2. Cari nilai penduga h2 (iterasi pertama) h2 dengan menggunakan rumus :


rB + tT - G
Y=
(r -1)(t -1)

Dimana nilai B da T merupakan total kelompok dan G adalah nilai total


dikurangi nilai h1
3. Selanjutnya cari pendugaan hi iterasi pertama dengan rumus yang sama tetapi
B dan T merupakan nilai total perlakuan dan G adalah nilai total dikurangi
nilai h2
4. Pendugaan h2 iterasi kedua dicari dengan cara yang sama dimana B da T
merupakan total kelompok dan G adalah nilai total dikurangi nilai pendugaan
h1 iterasi pertama
5. Selanjutnya cari pendugaan hi iterasi kedua dengan rumus yang sama tetapi B
dan T merupakan nilai total perlakuan dan G adalah nilai total dikurangi nilai
h2 iterasi pertama.
6. Pendugaan nilai h2 iterasi ketiga dicari dengan rumus yang sama dengan B
dan T merupakan total kelompok dan G adalah nilai total dikurangi nilai hi
iterasi kedua
7. Dengan demikian untuk data hilang pertama diisi oleh nilai penduga hi iterasi
kedua dan nilai data hilang kedua diisi dengan nilai h2 iterasi ketiga.
Nilai bias untuk dua data hilang atau lebih dicari dengan rumus :
(B1 – (t – 1) Y1)2 + (B2 – (t – 1) Y2)2
Bias =
t (t – 1)
Dimana : t = jumlah perlakuan
B1 = total nilai pengamatan dalam kelompok yang mengandung
data hilang pertama (h1)
B2 = total nilai pengamatan dalam kelompok yang mengandung
data hilang kedua (h2)
Y1 = nilai dugaan untuk data hilang pertama (h1)
Y2 = nilai dugaan untuk data hilang kedua (h2)

150
Selanjutnya akan terjadi koreksi terhadap nilai jumlah kuadrat perlakuan (JK D)
yang asli dikurangi nilai bias.

9.2.5 Uji Pembeda Lanjut


Apabila setelah dilakukan anlisis varians diketahui bahwa Ho ditolak atau
Hi diterima berarti terdapat perbedaan pengaruh perlakuan terhadap variabel
terikatnya. Untuk melihat pengaruh berbagai perlakuan yang signifikans dapat
dilakukan dengan uji pembeda lanjut (ganda).
Beberapa jenis uji pembeda ganda telah diketahui, namun demikian
berikut akan diuraikan beberapa jenis uji yang sering digunakan.
9.2.5.1 Uji BNT
Uji ini dilakuakn dengan membandingkan beda terkecil yang masih nyata
dengan nilai mutlak untuk setiap beda. Teknik perhitungan dengan menggunakan
uji t dengan kriteria beda nyata terkecil adalah apabila nilai thitung sama dengan atau
lebih besar dari nilai t tabel.
! Yi – Yi’ !
≥ t α/2
S Yi – Yi’

Kriteria uji untuk menentukan beda antara nilai tengah (kuadrat tengah)
disebut beda nyata terkecil/least significant different (BNT atau LSD) dengan
formulasi : BNT = t α/2 S Yi – Yi’

2
= t α/2 S
r

bila urangan r sama

9.2.5.2 Uji Scheffe


Pengujian Scheffe sangat umum digunakan untuk menguji selang
kepercayaan fungsi linearnya. Nilai kritis yang dibutuhkan oleh setiap kontras

151
harus besar akibatnya uji ini bersifat konservatif dan kuasanya rendah. Untuk
menghitung nilai kritis kontras dapat dilakukan dengan rumus :

S= ƒt Fα (ƒt, ƒe)

Dengan nilai ƒt dan ƒe menyatakan dk perlakuan dan dk galat dan F diperoleh dari
tabel dengan laju kesalahan sebesar α.
Nilai kritisnya adalah : Nilai Scheffe = SsQ

9.2.5.3 Uji Tukey W


Pengujian ini memanfaatkan wilayah yang dimasukan dalam distribusi
student serta diterapkan untuk menghitung perbandingan pasangan nilai kuadrat
tengah (KT). Prosedur ini hanya memerlukan satu nilai mutlak untuk menentukan
nyata atau tidaknya semua beda pasangan nilai KT tersebut. Karena perbandingan
dilakukan hanya sepasang-sepasenga maka pekerjaan menjadi cepat bila
dibandingkan dengan uji scheffe.
Untuk mencari nilai kritis maka digunakan rumus :

w = qα (p, ƒe)SY

Nilai qα diperoleh dari tabel titik persentase bagian atas bagi wilayah yang
distudentkan yang diperoleh dari (Ymaks – Ymin) / SY

9.2.5.4 Uji Wilayah Berganda Duncan


Pada tahun 1955 Duncan mengembangkan sebuah uji wilayah berganda
yang menyerupai uji Student-Newman-Keuls (S-N-K) tetapi tidak bisa membuat
selang kepercayaan. Konsep kepercayaan diganti dengan istilah tingkat
perlindung (protection level) terhadap diperolehnya beda nyata yang palsu.
Pengujian dilakukan dengan tingkat nyata yang bergantung pada
banyaknya nilai kuadrat tengah (KT) yang terlibat dalam setiap pengujiandengan
pemikiran semakin meningkat nilai kuadrat tengah maka semakin kecil
kemungkinan memberikan pengaruh yang sama.

152
Bila nilai tengahnya digunakan t = 2 maka α yang digunakan adalah 0,05
sedangkan bila tiga KT maka α yang digunakan adalah 1 - (1 – α) 2 = 0,0975.
Disarankan untuk 4 nilai KT menggunakan α sebesar 1 - (1 – α) 3 = 0,14. dan t
nilai tengah disarnkan menggunakan α sebesar 1 - (1 – α)t-1.
Perhitungan nilai wilayah nyata terkecil/least signifikcant range (LSR)
dicari dengan menggunakan rumus : Rp = qα’ SY dengan α’ = 1 - (1 – α)p-1 dan p =
1, 2, ...t

9.3 Penutup
Tes Formatif
1. Jelaskan definisi dan fungsi ANAVA !
2. Uraikan prasyarat suatu penelitian bisa dianalisis dengan menggunakan
ANAVA !
3. Jelaskan perbedaan ANAVA tunggal dengan ANAVA ganda !
4. Langkah apakah yang harus dilakukan bila unit eksperimen dalam
penelitian kita hilang !
5. Mengapa perlu dilakukan uji pembanding ganda ?
6. Suatu penelitian dengan menggunakan 3 perlakuan memberikan hasil
seperti pada tabel berikut :
Perlakuan
A B C
Data yang 2 8 3
dihasilkan 0 4 8
4 5 1
7 2 3

Apakah ketiga perlakuan tersebut memberikan pengaruh yang berbeda ?

Umpan Balik
Cocokan jawaban saudara dengan kunci jawaban yang tersedia, untuk soal no. 1 –
5 apabila jawabannya sempurna diberi skor tertinggi 10 sedangkan untuk soal
no.6 apabila jawabannya sempurna diberi nilai 50. Hitunglah jawaban yang benar

153
kemudian gunakan rumus berikut untuk mengetahui tingkat penguasaan saudara
terhadap materi kegiatan belajar ini.
Rumus
Skor jawaban yang benar
Tingkat Penguasaan = X 100
100

Bila saudara mencapai tingkat penguasaan 80 % atau lebih maka saudara dapat
melanjutkan ke materi berikutnya, namun apabila tingkat penguasaan saudara di
bawah 80 % maka saudara harus mengulang kegiatan belajar ini terutama pada
bagian yang tidak dikuasai

Kunci Jawaban
1. Analisis varians atau ANAVA merupakan suatu teknik analisis statistika
parametrik yang digunakan untuk menguji perbedaan rata-rata beberapa
kelompok data. Berfungsi untuk menguji data hasil penelitian yang memiliki
lebih dari 2 rata-rata kelompok.
2. Sebagai suatu analisis statistika parametrik maka ANAVA memiliki
prasyarat sebelum penggunaan yaitu, data harus berdistribusi normal, data
memiliki varians yang homogen serta data berdiri bebas/tidak terikat
(independen) baik dalam kelompok maupun antar kelompok. Selain itu, data
yang akan dianalisis memiliki lebih dari dua nilai rata-rata.
3. ANAVA tunggal digunakan untuk data penelitian yang hanya memiliki
satu variabel bebas dan satu varibel terikat sedangkan ANAVA ganda
digunakan untuk menganalisis suatu penelitian yang memiliki satu atau lebih
variabel bebas yang memiliki taraf tertentu untuk setiap variabel tersebut serta
memiliki satu atau lebih variabel terikat dengan taraf tertentu pula.
4. Apabila dalam suatu penelitian ditemukan ada unit eksperimen yang
hilang sehingga data yang dibutuhkan tidak ada maka apabila unit-unit
eksperimen yang hilang tersebut jumlahnya banyak maka penelitian harus
diulang denganmempertimbangkan faktor penyebab hilangnya unit
eksperimen tersebut. Tetapi apabila unit eksperimen yang hilang tersebut

154
hanya sedikit maka nilai-nilai dari unit eksperimen yang hilang tersebut bisa
ditaksir dengan menggunakan aturan Yates.
5. Uji pembanding ganda perlu dilakukan untuk melihat perbedaan-
perbedaan yang signifikans dari setiap variabel sebab ANAVA hanya melihat
perbedaan secara umum untuk keseluruhan variabel yang ada.
6. Dari data tersebut diasumsikan bahwa data bersifat acak, normal dan
homogen.
Ho : μ1 = μ2 = μ3 dan hi : ada satu tanda ≠
Setelah dihitung maka diketahu xA = 2,35 xB = 6,5 xC = 4
dan sA2 = 8,92 sB2 = 5,67 sC2 = 8,67
JKR = (13 + 26 + 16)2 / (4 + 4 + 4) = 252,08
(13)2 + (13)2 + (13)2
JKA = - 252,08 = 23,17
4 + 4 + 4
JKD = 345 – 252,08 – 23,17 = 69,75
Dkrata-rata = 1 DkA = 3 – 1 = 2 dan DkD = 12 – 3 = 9
RKrata-rata= 252,08 / 1 = 252,08
RKA = 23,17 / 2 = 11,58
RKD = 69,75 / 9 = 7,75
Fhitung = 11,58 / 7,75 = 1,49
Dari tabel F diperoleh harga F(1 – 0,05 (2, 9) adalah sebesar 4,26 dengan demikian
Fhitung < Ftabel maka Ho diterima, kesimpulan : semua perlakuan memberikan
pengaruh yang sama .

Daftar Pustaka

Arikunto Suharsimi, 1993, Prosedur Penelitian, Suatu Pendekatan Praktek,


Jogyakarta: Rineka Cipta.

155
Cohen Jacob, 1988, Statistical Power Analysisis for Behavioral Sciences, New
Jersey: Lawrence Elrlbaum Assosiate Publisers.

Furqon, 1997, Statistik Terapan Untu Penelitian, Bandung: Alfabeta

Gaspersz Vincent, 1995, Teknik Analisis dalam Penelitian Percobaan, Jilid 1-2,
Bandung: Tarsito

Hadi, Sutrisno, 2004, Statistik jilid 1, 2 dan 3, Jogyakarta: Andi

Hasan M. Iqbal, 2002, Pokok-pokok Materi Statistika, Jakarta; Bumi Aksara.

Husain Usman, 2003, Pengantar Statistika, Jakarta: Bumi Aksara

Sudjana, 2002, Metoda Statistika, Bandung: Tarsito

Sudjana, 2004, Desain dan Analisis Eksperimen, Bandung: Tarsito

Sugiyono, 2003, Model Penelitian Administrasi, Bandung: AlfaBeta.

Sukandar Dadan, 2004, Metode Statistika, Jogyakarta: Madyan Press

Suparman, 1995, Statistik Sosial, Jakarta: Raja Grafindo Persada.

Surakhmad Winarno, 1982, Pengantar Penelitian Ilmiah, Bandung: Tarsito

Torrie, James H,. 1995, Prinsip dan Prosedur Statistika, Suatu pendekatan
Biometrik, Jakarta: Gra
media

Wijaya, 2003, Statistika Non Parametrik, Bandung: AlfaBeta

BAB X
ANALISIS KORELASI DAN REGRESI

156
10.1 Pendahuluan
Bab ini menguraikan tentang definisi dan fungsi analisis korelasi dan
analisis regresi pada suatu hasil penelitian.

Kompetensi Dasar
Setelah menyelesaikan materi ini, mahasiswa mampu menngunakan teknik
korelasi dan analisis regresi yang sesuai pada suatu hasil penelitian

10.2 Penyajian
10.2.1 Pengantar
Korelasi merupakan suatu istilah statistik yang menyatakan derajat
hubungan linier antara dua variabel atau lebih. Metode ini ditemukan oleh Karl
Pearson (1900). Metode ini mampu menghitung kaitan antar suatu peristiwa
dengan peristiwa lainnya.
Hubungan antara dua variabel atau lebih dalam teknik korelasi bukan
merupakan hubungan sebab akibat (timbal balik), misalnya tingkat kemiskinan
tinggi menyebabkan peningkatan tingkat kejahatan sebaliknya kalau kejahatan
meningkat kemiskinan pun akan meningkat, melainkan hanya merupakan
hubungan searah saja, misalnya tinggi badan bisa menyebabkan berat badan
meningkat tetapi peningkatan berat badan tidak dapat menyebabkan tinggi badan
meningkat.
Data yang merupakan implementasi dari faktor penyebab disebut variabel
bebas sedangkan data yang menunjukan akibat disebut variabel terikat. Istilah
bebas (independent) dilambangkan dengan X dan istilah terikat (dependent)
dilambangkan dengan Y. Variabel-variabel yang akan dihubungkan terdiri atas
beberapa tingkatan data, yang meliputi data nominal, ordinal, interval dan rasio.
Tingkatan data tersebut sangat menentukan jenis analisis korelasi yang harus
digunakan. Beberapa teknik korelasi yang biasa digunakan adalah :
Tabel 1 : Beberapa Teknik Analisis Korelasi dan Jumlah Variabel Bebas

157
Selain itu bisa dilihat pula beberapa teknik korelasi dua variabel
(bivariant) untuk berbagai variabel dalam tabel berikut serta beberapa koefisien
korelasi dengan variabel yang diukur untuk masing-masing koefisien dapat dilihat
dalam tabel berikut :

158
Selain teknik korelasi seringkali suatu penelitian dianalisis dengan
menggunakan teknik regresi untuk mencoba meramalkan atau memperkirakan
berbagai hubungan fungsional antar variabel yang berkaitan. Apabila hubungan
yang dipelajari hanya memiliki satu variabel yang mempengaruhi (X atau variabel
prediktor) maka disebut analisis regresi tunggal sedangkan untuk hubungan yang
memiliki lebih dari satu variabel prediktor disebut analisis regresi ganda.
Dalam bab ini hanya akan diuraikan satu model analisis korelasi, yaitu
analisis korelasi product moment Spearman serta analisis regresi tunggal dan
regresi ganda.

10.2.2 Analisis Korelasi Pearson Product Moment (PPM)

159
Analisis korelasi PPM yang merupakan teknik analisis korelasi yang
paling banyak digunkan memiliki nilai koefisien relasi yang disingkat r. Analisis
ini memiliki kegunaan untuk ;
1. Menyatakan ada dan tidaknya hubungan yang signifikans antara satu variabel
dengan lainnya
2. Melihat besarnya sumbangan variabel yang satu terhadap variabel yang lain
yang dinyatakan dalam persen dengan demikian r2 disebut koefisien
determinasi atau koefisien penentu. Hal ini disebabkan r2 x 100% terjadi
dalam variabel terikat Y yang ditentukan oleh besarnya variabel bebas X
Beberapa asumsi yang harus dipenuhi untuk melakukan analisis dengan
teknik PPM ialah :
1. variabel yang dihubungkan memiliki dua data yang berdistribusi normal
2. variabel yang dihubungkan memiliki dua data linier
3. variabel yang dihubungkan memiliki dua data yang dipilih secara acak
4. variabel yang dihubungkan memiliki pasangan yang sama dari subjek yang
sama pula (variasi skor yang dihubungkan harus sama)
5. variabel yang dihubungkan memiliki data interval atau rasio
Terdapat beberapa kelayakan untuk nilai r, antara lain :
1. Batas nilai r terbesar ialah +1 dan terkecil ialah -1 sehingga dapat dituliskan
persamaan matematikanya -1 ≤ r ≤ 1. Untuk r = 1 disebut hubungan positif
sempurna sebaliknya bila nilai r = -1 disebut hubungan negatif sempurna dan
hubungan tidak langsung (indirect) sangat tinggi, disebut juga invers.
2. Nilai r hanya berlaku untuk korelasi linier saja
3. Nilai r tidak berlaku untuk sampel dengan nilai varians nol karena nilai ztidak
dapat dihitung sehingga akhirnya nilai r tidak bisa dihitung juga
4. nilai r tidak memiliki satuan (dimensi)
5. Bila nilai r antara 0 dan 1 maka hubungannya dapat dilihat dalam tabel ;
r Interpretasi
0 Tidak berkorelasi
0,01 – 0,20 Korelasi sangat rendah
0,21 – 0,40 Korelasi rendah
0,41 – 0,60 Korelasi agak rendah
0,61 – 0,80 Cukup berkorelasi

160
0,81 – 0,99 Korelasi tinggi
1 Korelasi sangat tinggi

Untuk menghitung nilai r bisa digunakan 4 cara, yaitu denagn


menggunakan tabel korelasi biasa, tabel peta korelasi, tabel distribusi frekwensi,
kalkulator dan komputer. Berikut hanya akan dibahas cara mencari r dengan
menggunakan tabel biasa. Langkah-langkah yang perlu dilakukan untuk
menghitung nilai r ialah :
1. Asumsikan bahwa persyaratan untuk menggunakan korelasi PPM sudah
terpenuhi
2. Buatlah hipotesis penelitian dalam bentuk kalimat yang tegas
3. Buatlah hipotesis statistiknya yaitu Ho : r = 0 dan Hi : r ≠ 0
4. Buat tabel penolong untuk menghitung nilai r, yaitu

5. Cari rhitung dengan mengunakan rumus;

a).
 xy
rxy =
  x   y 
2 2

Atau
b).
  X  X Y  Y 
i i i i
r =
  X  X   Y  Y 
2 2
i i i i

161
Atau
c).
r =
n X i Y    X i   Yi 
n X i
2
  X i 
2
 n Y   Y  
2
i i
2

Atau
d).
1  S 2y . x
r =
S 2y

Atau
e). Jika persamaan regresi y atas x sudah dihitung dapat digunakan rumus :

r2 =
b n X i Yi   X   Y 
i i

n  Y   Y 
2 2
i i

Atau
f).
b.Sx
r =
Sy

Atau

g).
r2 = b1b2

Atau

h). Jika kedua variabel yang diceri korelasinya memiliki nilai yang sangat
berbeda, maka r dihitung dengan cara mengubah data kedua variabel itu ke
dalam nilai z.

ZxZ y
r =
n
162
dimana;

X X
Zx =
sd x

Y-Y
Zy =
sdy

6. Tentukan taraf kepercayaan α


7. Tentukan kriteria pengujian sesuai dengan tabel kritis Pearson
Jika –rtabel ≤ rhitung ≤ rtabel maka Ho diterima atau korelasi tidak signifikans
8. Bandingkan nilai rhitung ≤ dengan rtabel. Dan buat kesimpulan
9. Bila diminta, hitung besarnya sumbangan variabel X terhadap Y dengan
melihar tabel interpretasi r dan dipersentase.
Bila kita ingin menggunakan korelasi r dan menggantinya dengan tabel t maka
langkah 5, 7, 8 dan 9 diganti menjadi :
5. Cari thitung dihitung dengan rumus;

n2
thitung = r
1 r2

7. Tentukan kriteria pengujian sesuai dengan tabel kritis t untuk signifikansi


korelasi, yaitu Jika –ttabel ≤ thitung ≤ ttabel maka Ho diterima atau korelasi tidak
signifikans
8. Tentukan dk dengan rumus dk = n – 2 kemudian carilah nilai t tabel
9. Bandingkan ttabel dengn thitung lalu buat kesimpulannya.

Terdapat empat macam korelasi yang memberikan makna berbeda-beda.


Ditunjukan dalam tabel berikut :
Tabel 9.2 : Contoh Nilai, Grafik dan Interpretasi Koefisien Korelasi (r)

163
164
10.2.3 Analisis Regresi Tunggal
Beberapa asumsi yang harus dipenuhi untuk penggunaan analisis regresi
tunggal ialah ;
1. variabel yang dicari hubungan fungsionalnya harus memiliki data yang
berdistribusi normal
2. variabel X tidak acak sedangkan variabel Y harus acak
4. variabel yang dihubungkan memiliki pasangan yang sama dari subjek yang
sama pula
5. variabel yang dihubungkan memiliki data interval atau rasio
Apabila kita ingin melihat hubungan fungsional (pengaruh atau
meramalkan pengaruh) antara banyaknya pengunjung (variabel X) dengan
banyaknya pembeli di sebuah toko maka persamaan analisi regresinya adalah :

Ỷ = a + bX

Dimana Ỷ = (Dibaca Y topi) variabel kriterium


X = variabel prediktor
a = bilangan konstan
b = koefisien arah regresi linier
Bentuk persamaan regresi tersebut sering dibaca regresi X atas Y namun
bisa juga sebaliknya apabila Y jadi variabel prediktor dan X jadi variabel
kriterium. Koefisien arah regresi (b) sebenarnya menyatakan rata-rata variabel Y
untuk setiap variabel X sebesar satu bagian, yaitu bila b positif maka Y akan
mengalami kenaikan dan sebaliknya. Contoh bila regresi antara pengunjung (X)
dan pembeli (Y) memiliki persamaan Ỷ = 9 + 0,50 X maknanya ialah karena b
positif maka hubungan fungsionalnya menjadi positif. Selanjutnya bila terdapat 30
orang pengunjung maka akan terjadi transaksi sebanyak 9 + 0,5 (30) = 24 orang.
Beberapa macam contoh persamaan regresi tunggal, grafik dan maknanya
dapat dilihat dalam table berikut :

165
Langkah-langkah untu menghitung persamaan regresi ialah :
1. Hitung beberapa persyaratan yang menjadi asumsi statistika parametric
2. Tulis hipotesisi penelitian dalam kalimat yang tegas
3. Tuliskan hipotesis statistiknya, yaitu Ho : r = 0 dan Hi : r ≠ 0
4. Buatlah tabel penolong untuk regresi tunggal sebagai berikut

166
No. Responden Xi Yi Xi Yi Xi2 Yi2
1
2
...
n
ΣXi ΣYi ΣXi Yi ΣXi2 ΣYi2

5. Hitung a dengan rumus

a =
  Yi   X    X   X Y 
2
i i i i

n X    X 
2 2
i i

6. Hitung b dengan rumus

n X i Yi    X i   Yi 
b =
n X 2i    X i 
2

Atau

Jika b sudah di ketahui lebih dahulu, maka a dapat dihitung denga rumus;

a = Y  bX

7. Masukkan nilai a dan b kedalam persamaan regresi;

Y = a + bX

8. Ujilah signifikansi dan linieritas persamaan tersebut dengan menggunakan


tabel penolong ANAVA seperti berikut :

167
9. Masukan angka-angka yang sesuai pada tabel tersebut berdasarkan
perhitungan
10. Tetapkan derajat kepercayaannya
11. Kriteria pengujian untuk hipotesis statisti ialah
Jika Fsign hitung ≤ F sign tabel maka Ho diterima
jika Fline hitung ≤ F line tabel maka Ho diterima
12. Carilah F sign tabel dengan rumus :
F sign tabel = F (1 – α)(dk reg), dk res) dengan melihat tabel distribusi F
13. Carilah F line tabel dengan rumus :
F line tabel = F (1 – α)(dk (TC)), dk (E)) dengan melihat tabel distribusi F
14. Bandingkan nilai Fhitung dengan Ftabel, lalu buat kesimpulannya

168
10.2.4 Analisis Regresi Ganda
Analisis ini digunakan untuk meramalkan pengaruh dua variabel prediktor
atau lebih terhadap satu variabel kriterium atau untuk membuktikan adanya
hubungan fungsional antara dua variabel bebas (X) atau lebih dengan sebuah
variabel terikat (Y).
Seluruh asumsi pada persamaan regresi linier tunggal berlaku juga untuk
regresi linear ganda. Bentuk persamaan garis regresi ganda ialah sebagai berikut :
Untuk 2 prediktor Y = a + b1X1 + b2 X2
Untuk 3 prediktor Y = a + b1X1 + b2 X2 + b3 X3
Untuk n prediktor Y = a + b1X1 + b2 X2 + b3 X3 + …. + b3 X3

Jika harga-harga b1, b2, b3, dan seterusnya sudah diketahui maka harga-harga
tersebut dapat pula digunakan untuk menghitung korelasi ganda dengan kata lain
dapat mengaitkan hasil-hasil perhitungan analisis regresi ganda dengan
perhitungan analisis korelasi ganda.. Hubungan tersebut bisa dihitung dengan
rumus :

b1  x1 y  b2  x 2 y
Untuk 2 prediktorRy(1. 2) =
y 2

b1  x1 y  b2  x 2 y  b3  x3 y
Untuk 3 prediktorRy(1. 2. 3) =
y3

b1  x1 y  b2 x yb x
2 3 3 y  b4  x 4 y
Untuk 4 prediktorRy(1. 2. 3. 4) =
y 2

Untuk n predictorRy(1. 2....n) =


b1  x1 y  b2  x 2 y  b3  x3 y  ......  bn  x n y
y 2

Adapun langkah-langkah untuk melakukan analisis regresi ganda ialah


sebagai berikut :
1. Lakukan perhitungan pemenuhan asumsi analisis statistika parametrik
2. Tulislah hipotesis penelitian dengan kalimat yang tegas
3. Cantumkan hipotesis statistiknya, yaitu :
Ho : ry.x1.x2 = 0 dan Hi : r ry.x1.x2 ≠ 0
4. Buatlah tabel penolong untuk regresi ganda seperti berikut ini :

169
No. Y X1 X2 YX1 YX2 X1X2 X12 X22 Y2
1
2
3
...

Σn ΣY Σ X1 Σ X2 ΣYX1 ΣYX2 ΣX1X2 Σ X12 Σ X22 Σ Y2

5. Masukan nilai-nilai tersebut dalam persaman :

Y = an + b1  X 1  b2  X 2
jika 2 prediktor YX1 = a X 1  b1  X 21  b2  X 1 X 2
YX2 = a X 2  b1  X 1 X 2  b2  X 2 2

jika 3 prediktor.
Hitung dahulu nilai-nilai berikut ini.

 X  2

x X
1
2
1
2
1 
n

 X  2

x X
2
2
2
2
2 
n

 X  2

x X
3
2
3
2
3 
n

  X   X 
x x   X1X 2 
1 2
1 2
n

  X   X 
x x   X1X 3 
1 2
1 3
n

  X   X 
x x3   X 2 X 3 
2 3
2
n

  X   XY 
x y  X Y 
1
1 1
n
  X   Y 
x y   X 2Y 
2
2
n

170
  X   Y 
x y   X 3Y 
3
3
n

Y  2

y 2
 Y  2

x y1  b1  x 21  b2  x1 x 2  b3  x1 x3 1

x y 2  b1  x1 x 2  b2  x 2 2  b3  x22 x3

x 3 y  b1  x1 x3  b2  x 2 x 2 x3  b3 3 x3

6. Hilangkan nilai a sehingga terbentuk persamaan baru (4)


7. Hilangkan nilai a sehingga terbentuk persamaan baru (5)
8. Hilangkan nilai b1 sehingga diperoleh nilai b2.
9. hitung b1 dan seterusnya untuk tiga prediktor
10. Hitung nilai a
11. Masukan nilai a, b1, b2 dan seterusnya ke dalam bentuk umum persamaan garis
regresi
12. Uji signifikansi garis regresi tersebut dengan langkah-langkah :
a. Jika dua predictor;
  X   Y 
x y  X Y 
1
(a). 1 1
n

  X   Y 
x y   X 2Y 
2
(b). 2
n
Y  2

(c). y 2
 Y 2 
n

b. Jika tiga peridiktor tambahkan;


  X 3   Y 
 x3 y   X 3Y  n

c. jika n prediktor tambahkan;

171
  X   Y 
x y   X nY 
n
n
n

d. Cari R hitung dengan rumus;

b1  x1 y  b2  x 2 y
Ry(1. 2) = jika 2 prediktor
 y2

e. Kuadratkan nilai R tersebut menjadi R2


f. Hitung F sign hitung dengan menggunakan rumus;

R 2  n  m  1
F =

m 1 R2 

Dimana; n = banyak anggota sampel (responden)


m = banyak prediktor

g. Tentukan taraf signifikansi α


h. Hitung F tabel dengan menggunakan rumus;

F tabel = F (1-)(dk pembilang, dk penyebut)


dk pembilang = m
dk penyebut = n-m-1

Kemudian lihat tabel F sehingga diperoleh F tabel

i. Tentukan kriteria pengujian yaitu jika Fhitung ≤ Ftabel maka Ho diterima


selanjutnya buat kesimpulannya

10.3 Penutup
Tes Formatif
1. Jelaskan perbedaan analisis korelasi dengan regresi !
2. Uraikan asumsi yang harus dipenuhi bila data ingin dianalisis secara
korelasi atau regresi !

172
3. Apa yang membedakan analisis regresi tunggal dengan ganda ?
4. Uraikan perbedaan analisis korelasi tunggal dengan ganda !
5. Jelaskan interpretasi nilai r dalam analisis regresi
6. Diketahui data sebagai berikut :
X 2 3 2 3 3 1
Y 3 12 2 1 1
Bila hipotesis bila hipotesis penelitian tersebut berbunyi tidak terdapat
hubungan yang positif, signifikans dan linier, buktikan hipotesis tersebut !

Umpan Balik
Cocokan jawaban saudara dengan kunci jawaban yang tersedia. Untuk soal no. 1 –
5 apabila jawabannya sempurna diberi skor tertinggi 10 sedangkan untuk soal
no.6 apabila jawabannya sempurna diberi nilai 50. Hitunglah jawaban yang benar
kemudian gunakan rumus berikut untuk mengetahui tingkat penguasaan saudara
terhadap materi kegiatan belajar ini.

Rumus
Skor jawaban yang benar
Tingkat Penguasaan = X 100
100

Bila saudara mencapai tingkat penguasaan 80 % atau lebih maka saudara dapat
melanjutkan ke materi berikutnya, namun apabila tingkat penguasaan saudara di
bawah 80 % maka saudara harus mengulang kegiatan belajar ini terutama pada
bagian yang tidak dikuasai

Kunci Jawaban
1. Analisis korelasi digunakan untuk melihat hubungan searah serta kuatnya
derjat hubungan antara dua variabel atau lebih sedangkan analisi regresi selain
melihat hubungan juga meramalkan hubungan fungsional antara variabel
prediktor dengan variabel kriterium

173
2. Asumsi yang harus dipenuhi untuk melakukan analisis korelasi atau
regresi ialah : data harus memenuhi prasyarat analisis statistika parametrik,
ada dua variabel yang berpasangan, data memiliki interval dan rasio
3. Regresi tunggal ialah suatu analisis regresi yang hanya bisa dilakukan bila
data hanya memiliki satu variabel prediktor dan satu variabel kriterium,
sedangkan regresi ganda bisa meramalkan hubungan antara lebih dari satu
variabel prediktor dengan satu variabel kriterium.
4. Korelasi tunggal digunakan untuk melihat hubungan dan derajat hubungan
antara satu variabel sebab dan satu variabel akibat sedangkan pada korelasi
ganda bisa dilihat hubungan beberapa variabel sebab dengan satu variabel
akibat
5. Interpretasi nilai r pada analisis korelasi adalah sebagai berikut :
R Interpretasi
0 Tidak berkorelasi
0,01 – 0,20 Korelasi sangat rendah
0,21 – 0,40 Korelasi rendah
0,41 – 0,60 Korelasi agak rendah
0,61 – 0,80 Cukup berkorelasi
0,81 – 0,99 Korelasi tinggi
1 Korelasi sangat tinggi

6. Berdasarkan hipotesis yang diajukan maka data akan dianalisis dengan


regresi tunggal. Oleh kare itu data tersebut diuraikan lebih jauh dalam tabel
penolong regresi tunggal
Selanjutnya dicari nilai :
a = (10,36 – 14,23) / (6,38 – (14)2 = 1,90
b = (6,23 – 14,10) / (6,38 – (14)2 = - 1,10
Y = a + bX = 1,90 + 1,10X
Selanjutnya dicari beberapa nilai untuk mengisi tabel ANAVA

No. Xi Yi Xi Yi Xi2 Yi2


Responden
1 2 3 6 4 9

174
2 3 1 3 9 1
3 2 2 4 4 4
4 3 2 6 9 4
5 3 1 3 9 1
6 1 1 1 1 1
ΣXi = 14 ΣYi = 10 ΣXi Yi= 23 ΣXi2 = 36 ΣYi2 = 20

n=6
ΣY2 = 20
JK(reg a) = (ΣY)2 / n = (10)2 / 6 16,666
(ΣXi)( ΣYi)
JKreg(bia) = b ΣYiYi - = -0,10 (23 – (14 x 10) / 6) = 0,0333
n
JKres = ΣY2 - JK reg(bia) - JK(reg a) = 20 – (0,3333 – 16,6666) = 3,3001
RJK(reg a) = JK(reg a) = 16,6666
RJKreg(bia) = JKreg(bia) = 0,3333
RJKres = JKres / (n – 2) = 3,3001 / (6 – 2) = 0,8202
(ΣY)2
JK(E) = Σ ΣYi2 -
x n
Untuk mencarinya maka digunakan tabel penolong dari data X terendah
sampai tertinggi berikut pasangannya :
X Y
1 1
2 2
2 3
3 1
3 1
3 2
12 – (12 / 1) = 0
22 + 32 - ((2 + 3) 2 / 3) = 0,5000
12 + 12 + 22 - ( (1 + 1 + 2) 2 / 3 = 0,6667 +
JK(E) = 1,1667
JK(TC) = JKres - JK(E) = 3,6667 - 1,1667 = 2,5000
JK(TC) 2,5000
RJK(TC) = + = 2,5000
k–2 3–2

175
JK(E) 1,1667
RJK(E) = + = 0,3889
n-k 6 - 3
Fsign = RJKreg(bia) / RJKres = 0,0333 / 0,8202 = 0,0406
Fline = RJK(TC) / RJK(E) = 2,5000 / 0,3889 = 6,4284
Tarf signifikansi = 0,05
Dari tabel diketahui Fsign tabel = F(1-α)(dk reg (bia), dk res)) = F(1-0,05)(1, 4) = 7,71
Sedangkan nilai Fline tabel = F(1-α)(dk (TC), dk (E)) = F(1-0,05)(1, 3) = 10,13
Sehingga Fsign hitung < Fsign tabel dan Fline hitung < Fline tabel .maka Ho diterima
Kesimpulan : Tidak terdapat hubungan yang positif, signifikans dan linier
antara variabel X dengan variabel Y.

Daftar Pustaka

Arikunto Suharsimi, 1993, Prosedur Penelitian, Suatu Pendekatan Praktek,


Jogyakarta: Rineka Cipta.

Cohen Jacob, 1988, Statistical Power Analysisis for Behavioral Sciences, New
Jersey: Lawrence Elrlbaum Assosiate Publisers.

Furqon, 1997, Statistik Terapan Untu Penelitian, Bandung: Alfabeta

Gaspersz Vincent, 1995, Teknik Analisis dalam Penelitian Percobaan, Jilid 1-2,
Bandung: Tarsito

Hadi, Sutrisno, 2004, Statistik jilid 1, 2 dan 3, Jogyakarta: Andi

Hasan M. Iqbal, 2002, Pokok-pokok Materi Statistika, Jakarta; Bumi Aksara.

Husain Usman, 2003, Pengantar Statistika, Jakarta: Bumi Aksara

Sudjana, 2002, Metoda Statistika, Bandung: Tarsito

Sudjana, 2004, Desain dan Analisis Eksperimen, Bandung: Tarsito

Sugiyono, 2003, Model Penelitian Administrasi, Bandung: AlfaBeta.

Sukandar Dadan, 2004, Metode Statistika, Jogyakarta: Madyan Press

Suparman, 1995, Statistik Sosial, Jakarta: Raja Grafindo Persada.

176
Surakhmad Winarno, 1982, Pengantar Penelitian Ilmiah, Bandung: Tarsito

Torrie, James H,. 1995, Prinsip dan Prosedur Statistika, Suatu pendekatan
Biometrik, Jakarta: Gra
media

Wijaya, 2003, Statistika Non Parametrik, Bandung: AlfaBeta

BAB XI
STATISTIK NON PARAMETRIK

177
11. 1 Pendahuluan
Bab ini menguraikan tentang penggunaan dan fungsi analisis statistika
Non parametrik serta teknik perhitungannya.

Kompetensi Dasar
Setelah menyelesaikan materi ini, mahasiswa mampu menngunakan
analisis statistika Non parametrik serta teknik perhitungannya dengan baik dan
benar

11.2 Penyajian
11.2.1 Pengantar
Analisis statistika inferensia mencakup semua metode yang berhubungan
dengan analisis sebagian data (sampel) untuk kemudian sampai pada peramalan
atau penarikan kesimpulan yang berlaku untuk seluruh anggota populasi.
Pada pengujian hipotesis melalui analisis parametrik, dibutuhkan asumsi-
asumsi tertentu yang harus dipenuhi oleh suatu data, seperti data harus
berdistribusi norma, homogen, acak dan independen. Kenyataannya sangatlah
sulit untuk memperoleh data yang memenuhi asum-asumsi tersebut. Oleh karena
itu dicari jalan keluar untuk memecahkan kasus dalam berbagai penelitian yang
datanya tidak memenuhi asumsi-asumsi tersebut. Alternatif yang dapat digunakan
ialah dengan menggunakan teknik analisis bebas asumsi di atas yang dikenal
dengan analisis statistika non parametrik.
Dengan demikian analisis statistika non parametrik digunakan apabila :
1. Sampel yang digunakan memiliki ukuran yang kecil
2. Data yang diperoleh bersifat ordinal yaitu data yang bisa diurutkan atau
diklasifikasikan berdasarkan ranking
3. Data yang diperoleh bersifat nominal yaitu data yang diklasifikasikan dalam
bentuk kategori dan dapat dihitung frekwensinya

178
4. Data tidak berdistribusi normal, mendekati normal atau memengikuti
distribusi tertentu
5. Dalam beberapa kasus, data tidak memiliki varians yang homogen atau
independen
6. Ingin menyelesaikan masalh statistik dengan cepat tanpa mengunakan
parameter sebagai alat ukur/hitung.
Langkah-langkah yang harus dilakukan untuk pengujian hipotesis melalui
statistik non parametrik ialah sebagai berikut :
1. Menentukan jenis analisis non parametrik yang sesuai dengan model
penelitian yang dibuat.
2. Menentukan formulasi hipotesis, baik hipotesis penelitian maupun hipotesis
statistiknya.
3. Menentukan derajat kepercayaan (taraf nyata/α)
4. Menentukan kriteria pengujian
5. Menentukan nilai uji statistik
6. Membuat kesimpulan
Berikut disajikan tabel tentang tingkat pengukuran dan uji statistiknya :
Skala Hubungan Statistik Uji
Nominal Ekivalensi Modus Non Parametrik
Frekwensi
Koefisien kontingensi
Ordinal Ekivalensi Median persentil Non Parametrik
>atau < Spearman (r)
Kendal (-τ)
Kendal (W)
Interval Ekivalensi Mean Parametrik dan
>atau < Deviasi standar Non Parametrik
Rasio sembarang Koef. Korelasi Pearson
(2 interval diketahu) Koef. Korelasi ganda
Rasio Ekivalensi Mean Parametrik dan
>atau < Deviasi standar Non Parametrik
Rasio sembarang Koef. Korelasi Pearson
(2 interval diketahu) Koef. Korelasi ganda
Mean geometrik
Koefisien variasi

179
Beberapa model analisis statistika non parametrik sudah banyak diketahui
dan digunakan. Namun demikian dalambab ini hanya akan diuraikan beberapa
model yang paling sering digunakan oleh mahasiswa dalam menganalisis data
hasil pengamatan pada penelitian skripsi mereka.

11.2.2 Uji Chi Kuadrat


Uji ini digunakan untuk mengukur kuatnya hubungan antara kedua data
nominal yang dinyatakan dengan besaran kontingensi dengan lambang C Oleh
karena itu uji ini merupakan uji non parametris untuk analisis korelasi dua
populasi, rumusnya adalah :

 21
C =
2 n

Selanjutnya harga C tersebut dibandingkan dengan Cmaksimum dengan rumus.

m 1
Cmaks =
m

Dimana m = dipilih nilai minimum antara banyaknya kolom dengan


banyaknya baris. Jika tidak ingin menghitung Cmaks, maka nilai C bisa langsung
dibandingkan dengan nilai Ctabel.
Selanjutnya keriteria penilaian yang berlaku adalah semakin dekat nilai C
dengan Cmaks atau C tabel maka semakin dekat pula derajat hubungan kedua
populasi.

11.2.3 Uji Urutan Korelasi Spearman


Uji ini juga merupakan uji non parametrik dari korelasi tunggal.
Diperkenalkan oleh Karl Spearman tahun 1904 yang digunakan untuk menguji
keeratan hubungan antara dua variabel atau dua data ordinal. Koefisien korelasi
Spearman disimbolkan dengan rs.

180
1. Jika rs = 1 maka data sampel menunjukan hubungan positif sempurna yaitu
urutan untuk setiap data sama
2. Jika rs = -1 maka data sampel menunjukan hubungan negatif sempurna yaitu
urutan untuk setiap data merupakan urutan terbalik
3. Jika rs = 0 maka data sampel menunjukan tidak adanya hubungan
Dengan demikian nilai rs berkisar antara -1 dan 1 atau -1 ≤ rs ≤ 1
Koefisien korelasi urutan Spearman dicari dengan rumus :
6  d2
rs  1 

n n2 1
Dengan d = beda urutan dalam satu pasangan data
n = banyaknya pasangan data
Langkah untuk pengujian adalah sebagai berikut :
1. Nilai pengamatan dari dua variabel yang akn diukur hubungannya diberi
urutan. , jika ada yang sama dihitung rata-ratanya
2. Setiap pasangan dihitung perbedaannya
3. Perbedaan setiap pasangan tersebut dikuadratkan dan dihitung jumlahnya
kemudian hitung nilai rs .

11.2.4 Uji Tanda


Uji ini didasarkan atas tanda-tanda positif dan negatif dari perbedaan
antara pasangan pengamatan bukan atas besarnya perbedaan dengan demikian uji
ini memiliki kelemahan karen banyak membuang data penting terutama harga
selisih dari setiap data berpasangan tidak dianalisis secara detil melainkan hanya
diberi tanda positif dan negatif saja.
Biasanya uji ini digunakan untuk penelitian yang memiliki dua rata-rata
populasi. Uji ini sangat baik digunakan apabila :
1. Pasangan yang akan dinalisis bersifat independen
2. Masing-masing pengamatan dalam setiap pasangan terjadi karena pengaruh
kondisi yang serupa
3. Pasangan yang berlainan terjadi karena kondisi yang berbeda

181
Langkah yang harus dilakukan untuk menggunakan uji tanda ialah sebagai
berikut :
1. Menentukan formula hipotesis, yaitu :
Ho : Probabilitas terjadinya tanda positif dan tanda negatif adalah sama
atau Tidak ada perbedaan pengaruh antara dua perlakuan
Hi : Probabilitas terjadinya tanda positif dan tanda negatif adalah
berbeda
atau Terdapat perbedaan pengaruh antara dua perlakuan
2. Menentukan derjat kepercayaan α.
3. Menentukan kriteria pengujian, yaitu
 Satu pihak : Ho diterima apabila α ≤ probabilitas hasil sampel
Ho ditolak apabila α > probabilitas hasil sampel
 Dua pihak : Ho diterima apabila α ≤ 2 kali probabilitas hasil
sampel
Ho ditolak apabila α > 2 kali probabilitas hasil sampel
4. Menentukan nilai uji statistik, yaitu nilai dari probabilitas hasil sampel pada
tabel probabilitas dengan nilai n, r dan α tertentu. Nilai r adalah jumlah tanda
terkecil.
5. Membandingakan nilai tersebut dengan derajat kebebasan yang dipilih lalu
buatlah kesimpulan
Catatan : apabila sampel besar (n ≥ 30), uji statistiknya adalah

2r  n
CR =
n

Keterangan :

r = jumlah tanda positif


n = jumlah pasangan observasi yang releven

11.2.5 Uji Urutan Bertanda Wilcoxon (Signed Rank Test)

182
Merupakan penyempurnaan dari uji tanda yang diperkenalkan oleh Frank
Wilcoxon tahun 1945. Uji ini disamping memperhatikan tanda perbedaan positif
dan negatif juga memperhatikan besaran beda dari selisih daata yang berpasangan
dalam menentukan ada tidaknya perbedaan nyata antara dua sampel yang
berhubungan.
Langkah-langkah pengujiannya adalah :
1. Menentukan formula hipotesis, yaitu :
Ho : Jumlah urutan tanda positif dengan negatif adalah sama
atau Tidak ada perbedaan pengaruh antara dua perlakuan
Hi : Jumlah urutan tanda positif dengan negatif adalah berbeda
atau Terdapat perbedaan pengaruh antara dua perlakuan
2. Menentukan derajat kepercayaan, dengan memperhatikan pengujian sepihak
atau dua pihak, pada tabel T Wilcoxon
3. Menentukan kriteria pengujian, yaitu Ho diterima apabila Thit ≥ T
4. Menentukan nilai uji statistikanya (niali To atau Thit), sebagai berikut :
 Menentukan tanda beda dan besarnya tanda beda antara pasangan data
 Mengurutkan bedanya tanpa memperhatikan tanda atau jenjang :
a. Angka 1 untuk beda yang terkecil dan seterusnya
b. Jika terdapat beda yang sama diambil rata-ratanya
c. Beda nol tidak diperhatikan
 Memisahkan tanda beda postif dengan negatif atau tanda jenjang
 Menjumlahkan semua angka positif dan negatif
 Nilai terkecil dari nilai absolut hasil penjumlahan merupakan nilai Thit.
5. Bandingkan nilai Thit dengan Ttabel. Buat kesimpulan
Catatan : Untuk pasangan data lebih dari 25 dilakukan pengujian melalui rumus :

T  E (T )
 
T

n( n  1)
E(T) =
4

n n  1 2n  1
T =
24
183
11.2.6 Uji Median
Digunakan untuk menguji dua atau lebih sampel independen memiliki
media yang sama. Langkah-langkahnya sebagai berikut :
1. Menentukan formula hipotesis, yaitu :
Ho : Beberapa populasi tempat sampel diambil memiliki median yang
sama
Hi : Beberapa populasi tempat sampel diambil memiliki median yang
berbeda
2. Menentukan derajat kepercayaan α dan nilai χ2tabel, dengan dengan derajat
kebebasan dk = n - 1
3. Menentukan kriteria pengujian, yaitu Ho diterima apabila χ2hitung ≤ χ2tabel,.
4. Menentukan nilai uji statistikanya (niali To atau Thit), sebagai berikut :
 Menentukan median dari kombinasi distribusi sampelnya
 Menghitung frekwensi nilai yang terletak di atas dan di bawah media
kombinasi untuk setiap kelompok yang tabelnya berbentuk :
Jumlah Nilai Kelompok I Kelompok II Total
Di atas median a b a+b
Kombinasi
Di bawah median c d c+d
Kombinasi
a + c = n1 b + d = n2 n1+ n2 = n
Rumus  o :
2

n((ad  bc )  1 n) 2
o
2
 2
(a  b) (c  d ) (a  c) (b  d )

5. Bandingkan nilai χ2hitung dengan χ2tabel. Buat kesimpulan

184
112.7 Uji Mann-Whitney (U Test)
Uji ini digunakan untuk menguji rata-rata dua sampel dengan ukuran yang
tidak sama. Dikembangkan oleh H. B. Mann dan D. R. Whitney pada tahun 1947.
Langkah-langkahnya sebagai berikut :

1. Menentukan formula hipotesis, yaitu :


Ho : dua sampel independen memiliki rata-rata yang sama
atau Tidak ada perbedaan pengaruh antara dua perlakuan
Hi : dua sampel independen memiliki rata-rata yang berbeda
atau Terdapat perbedaan pengaruh antara dua perlakuan
2. Menentukan derajat kepercayaan dan nilai U tabel dari daftar U Mann –
Whitney Uα(n1)(n2). Perhatikan uji sepihak atau dua pihak
3. Menentukan kriteria pengujian , yaitu : Ho diterima biala U ≥ Uα(n1)(n2).
4. Menentukan nilai uji statistik dengan tahapan :
 Menggabungkan kedua sampel dan memberi urutan setiap anggota dari
pengamatan terkecil ke terbesar.
 Menjumlahkan urutan sampel masing-masing (R1 dan R2)
 Menghitung tatistik U dengan rumus :

n1  n1  1
U 1  n1 . n 2   R1
2

atau

n 2  n 2  1
U 1  n1 . n 2   R2
2

Nilai U yang di ambil adaqlah nilai U yang terkecil. Untuk memeriksa


ketelitian perhitungan di gunakan rumus:

Uterkecil = n1.n2 – Uterbesar

185
5. Buatlah kesimpulannya
Catatan : untuk n > 20 digunakan nilai statistic Z, yaitu :

U  E (U )
Z = U

n1 .n 2
E(U) =
2

n1 .n 2 (n1  n2  1
u 
12

11.2.8 Uji Kruskall-Wallis (H Test)


Pertama kali diperkenalkan oleh William H. Kruskall dan W. Allen Wallis
pada tahun 1952. Merupakan pengembangan dari uji Mann-Whitney tetapi
membandingkan lebih dari dua rata-rata dengan demikian uji ini merupakan
alternatif untuk analisis varians satu arah (tunggal) dari suatu penelitian yang
memiliki desain rancangan acak sempurna (RAK).
Langkah-langkah pengujian Kruskall-Wallis adalah :
1. Menentukan formula hipotesis, yaitu :
Ho : populasi dari sampel yang diambila memiliki mean yang sama
atau Tidak ada perbedaan pengaruh antara beberapa perlakuan
Hi : populasi dari sampel yang diambila memiliki mean yang berbeda
atau sedikitnya terdapat satu tanda tidak sama
atau Terdapat perbedaan pengaruh antara berbagai perlakuan
2. Menentukan derajat kepercayaan α dan nilai χ2 yang ditentukan oleh derajat
kebebasan (dk) = t – 1 : χ2 α(t – 1) = ......
3. Menentukan kriteria pengujian , yaitu : Ho diterima biala H ≤ χ2 α(t – 1)
4. Tentukan nilai H dengan cara :
1 Ri2 N(N +1)2
H = Σ -
S2 i ri 4
Dimana r banyaknya ulangan dan N = rt
186
Sedangkan nilai S2 dicari dengan rumus :

1 N(N + 1)2
S2 = Σ Rij2 -
N–1 i,j 4

Dimana Rij adalah pangkat dari pengamatan


ulangan ke- j perlakuan ke -i

5. Membandingkan nilai H dengan χ2 α(k – 1) serta membuat kesimpulan

11.2.9 Uji Friedman


Uji Fredman, ditemukan oleh Fredman tahun 1937, sangat relevan
digunakan untuk menganalisis suatu data hasil penelitian dengan menggunakan
desain penelitian rancangan acak blok (RAB) yang karena sesuatu hal data hasil
penelitian tidak memenuhi asumsi untuk analisis statistika parametrik.
Uji ini didasarkan atas data yang sebelumnya sudah dirangkinguntuk
respon perlakuan setiap kelompok. Uji ini menentukan apakah jumlah setiap
rangking dari setiap perlakuan berbeda nyata. Nilai statistic Fredman dinyatakan
dalam T. Penyebarannya mengikuti sebaran chi kuadrta dengan derajat kebebasan
dk = t – 1 dimana t adalah banyaknya perlakuan.
Kriteria penilaiannya ialah tolak Ho bila T χ2 α(t – 1) .
Nilai Fredman dihitung dengan rumus

12 t
T= Σ (Ri)2 – 3 r(t + 1)
rt(t + 1) i=1

Diamana r = banyaknya kelompok


t = banyaknya perlakuan
Ri = jumlah rangking fari perlakuan ke - i

187
11.3 Penutup
Tes Formatif
1. Jelaskan definisi dan fungsi dari analisis statistika non parametrik !
2. Kenapa uji urutan bertanda Wilcoxon lebih baik digunakan dari pada uji
tanda biasa ?
3. Kapan anda menggunakan uji urutan bertanda Spearman!
4. Jelaskan fungsi dari uji Kruskall - Wallis!
5. Jelaskan fungsi uji Mann – Whitney ?
6. Dari suatu penelitian dengan data yang tidak berdistribusi normal
diperoleh hasil pengamatan sebagai berikut :
Kelompok Umur Perlakuan
A B C D
1 2 5 8 6
2 3 4 7 5
3 3 5 10 5
4 5 5 9 2
Total 13 19 34 18

Tentukan, apakah keempat perlakuan tersebut memberikan pengaruh yang


berbeda ?

Umpan Balik
Cocokan jawaban saudara dengan kunci jawaban yang tersedia, untuk soal no. 1 –
5 apabila jawabannya sempurna diberi skor tertinggi 10 sedangkan untuk soal
no.6 apabila jawabannya sempurna diberi nilai 50. Hitunglah jawaban yang benar
kemudian gunakan rumus berikut untuk mengetahui tingkat penguasaan saudara
terhadap materi kegiatan belajar ini.
Rumus
Skor jawaban yang benar
Tingkat Penguasaan = X 100
100

188
Bila saudara mencapai tingkat penguasaan 80 % atau lebih maka saudara dapat
melanjutkan ke materi berikutnya, namun apabila tingkat penguasaan saudara di
bawah 80 % maka saudara harus mengulang kegiatan belajar ini terutama pada
bagian yang tidak dikuasai

Kunci Jawaban
1. Analisis statistika non parametrik. Adalah suatu model analisis statistika
yang tidak mewajibkan datanya berdistribusi normal atau memenuhi asumsi-
asumsi untuk pengujian parametrik. Fungsinya ialah untuk memberikan solusi
bagi permasalahan statistika yang tidak bisa dipecahkan oleh analisis statistika
parametrik dan memberikan kemudahan bagi peneliti dalam menarik
kesimpulan tanpa memperhitungkan parameter tertentu.
2. Sebab pada uji urutan tanda Wilcoxon analisis data dilakukan tidak hanya
dengan memberikan tanda posifi dan negatif saja tetapi memberikan urutan
terhadap selisih kedua data yang berpasangan.dalam menentukan ada tidaknya
perbedaan dari dua data berpasangan tersebut.
3. Uji urutan bertanda Spearman digunakan apabila kita ingin melihat derajat
hubungan (korelasi) antara dua populasi tetapin data yang diperoleh tidak
berdistribusi normal dengan kata lain uji ini menolong peneliti memecahkan
masalah pada penelitian korelasi biasa yang memiliki data bebas distribusi
4. Uji Kruskall – Wallis digunakan untuk menganalisis data yang memiliki
lebih dari dua rata-rata populasi dengan desain penelitian rancangan acak
lengkap tetapi data tidak berdistribusi normal dan varians tidak homogen
5. Uji Mann – Whitney digunakan untuk menguji rata-rata dua sampel
dengan ukuran yang tidak sama dan tidak berdistribusi normal.
6. Data dalam soal tadi selanjutnya disusun dalam tabel rangking seperti
berikut :
Ke. Perlakuan Rangking
A B C D A B C D
1 2 5 8 6 1 2 4 3
2 3 4 7 5 1 2 4 3
3 3 5 10 5 1 2,5 4 2,5

189
4 5 5 9 2 2,5 2,5 4 1
Total 13 19 34 18 5,5 9 16 9,5

12
T = (5,52 + 92 + 162 + 9,52) - (3)(4)(4 + 1)
(4)(4)(4 + 1)

= 8,625

Daftar Pustaka

Arikunto Suharsimi, 1993, Prosedur Penelitian, Suatu Pendekatan Praktek,


Jogyakarta: Rineka Cipta.

Cohen Jacob, 1988, Statistical Power Analysisis for Behavioral Sciences, New
Jersey: Lawrence Elrlbaum Assosiate Publisers.

Furqon, 1997, Statistik Terapan Untu Penelitian, Bandung: Alfabeta

Gaspersz Vincent, 1995, Teknik Analisis dalam Penelitian Percobaan, Jilid 1-2,
Bandung: Tarsito

Hadi, Sutrisno, 2004, Statistik jilid 1, 2 dan 3, Jogyakarta: Andi

Hasan M. Iqbal, 2002, Pokok-pokok Materi Statistika, Jakarta; Bumi Aksara.

Husain Usman, 2003, Pengantar Statistika, Jakarta: Bumi Aksara

Sudjana, 2002, Metoda Statistika, Bandung: Tarsito

Sudjana, 2004, Desain dan Analisis Eksperimen, Bandung: Tarsito

Sugiyono, 2003, Model Penelitian Administrasi, Bandung: AlfaBeta.

Sukandar Dadan, 2004, Metode Statistika, Jogyakarta: Madyan Press

Suparman, 1995, Statistik Sosial, Jakarta: Raja Grafindo Persada.

Surakhmad Winarno, 1982, Pengantar Penelitian Ilmiah, Bandung: Tarsito

Torrie, James H,. 1995, Prinsip dan Prosedur Statistika, Suatu pendekatan
Biometrik, Jakarta: Gra

190
media

Wijaya, 2003, Statistika Non Parametrik, Bandung: AlfaBeta

BAB XII
ANALISIS MULTIVARIAT

12. 1 Pendahuluan
Bab ini menguraikan tentang penggunaan dan fungsi analisis statistika
multivariate serta teknik perhitungannya.

Kompetensi Dasar
Setelah menyelesaikan materi ini, mahasiswa mampu menngunakan
analisis statistika multivariate serta teknik perhitungannya dengan baik dan benar

11.2 Penyajian
11.2.1 Pengantar
ANALISIS STATISTIKA MULTIVARIATE

Analisis statistika multivariate adalah analisis statistika yang dikenakan


pada data yang terdiri dari banyak variabel dan antar variabel saling berkorelasi.
Beberapa metode yang termasuk ke dalam golongan analisis ini adalah :
# Metode Tujuan Model
1 Principal Mereduksi dimensi data dengan cara Yi  a' X
Component membangkitkan variabel baru (komponen Maks var(Yi)
Analysis utama) yang merupakan kombinasi linear dan
dari variabel asal sedemikan hingga corr(Yi, Yj)=0
varians komponen utama menjadi
maksimum dan antar komponen utama
bersifat saling bebas
2 Factor Mereduksi dimensi data dengan cara X  CF  
Analysis menyatakan variabel asal sebagai maks var(CF)
kombinasi linear sejumlah faktor,
sedemikian hingga sejumlah faktor
tersebut mampu menjelas-kan sebesar

191
mungkin keragaman data yang
dijelaskan oleh variabel asal.
3 Cannonical Menganalisis hubungan antar dua Ada dua
Correlation kelompok variabel dengan cara kelompok
membangkitkan vari-abel baru pada variabel :
setiap kelompok. Variabel baru tersebut X dan Y
merupakan kombinasi linear dari variabel dibangkitkan
asal. Kombinasi linearnya ditentukan variabel baru :
sedemikian hingga korelasi antar variabel U i  a' X dan
baru yang berasal dari dua ke-lompok Vi  b' Y se-
menjadi maksimum hingga
corr( U i , Vi )
maks dan
corr( U i , V j )=0
4 Multivariate Memodelkan hubungan antara kelompok Y  X  
Regression variabel respon (Y) dengan kelompok
variabel (X) yang diduga mempengaruhi
variabel respon
5 MANOVA Menganalisis hubungan antara vektor va- Yijk   k   ik   ijk
riabel respon (Y) yang diduga i=1,...,t
dipengaruhi oleh beberapa perlakuan j=1,...,ni
(treatment). k=1,...,p
6 Discriminan Membentuk fungsi yang memisahkan
t Analysis antar kelompok berdasarkan variabel
pembeda, fungsi tsb disusun sedemikian
nisbah kera-gaman data antar dan
kelompok maksimum.
7 Cluster Mengelompokkan data ke dalam
Analysis beberapa kelompok sedemikian hingga
data yang berada di dalam kelompok
yang sama cenderung mempunyai sifat
yang lebih homogen daripada data yang
berada di kelompok yang berbeda

Distribusi Multinormal
Beberapa metode statistika multivariate seperti : MANOVA, dan
discriminant analysis seringkali mensyaratkan terpenuhinya asumsi distribusi
multinormal. Asumsi ini diperlukan karena di dalam MANOVA dan discriminant
analysis dilakukan pengujian dengan menggunakan statistik uji Wilk. Kesimpulan
yang diambil berdasarkan statistik ini dikatakan sahih (valid), jika syarat
distribusi multinormal dipenuhi.

192
Variabel X i , X 2 ,..., X p dikatakan berditribusi normal multivariate dengan
parameter  dan jika mempunyai probability density function :
1
1  ( X   )' 1 ( X   )
f ( X i , X 2 ,..., X p )  p/2
e 2

( 2 ) p / 2 

Jika X i , X 2 ,..., X p berdistribusi normal multivariate maka ( X   )'  1 ( X   )


berditribusi  p . Berdasarkan sifat ini maka pemeriksaan distribusi multinormal
2

dapat dilakukan dengan cara membuat q-q plot dari nilai


 1

d i  X i  X)' S ( X i  X , i  1,..., n .
2

Tahapan dari pembuatan q-q plot ini adalah sebagai berikut (Johnson,
1990)
1. Mulai
2. Tentukan nilai vektor rata-rata : X
3. Tentukan nilai matriks varians-kovarians : S
4. Tentukan nilai jarak Mahalanobis setiap titik pengamatan dengan

1
vektor rata-ratanya d i  X i  X)' S ( X i  X , i  1,..., n
2

5. Urutkan nilai d i dari kecil ke besar : d (1)  d ( 2)  d (3)  ...  d ( n )
2 2 2 2 2

i  1/ 2
6. Tentukan nilai pi  , i  1,..., n
n
qi

 f ( ) d 2  p i
2
7. Tentukan nilai q i sedemikian hingga

2
8. Buat scatter-plot d (i ) dengan q i
9. Jika scatter-plot ini cenderung membentuk garis lurus dan lebih dari

50 % nilai d i   p ,0.50
2 2

10. Selesai

Implementasi pembuatan q-q plot dari nilai


 1

d  X i  X)' S ( X i  X , i  1,..., n dalam macro MINITAB disajikan pada
i
2

Lampiran 1.

193
Selain dengan memeriksa nilai jarak Mahalanobis setiap pengamatan
dengan vektor rata-ratanya. Menurut Mardia (1974) di dalam Rencher (1995)
pemeriksaan kemultinormalan data dapat juga dikaji melalui nilai multivariate
skewnewss ( b1, p ) dan kurtosisnya ( b2, p )

n n
1 1 n 2
b1, p 
n2
 g
i 1 j 1
3
ij dan b2 , p   g ii
n i 1
sedangkan

g ij  ( X i  X)' S 1 ( X j  X)

Jika X i , X 2 ,..., X p dikatakan berditribusi normal multivariate maka :

( p  1)(n  1)(n  3)
z1  b1, p berditribusi  p2 ( p 1)( p  2 ) / 6 dan
6 ( n  1)( p  1)  6

b2, p  p ( p  2)
z2  berdistribusi normal baku.
8 p ( p  2) / n

Penentuan nilai z1, z2 dengan bantuan macro MINITAB disajikan pada


Lampiran 2.

Kebebasan antar variabel


Variabel X i , X 2 ,..., X p dikatakan bersifat saling bebas (independent) jika
matriks korelasi antar variabel membentuk matriks identitas. Untuk menguji
kebebasan antar variabel ini dapar dilakukan uji Bartlett sphericity berikut
(Morrison, 2005) :
Hipotesis :
Ho : R = I
H1 : R  I
 2 p  5
Statiistik uji :  hitung   n  1 
2
 ln R
 6 

Terima hipotesis Ho yang berarti antar variabel bersifat saling bebas jika

nilai  hitung   1 p ( p 1) . Jika hipotesis ini yang diterima maka penggunanan
2 2

metode multivariate tidak layak terutama metode analisis komponen utama dan

194
analisis faktor. Penentuan nilai statistik uji Bartlett sphericity dengan bantuan
macro MINITAB disajikan pada Lampiran 3.

195
Kehomogenan Matriks Varians-Kovarians
Beberapa analisis statistika multivariate seperti discriminant analysis dan
MANOVA membutuhkan syarat matriks varians-kovarians yang homogen. Untuk
menguji syarat ini dapat dipergunakan statistik uji Box-M. Hipoteris dan statistik
uji Box-M adalah (Rencher, 1995) :
Hipotesis
Ho : 1   2  ...   k
H1 :  i   j untuk i  j
Statistik uji

1 k 1 k

 2
hitung  2(1  c1 )   vi ln S i  ln S pool  v  i
 2 i 1 2 ii 1

dan
k

v S i i

 k 1

1  2 p 2  3 p  1 
S pool  i 1
c1      v i  ni  1
k
 i 1 vi
k
6( p  1)( k  1) 
 vi  
v
i 1
i  i 1 

Terima hipotesis nol yang berarti matriks varians-kovarians bersifat


homogen jika

 hitung
2
  12
( k 1) p ( p 1
2

196
Outlier
Data tidak bersitribusi multinormal atau matriks varians-variansnya tidak
homogen bisa saja disebabkan oleh sedikit pengamatan yang mempunyai pola
berbeda dengan sebagian besar pengamatan. Pengamatan yang mempunyai
perilaku seperti ini disebut outlier. Contoh pengamatan yang merupakan outlier
adalah negara Jepang (Gambar 1.) Statistik uji yang dapat dipakai untuk
mendeteksi adanya outlier adalah (Morrison, 2005)
 n  p  1 nd i2
Fi 
p n  1 npd i2
2

Pengamatan ke-i adalah outlier jika Fi  F ; p ,n  p 1 Penentuan adanya


outlier dengan menggunakan macro MINITAB disajikan di Lampiran 4.

10 Japan

Belgium
Netherland
7

Denmark
France
6
Italy

Germany
5 Sweden
Produktivitas

4
UK
US
3
1500 1600 1700 1800 1900 2000 2100 2200

Jam kerja setahun


Gambar 12.1
Scater-plot Produktivitas dan Jam-kerja Bebarapa NegaraMaju

197
Kegiatan Praktikum

COUNTRY DENSITY URBAN LIFEEXPF LIFEEXPM LITERACY BABYMORT GDP_CAP


Afghanistan 25 18 44 45 29 168 205
Bangladesh 800 16 53 53 35 106 202
Cambodia 55 12 52 50 35 112 260
China 124 26 69 67 78 52 377
Hong Kong 5494 94 80 75 77 5.8 14641
India 283 26 59 58 52 79 275
Indonesia 102 29 65 61 77 68 681
Japan 330 77 82 76 99 4.4 19860
Malaysia 58 43 72 66 78 25.6 2995
N. Korea 189 60 73 67 99 27.7 1000
Pakistan 143 32 58 57 35 101 406
Philippines 221 43 68 63 90 51 867
S. Korea 447 72 74 68 96 21.7 6627
Singapore 4456 100 79 73 88 5.7 14990
Taiwan 582 71 78 72 91 5.1 7055
Thailand 115 22 72 65 93 37 1800
Vietnam 218 20 68 63 88 46 230
Sumber data : Contoh data SPSS world95.sav

Ketrangan variabel :
Variabel Penjelasan
Density Banyaknya penduduk per km persegi
Urban Persentase penduduk yang tinggal di perkotaan
Lifeexpf Harapan hidup penduduk perempuan (tahun)
Ligeexpm Harapan hidup penduduk laki-laki (tahun)
Literacy Persentase penduduk yang bisa baca-tulis
Babymort Banyaknya kematian bayi per 1000 kelahiran
Gdp_cap Penghasilan penduduk per kapita pertahun (US$)

1. Periksa kemultinormalan data kependudukan negara-negara di Asia


dengan
a. Menggunakan q-q plot dari nilai

d i2   X i  X)' S 1 ( X i  X , i  1,..., n
b. Menggunakan multivariate skewness dan multivariate kurtosis
2. Apakah data di atas layak dianalisis dengan menggunakan analisis
statistika multivariate
3. Tentukan negara-negara yang dianggap outlier, jika ada outlier maka
hapus negara yang paling outlier (Nilai sig_f paling kecil) kemudian

198
lakukan pengujian kemultinormalan melalui multivariate skewness dan
kurtosis.
4. Dengan menggunakan variabel yang sama, ujilah apakah matriks varians-
kovarians Afrika sama dengan Amerika Latin atau tidak , jika tidak sama,
coba lakukan penghapusan beberapa negara yang dianggap outlier

199
Penyelesaian
1a.  1

q-q plot dari nilai d i  X i  X)' S ( X i  X , i  1,..., n untuk data
2

kependudukan negara-negara di Asia adalah :

MTB > %qq.txt c2-c8

t 0.529412
distribusi data multinormal
 1

q-q plot dari nilai d i  X i  X)' S ( X i  X , i  1,..., n cenderung
2

membentuk garis kurus dan ada lebih dari 50 % (52.9412 %) nilai


d i2   p2 , 0.50 sehingga data diatas cenderung berdistribusi multinormal.

1b. Pemeriksaan kemultinormalan data melalui multivariate skewness dan


kurtosis adalah :
MTB > %mardia.txt c2-c8
Multivariate skewness
b1 33.2386
z1 115.612
pvalue 0.0126605
Multivariate kurtosis
b2 60.5424
z2 -0.451353
pvalue 0.651735

Pvalue untuk statistik uji multivariate skewness lebih kecil dari


sehingga data kependudukan negara-negara di Asia cenderung
tidak berdistribusi multinormal

200
2. Kelayakan penggunaan analisis statistika multivariate dapat dikaji melalui
dua sisi yaitu sisi terapan dan sisi statistika. Dari sisi terapan dapat
ditunjukkan bahwa berdasarkan referensi disiplin ilmu kependudukan,
variabel-variabel di atas memang saling terkait satu dengan yang lainnya.
Dari disiplin ilmu statistika, keeratan hubungan antar variabel dapat
dilakukan melalui pengujian terhadap matriks korelasi. Apakah matriks
korelasinya membentuk matriks identitas atau tidak, jika matriks
korelasinya setelah diuji berbeda secara significant dengan matriks
identitas maka dapat disimpulkan bahwa ada hubungan antar variabel.
Sehingga data ini layak di analisis dengan menggunakan analisis statistika
multivariate. Jika matriks korelasinya setelah diuji tidak berbeda dengan
matriks identitas, maka diduga sampel yang diperoleh tidak cukup,
sehingga disarankan untuk menambah sampel. Diharapkan setelah
dilakukan penambahan sampel maka hasil pengujian matriks korelasi
berbeda dengan matriks identitas. Karena dari hasil pengujian Bartlett
sphericity dapat disimpulkan perlunya penambahan sampel maka uji ini
disebut juga uji kecukupan sampel. Dengan bantuan MINITAB pengujian
ini dapat diilakukan dengan cara :
MTB > %bart.txt c2-c8

chis 178.398
pvalue 0

pvalue dari statistik uji Bartlett sphericity lebih kecil dari 5 %) sehingga
dapat disimpulkan matriks korelasi antar variabel berbeda dengan matriks
identitas. Karena matriks korelasi bukan merupakan matriks identitas
maka analisis statistika multivariate layak untuk digunakan.

201
 n  p  1 nd i2
3. Suatu pengamatan diakatakan outlier jika nilai Fi 
p n  1 npd i2
2

melampaui Fi  F ; p ,n  p 1 , dengan menggunakan macro MINITAB hal


ini dapat diselesaikan dengan cara :

MTB > %outlier.txt c1-c8

Row COUNTRY d f_value sig_f

1 Afghanistan 10.9875 3.4699 0.043306


2 Bangladesh 4.8952 0.6192 0.729851
3 Cambodia 4.7223 0.5874 0.752289
4 China 5.4980 0.7394 0.646985
5 Hong Kong 11.0696 3.5676 0.040074
6 India 4.6708 0.5781 0.758837
7 Indonesia 1.6888 0.1624 0.987188
8 Japan 13.6454 12.4126 0.000564
9 Malaysia 6.0117 0.8543 0.572647
10 N. Korea 5.2646 0.6911 0.679801
11 Pakistan 10.5513 3.0096 0.063477
12 Philippines 2.8156 0.2957 0.938851
13 S. Korea 5.9621 0.8427 0.579908
14 Singapore 9.4582 2.1713 0.138178
15 Taiwan 4.6465 0.5738 0.761898
16 Thailand 5.4036 0.7196 0.660353
17 Vietnam 4.7088 0.5849 0.754010

Ada 3 negara yang dianggap outlier yaitu Jepang, Hongkong dan


Afganistan. Hasil pengujian kemultinormalan setelah Jepang dikeluarkan
adalah :
MTB > delete 8 c1-c8
MTB > %mardia.txt c2-c8

Multivariate skewness
b1 30.1551
z1 99.8985
pvalue 0.113626

Multivariate kurtosis

b2 56.8194
z2 -1.10122
pvalue 0.270800

202
Setelah Jepang dikeluarkan, ternyata data kependudukan Negara-negara di
Asia berdistribusi multinormal. Dari contoh ini dapat ditunjukkan bahwa
adanya outlier dapat menyebabkan data tidak berdistribusi multinormal.
4. Pengujian kesamaan matriks varians-kovarian untuk region Afrika dan
Amerika Latin dapat dilakukan dengan cara :
- Memilih negara-negara di region Afrika dan Amerika Latin
klik Data, Select Cases

kemudian klik if dan ketik region=4 or region=6

203
klik Continue kemudian OK
- Melakuan pengujian kehomogenan matriks varians-kovarians
klik Analyze, Clasify, Discriminant

klik Statistics

klik Continue kemudian OK


Test Results
Box's M 70.555
F Approx. 2.015
df1 28
df2 4918.900
Sig. .001
Tests null hypothesis of equal population covariance matrices.

Nilai significance statistik uji Box-M lebih kecil dari 5%, sehingga
disimpulkan matriks varians-kovarians region Afrika dan Amerika Latin
tidak homogen, di duga ketidakhomogenan ini disebabkan adanya outlier.

204
Deteksi outlier Negara-negara di Afrika dan Amerika Latin adalah :

MTB > %outlier.txt c1-c8

Row COUNTRY d f_value sig_f


2 Barbados 30.0922 17.3411 0.000000
5 Brazil 13.2080 2.4330 0.040604
34 Somalia 15.7276 3.2245 0.010578
40 Zambia 16.9353 3.6709 0.005090

Hasil pengujian kehomogenan matriks varians-kovarians setelah Barbados


dikeluarkan adalah :

Test Results

Box's M 55.121
F Approx. 1.564
df1 28
df2 4741.799
Sig. .030
Tests null hypothesis of equal population covariance matrices.

Hasil pengujian kehomogenan matriks varians-kovarians setelah Barbados


dan Zambia dikeluarkan adalah :

Test Results
Box's M 51.217
F Approx. 1.441
df1 28
df2 4403.414
Sig. .062
Tests null hypothesis of equal population covariance matrices.

Setelah Barbados dan Zambia dikeluarkan maka matriks varians-kovarians


sudah bersifat homogen pada . Seandainya setelah dilakukan
pembuangan data outlier matriks varians-kovarians belum bersifat
homogen maka dapat dicoba dilakukan transfor-masi Box-Cox dengan
mencobakan berbagai nilai  Hasil transformasi ini tidak selalu berhasil
menghomogenkan matriks varians-kovarians. Jika matriks varians-

205
kovarians tidak bisa dihomogenkan maka dapat dilakukan metode
statistika yang lain yang tidak membutukan asumsi ini.

206
Lampiran 1. Macro MINITAB untuk memeriksa kemultinormalan DATA

 1

dari q-q plot nilai d i  X i  X)' S ( X i  X , i  1,..., n
2

macro
qq x.1-x.p
mconstant i n p t chis
mcolumn d x.1-x.p dd pi q ss tt
mmatrix s sinv ma mb mc md
let n=count(x.1)
cova x.1-x.p s
invert s sinv
do i=1:p
let x.i=x.i-mean(x.i)
enddo
do i=1:n
copy x.1-x.p ma;
use i.
transpose ma mb
multiply ma sinv mc
multiply mc mb md
copy md tt
let t=tt(1)
let d(i)=t
enddo
set pi
1:n
end
let pi=(pi-0.5)/n
sort d dd
invcdf pi q;
chis p.
plot q*dd
invcdf 0.5 chis;
chis p.
let ss=dd<chis
let t=sum(ss)/n
print t
if t>0.5
note distribusi data multinormal
endif
if t<=0.5
note distribusi data bukan multinormal
endif
endmacro

207
Lampiran 2. Macro MINITAB untuk menguji kemultinormalan data melalui
multivariate skewness dan multivariate kurtosis
macro
mardia y.1-y.p
mconstant i j n p g b1 b2 z1 z2 zz v pp pvalue
mcolumn x.1-x.p y.1-y.p z.1-z.p t
mmatrix s sinv mi mj mjt ma mat mb mc md
let n=count(y.1)
do i=1:p
let x.i=y.i-mean(y.i)
let z.i=x.i/sqrt(n)
enddo
copy z.1-z.p ma
transpose ma mat
multiply mat ma s
invert s sinv
let b1=0
let b2=0
do i=1:n
copy x.1-x.p mi;
use i.
do j=1:n
copy x.1-x.p mj;
use j.
transpose mj mjt
multiply mi sinv mc
multiply mc mjt md
copy md t
let g=t(1)
let b1=b1+g*g*g
if i=j
let b2=b2+g*g
endif
enddo
enddo
let b1=b1/(n*n)
let b2=b2/n
let z1=(p+1)*(n+1)*(n+3)*b1/(6*((n+1)*(p+1)-6))
let z2=(b2-p*(p+2))/sqrt(8*p*(p+2)/n)
let v=p*(p+1)*(p+2)/6
note Multivariate skewness
cdf z1 pp;
chis v.
let pvalue=1-pp
print b1 z1 pvalue
note Multivariate kurtosis
let zz=abs(z2)
cdf zz pp;
normal 0 1.
let pvalue=2*(1-pp)
print b2 z2 pvalue
endmacro

208
Lampiran 3. Macro MINITAB untuk menguji kebebasan antar variabel dengan
Bartlett sphericity test

macro
bart x.1-x.p
mconstant i n p d chis pp pvalue v
mcolumn x.1-x.p eigen
mmatrix r
let n=count(x.1)
corr x.1-x.p r
eigenvalues r eigen
let d=0
do i=1:p
let d=d+loge(eigen(i))
enddo
let chis=-(n-1-(2*p+5)/6)*d
let v=p*(p-1)/2
cdf chis pp;
chis v.
let pvalue=1-pp
print chis pvalue
endmacro

209
Lampiran 4. Macro MINITAB untuk mendeteksi adanya multivariete outlier

macro
outlier obs y.1-y.p
mconstant i n p df
mcolumn d x.1-x.p y.1-y.p dd pi f_value tt obs p1 sig_f
mmatrix s sinv ma mb mc md
let n=count(y.1)
cova y.1-y.p s
invert s sinv
do i=1:p
let x.i=y.i-mean(y.i)
enddo
do i=1:n
copy x.1-x.p ma;
use i.
transpose ma mb
multiply ma sinv mc
multiply mc mb md
copy md tt
let d(i)=tt(1)
enddo
let f_value=((n-p-1)*n*d)/(p*(n-1)**2-n*p*d)
let df=n-p-1
cdf f_value p1;
f p df.
let sig_f=1-p1
print obs d f_value sig_f
endmacro

210

Anda mungkin juga menyukai