LAPORAN PRAKTIKUM
ANALISIS DATA KATEGORIK
Modul 2 : Analisis Tabel Kontigensi dan Uji Independensi
JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS ISLAM INDONESIA
YOGYAKARTA
2019
Daftar Isi
Halaman Sampul.......................................................................................................i
Daftar Isi..................................................................................................................ii
Daftar Gambar........................................................................................................iii
1 Pendahuluan.....................................................................................................1
1.1 Tabel Kontigensi.......................................................................................1
1.2 Tabel Kontigensi dengan Cara Matrik......................................................1
1.3 Analisis Loglinear.....................................................................................2
2 Deskripsi Kerja................................................................................................3
2.1 Studi Kasus................................................................................................3
2.2 Langkah Kerja...........................................................................................4
3 Pembahasan....................................................................................................12
4 Penutup..........................................................................................................23
5 Daftar Pustaka................................................................................................25
ii
Daftar Gambar
iii
1
iv
2 Pendahuluan
1
> round(rowpct,2)
(Nugraha, 2013)
2.3 Analisis Loglinear
Model loglinear adalah salah satu kasus khusus dari Generalized Linear
Model (GLM). Analisis Loglinear merupakan pengembangan dari analisis tabel
kontingensi dua arah atau lebih. Walaupun model loglinear dapat digunakan
untuk menganalisa hubungan antara dua variabel kategorik (tabel kontingensi dua
arah), tetapi biasanya digunakan untuk mengevaluasi multi arah dari tabel
kontingensi yang melibatkan tiga atau lebih variabel. Dalam analisis ini tida
membedakan antara variabel respon dan prediktornya. Oleh karena itu, hanya
model loglinear menunjukkan hubungan antara variabel-variabel.
Estimasi parameter dilakukan menggunakan data sampel salah satu metode
yang digunakan untuk mengestimasi parameter adalah maximum likelihood
estimator (MLE). Terdapat dua cara untuk inferensi parameter ƛ, yaitu metode
exsak dan metode pendekatan distribusi normal. Metode eksak digunakan pada
sampel kecil dan metode pendekatan distirbusi normal digunakan ketika jumlah
sampel besar. Dalam inferensi statistik, kita mengenal nilai α yang merupakan
probabilitas kesalahan tipe I yang biasa disebut dengan tingkat signifikansi. Untuk
menguji hipotesis H0, peneliti menetapkan nilai α yang digunakan. Nilai α terkecil
sedemikian hingga dapat menolak H0 disebut P-value. [ CITATION Jak16 \l 1057 ]
Jika persamaan tersebut dinyatakan dalam bentuk logaritma, maka didapatkan:
𝐿𝑜𝑔𝑚𝑖𝑗 = log 𝑛++ + log 𝜋𝑖+ + log 𝜋+𝑗 atau
A b C AB AC BC ABC
Log(ijk)=λ+ λi + λ j + λ k + λ ij + λik + λ jk + λ ijk
2
3 Deskripsi Kerja
1. Terdapat data tentang jenis kelamin dengan pemilihan kandidat calon ketua
LEM. Seseorang dengan jenis kelamin laki-laki yang memilih kandidat A
sebanyak 201 orang dan yang memilih kandidat B sebanyak 405 orang.
Sedangkan seseorang dengan jenis kelamin perempuan yang memilih
kandidat A sebanyak 417 orang dan yang memilih kandidat B sebanyak 391
orang.
a. Buatlah tabel kontigensi dengan menggunakan cara matrik dan
dataframe menggunakan software R
b. Hitunglah total sampel dan proporsi masing-masing sel
c. Hitunglah total masing-masing baris dan kolom serta proporsi
terhadap masing-masing total baris dan kolom
d. Apakah terdapat hubungan antara jenis kelamin dengan kandidat
yang dipilih ?
e. Hitung nilai odds yang memilih kandidat A untuk laki-laki dan
perempuan
f. Hitung rasio odds (OR) untuk memilih kandidat A serta
interpretasikan hasilnya
2. Berikut hasil data penggunaan obat dalam mengatasi sakit kepala. Dari data
dibawah ini, apakah ada hubungan antara jenis obat dengan kesembuhan sakit
kepala. Buatlah dengan menggunakan software SPSS.
3
Ya Tidak
Bodrek 90 45
Paramex 32 93
3. Penelitian dilakukan terhadap pelajar SMA. Survey berkaitan dengan
strata sosial, pendidikan orang tua, dan rencana studi lanjut.
Pendidikan Rencana studi lanjut
Strata sosial
orang tua Tidak Ya
Rendah 749 35
Pra Sejahtera
Tinggi 233 133
Rendah 627 38
Sejahtera 1
Tinggi 330 303
Rendah 420 37
Sejahtera 2
Tinggi 374 467
4
Gambar 2.2 Lembar Kerja RStudio
5
Gambar 2.4 Menghitung proporsi
7. Selanjutnya praktikan akan bekerja menggunakan spss , setelah input data lalu
memilih dataweight cases memasukkan variabel frekuensi pada kolom
weight cases by:
6
Gambar 2.9 Input Data
7
Gambar 2.12 Memilih menu analyze
8
Gambar 2.15 Menu Cells
9
Gambar 2.18 Menu weight cases
10
12. Selanjutnya praktikan akan menganalisis kasus kedua, untuk
melakukan uji log linier. Praktikan mengklik menu analyze loglinear
model selection.
11
Gambar 2.23 Menu loglinear
4 Pembahasan
Pada kesempatan kali ini praktikan akan membahas beberapa studi kasus
yang diberikan berdasarkan deskripsi kerja yang telah praktikan lakukan. Dari
langkah-langkah kerja yang telah praktikan lakukan, masing-masing kasus dapat
dijelaskan dan diinterpretasikan berdasarkan output yang dihasilkan oleh software
R dan SPSS. Maka di sinilah praktikan akan membahas dan menganalisis lebih
rinci lagi kasus-kasus yang diberikan.
12
Gambar 3.25 Output Kasus 1b
Pada Gambar 3.2 dapat dilihat hasil outputnya yaitu 1414 total laki laki dan
perempuan yang memilih kandidat A dan B, hasil proporsi laki-laki yang memilih
kandidiat A sebesar 0.14 atau 14%, proporsi laki-laki memilih kandidat B sebesar
0,28 atau 28%, proporsi perempuan memilih kandidat A sebesar 0.29 atau 29%,
dan proporsi perempuan mimilih kandidat B yaitu 0,27 atau 27%. Kemudia
praktikan diminta untuk menghitung total masing-masing baris dan kolom serta
proporsi terhadap masing-masing total baris dan kolom sebagai berikut :
Dari hasil output didapatkan pemilih laki-laki sebanyak 606 orang dan
pemilih perempuan sebanyak 808 orang, sedangkan pemilih kandidat A sebanyak
618 orang dan pemilih kandidat B sebanyak 796 orang. Selanjutnya proporsi laki-
laki yang memilih kandidat A dari keseluruhan pemilih laki-laki 0.33 atau 33%,
proporsi laki-laki yang memilih kandidat B dari keseluruhan pemilih laki-laki
0.66 atau 66%, proporsi perempuan yang memilih kandidat A dari keseluruhan
13
pemilih perempuan 0.51 atau 51%, dan proporsi perempuan yang memilih
kandidat B dari keseluruhan pemilih laki-laki 0.48 atau 48%. Lalu proporsi
kandidat A dipilih oleh laki-laki sebanyak 0.32 atau 32%, proporsi kandidat B
dipilih oleh laki-laki sebanyak 0.50 atau 50%, proporsi kandidat A dipilih oleh
perempuan sebanyak 0.67 atau 67%, dan proporsin kandidat B dipilih oleh
perempuan sebanyak 0.49 atau 49%. Selanjutnya praktikan diminta untuk
mencari apakah ada hubungan antara jenis kelamin dengan kandidat yang dipilih
dengan melihat hasil chi square berikut :
v. Keputusan
Tolak H0 karena p-value < α yaitu 6.696 x10-12 < 0.05
vi. Kesimpulan
14
Dengan menggunakan tingkat kepercayaan 95% maka data yang
ada Tolak H0 yang artinya tidak ada hubungan antara jenis kelamin
mempengaruhi kandidat bersifat dependen
Selanjutnya peraktikan diminta untuk menghitung nilai odds yang memilih
kandidat A untuk laki-laki dan perempuan.
15
Paramex 32 93
Dari hasil analisis menggunakan SPPS didaptkan hasil sebagai berikut :
16
value 5.813 nilai bodrex karena lebih baik, nilainya berada direntang 3.394 dan
9.954
17
H0 = Efek orde ke-i dan yang lebih tinggi =0 (tidak ada pengaruh interaksi
dari orde ke-i dan yang lebih tinggi) ; i= 1,2,3
H1= Efek orde ke-i dan yang lebih tinggi ≠0 (ada pengaruh interaksi dari
orde ke-i dan yang lebih tinggi) ; i=1,2,3
2. Tingkat signifikansi
Untuk semua K (1,2,3) menggunakan α = 5%
3. Daerah Kritis
H0 ditolak jika p-value < α
4. Statistik Uji
6. Kesimpulan
Dengan tingkat kepercayaan 95% data yang ada menjelaskan bahwa orde
atau k=1 dan k=2 memiliki pengaruh interaksi yang tidak sama dengan 0.
Sedangkan k=3 tidak memiliki pengaruh interaksi yang tidak sama dengan
0.. Sehingga diperoleh model :
log ( μij )= λ+ λ s+ λ p + λ r + λ sp + λsr + λ pr
18
H1= Efek interaksi antara variabel ≠0 (Interaksi antar berbagai peubah
terkandung dalam model)
2. Tingkat Signifikansi
α = 5%
3. Daerah kritis
H0 ditolak jika p-value < α
4. Statistik Uji
5. Keputusan
6. Kesimpulan
19
Dengan menggunakan tingkat kepercayaan 95% diperoleh bahwa
model S*R, S*P, R*P, S, dan R, maka diperoleh kesimpulan :
a. Ada efek interaksi antara variabel strata sosial dengan rencana
studi lanjut.
b. Ada efek interaksi antara variabel strata sosial dengan pendidikan.
c. Ada efek interaksi antara variabel rencana studi lanjut dengan
pendidikan.
d. Ada efek interaksi antara variabel strata sosial.
e. Tidak ada efek interaksi antara variabel pendidikan.
f. Ada efek interaksi antara variabel rencana studi lanjut.
20
Step Summary
Chi- Number of
a c
Step Effects Square df Sig. Iterations
Deleted 1
strata*rencana_studilanjut*pendidikan .624 2 .732 5
Effect
5. Keputusan
Dengan menggunakan tingkat kepercayaan 95% diperoleh bahwa p-
value (0.732) > 0.05, maka gagal tolak H0, model 1 adalah model yang
s r sp sr pr
terbaik yaitu :log ( μij )= λ+ λ + λ + λ + λ + λ
21
5. Keputusan
6. Kesimpulan
Dengan menggunakan tingkat kepercayaan 95%, maka model
S*R,S*P,R*P,S,R tolak H0 yang berarti pola hubungan signifikan atau
parameter signifikan dalam model, maka model yang didapat adalah:
log ( μij )= λ−0.19 s +0.723r + 0.293sp +0.179+0.653 pr
22
4. Statistik Uji
5. Keputusan
p-value (0.730) > 0.05, maka gagal tolak H0.
6. Kesimpulan
Dengan tingkat kepercayaan 95 % data yang ada menjelaskan bahwa
model sesuai untuk digunakan.
23
5 Penutup
24
f. laki-laki dan perempuan yg memilh kandidat A sebesar 0.46 atau 46%
lebih banyak dibanding pemilih kandidat B
2. dilihat 135 orang menggunakan obat bodrex dimana 90 diantaranya
sembuh dari sakit kepala dan 45 orang lainnya tidak sembuh, selanjutnya
dari 125 orang menggunakan obat paramex 32 diantarnya sembuh dari
sakit kepala dan 93 orang lainnya tidak sembuh. Kemudian nilai p-value
5.813 nilai bodrex karena lebih baik, nilainya berada direntang 3.394 dan
9.954.
3. Uji k-way and Higher- Order Effects didapatkan model jenuh
log ( μij )= λ+ λ s+ λ p + λ r + λ sp + λsr + λ pr
uji asosiasi parsial didapatkan model
log ( μij )= λ+ λ s+ λr + λsp + λ sr + λ pr
Uji Backward Elimination model terbaik yang didapatkan adalah
25
6 Daftar Pustaka
26
27
28