Analisis Asosiasi
Sebelum mendalami lebih lanjut mengenai perluasan percobaan dua perlakuan, ada
baiknya kita mempelajari lebih lanjut bagaimana melakukan analisis statistik antara
dua atau lebih peubah yang saling berkaitan (berasosiasi). Penelitian di bidang
pertanian banyak menggunakan kerangka metodologi ini.
Analisis mengenai keterkaitan (asosiasi) antara satu peubah (variable) dengan satu
atau lebih peubah lain merupakan analisis mendasar dalam banyak penelitian hayati
maupun sosial. Data yang dipakai berasal dari penelitian non-percobaan, seperti survei
dan sensus, maupun penelitian percobaan, baik percobaan semu maupun percobaan
dengan perlakuan terkendali penuh. Dalam penelitian survei atau deskriptif (bukan
penelitian rekomendasi), peubah yang dilihat keterkaitannya biasanya berasal dari
pengamatan langsung. Dalam percobaan untuk memberi rekomendasi, beberapa
peubah merupakan perlakuan. Tabel 1 memberikan rangkuman mengenai pendekatan
analisis yang dilakukan.
Tabel 1. Tipe peubah data dan pendekatan analisisnya.
Tipe data
Hubungan X
Peubah I (X) Peubah II Pendekatan
dan Y
(Y)
Kategorik Kategorik Tidak selalu Analisis frekuensi (non
kausal parametrik)
Numerik acak Numerik Tidak selalu Analisis korelasi (Y~X)
acak kausal
Numerik acak atau fixed Numerik Kausal (X Y) Analisis regresi (Y~X)
acak
Kategorik fixed Numerik Kausal (X Y) Uji-t dan analisis varians
acak (Y~X)
Kategorik fixed dan Numerik Kausal (X Y) Analisis kovarians (Y~X)
numerik acak atau fixed acak (tidak dibahas)
Numerik Kategorik Kausal (X Y) An. regresi logistik (non-
liner) (tdk dibahas)
Analisis regresi dan varians untuk peubah Y yang bersifat kategorik sebenarnya
tersedia, tetapi tidak menjadi lingkup mata praktikum ini. Dalam acara praktikum ini,
akan dibahas analisis frekuensi (kesesuaian model & independensi), korelasi, dan
regresi.
Pengujian independensi
Pengujian ini menguji hipotesis nol bahwa dua (atau lebih) peubah saling bebas
(independen). Kebebasan ini diukur dari apakah frekuensi kombinasi sama dengan
perkalian frekuensi marginal masing-masing peubah, atau dapat ditulis Ho: pAB = pA .
pB. Pengujian menggunakan MsExcel dapat dilihat kembali pada Panduan Praktikum
Statistika. Berikut ini latihan yang dapat dilakukan pada program R. Bukalah file R
dengan nama Acara-2-non-parametrik.R untuk latihan pengujian independensi.
Statistik Parametrik
Statistik parametrik yang diberikan di sini terbatas hanya pada model liner untuk
korelasi, regresi, dan ANOVA klasik. Statistik parametrik lainnya seperti regresi logistik,
model liner campuran (linear mixed model) tidak diberikan di sini.
Analisis korelasi
Pengamatan terhadap dua atau lebih peubah seringkali berangkat dari minat untuk
mengetahui keterkaitan antara peubah-peubah tersebut. Sebagai contoh,
pengamatan terhadap umur berbunga, tinggi tanaman, panjang tongkol, dan hasil
pada jagung. Apabila orang mengetahui keterkaitan antara umur berbunga dan tinggi
tanaman terhadap panjang tongkol dan hasil jagung, sebelum panen sudah dapat
diperkirakan besar-kecil tongkol atau tinggi rendahnya hasil. Hubungan ini belum
tentu dapat dijelaskan secara sebab-akibat, kecuali ada dasar teori yang dapat
menegakkan hubungan sebab-akibat tersebut. Sebagai misal, hubungan antara bobot
dan lingkar lengan bayi, tingkat konsumsi ikan mentah dan panjang usia, dan
sebagainya.
Secara faktual, data menunjukkan hubungan positif pada kedua contoh tersebut,
tetapi hasil itu tidak berimplikasi bahwa salah satu peubah menyebabkan perubahan
pada peubah lainnya. Sebagai contoh, hasil analisis korelasi pearson dapat dibuat
plot matriks korelasi seperti berikut.
Plot matriks korelasi (korelogram) memudahkan kita untuk melihat korelasi antar
variabel. Plot sebelah kanan langsung menunjukkan angka dan warna yang
menunjukkan koefisien korelasi. Semakin merah artinya korelasinya positif dan kuat.
Sedangkan, semakin biru berarti korelasi antar variabel negatif dan kuat. Korelasi yang
lemah ditunjukkan dengan warna yang relatif pudar. Plot di sebelah kanan
menggunakan lingkaran dan warna untuk menunjukkan koefisien korelasi. Semakin
besar lingkaran artinya korelasi antar variabel semakin kuat. Jika lingkaran semakin
kecil berarti korelasi mendekati 0. Warna pada lingkaran menunjukkan sifat korelasi.
Jika berwarna merah berarti sifatnya positif dan jika berwarna biru berarti sifatnya
negatif.
> library(ppcor)
> pcor(nama)
> pcor.test(nama$hasil,nama$gbhpmalai,nama[,c("anakan")])
> pcor.test(nama$hasil,nama$gbhpmalai,nama[,c("anakan",
"b1000gbh")])
> shapiro.test(namaoutput$residual)
Perintah di atas akan menghasilkan statistik Wilk dan probabilitas menerima H0-nya.
Prosedur ini menguji H0 bahwa data mengikuti sebaran normal. Untuk diketahui,
penggunaan uji ini tidak diperlukan jika QQ plot sudah menunjukkan distribusi normal.
Terkadang derajat bebas yang terlalu besar menyebabkan uji ini menyimpulkan
distribusi tidak normal.
Cara 2. Menggunakan plot kurva
Teknik lain, yang berbasis kurva, adalah dengan membuat plot kuantil vs. kuantil
(quantile-to-quantile plot). Kita telah mengenal median, kuartil, atau persentil.
Kesemuanya ini adalah kuantil. Dengan membandingkan sebaran data pada kurva
kuantil dapat dinilai kenormalan sebaran. Apabila sebaran data mengikuti garis lurus,
maka sebaran itu mendekati normal. Ketiklah baris perintah berikut dan simpan grafik
yang muncul ke dalam format gambar (TIFF atau .jpg). Berikut perintah di R untuk
menghasilkan QQ plot dengan package car.
> car::qqPlot(namadata$namavar,dist=norm)
Jika asumsi normalitas terpenuhi maka QQ plot akan terlihat seperti di bawah
ini. Perhatikan bahwa titik-titik tersebar mengikuti garis merah dan sebagian besar
titik-titik tersebut berada dalam garis selang kepercayaan (garis putus-putus/dashed
line)
Jika data tidak mengikuti distribusi normal, lakukan analisis varians untuk distribusi
data yang sesuai, namun topik ini tidak akan dibahas.
untuk uji homoskedastisitas varians. Metode ini dapat digunakan untuk memeriksa
homoskedastisitas varians untuk regresi liner dan ANOVA klasik. Metode levene pada
R tidak dapat digunakan untuk metode regresi sehingga pada praktikum ini akan
digunakan metode Breusch dan Pagan. Perintah untuk melakukan metode tersebut
adalah sebagai berikut. Jika P-value hasil uji tersebut di bawah 0.05 berarti asumsi
homoskedastisitas terpenuhi.
> car::ncvTest(model)
Cara lain adalah dengan melihat plot diagnostik pada bagian Residual vs. Fitted
value atau Standardised residual vs. Fitted value. Jika titik-titik pada grafik ini menyebar
tanpa pola, maka asumsi terpenuhi. Jika terdapat pola tertentu, terutama pola
loudspeaker, maka asumsi homoskedastisitas varians tidak terpenuhi. Perhatikan
contoh grafik di bawah ini.
Perhitungan yang dilakukan menggunakan statistik uji yang mengikuti distribusi khi-
kuadrat (2). Jika nilai uji lebih kecil daripada nilai tabel atau probabilitas lebih besar
daripada , maka Ho diterima, artinya median beberapa populasi seragam.
>kruskal.test(model)