Tujuan :
Asosiasi dua peubah dapat dimaknai sebagai penjabaran dari hubungan dua
peubah data. Hubungan tersebut dapat berupa hubungan linear saja atau hubungan
kausalitas (hubungan sebab – akibat). Hubungan linear antara dua peubah data ini
sering disebut dengan korelasi sedangkan hubungan kausalitas (sebab – akibat) antara
dua peubah data sering disebut dengan regresi. Analisis mengenai keterkaitan (asosiasi)
antara satu peubah (variable) dengan satu atau lebih peubah lain merupakan analisis
mendasar dalam banyak penelitian hayati maupun sosial.
Tipe Data
Hubungan X dan Y Pendekatan
Peubah I (X) Peubah II (Y)
Analisis frekuensi
Kategorik Kategorik Tidak selalu kausal
(non parametrik)
Analisis korelasi
Numerik acak Numerik acak Tidak selalu kausal
(Y~X)
1. Analisis Frekuensi
Analisis frekuensi dilakukan untuk mengetahui keterkaitan antara dua atau lebih
peubah kategorik, misalnya antara jenis kelamin dan kebiasaan merokok. Ada atau
tidaknya hubungan sebab-akibat (kausal) antara peubah yang dilibatkan tidak diberi
perhatian dalam analisis ini. Analisis frekuensi untuk pengujian independensi (untuk
mengetahui ada atau tidaknya hubungan peubah) dapat dilakukan dengan prosedur
Chi-square. Sebagai contoh Ahmad ingin melakukan survei terhadap beberapa orang
Apabila ingin menguji keterkaitan dalam satu variable maka dapat digunakan uji
keselarasan atau goodness of fit test. Sebagai contoh Samsul ingin melakukan pengujian
perbandingan generasi pertama silang balik (BC1) dengan tetua resesif rentan untuk
mengetahui apakah hasil pengujiannya sesuai dengan Hukum Mendel atau tidak
(lembar kerja).
2. Analisis Korelasi
Korelasi antara dua peubah, sebut saja Y dan X dihitung apabila diinginkan
mengukur derajat asosiasi (hubungan) antara dua peubah. Korelasi tidak berdimensi,
bernilai dari -1 sampai 1. Semakin mendekati -1 atau 1 maka hubungan antara kedua
variabel tersebut kuat. Korelasi dalam bahasa statistika menunjukkan apakah dua
peubah memiliki hubungan linear. Hubungan linear yang dimaksud adalah hubungan
linear positif (Kenaikan peubah 1 menyebabkan peubah 2 juga naik) atau linear negatif
Korelasi sering dilambangkan dengan rxy dengan rumus dan interpretasi sebagai
berikut.
-1
0 1
Hub. Negatif
Independen (tdk Hub. Positif
(var x naik, var y turun
memiliki hubungan) (var x naik, var y juga naik)
dan sebaliknya)
Berikut adalah salah satu contoh penggunaan korelasi dalam kehidupan sehari-
hari.
peubah 1 (datar) dan penjualan es teh merupakan peubah 2 (tegak), lalu disajikan dalam
*note : scatter yang kanan itu menggambarkan kalau suhu terus meningkat drastis
akhirnya orang2 males keluar terus penjualan es malah turun. Jadinya suhu naik tp
penjualan turun.
Nilai korelasi antara kedua variabel tersebut adalah 0,9575 yang berarti kuat,
linear positif. Namun, korelasi tidak menjelaskan hubungan antara dua peubah yang
berpola selain linear. Kita masih mengambil contoh dari suhu dan penjualan es teh,
bayangkan jika suhu di Yogyakarta meningkat drastis dalam beberapa hari. Efeknya
adalah banyak orang yang merasa malas keluar dari rumah untuk membeli es teh. maka
diagram tebarnya menjadi seperti sajian tebar di sisi kanan (perhatikan nilai koefisien
korelasinya).
Hubungan antara kedua peubah dilihat secara numerik kuat, penyebabnya ada
dua kemungkinan:
o Korelasi antara Peubah 1 dan 2 kuat karena memang mereka terkait langsung
regresi dapat digunakan untuk menentukan apakah pertambahan bobot ikan lele
independen). Pada pemodelan regresi, dikenal pula istilah koefisien determinasi (R2)
yang menunjukkan persentase variasi y (peubah dependen) yang dapat dijelaskan oleh
seluruh variabel X (peubah independen) secara bersama. R2 selalu bernilai positif (karena
merupakan nilai kuadrat) dengan nilai di antara 0 dan 1. Semakin tinggi nilai R2 semakin
baik.
Apabila hubungan peubah X mempengaruhi peubah Y dapat ditegakkan secara
untuk melihat pengaruh X yang bukan garis lurus tetapi polinom derajat dua.
Menjadi dasar modeling untuk memprediksi (prakira) sesuatu yang akan terjadi
tertentu.
Regresi dapat pula digunakan untuk studi segmentasi. Pola-pola regresi yang
berbeda untuk setiap segmen pasar atau lingkungan dapat digunakan sehingga
tersebut. Ini akan membantu dalam menentukan pola kecende-rungan atau nilai
Persamaan regresi :
Keterangan :
Y : variable dependen/regressand
X : variable independen/regressor
a : intercept (konstan)
b : slope
R2 : koefisien determinasi
determinasi, yaitu menyatakan persen dari nilai Y yang dideterminasi (ditentukan) oleh
Dihitung nilai dari regresi tinggi tanaman dan intensitas penyiraman air dalam sehari,
Y : tinggi tanaman
120
100
80
y = -2.1698x + 99.255
60 R² = 0.3393
40
20
0
0 2 4 6 8 10 12
Interpretasi : Setiap kenaikan 1 kali intensitas penyiraman air dalam sehari akan
menurunkan tinggi tanaman sebesar 2.1698 kali. Intensitas penyiraman menentukan
tinggi tanaman atau mempengaruhi tinggi tanaman sebesar 33.93 % sedangkan 66.07
% dipengaruhi oleh faktor lain (selain intensitas penyiraman – bisa banyak pupuk,
cahaya matahari dll).
4. Asumsi Model Linear (Regresi dan Anova Klasik)
Pernyataan εij ~ N (0,σ2) merupakan asumsi dasar dalam model liner (baik regresi liner
dan ANOVA klasik). Asumsi tersebut adalah bahwa komponen sesatan dari data
regresi dan anova klasik harus dilakukan uji asumsi terlebih dahulu (uji normalitas dan
uji homoskedastisitas). Kemudian apabila uji asumsi sudah terpenuhi selanjutnya dapat
dilakukan uji regresi atau anova klasik. Untuk uji independensi dianggap sudah
a. Uji normalitas
Untuk menguji asumsi normalitas, dapat digunakan berbagai cara seperti uji goodness-
membuat quantile-to-quantile plot/QQ plot. Namun pada metode QQ plot sering kali
Wilk’s test
Uji ini dilakukan dengan membandingkan peluang munculnya suatu nilai data
(atau penduga sesatannya) dengan peluang distribusi normal untuk nilai tersebut. Jika
selalu berdekatan peluangnya, maka distribusinya normal. Pengujian yang biasa dipakai
Dari suatu kolom analisis varians, ambillah data asli dan simpan sebagai data
> shapiro.test(namaoutput$residual)
Perintah di atas akan menghasilkan statistik Wilk dan probabilitas menerima H 0-
nya. Prosedur ini menguji H0 bahwa data mengikuti sebaran normal. Untuk diketahui,
penggunaan uji ini tidak diperlukan jika QQ plot sudah menunjukkan distribusi normal.
Terkadang derajat bebas yang terlalu besar menyebabkan uji ini menyimpulkan
distribusi tidak normal. Apabila jumlah perlakuan lebih dari lima (treatment > 5) maka
> shapiro.test(namadata$namavariabel)
Cara 2. Menggunakan plot kurva (QQ plot)
Teknik lain, yang berbasis kurva, adalah dengan membuat plot kuantil vs. kuantil
kuantil dapat dinilai kenormalan sebaran. Apabila sebaran data mengikuti garis lurus,
maka sebaran itu mendekati normal. Ketiklah baris perintah berikut dan simpan grafik
yang muncul ke dalam format gambar (TIFF atau .jpg). Berikut perintah di R untuk
menghasilkan QQ plot dengan package car.
> car::qqPlot(namadata$namavar,dist=”norm”)
Berikut ada contoh QQ plot yang mengindikasikan asumsi normalitas tidak terpenuhi.
Perrhatikan titik-titik yang ada tidak mengikuti garis merah yang miring ke kanan dan
banyak titik-titik berada di luar garis selang kepercayaan (garis putus- putus/dashed
line)
Gambar dibawah merupakan contoh jika asumsi normalitas terpenuhi. Perhatikan bahwa
titik-titik tersebar mengikuti garis merah dan sebagian besar titik-titik tersebut berada
dalam garis selang kepercayaan (garis putus-putus/dashed line)
*Jika data tidak mengikuti distribusi normal, lakukan analisis varians untuk distribusi
b. Uji homoskedastisitas
Asumsi ini cukup mempengaruhi kekuatan uji analisis varians. Penyimpangan dari
asumsi kehomogenan varians-varians grup perlakuan akan membuat kita perlu
melakukan bentuk analisis alternatif. Untuk data yang menggunakan uji t, pengujian
homoskedasitas dapat dilakukan dengan uji F jika perlakuannya dua. Namun, untuk
ANOVA klasik yang perlakuannya lebih dari dua, maka uji homoskedatisitas dilakukan
dengan Uji Hartley (CRD dengan jumlah ulangan yang sama) atau Uji Bartlett (CRD
dengan jumlah ulangan bebas). Selain itu, terdapat pula Uji Levene dapat digunakan
untuk data dengan rancangan apa saja (tidak terdapat pada praktikum ini).
menggunakan metode Breusch dan Pagan (1979) yang menggunakan metode skoring
untuk uji homoskedastisitas varians. Metode ini dapat digunakan untuk memeriksa
homoskedastisitas varians untuk regresi liner dan ANOVA klasik. Metode levene pada R
tidak dapat digunakan untuk metode regresi sehingga pada praktikum ini akan
digunakan metode Breusch dan Pagan. Perintah untuk melakukan metode tersebut
adalah sebagai berikut. Jika P-value hasil uji tersebut di atas 0.05 berarti asumsi
homoskedastisitas terpenuhi.
> car::ncvTest(model)
Cara lain adalah dengan melihat plot diagnostik pada bagian Residual vs. Fitted
value atau Standardised residual vs. Fitted value. Jika titik-titik pada grafik ini menyebar
tanpa pola, maka asumsi terpenuhi. Jika terdapat pola tertentu, terutama pola
dilihat apakah ada hubungan fungsional antara rerata-rerata dengan variansnya masing-
masing. Jika hubungan ini terdeteksi, lakukanlah transformasi data (transformasi data
akan dibahas pada acara berikutnya). Jika tidak ada hubungan antara rerata dan varians,
analisis varians untuk varians tidak homogen (tidak dibahas dalam mata kuliah ini, tapi
tersedia di R), atau uji-uji nonparametrik dilakukan (misalnya Uji Kruskal-Wallis untuk
ANOVA satu-arah).
Uji Kruskal-Wallis (optional, diberikan atau tidak dalam praktikum)
Analisis ini menggunakan peringkat (rank) data. Berbeda dengan ANOVA yang
bahwa apabila asumsi normalitas terpenuhi, uji Kruskal-Wallis tidak sebaik ANOVA.
Dalam uji Kuskal-Wallis, tetap diperlukan berbagai asumsi yaitu: (1) sampel ditarik
dari populasi secara acak; (2) kasus masing-masing kelompok independen; (3) skala
khi- kuadrat (2). Jika nilai uji lebih kecil daripada nilai tabel atau probabilitas lebih besar
daripada α, maka Ho diterima, artinya median beberapa populasi seragam.
>kruskal.test(model)
Latihan. Lakukanlah Uji Asumsi (Uji Normalitas Sesatan Data dan Uji Homoskedasitas
Sesatan Data) pada data dat.crd yang telah dianalisis varians (anova) CRD!
Skema Penggunaan Model Linear Secara Umum