Anda di halaman 1dari 11

Acara 5 : Asosiasi Dua Peubah

Tujuan :

1. Mahasiswa mampu mengulang dan mempelajari analisis asosiasi lebih lanjut


2. Mahasiswa mampu melakukan analisis frekuensi, analisis korelasi, dan

menafsirkan dengan tepat

Asosiasi dua peubah dapat dimaknai sebagai penjabaran dari hubungan dua

peubah data. Hubungan tersebut dapat berupa hubungan linear saja atau hubungan
kausalitas (hubungan sebab – akibat). Hubungan linear antara dua peubah data ini

sering disebut dengan korelasi sedangkan hubungan kausalitas (sebab – akibat) antara

dua peubah data sering disebut dengan regresi. Analisis mengenai keterkaitan (asosiasi)

antara satu peubah (variable) dengan satu atau lebih peubah lain merupakan analisis
mendasar dalam banyak penelitian hayati maupun sosial.

Tabel 4.1 Tipe Peubah Data dan Pendekatan Analisisnya

Tipe Data
Hubungan X dan Y Pendekatan
Peubah I (X) Peubah II (Y)

Analisis frekuensi
Kategorik Kategorik Tidak selalu kausal
(non parametrik)

Analisis korelasi
Numerik acak Numerik acak Tidak selalu kausal
(Y~X)

Numerik acak atau Analisis regresi


Numerik acak Kausal (X  Y)
fixed (Y~X)

1. Analisis Frekuensi

Analisis frekuensi dilakukan untuk mengetahui keterkaitan antara dua atau lebih

peubah kategorik, misalnya antara jenis kelamin dan kebiasaan merokok. Ada atau

tidaknya hubungan sebab-akibat (kausal) antara peubah yang dilibatkan tidak diberi
perhatian dalam analisis ini. Analisis frekuensi untuk pengujian independensi (untuk
mengetahui ada atau tidaknya hubungan peubah) dapat dilakukan dengan prosedur

Chi-square. Sebagai contoh Ahmad ingin melakukan survei terhadap beberapa orang

untuk mengetahui apakah kebiasaan merokok berkaitan dengan timbulnya penyakit


asma pada seseorang (lembar kerja).

Apabila ingin menguji keterkaitan dalam satu variable maka dapat digunakan uji

keselarasan atau goodness of fit test. Sebagai contoh Samsul ingin melakukan pengujian

perbandingan generasi pertama silang balik (BC1) dengan tetua resesif rentan untuk
mengetahui apakah hasil pengujiannya sesuai dengan Hukum Mendel atau tidak

(lembar kerja).

2. Analisis Korelasi

Korelasi antara dua peubah, sebut saja Y dan X dihitung apabila diinginkan
mengukur derajat asosiasi (hubungan) antara dua peubah. Korelasi tidak berdimensi,

bernilai dari -1 sampai 1. Semakin mendekati -1 atau 1 maka hubungan antara kedua

variabel tersebut kuat. Korelasi dalam bahasa statistika menunjukkan apakah dua

peubah memiliki hubungan linear. Hubungan linear yang dimaksud adalah hubungan
linear positif (Kenaikan peubah 1 menyebabkan peubah 2 juga naik) atau linear negatif

(Kenaikan peubah 1 menyebabkan peubah 2 mengalami penurunan).

Korelasi sering dilambangkan dengan rxy dengan rumus dan interpretasi sebagai

berikut.

-1
0 1
Hub. Negatif
Independen (tdk Hub. Positif
(var x naik, var y turun
memiliki hubungan) (var x naik, var y juga naik)
dan sebaliknya)
Berikut adalah salah satu contoh penggunaan korelasi dalam kehidupan sehari-

hari.

Hasil pengamatan di Kota Yogyakarta menunjukkan, apabila suhu semakin panas


diklaim jumlah es teh yang terjual akan semakin banyak. Suhu kita asumsikan sebagai

peubah 1 (datar) dan penjualan es teh merupakan peubah 2 (tegak), lalu disajikan dalam

sajian tebar (scatter plot) sebelah kiri:

*note : scatter yang kanan itu menggambarkan kalau suhu terus meningkat drastis

akhirnya orang2 males keluar terus penjualan es malah turun. Jadinya suhu naik tp
penjualan turun.

Nilai korelasi antara kedua variabel tersebut adalah 0,9575 yang berarti kuat,

linear positif. Namun, korelasi tidak menjelaskan hubungan antara dua peubah yang

berpola selain linear. Kita masih mengambil contoh dari suhu dan penjualan es teh,
bayangkan jika suhu di Yogyakarta meningkat drastis dalam beberapa hari. Efeknya
adalah banyak orang yang merasa malas keluar dari rumah untuk membeli es teh. maka

diagram tebarnya menjadi seperti sajian tebar di sisi kanan (perhatikan nilai koefisien

korelasinya).
Hubungan antara kedua peubah dilihat secara numerik kuat, penyebabnya ada

dua kemungkinan:

o Korelasi antara Peubah 1 dan 2 kuat karena memang mereka terkait langsung

(ini yang kita cari sebenarnya), atau


o Korelasi antara peubah 1 dan 2 kuat karena ada pengaruh peubah lain
3. Analisis Regresi

Analisis regresi merupakan metode yang luas sekali penggunaannya untuk

menggambarkan hubungan sebab akibat (kausalitas) antara peubah dependen (yang


dipengaruhi) dengan peubah independent (yang mempengaruhi). Sebagai contoh,

regresi dapat digunakan untuk menentukan apakah pertambahan bobot ikan lele

(peubah dependen) dipengaruhi oleh volume pelet yang diberikan (peubah

independen). Pada pemodelan regresi, dikenal pula istilah koefisien determinasi (R2)
yang menunjukkan persentase variasi y (peubah dependen) yang dapat dijelaskan oleh

seluruh variabel X (peubah independen) secara bersama. R2 selalu bernilai positif (karena

merupakan nilai kuadrat) dengan nilai di antara 0 dan 1. Semakin tinggi nilai R2 semakin

baik.
Apabila hubungan peubah X mempengaruhi peubah Y dapat ditegakkan secara

teoritis maka analisis regresi dapat dilakukan dengan meregresi Y ke X. berikut

merupakan beberapa macam bentuk regresi :

a) Regresi linear sederhana : apabila peubah Y diregresi ke satu peubah X.


regresi ini membentuk garis lurus pada proyeksi Descartes (castesius)

b) Regresi berganda : digunakan apabila peubah Y diregresi secara simultan

(sekaligus) ke dua atau lebih peubah X. *yang dipelajari hanya 2 bentuk

regresi (linear sederhana dan berganda)

c) Regresi linear polinom kuadratik : meregresikan peubah Y ke peubah X dan X 2

untuk melihat pengaruh X yang bukan garis lurus tetapi polinom derajat dua.

d) Analisis permukaan tanggap : gabungan dari regresi berganda dan regresi

linear polinom kuadratik.


Regresi dapat digunakan untuk :

 Menjadi dasar modeling untuk memprediksi (prakira) sesuatu yang akan terjadi

atau tidak dapat diwujudkan situasinya, berdasarkan data-data empirik


sebelumnya. Prakiraan cuaca, kecenderungan perilaku konsumen, atau perilaku

pemodal dalam bursa efek, dapat diperkirakan berdasarkan model regresi

tertentu.

 Regresi dapat pula digunakan untuk studi segmentasi. Pola-pola regresi yang
berbeda untuk setiap segmen pasar atau lingkungan dapat digunakan sehingga

pola cara lebih tepat dapat diterapkan untuk setiap segmen.

4. Pengujian mengenai suatu perlakuan pada seri perlakuan yang berbeda-beda

sangat cocok menggunakan analisis regresi. Pengujian dosis pupuk, pengaruh


perubahan suhu pemanggangan ikan, dan sebagainya dapat dilakukan pada

tingkat yang berbeda-beda, lalu pengaruhnya diregresikan ke seri perlakuan

tersebut. Ini akan membantu dalam menentukan pola kecende-rungan atau nilai

efektif tertentu. Percobaan/eksperimen di bidang pertanian sangat sering


menggunakan regresi untuk keperluan ini.

Persamaan regresi :

Y = a + bx, R2 Y = a + bx1 + bx2 + bx3 + … + bxn, R2

Keterangan :
Y : variable dependen/regressand

X : variable independen/regressor

a : intercept (konstan)

b : slope
R2 : koefisien determinasi

Interpretasi : X mempengaruhi nilai Y sebesar b kali. R 2 merupakan koefisien

determinasi, yaitu menyatakan persen dari nilai Y yang dideterminasi (ditentukan) oleh

nilai X. Sisanya (100% - R2) dijelaskan oleh faktor lain.


Contoh :

Dihitung nilai dari regresi tinggi tanaman dan intensitas penyiraman air dalam sehari,

hasilnya disajikan dalam scatter plot berikut.


Identifikasi :

Y : tinggi tanaman

X : intensitas penyiraman air dalam sehari

120

100

80
y = -2.1698x + 99.255
60 R² = 0.3393

40

20

0
0 2 4 6 8 10 12

Persamaan regresi : Y = 99.255 – 2.1698X , 0.3393 (33.93 %)

Interpretasi : Setiap kenaikan 1 kali intensitas penyiraman air dalam sehari akan
menurunkan tinggi tanaman sebesar 2.1698 kali. Intensitas penyiraman menentukan

tinggi tanaman atau mempengaruhi tinggi tanaman sebesar 33.93 % sedangkan 66.07

% dipengaruhi oleh faktor lain (selain intensitas penyiraman – bisa banyak pupuk,
cahaya matahari dll).
4. Asumsi Model Linear (Regresi dan Anova Klasik)

Pernyataan εij ~ N (0,σ2) merupakan asumsi dasar dalam model liner (baik regresi liner

dan ANOVA klasik). Asumsi tersebut adalah bahwa komponen sesatan dari data

menyebar saling independen, mengikuti distribusi normal, dengan rerata = 0, dan


varians yang homogen untuk setiap grup perlakuan. Jadi sebelum melakukan uji

regresi dan anova klasik harus dilakukan uji asumsi terlebih dahulu (uji normalitas dan

uji homoskedastisitas). Kemudian apabila uji asumsi sudah terpenuhi selanjutnya dapat
dilakukan uji regresi atau anova klasik. Untuk uji independensi dianggap sudah

terpenuhi apabila pengacakan dilakukan secara benar.

a. Uji normalitas
Untuk menguji asumsi normalitas, dapat digunakan berbagai cara seperti uji goodness-

of-fit untuk kenormalan sebaran menggunakan Shapiro-Wilk’s test atau dengan

membuat quantile-to-quantile plot/QQ plot. Namun pada metode QQ plot sering kali

terjadi perbedaan cara pandang peneliti terhadap plot yang tersajikan.


Cara 1. Uji goodness-of-fit untuk kenormalan sebaran menggunakan Shapiro-

Wilk’s test

Uji ini dilakukan dengan membandingkan peluang munculnya suatu nilai data

(atau penduga sesatannya) dengan peluang distribusi normal untuk nilai tersebut. Jika
selalu berdekatan peluangnya, maka distribusinya normal. Pengujian yang biasa dipakai

adalah uji Shapiro-Wilk.

Dari suatu kolom analisis varians, ambillah data asli dan simpan sebagai data

berkas tersendiri (tanpa menyertakan kolom-kolom lainnya). Ambillah juga kolom


penduga sesatan dan simpan sebagai data tersendiri (menggunakan permintaan

namaoutput$residual setelah ANOVA) dengan nama berkas yang berbeda. Berikut

syntax untuk menguji normalitas residual dengan R Studio.

> shapiro.test(namaoutput$residual)
Perintah di atas akan menghasilkan statistik Wilk dan probabilitas menerima H 0-

nya. Prosedur ini menguji H0 bahwa data mengikuti sebaran normal. Untuk diketahui,

penggunaan uji ini tidak diperlukan jika QQ plot sudah menunjukkan distribusi normal.

Terkadang derajat bebas yang terlalu besar menyebabkan uji ini menyimpulkan
distribusi tidak normal. Apabila jumlah perlakuan lebih dari lima (treatment > 5) maka

uji normalitas sesatan data menggunakan syntax berikut ini.

> shapiro.test(namadata$namavariabel)
Cara 2. Menggunakan plot kurva (QQ plot)

Teknik lain, yang berbasis kurva, adalah dengan membuat plot kuantil vs. kuantil

(quantile-to-quantile plot). Kita telah mengenal median, kuartil, atau persentil.


Kesemuanya ini adalah kuantil. Dengan membandingkan sebaran data pada kurva

kuantil dapat dinilai kenormalan sebaran. Apabila sebaran data mengikuti garis lurus,

maka sebaran itu mendekati normal. Ketiklah baris perintah berikut dan simpan grafik

yang muncul ke dalam format gambar (TIFF atau .jpg). Berikut perintah di R untuk
menghasilkan QQ plot dengan package car.

> car::qqPlot(namadata$namavar,dist=”norm”)

Berikut ada contoh QQ plot yang mengindikasikan asumsi normalitas tidak terpenuhi.

Perrhatikan titik-titik yang ada tidak mengikuti garis merah yang miring ke kanan dan
banyak titik-titik berada di luar garis selang kepercayaan (garis putus- putus/dashed

line)

Gambar dibawah merupakan contoh jika asumsi normalitas terpenuhi. Perhatikan bahwa

titik-titik tersebar mengikuti garis merah dan sebagian besar titik-titik tersebut berada
dalam garis selang kepercayaan (garis putus-putus/dashed line)
*Jika data tidak mengikuti distribusi normal, lakukan analisis varians untuk distribusi

data yang sesuai, namun topik ini tidak akan dibahas.

b. Uji homoskedastisitas

Asumsi ini cukup mempengaruhi kekuatan uji analisis varians. Penyimpangan dari
asumsi kehomogenan varians-varians grup perlakuan akan membuat kita perlu

melakukan bentuk analisis alternatif. Untuk data yang menggunakan uji t, pengujian

homoskedasitas dapat dilakukan dengan uji F jika perlakuannya dua. Namun, untuk

ANOVA klasik yang perlakuannya lebih dari dua, maka uji homoskedatisitas dilakukan
dengan Uji Hartley (CRD dengan jumlah ulangan yang sama) atau Uji Bartlett (CRD

dengan jumlah ulangan bebas). Selain itu, terdapat pula Uji Levene dapat digunakan
untuk data dengan rancangan apa saja (tidak terdapat pada praktikum ini).

Perkembangan perangkat lunak untuk analisis statistika memungkinkan metode


baru dalam menguji homoskedastisitas varians. Pada R terdapat package car yang

menggunakan metode Breusch dan Pagan (1979) yang menggunakan metode skoring

untuk uji homoskedastisitas varians. Metode ini dapat digunakan untuk memeriksa

homoskedastisitas varians untuk regresi liner dan ANOVA klasik. Metode levene pada R
tidak dapat digunakan untuk metode regresi sehingga pada praktikum ini akan

digunakan metode Breusch dan Pagan. Perintah untuk melakukan metode tersebut
adalah sebagai berikut. Jika P-value hasil uji tersebut di atas 0.05 berarti asumsi

homoskedastisitas terpenuhi.

> car::ncvTest(model)
Cara lain adalah dengan melihat plot diagnostik pada bagian Residual vs. Fitted

value atau Standardised residual vs. Fitted value. Jika titik-titik pada grafik ini menyebar

tanpa pola, maka asumsi terpenuhi. Jika terdapat pola tertentu, terutama pola

loudspeaker, maka asumsi homoskedastisitas varians tidak terpenuhi. Perhatikan contoh


grafik di bawah ini.

Asumsi homoskedastisitas terpenuhi Asumsi homoskedastisitas tidak terpenuhi

Hal yang dilakukan jika asumsi tidak terpenuhi

Apabila uji homoskedastisitas menunjukkan varians-varians tidak homogen, perlu

dilihat apakah ada hubungan fungsional antara rerata-rerata dengan variansnya masing-

masing. Jika hubungan ini terdeteksi, lakukanlah transformasi data (transformasi data
akan dibahas pada acara berikutnya). Jika tidak ada hubungan antara rerata dan varians,

analisis varians untuk varians tidak homogen (tidak dibahas dalam mata kuliah ini, tapi

tersedia di R), atau uji-uji nonparametrik dilakukan (misalnya Uji Kruskal-Wallis untuk

ANOVA satu-arah).
Uji Kruskal-Wallis (optional, diberikan atau tidak dalam praktikum)

Uji Kruskal-Wallis merupakan versi nonparametrik analisis varians satu-arah.

Analisis ini menggunakan peringkat (rank) data. Berbeda dengan ANOVA yang

memerlukan asumsi agar distribusi dari masing-masing kelompok peubah berdistribusi


normal, dalam uji Kruskal-Wallis, distribusi peubah tersebut dapat bebas. Perlu diingat

bahwa apabila asumsi normalitas terpenuhi, uji Kruskal-Wallis tidak sebaik ANOVA.

Dalam uji Kuskal-Wallis, tetap diperlukan berbagai asumsi yaitu: (1) sampel ditarik
dari populasi secara acak; (2) kasus masing-masing kelompok independen; (3) skala

pengukuran yang digunakan biasanya ordinal.

Perhitungan yang dilakukan menggunakan statistik uji yang mengikuti distribusi

khi- kuadrat (2). Jika nilai uji lebih kecil daripada nilai tabel atau probabilitas lebih besar
daripada α, maka Ho diterima, artinya median beberapa populasi seragam.

>kruskal.test(model)

Latihan. Lakukanlah Uji Asumsi (Uji Normalitas Sesatan Data dan Uji Homoskedasitas

Sesatan Data) pada data dat.crd yang telah dianalisis varians (anova) CRD!
Skema Penggunaan Model Linear Secara Umum

Anda mungkin juga menyukai