Buku Panduan Acara 5 Asosiasi Peubah

Acara 5 : Asosiasi Dua Peubah
Tujuan :
1. Mahasiswa mampu mengulang dan mempelajari analisis asosiasi lebih lanjut

2. Mahasiswa mampu melakukan analisis frekuensi, analisis korelasi, dan
menafsirkan dengan tepat
Asosiasi dua peubah dapat dimaknai sebagai penjabaran dari hubungan dua
peubah data. Hubungan tersebut dapat berupa hubungan linear saja atau hubungan
kausalitas (hubungan sebab – akibat). Hubungan linear antara dua peubah data ini
sering disebut dengan korelasi sedangkan hubungan kausalitas (sebab – akibat) antara
dua peubah data sering disebut dengan regresi. Analisis mengenai keterkaitan (asosiasi)
antara satu peubah (variable) dengan satu atau lebih peubah lain merupakan analisis
mendasar dalam banyak penelitian hayati maupun sosial.
Tabel 4.1 Tipe Peubah Data dan Pendekatan Analisisnya
Tipe Data
Hubungan X dan Y Pendekatan
Peubah I (X) Peubah II (Y)
Analisis frekuensi
Kategorik Kategorik Tidak selalu kausal
(non parametrik)
Analisis korelasi
Numerik acak Numerik acak Tidak selalu kausal
(Y~X)
Numerik acak atau Analisis regresi

Numerik acak Kausal (X  Y)
fixed (Y~X)
1. Analisis Frekuensi
Analisis frekuensi dilakukan untuk mengetahui keterkaitan antara dua atau lebih
peubah kategorik, misalnya antara jenis kelamin dan kebiasaan merokok. Ada atau
tidaknya hubungan sebab-akibat (kausal) antara peubah yang dilibatkan tidak diberi
perhatian dalam analisis ini. Analisis frekuensi untuk pengujian independensi (untuk
mengetahui ada atau tidaknya hubungan peubah) dapat dilakukan dengan prosedur
Chi-square. Sebagai contoh Ahmad ingin melakukan survei terhadap beberapa orang
untuk mengetahui apakah kebiasaan merokok berkaitan dengan timbulnya penyakit

asma pada seseorang (lembar kerja).
Apabila ingin menguji keterkaitan dalam satu variable maka dapat digunakan uji
keselarasan atau goodness of fit test. Sebagai contoh Samsul ingin melakukan pengujian
perbandingan generasi pertama silang balik (BC1) dengan tetua resesif rentan untuk
mengetahui apakah hasil pengujiannya sesuai dengan Hukum Mendel atau tidak
(lembar kerja).
2. Analisis Korelasi
Korelasi antara dua peubah, sebut saja Y dan X dihitung apabila diinginkan
mengukur derajat asosiasi (hubungan) antara dua peubah. Korelasi tidak berdimensi,
bernilai dari -1 sampai 1. Semakin mendekati -1 atau 1 maka hubungan antara kedua
variabel tersebut kuat. Korelasi dalam bahasa statistika menunjukkan apakah dua
peubah memiliki hubungan linear. Hubungan linear yang dimaksud adalah hubungan
linear positif (Kenaikan peubah 1 menyebabkan peubah 2 juga naik) atau linear negatif
(Kenaikan peubah 1 menyebabkan peubah 2 mengalami penurunan).
Korelasi sering dilambangkan dengan rxy dengan rumus dan interpretasi sebagai
berikut.
-1
0 1
Hub. Negatif
Independen (tdk Hub. Positif
(var x naik, var y turun
memiliki hubungan) (var x naik, var y juga naik)
dan sebaliknya)
Berikut adalah salah satu contoh penggunaan korelasi dalam kehidupan sehari-
hari.
Hasil pengamatan di Kota Yogyakarta menunjukkan, apabila suhu semakin panas

diklaim jumlah es teh yang terjual akan semakin banyak. Suhu kita asumsikan sebagai
peubah 1 (datar) dan penjualan es teh merupakan peubah 2 (tegak), lalu disajikan dalam
sajian tebar (scatter plot) sebelah kiri:
*note : scatter yang kanan itu menggambarkan kalau suhu terus meningkat drastis
akhirnya orang2 males keluar terus penjualan es malah turun. Jadinya suhu naik tp
penjualan turun.
Nilai korelasi antara kedua variabel tersebut adalah 0,9575 yang berarti kuat,
linear positif. Namun, korelasi tidak menjelaskan hubungan antara dua peubah yang
berpola selain linear. Kita masih mengambil contoh dari suhu dan penjualan es teh,
bayangkan jika suhu di Yogyakarta meningkat drastis dalam beberapa hari. Efeknya
adalah banyak orang yang merasa malas keluar dari rumah untuk membeli es teh. maka
diagram tebarnya menjadi seperti sajian tebar di sisi kanan (perhatikan nilai koefisien
korelasinya).
Hubungan antara kedua peubah dilihat secara numerik kuat, penyebabnya ada
dua kemungkinan:
o Korelasi antara Peubah 1 dan 2 kuat karena memang mereka terkait langsung
(ini yang kita cari sebenarnya), atau

o Korelasi antara peubah 1 dan 2 kuat karena ada pengaruh peubah lain
3. Analisis Regresi
Analisis regresi merupakan metode yang luas sekali penggunaannya untuk
menggambarkan hubungan sebab akibat (kausalitas) antara peubah dependen (yang

dipengaruhi) dengan peubah independent (yang mempengaruhi). Sebagai contoh,
regresi dapat digunakan untuk menentukan apakah pertambahan bobot ikan lele
(peubah dependen) dipengaruhi oleh volume pelet yang diberikan (peubah
independen). Pada pemodelan regresi, dikenal pula istilah koefisien determinasi (R2)
yang menunjukkan persentase variasi y (peubah dependen) yang dapat dijelaskan oleh
seluruh variabel X (peubah independen) secara bersama. R2 selalu bernilai positif (karena
merupakan nilai kuadrat) dengan nilai di antara 0 dan 1. Semakin tinggi nilai R2 semakin
baik.
Apabila hubungan peubah X mempengaruhi peubah Y dapat ditegakkan secara
teoritis maka analisis regresi dapat dilakukan dengan meregresi Y ke X. berikut
merupakan beberapa macam bentuk regresi :
a) Regresi linear sederhana : apabila peubah Y diregresi ke satu peubah X.

regresi ini membentuk garis lurus pada proyeksi Descartes (castesius)
b) Regresi berganda : digunakan apabila peubah Y diregresi secara simultan
(sekaligus) ke dua atau lebih peubah X. *yang dipelajari hanya 2 bentuk
regresi (linear sederhana dan berganda)
c) Regresi linear polinom kuadratik : meregresikan peubah Y ke peubah X dan X 2
untuk melihat pengaruh X yang bukan garis lurus tetapi polinom derajat dua.
d) Analisis permukaan tanggap : gabungan dari regresi berganda dan regresi
linear polinom kuadratik.

Regresi dapat digunakan untuk :
 Menjadi dasar modeling untuk memprediksi (prakira) sesuatu yang akan terjadi
atau tidak dapat diwujudkan situasinya, berdasarkan data-data empirik

sebelumnya. Prakiraan cuaca, kecenderungan perilaku konsumen, atau perilaku
pemodal dalam bursa efek, dapat diperkirakan berdasarkan model regresi
tertentu.
 Regresi dapat pula digunakan untuk studi segmentasi. Pola-pola regresi yang
berbeda untuk setiap segmen pasar atau lingkungan dapat digunakan sehingga
pola cara lebih tepat dapat diterapkan untuk setiap segmen.
4. Pengujian mengenai suatu perlakuan pada seri perlakuan yang berbeda-beda
sangat cocok menggunakan analisis regresi. Pengujian dosis pupuk, pengaruh

perubahan suhu pemanggangan ikan, dan sebagainya dapat dilakukan pada
tingkat yang berbeda-beda, lalu pengaruhnya diregresikan ke seri perlakuan
tersebut. Ini akan membantu dalam menentukan pola kecende-rungan atau nilai
efektif tertentu. Percobaan/eksperimen di bidang pertanian sangat sering

menggunakan regresi untuk keperluan ini.
Persamaan regresi :
Y = a + bx, R2 Y = a + bx1 + bx2 + bx3 + … + bxn, R2
Keterangan :
Y : variable dependen/regressand
X : variable independen/regressor
a : intercept (konstan)
b : slope
R2 : koefisien determinasi
Interpretasi : X mempengaruhi nilai Y sebesar b kali. R 2 merupakan koefisien
determinasi, yaitu menyatakan persen dari nilai Y yang dideterminasi (ditentukan) oleh
nilai X. Sisanya (100% - R2) dijelaskan oleh faktor lain.

Contoh :
Dihitung nilai dari regresi tinggi tanaman dan intensitas penyiraman air dalam sehari,
hasilnya disajikan dalam scatter plot berikut.

Identifikasi :
Y : tinggi tanaman
X : intensitas penyiraman air dalam sehari
120
100
80
y = -2.1698x + 99.255
60 R² = 0.3393
40
20
0
0 2 4 6 8 10 12
Persamaan regresi : Y = 99.255 – 2.1698X , 0.3393 (33.93 %)
Interpretasi : Setiap kenaikan 1 kali intensitas penyiraman air dalam sehari akan
menurunkan tinggi tanaman sebesar 2.1698 kali. Intensitas penyiraman menentukan
tinggi tanaman atau mempengaruhi tinggi tanaman sebesar 33.93 % sedangkan 66.07
% dipengaruhi oleh faktor lain (selain intensitas penyiraman – bisa banyak pupuk,
cahaya matahari dll).
4. Asumsi Model Linear (Regresi dan Anova Klasik)
Pernyataan εij ~ N (0,σ2) merupakan asumsi dasar dalam model liner (baik regresi liner
dan ANOVA klasik). Asumsi tersebut adalah bahwa komponen sesatan dari data
menyebar saling independen, mengikuti distribusi normal, dengan rerata = 0, dan

varians yang homogen untuk setiap grup perlakuan. Jadi sebelum melakukan uji
regresi dan anova klasik harus dilakukan uji asumsi terlebih dahulu (uji normalitas dan
uji homoskedastisitas). Kemudian apabila uji asumsi sudah terpenuhi selanjutnya dapat
dilakukan uji regresi atau anova klasik. Untuk uji independensi dianggap sudah
terpenuhi apabila pengacakan dilakukan secara benar.
a. Uji normalitas
Untuk menguji asumsi normalitas, dapat digunakan berbagai cara seperti uji goodness-
of-fit untuk kenormalan sebaran menggunakan Shapiro-Wilk’s test atau dengan
membuat quantile-to-quantile plot/QQ plot. Namun pada metode QQ plot sering kali
terjadi perbedaan cara pandang peneliti terhadap plot yang tersajikan.

Cara 1. Uji goodness-of-fit untuk kenormalan sebaran menggunakan Shapiro-
Wilk’s test
Uji ini dilakukan dengan membandingkan peluang munculnya suatu nilai data
(atau penduga sesatannya) dengan peluang distribusi normal untuk nilai tersebut. Jika
selalu berdekatan peluangnya, maka distribusinya normal. Pengujian yang biasa dipakai
adalah uji Shapiro-Wilk.
Dari suatu kolom analisis varians, ambillah data asli dan simpan sebagai data
berkas tersendiri (tanpa menyertakan kolom-kolom lainnya). Ambillah juga kolom

penduga sesatan dan simpan sebagai data tersendiri (menggunakan permintaan
namaoutput$residual setelah ANOVA) dengan nama berkas yang berbeda. Berikut
syntax untuk menguji normalitas residual dengan R Studio.
> shapiro.test(namaoutput$residual)
Perintah di atas akan menghasilkan statistik Wilk dan probabilitas menerima H 0-
nya. Prosedur ini menguji H0 bahwa data mengikuti sebaran normal. Untuk diketahui,
penggunaan uji ini tidak diperlukan jika QQ plot sudah menunjukkan distribusi normal.
Terkadang derajat bebas yang terlalu besar menyebabkan uji ini menyimpulkan
distribusi tidak normal. Apabila jumlah perlakuan lebih dari lima (treatment > 5) maka
uji normalitas sesatan data menggunakan syntax berikut ini.
> shapiro.test(namadata$namavariabel)
Cara 2. Menggunakan plot kurva (QQ plot)
Teknik lain, yang berbasis kurva, adalah dengan membuat plot kuantil vs. kuantil
(quantile-to-quantile plot). Kita telah mengenal median, kuartil, atau persentil.

Kesemuanya ini adalah kuantil. Dengan membandingkan sebaran data pada kurva
kuantil dapat dinilai kenormalan sebaran. Apabila sebaran data mengikuti garis lurus,
maka sebaran itu mendekati normal. Ketiklah baris perintah berikut dan simpan grafik
yang muncul ke dalam format gambar (TIFF atau .jpg). Berikut perintah di R untuk
menghasilkan QQ plot dengan package car.
> car::qqPlot(namadata$namavar,dist=”norm”)
Berikut ada contoh QQ plot yang mengindikasikan asumsi normalitas tidak terpenuhi.
Perrhatikan titik-titik yang ada tidak mengikuti garis merah yang miring ke kanan dan
banyak titik-titik berada di luar garis selang kepercayaan (garis putus- putus/dashed
line)
Gambar dibawah merupakan contoh jika asumsi normalitas terpenuhi. Perhatikan bahwa
titik-titik tersebar mengikuti garis merah dan sebagian besar titik-titik tersebut berada
dalam garis selang kepercayaan (garis putus-putus/dashed line)
*Jika data tidak mengikuti distribusi normal, lakukan analisis varians untuk distribusi
data yang sesuai, namun topik ini tidak akan dibahas.
b. Uji homoskedastisitas
Asumsi ini cukup mempengaruhi kekuatan uji analisis varians. Penyimpangan dari
asumsi kehomogenan varians-varians grup perlakuan akan membuat kita perlu
melakukan bentuk analisis alternatif. Untuk data yang menggunakan uji t, pengujian
homoskedasitas dapat dilakukan dengan uji F jika perlakuannya dua. Namun, untuk
ANOVA klasik yang perlakuannya lebih dari dua, maka uji homoskedatisitas dilakukan
dengan Uji Hartley (CRD dengan jumlah ulangan yang sama) atau Uji Bartlett (CRD
dengan jumlah ulangan bebas). Selain itu, terdapat pula Uji Levene dapat digunakan
untuk data dengan rancangan apa saja (tidak terdapat pada praktikum ini).
Perkembangan perangkat lunak untuk analisis statistika memungkinkan metode

baru dalam menguji homoskedastisitas varians. Pada R terdapat package car yang
menggunakan metode Breusch dan Pagan (1979) yang menggunakan metode skoring
untuk uji homoskedastisitas varians. Metode ini dapat digunakan untuk memeriksa
homoskedastisitas varians untuk regresi liner dan ANOVA klasik. Metode levene pada R
tidak dapat digunakan untuk metode regresi sehingga pada praktikum ini akan
digunakan metode Breusch dan Pagan. Perintah untuk melakukan metode tersebut
adalah sebagai berikut. Jika P-value hasil uji tersebut di atas 0.05 berarti asumsi
homoskedastisitas terpenuhi.
> car::ncvTest(model)
Cara lain adalah dengan melihat plot diagnostik pada bagian Residual vs. Fitted
value atau Standardised residual vs. Fitted value. Jika titik-titik pada grafik ini menyebar
tanpa pola, maka asumsi terpenuhi. Jika terdapat pola tertentu, terutama pola
loudspeaker, maka asumsi homoskedastisitas varians tidak terpenuhi. Perhatikan contoh

grafik di bawah ini.
Asumsi homoskedastisitas terpenuhi Asumsi homoskedastisitas tidak terpenuhi
Hal yang dilakukan jika asumsi tidak terpenuhi
Apabila uji homoskedastisitas menunjukkan varians-varians tidak homogen, perlu
dilihat apakah ada hubungan fungsional antara rerata-rerata dengan variansnya masing-
masing. Jika hubungan ini terdeteksi, lakukanlah transformasi data (transformasi data
akan dibahas pada acara berikutnya). Jika tidak ada hubungan antara rerata dan varians,
analisis varians untuk varians tidak homogen (tidak dibahas dalam mata kuliah ini, tapi
tersedia di R), atau uji-uji nonparametrik dilakukan (misalnya Uji Kruskal-Wallis untuk
ANOVA satu-arah).
Uji Kruskal-Wallis (optional, diberikan atau tidak dalam praktikum)
Uji Kruskal-Wallis merupakan versi nonparametrik analisis varians satu-arah.
Analisis ini menggunakan peringkat (rank) data. Berbeda dengan ANOVA yang
memerlukan asumsi agar distribusi dari masing-masing kelompok peubah berdistribusi

normal, dalam uji Kruskal-Wallis, distribusi peubah tersebut dapat bebas. Perlu diingat
bahwa apabila asumsi normalitas terpenuhi, uji Kruskal-Wallis tidak sebaik ANOVA.
Dalam uji Kuskal-Wallis, tetap diperlukan berbagai asumsi yaitu: (1) sampel ditarik
dari populasi secara acak; (2) kasus masing-masing kelompok independen; (3) skala
pengukuran yang digunakan biasanya ordinal.
Perhitungan yang dilakukan menggunakan statistik uji yang mengikuti distribusi
khi- kuadrat (2). Jika nilai uji lebih kecil daripada nilai tabel atau probabilitas lebih besar
daripada α, maka Ho diterima, artinya median beberapa populasi seragam.
>kruskal.test(model)
Latihan. Lakukanlah Uji Asumsi (Uji Normalitas Sesatan Data dan Uji Homoskedasitas
Sesatan Data) pada data dat.crd yang telah dianalisis varians (anova) CRD!
Skema Penggunaan Model Linear Secara Umum

Buku Panduan Acara 5 Asosiasi Peubah

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Buku Panduan Acara 5 Asosiasi Peubah

Diunggah oleh

Hak Cipta:

Format Tersedia

Acara 5 : Asosiasi Dua Peubah

1. Mahasiswa mampu mengulang dan mempelajari analisis asosiasi lebih lanjut

menafsirkan dengan tepat

Tabel 4.1 Tipe Peubah Data dan Pendekatan Analisisnya

Numerik acak atau Analisis regresi

untuk mengetahui apakah kebiasaan merokok berkaitan dengan timbulnya penyakit

(Kenaikan peubah 1 menyebabkan peubah 2 mengalami penurunan).

Hasil pengamatan di Kota Yogyakarta menunjukkan, apabila suhu semakin panas

sajian tebar (scatter plot) sebelah kiri:

(ini yang kita cari sebenarnya), atau

Analisis regresi merupakan metode yang luas sekali penggunaannya untuk

menggambarkan hubungan sebab akibat (kausalitas) antara peubah dependen (yang

(peubah dependen) dipengaruhi oleh volume pelet yang diberikan (peubah

teoritis maka analisis regresi dapat dilakukan dengan meregresi Y ke X. berikut

merupakan beberapa macam bentuk regresi :

a) Regresi linear sederhana : apabila peubah Y diregresi ke satu peubah X.

b) Regresi berganda : digunakan apabila peubah Y diregresi secara simultan

(sekaligus) ke dua atau lebih peubah X. *yang dipelajari hanya 2 bentuk

regresi (linear sederhana dan berganda)

c) Regresi linear polinom kuadratik : meregresikan peubah Y ke peubah X dan X 2

d) Analisis permukaan tanggap : gabungan dari regresi berganda dan regresi

linear polinom kuadratik.

atau tidak dapat diwujudkan situasinya, berdasarkan data-data empirik

pemodal dalam bursa efek, dapat diperkirakan berdasarkan model regresi

pola cara lebih tepat dapat diterapkan untuk setiap segmen.

4. Pengujian mengenai suatu perlakuan pada seri perlakuan yang berbeda-beda

sangat cocok menggunakan analisis regresi. Pengujian dosis pupuk, pengaruh

tingkat yang berbeda-beda, lalu pengaruhnya diregresikan ke seri perlakuan

efektif tertentu. Percobaan/eksperimen di bidang pertanian sangat sering

Y = a + bx, R2 Y = a + bx1 + bx2 + bx3 + … + bxn, R2

Interpretasi : X mempengaruhi nilai Y sebesar b kali. R 2 merupakan koefisien

nilai X. Sisanya (100% - R2) dijelaskan oleh faktor lain.

hasilnya disajikan dalam scatter plot berikut.

X : intensitas penyiraman air dalam sehari

Persamaan regresi : Y = 99.255 – 2.1698X , 0.3393 (33.93 %)

menyebar saling independen, mengikuti distribusi normal, dengan rerata = 0, dan

terpenuhi apabila pengacakan dilakukan secara benar.

of-fit untuk kenormalan sebaran menggunakan Shapiro-Wilk’s test atau dengan

terjadi perbedaan cara pandang peneliti terhadap plot yang tersajikan.

adalah uji Shapiro-Wilk.

berkas tersendiri (tanpa menyertakan kolom-kolom lainnya). Ambillah juga kolom

namaoutput$residual setelah ANOVA) dengan nama berkas yang berbeda. Berikut

syntax untuk menguji normalitas residual dengan R Studio.

uji normalitas sesatan data menggunakan syntax berikut ini.

(quantile-to-quantile plot). Kita telah mengenal median, kuartil, atau persentil.

data yang sesuai, namun topik ini tidak akan dibahas.

Perkembangan perangkat lunak untuk analisis statistika memungkinkan metode

loudspeaker, maka asumsi homoskedastisitas varians tidak terpenuhi. Perhatikan contoh

Asumsi homoskedastisitas terpenuhi Asumsi homoskedastisitas tidak terpenuhi

Hal yang dilakukan jika asumsi tidak terpenuhi

Apabila uji homoskedastisitas menunjukkan varians-varians tidak homogen, perlu

Uji Kruskal-Wallis merupakan versi nonparametrik analisis varians satu-arah.

memerlukan asumsi agar distribusi dari masing-masing kelompok peubah berdistribusi

pengukuran yang digunakan biasanya ordinal.

Perhitungan yang dilakukan menggunakan statistik uji yang mengikuti distribusi

Anda mungkin juga menyukai