Anda di halaman 1dari 55

Ukuran Pemusatan, Penyebaran, dan Asosiasi Data

I Wayan Sumarjaya

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 1 / 55


Topik

Topik

Ukuran Pemusatan
Ukuran Penyebaran
Ukuran Asosiasi

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 2 / 55


Ukuran Pemusatan

Ukuran Pemusatan: Rata-rata


Ukuran kecenderungan pusat memberikan gambaran tentang pusat atau
penyebaran data.
Rata-rata, biasa disebut rata-rata aritmetika,
n
x1 + x2 + · · · + xn 1X
x̄ = = xi , (1)
n n
i=1

Contoh: rata-rata berat badan 30 orang Eropa:


20 + 30 + · · · + 48 1742
x̄ = = = 58,06667 ≈ 58,07. (2)
30 30
Rata-rata bersifat sensitif terhadap nilai ekstrem. Berat badan 5
orang: 50, 65, 60, 70, 40 (rata-rata: 57). Sekarang, kalau berat
badan: 50, 65, 60, 70, 100 (rata-rata: 69). Kemudian kalau berat
badan: 10, 65, 60, 70, 40 (rata-rata: 49).
I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 3 / 55
Ukuran Pemusatan

Ukuran Pemusatan: Rata-rata Terpangkas

Mengatasi masalah “sensitif” ini? Rata-rata terpangkas.


Rata-rata ini dihitung dengan terlebih dahulu mengurutkan data dari
nilai terkecil ke terbesar, kemudian menghapus nilai terpilih pada
masing-masing ujung data terurut, dan kemudian merata-ratakan nilai
sisanya.
Persentase pemangkasan dihitung sebagai berikut

# data yang dihapus pada setiap sisi


persentase pemangkasan = ×100.
n
(3)

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 4 / 55


Ukuran Pemusatan

Ukuran Pemusatan: Rata-rata Terpangkas

Data: 0, 50, 65, 60, 70, 100. Apabila dua amatan ekstrem, 0 dan 100,
dihilangkan kita akan memperoleh persentase rata-rata terpangkas
2
× 100 = 33,33%. (4)
6
Sehingga kita peroleh rata-rata terpangkas 33,33% sebagai berikut:
50 + 65 + 60 + 70
rata-rata terpangkas 33,33% = = 61,25. (5)
4

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 5 / 55


Ukuran Pemusatan

Ukuran Pemusatan: Median

Median merupakan amatan di tengah, yakni separuh amatan lebih


kecil (di bawah) dan separuh lagi lebih besar (di atas).
Cara menghitung median?
Urutkan amatan dari yang terkecil ke yang terbesar.
Hitung nilai tengah amatan. Median merupakan nilai tengah untuk
jumlah amatan ganjil; sebaliknya, jika nilai amatan genap didefinisikan
sebagai rata-rata dari dua nilai tengah untuk amatan genap.
Sebagai contoh, untuk data berat badan 30 orang di atas diperoleh
median 62,5 yang diperoleh dari rata-rata dua nilai tengah yakni
amatan ke-15 dan ke-16, yakni
60 + 65
median = = 62,5. (6)
2

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 6 / 55


Ukuran Pemusatan

Ukuran Pemusatan: Median

Sifat-sifat median:
tidak sensitif terhadap nilai ekstrem.
Berat badan: 50, 65, 60, 70, dan 40 (median: 60).
Berat badan: 50, 65, 60, 70, dan 100 (median: 65).
Berat badan: 0, 65, 60, 70, dan 40 (median: 60).
hanya dapat digunakan untuk data kuantitatif dan hanya terdapat
satu median untuk setiap kumpulan data

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 7 / 55


Ukuran Pemusatan

Perbandingan Rata-rata dan Median

Tabel: Perbandingan rata-rata dan median berat badan lima orang

Data Rata-rata Median


50, 65, 60, 70, 40 57 60
50, 65, 60, 70, 100 69 65
0, 65, 60, 70, 40 47 60

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 8 / 55


Ukuran Pemusatan

Ukuran Pemusatan: Modus

Modus merupakan nilai amatan yang paling sering muncul. Apabila


amatan memiliki dua modus, kumpulan data tersebut disebut bimodal.
Lihat kembali contoh berat badan 30 orang. Berdasarkan data ini
diperoleh nilai yang paling sering muncul adalah 50.
Modus dapat digunakan untuk data kuantitatif dan kualitatif. Salah
satu kelebihan modus adalah bahwa modus tidak dipengaruhi oleh
data ekstrem.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 9 / 55


Ukuran Pemusatan

Menggunakan Ukuran Kecenderungan Pusat

Jika rata-rata dan median sama, sebaran amatan adalah simetris.

Mo
Md
Ra
TM

Gambar: Sebaran simetris.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 10 / 55


Ukuran Pemusatan

Menggunakan Ukuran Kecenderungan Pusat

Jika rata-rata lebih besar daripada median, sebaran data akan pencong ke
kanan.

Mo Md Ra
TM

Gambar: Sebaran pencong ke kanan.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 11 / 55


Ukuran Pemusatan

Menggunakan Ukuran Kecenderungan Pusat

Jika rata-rata lebih kecil daripada median, sebaran data akan pencong ke
kiri.

Ra Md Mo
TM

Gambar: Sebaran pencong ke kiri.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 12 / 55


Ukuran Penyebaran

Ukuran Penyebaran: Rentang

Rentang merupakan selisih antara amatan terbesar dan terkecil.


Rentang digunakan apabila penekanannya adalah nilai ekstrem.
Contoh: untuk data berat badan 30 orang, diperoleh
rentang = 95 − 10 = 85.
Meskipun rentang memberikan ide tentang penyebaran data, namun
nilainya dipengaruhi oleh pencilan (data dengan nilai yang sangat
besar atau sangat kecil).

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 13 / 55


Ukuran Penyebaran

Ukuran Penyebaran: Simpangan Baku

Simpangan baku merupakan ukuran penyebaran data di sekitar


rata-rata. Dengan kata lain, melihat seberapa jauh amatan dari
rata-rata (mean).
Logika dibalik statistik ini adalah kita memerlukan ukuran “rata-rata”
penyebaran data di sekitar rata-rata.
Dengan kata lain, simpangan baku hanya cocok digunakan apabila
data bersifat simetris. Secara matematis simpangan baku didefinisikan
sebagai akar positif dari varians.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 14 / 55


Ukuran Penyebaran

Ukuran Penyebaran: Simpangan Baku

Varians didefinisikan sebagai


n
1 X
var(x) = (xi − x̄)2 . (7)
n−1
i=1

Akar (7) adalah simpangan baku, dinotasikan sd, sebagai


v
u n
u 1 X
sd(x) = t (xi − x̄)2 . (8)
n−1
i=1

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 15 / 55


Ukuran Penyebaran

Ukuran Penyebaran: Simpangan Baku

Lihat contoh data berat badan pada bagian sebelumnya.


1
var(x) = ((20 − 58,07)2 + (30 − 58,07)2 ) + · · · + (48 − 58,07)2 )
29
= 501,7195. (9)

Selanjutnya simpangan baku


p
sd(x) = 501,7195 = 22,3991 ≈ 22,4.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 16 / 55


Ukuran Penyebaran

Ukuran Penyebaran; Simpangan Baku

Aturan-aturan berikut dapat digunakan untuk membantu kita dalam


menggunakan simpangan baku:
Bagaimanapun amatan menyebar setidaknya 75% berada pada
x̄ ± 2 × sd(x).
Apabila data berbentuk seperti lonceng (bell-shaped )
67% amatan terletak di antara x̄ ± sd(x),
95% amatan terletak di antara x̄ ± 2 × sd(x),
99,7% amatan terletak di antara x̄ ± 3 × sd(x).
Kalau kita lihat kembali data berat badan 30 orang di atas dihitung
bahwa setidaknya 75% berat orang berada pada
58,07 ± 2 × 22,4 = 58,07 ± 44,8.
Sebagai catatan, apabila semua amatan memiliki nilai yang sama,
maka simpangan baku sampel akan bernilai nol. Hal ini berarti tidak
ada variabilitas di dalam data.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 17 / 55


Ukuran Penyebaran

Ukuran Penyebaran: Koefisien Variasi

Koefisien variasi CV merupakan ukuran penyebaran relatif dalam data.


Koefisien ini didefinisikan sebagai simpangan baku dibagi rata-rata
dikalikan 100%.
Hal ini menghasilkan ukuran variasi relatif, yakni variasi yang relatif
terhadap ukuran rata-rata. Formula koefisien variasi adalah

sd(x)
CV(x) = × 100%. (10)

Koefisien variasi dapat digunakan untuk membandingkan sebaran data
yang diukur pada skala yang berbeda. Secara matematis koefisien
variasi tidak memiliki unit karena simpangan baku dan rata-rata
memiliki unit yang sama sehingga saling meniadakan.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 18 / 55


Ukuran Penyebaran

Ukuran Penyebaran: Koefisien Variasi

Untuk data berat badan 30 orang Asia ini diperoleh rata-rata


51,03333 dan simpangan baku 21,61494. Dengan demikian, koefisien
variasinya adalah
21,61494
CV(berat orang Asia) = × 100% = 42,35456%.
51,03333

Apabila dibandingkan dengan koefisien variasi berat badan 30 orang


yakni
22,3991
CV(berat orang Eropa) = × 100% = 38,57479%.
58,06667

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 19 / 55


Ukuran Penyebaran

Ukuran Penyebaran: Koefisien Variasi

Untuk data berat badan 30 orang Asia ini diperoleh rata-rata


51,03333 dan simpangan baku 21,61494. Dengan demikian, koefisien
variasinya adalah
21,61494
CV(berat orang Asia) = × 100% = 42,35456%.
51,03333

Apabila dibandingkan dengan koefisien variasi berat badan 30 orang


yakni
22,3991
CV(berat orang Eropa) = × 100% = 38,57479%.
58,06667

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 20 / 55


Ukuran Penyebaran

Ukuran Penyebaran: Koefisien Variasi

Berdasarkan nilai koefisien variasi di atas dapat dilihat bahwa CV


berat Asia lebih besar dibandingkan CV berat orang Eropa. Dengan
demikian, berat orang Asia memiliki variabilitas yang lebih banyak
dibandingkan berat badan 30 orang Eropa.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 21 / 55


Ukuran Penyebaran

Ukuran Penyebaran: Persentil dan Kuartil

Persentil merupakan persentase sebaran data yang sama atau lebih


kecil dari suatu nilai tertentu. Lebih jelasnya, persentil ke-p adalah
suatu amatan yang diurut sedemikian hingga p% dari amatan di
bawah dan paling banyak (100 − p)% di atasnya.
Sebagai contoh persentil ke-75 berat badan adalah 80. Hal ini berarti
bahwa 75% berat badan adalah 80 atau kurang, dan hanya 25% yang
beratnya di atas 80.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 22 / 55


Ukuran Penyebaran

Ukuran Penyebaran: Persentil dan Kuartil

Menghitung persentil dan kuartil pada secara prinsip sama. Berikut


akan dijelaskan bagaimana menghitung kuartil (disebut juga kuantil).
Langkah pertama adalah mengurutkan data dari yang paling kecil ke
yang paling besar. Misalkan kita memiliki n amatan yaitu
x1 , x2 , . . . , xn . Misalkan kita menyusun kembali data dengan cara
mengurutkan dari kecil ke besar.
Misalkan
x(1) ≤ x(2) ≤ · · · ≤ x(n) (11)
menyatakan data yang telah diurutkan ini. Misalkan q1 adalah kuartil
pertama atau kuartil bawah dan q3 adalah kuartil ketiga atau atas.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 23 / 55


Ukuran Penyebaran

Ukuran Penyebaran: Persentil dan Kuartil

Misalkan lk adalah lokasi kuartil yang didefinisikan oleh



 n + 3 , jika n ganjil,

lk = n + 4 (12)
2

 , jika n genap.
4
Jika lk bulat, maka kita dapat menghitung kuartil pertama dengan
menghitung lk nilai posisi awal pada data yang telah diurutkan; untuk
kuartil ketiga kita hitung lk nilai posisi akhir pada data yang telah
diurutkan dengan kata lain

q1 = x(lk ) , (13)
q3 = x(n+1−lk ) . (14)

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 24 / 55


Ukuran Penyebaran

Ukuran Penyebaran: Persentil dan Kuartil

Jika lk bukan bilangan bulat, maka kuartil hampiran adalah rata-rata


dari dua nilai yaitu
x(lk −0,5) + x(lk +0,5)
q1 = , (15)
2
x(n+1−lk −0,5) + x(n+1−lk +0,5)
q3 = . (16)
2
Sebagai contoh berikut ini adalah panjang cangkang (dalam cm) dari
suatu sampel penyu hijau betina dewasa Chelonia mydas.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 25 / 55


Ukuran Penyebaran

Gambar: Penyu hijau betina dewasa (Chelonia mydas)

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 26 / 55


Ukuran Penyebaran

Ukuran Penyebaran: Persentil dan Kuartil


Sebagai contoh berikut ini adalah panjang cangkang (dalam cm) dari suatu
sampel penyu hijau betina dewasa

110 105 117 113 95 115 98 97 93 120.

Berikut ini adalah data penyu (dalam cm) setelah diurutkan:

93 95 97 98 105 110 113 115 117 120.

Dari data di atas kita peroleh n = 10, sehingga lk = (10 + 2)/4 = 3


(bilangan bulat). Dengan demikian kuartil q1 dan q3 dapat dihitung
sebagai berikut:

q1 = x(3) = 97, (17)


q3 = x(10+1−3) = x(8) = 115. (18)

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 27 / 55


Ukuran Penyebaran

Ukuran Penyebaran: Rentang Antarkuartil

Ukuran variasi yang menggunakan persentil adalah rentang antar kuartil


yang didefinisikan sebagai selisih dari persentil ke-75 (disebut juga kuartil
ketiga) dan ke-25 (disebut juga kuartil pertama). Rentang antarkuartil ini
digunakan untuk mendeskripsikan 50% amatan tengah, terlepas dari apa
pun bentuk sebaran data. Secara matematis rentang antar kuartil IQR
didefinisikan sebagai
IQR = q3 − q1
dengan q3 adalah kuartil ketiga (atau persentil ke-75) dan q1 adalah kuartil
pertama (atau persentil ke-25).

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 28 / 55


Ukuran Penyebaran

Ukuran Penyebaran: Rentang Antarkuartil


Sebagai contoh kuantil ke-75 berat 30 orang di atas adalah 76,50 dan
kuantil ke-25 ulangan adalah 41,25. Hal ini berarti 50% berat orang
berada antara 41,25 dan 76,50. Dengan kata lain, nilai tengah 50%
berat orang menyebar pada rentang 35,25 nilai.
Untuk contoh penyu Chelonia mydas di atas kita peroleh

IQR = 115 − 97 = 18.

Secara garis besar persentil dan rentang antar kuartil digunakan


berdasarkan kondisi berikut.
Pertama, pada saat median digunakan (data numerik pencong atau
data ordinal).
Kemudian apabila rata-rata digunakan, tetapi tujuannya adalah
membandingkan amatan individual.
Hal yang perlu diperhatikan adalah apabila data terpusat pada
median, rentang antarkuantil dapat memberikan informasi yang keliru.
I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 29 / 55
Ukuran Penyebaran

Ukuran Penyebaran: Rentang Antarkuartil

Misalkan berat badan 10 orang adalah 20, 50, 50, 50, 50, 50, 50, 50, 50,
dan 80. Kuartil ketiga dan kuartil pertama berturut-turut adalah 50.
Dengan demikian rentang antarkuartil IQR = 0. Nilai 0 ini seharusnya
menunjukkan bahwa amatan terdiri dari nilai yang identik, yang tentu saja
tidak demikian dengan kesepuluh nilai berat orang tersebut.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 30 / 55


Ukuran Asosiasi

Ukuran Asosiasi

Meskipun telah banyak studi menyimpulkan bahwa merokok berbahaya bagi


kesehatan dalam berbagai hal, satu studi menemukan bukti bertentangan
(conflicting evidence). Suatu studi dilakukan terhadap 1.314 wanita di
Inggris dan mereka ditanya apakah merokok atau tidak. Dua puluh tahun
kemudian suatu studi lanjutan dilakukan apakah wanita yang ditanya
tersebut masih hidup atau sudah meninggal. Peneliti mempelajari
kemungkinan tautan antara apakah wanita tersebut merokok dan apakah
wanita tersebut bertahan hidup selama periode studi 20 tahun. Selama
periode ini diperoleh 24% perokok meninggal dan 31% yang bukan perokok
meninggal. Laju kematian yang lebih tinggi bagi perokok sangat
mengejutkan.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 31 / 55


Ukuran Asosiasi

Ukuran Asosiasi

Melihat kembali skenario di atas pertanyaan yang layak diajukan adalah


sebagai berikut:
1 Bagaimana kita dapat mendeskripsikan hubungan antara merokok dan
tahan hidup dengan angka (statistika deskriptif)?
2 Apakah merokok sebenarnya menguntungkan bagi kesehatan,
mengingat persentase perokok yang meninggal lebih kecil
dibandingkan perokok?
3 Jika kita mengamati hubungan antara status merokok dan status
tahan hidup (sintasan), apakah ada yang bisa menjelaskan bagaimana
hal ini bisa terjadi?

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 32 / 55


Ukuran Asosiasi

Ukuran Asosiasi

Dalam studi di atas kita dapat mengidentifikasi dua variabel kategori.


Variabel kategori pertama adalah status merokok: ya atau tidak. Variabel
kategorik berikutnya adalah status sintasan: ya atau tidak. Dalam,
penelitian kita hampir selalu menganalisis lebih dari satu variabel.
Ketertarikan kita biasanya terhadap hubungan di antara dua variabel
tersebut. Pada materi kuliah ini, kita akan melihat hubungan antara dua
variabel seperti pada contoh di atas.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 33 / 55


Ukuran Asosiasi

Ukuran Asosiasi

Variabel yang pertama disebut variabel respons (response variable)


yaitu variabel hasil (outcome) yang bergantung kepada atau dijelaskan
oleh variabel penjelas atau eksplanatori (explanatory variable).
Apabila variabel penjelas bersifat kategori, variabel ini mendefinisikan
kelompok-kelompok yang akan dibandingkan yang bersesuain dengan
variabel respons.
Apabila variabel penjelas bersifat kuantitatif, kita dapat menguji
bagaimana nilai-nilai berbeda dari peubah penjelas berhubungan
dengan perubahan dalam variabel respons.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 34 / 55


Ukuran Asosiasi

Ukuran Asosiasi

Pada contoh studi di atas, status sintasan (apakah wanita hidup


setelah 20 tahun) adalah variabel respons dan status merokok adalah
variabel penjelas. Dalam penelitian tersebut peneliti ingin mengetahui
sintasan pada kedua kelompok (perokok dan nonperokok).
Suatu asosiasi (association) atau hubungan (relationship) terjadi di
antara dua variabel jika nilai tertentu variabel yang satu lebih mungkin
terjadi (more likely ) dengan nilai tertentu pada variabel yang lain.
Melihat kembali contoh di atas, sintasan perokok “mungkin terjadi”
dibandingkan nonperokok. Jadi terdapat asosiasi antara status
sintasan dan status merokok.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 35 / 55


Ukuran Asosiasi

Tabel Kontingensi

Tabel kontingensi adalah tabel yang menampilkan dua peubah kategori.


Baris berisi kategori dari satu variabel dan kolom berisi kategori dari
variabel lain. Masing-masing masukan atau entri dalam tabel adalah
jumlah amatan dalam sampel untuk kombinasi kedua kategori.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 36 / 55


Ukuran Asosiasi

Tabel Kontingensi: Contoh Agresti et al (2018)

Salah satu daya tarik makanan organik adalah kepercayaan bahwa makanan
tersebut bebas pestisida dan lebih sehat. Namun, hanya sedikit lahan untuk
makan dan buah organik (2% di Amerika Serikat) dan konsumen membayar
mahal untuk makanan organik. Bagaimana kita bisa meneliti persentase
makanan yang membawa residu pestisida untuk makanan yang ditanam
secara organik dan konvensional? Consumers Union melakukan studi
berdasarkan sampel yang diambil oleh Departemen Pertanian Amerika
Serikat (USDA) dan negara bagian California. Studi ini merupakan bagian
dari kebijakan pemantauan makanan untuk residu pestisida. Tabel 2
memperlihatkan frekuensi makanan untuk semua kombinasi yang mungkin
dari dua variabel yaitu jenis makanan dan status pestisida.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 37 / 55


Ukuran Asosiasi

Tabel: Frekuensi jenis makanan dan status pestisida

Status Pestisida
Jenis makanan Ada Tidak Ada Total
Organik 29 98 127
Konvensional 19.485 7.086 26.571
Total 19.514 7.184 26.698

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 38 / 55


Ukuran Asosiasi

Pertanyaan yang perlu dieksplorasi dapat berupa hal-hal berikut:


1 Apa variabel responsnya dan apa variabel penjelasnya?
2 Hanya 127 jenis makanan organik diambil sampelnya dibandingkan
dengan 26.571 jenis konvensional. Terlepas dari ketimpangan jumlah
ini masih dapatkah kita membuat perbandingan yang adil?
3 Bagaimana proporsi makanan dengan status pestisida ada
dibandingkan untuk kedua jenis makanan?
4 Berapakah proporsi semua sampel berisi residu pestisida?

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 39 / 55


Ukuran Asosiasi

Mari kita pikirkan lebih lanjut pertanyaan-pertanyaan tersebut di atas:


Status pestisida, yaitu ada atau tidak, merupakan hasil yang ingin
diteliti. Jenis makanan yaitu, organik atau konvensional, adalah
variabel yang definisikan dua grup yang akan dibandingkan
berdasarkan status pestisida. Dalam hal ini, status pestisida adalah
variabel respons dan jenis makanan adalah peubah penjelas.
Kita tidak bisa membandingkan jumlah mutlak untuk masing-masing
jenis makanan pada Tabel 2 secara langsung. Namun, dengan melihat
frekuensi relatif yaitu proporsi, perbandingan yang adil dapat
dilakukan.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 40 / 55


Ukuran Asosiasi

Mari kita pikirkan lebih lanjut pertanyaan-pertanyaan tersebut di atas:


Berdasarkan Tabel 2 29 dari 127 makanan organik mengandung residu
pestisida. Dengan demikian, proporsi dengan pestisida adalah 29/127
= 0,228. Dengan cara serupa, makanan konvensional yang
mengandung pestisida memiliki proporsi 19.485/26.571 = 0,733, yang
ternyata lebih tinggi daripada makanan organik. Karena 0,733/0,228
= 3,2 kemunculan relatif dari residu pestisida untuk makanan yang
ditumbuhkan secara konvensional hampir tiga kali lipat makanan yang
diproduksi secara organik.
Proporsi semua sampel dengan residu pestisida adalah jumlah total
residu pestisida dibagi total jumlah makanan (29 + 19,485)/(127 +
26,571) = 19,514/26,698 = 0,731.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 41 / 55


Ukuran Asosiasi

Apa yang kita peroleh? Pertama, nilai 0,731 untuk semua proporsi
makanan dengan pestisida mendekati proporsi makanan yang ditanam
secara konvensional yaitu 0,733. Hal ini disebabkan makanan yang
ditumbuhkan secara konvensional membuat persentase yang tinggi pada
sampel yaitu 26,571/26,698 = 0,995. Dengan kata lain residu pestisida
terdapat pada lebih dari 73% sampel dan ini lebih banyak terdapat pada
makanan yang ditumbuhkan secara konvensional.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 42 / 55


Ukuran Asosiasi

Proporsi Bersyarat

Sekarang misalkan pertanyaan “Apakah proporsi makanan organik dan


makanan konvensional berbeda dalam hal residu pestisida?” Untuk
menjawab pertanyaan ini kita menghitung proporsi status pestisida pada
masing-masing kategori jenis makanan dan membandingkannya. Untuk
makanan organik proporsinya adalah 29/127 = 0,228 dan untuk makanan
konvensional 19.485/26.571 = 0,733. Proporsi ini dikatakan proporsi
bersyarat karena formasinya bersyarat (conditional ) pada jenis makanan.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 43 / 55


Ukuran Asosiasi

Proporsi Bersyarat

Proporsi bersyarat untuk status pestisida untuk kedua jenis makanan dapat
dilihat pada tabel berikut.

Tabel: Proporsi bersyarat jenis makanan dan status pestisida

Status Pestisida
Jenis makanan Ada Tidak Ada Total n
Organik 0,23 0,77 1 127
Konvensional 0,73 0,27 1 26.571

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 44 / 55


Ukuran Asosiasi

Proporsi Bersyarat

Proporsi bersyarat pada masing-masing baris berjumlah 1. Pada Tabel 3


masing-masing ukuran sampel n untuk masing-masing proporsi bersyarat
juga disertakan untuk memperjelas frekuensi dasar masing-masing proporsi
bersyarat. Bilamana kita ingin membedakan variabel respons dan variabel
penjelas, adalah hal yang wajar kalau proporsi bersyarat dibuat berdasarkan
variabel penjelas untuk masing-masing kategori variabel respons.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 45 / 55


Ukuran Asosiasi

Proporsi Marginal

Proporsi marginal mengacu kepada jumlah baris atau kolom dari tabel
kontingensi. Sebagai contoh mengabaikan informasi jenis makanan dan
menggunakan jumlah pada margin bawah tabel kita mendapatkan proporsi
marginal 19.514/26.698 = 0,731.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 46 / 55


Ukuran Asosiasi

Mengukur Kekuatan Asosiasi

Kekuatan asosiasi dapat dihitung menggunakan selisih proporsi, rasio


proporsi, dan nisbah gasal (odds ratio).

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 47 / 55


Ukuran Asosiasi

Selisih Proporsi

Lihat kembali data di atas, kita melihat bahwa 73% makanan konvensional
memiliki residu pestisida dan 23% untuk makanan organik. Selisih antara
kedua persentase ini adalah 73% - 23% = 50%. Persentase makanan
konvensional dengan residu pestisida 50% lebih tinggi dibandingkan
makanan organik. Angka ini menunjukkan asosiasi yang cukup kuat antara
kedua variabel. Apabila tidak terdapat asosiasi, selisih kedua proporsi
adalah nol. Cara lain untuk mengatakan hal ini adalah masing-masing
variabel saling bebas. Selisih proporsi berada antara -1 dan 1. Angka -1
dan 1 mencerminkan asosiasi terkuat yang mungkin.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 48 / 55


Ukuran Asosiasi

Rasio Proporsi

Rasio dua proporsi bersyarat, misalnya makanan dengan residu pestisida


pada konvensional dan organik adalah 0,73/0,23 = 3,2. Proporsi makanan
dengan residu pestisida adalah 3,2 kali lebih besar untuk makanan
konvensional dibandingkan makanan organik. Bagaimana kalau kedua
proporsi identik? Nilai rasio ini akan sama dengan satu. Rasio ini sering
disebut rasio risiko (risk ratio) atau risiko relatif (relative risk).

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 49 / 55


Ukuran Asosiasi

Sifat-sifat rasio proporsi adalah sebagai berikut:


1 risiko relatif adalah bilangan nonnegatif;
2 saat p1 = p2 variabel saling bebas dan risiko relatif = 1;
3 nilai yang lebih dari 1 menyatakan asosiasi yang kuat.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 50 / 55


Ukuran Asosiasi

Nisbah Gasal

Ukuran asosiasi berikutnya adalah nisbah gasal (odds ratio). Odds adalah
rasio dari dua proporsi bersyarat pada paris tersebut. Odds pada baris
pertama adalah p1 /(1 − p1 ) dan pada baris kedua nilainya p2 /(1 − p2 ).
Rasio kedua odds disebut odds ratio yang didefinisikan sebagai

p1 /(1 − p1 )
(19)
p2 /(1 − p2 )

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 51 / 55


Ukuran Asosiasi

Tabel: Frekuensi jenis makanan dan status pestisida

Status Pestisida
Jenis makanan Ada Tidak Ada
Organik 0,23/(1 − 0,23) = 0,29 0,77/(1 − 0,77) = 3,35
Konvensional 0,73/(1 − 0,73) = 2,70 0,27/(1 − 0,27) = 0,37

Odds 0,29 berarti proporsi makanan dengan residu pestisida pada makanan
organik 0,29 kali proporsi tidak mengandung pestisida.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 52 / 55


Ukuran Asosiasi

Rasio odds pada makanan yang mengandung pestisida adalah


0,29
= 0,10. (20)
2,70

Artinya odds pada residu pestisida pada makanan organik 0,1 kali odds
makanan konvensional.
Sifat-sifat odds ratio adalah sebagai berikut:
1 Odds ratio dapat berupa sebarang bilangan taknegatif;
2 Dalam asumsi kebebasan p1 = p2 , odds ratio sama dengan 1.
3 Nilai odds ratio yang lebih besar dari satu menunjukkan asosiasi yang
lebih kuat.

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 53 / 55


Ukuran Asosiasi

Pertanyaan?

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 54 / 55


Ukuran Asosiasi

Terima kasih

I Wayan Sumarjaya Ukuran Pemusatan, Penyebaran, dan Asosiasi Data 55 / 55

Anda mungkin juga menyukai