Anda di halaman 1dari 11

Modul Minggu Ke-6

Matakuliah : Statistika

Program Studi : PAI

Semester :V

Penyebaran data atau variabilitas digunakan untuk menggambarkan bagaimana menyebarnya atau
berpencarnya data. Beberapa ukuran penyebaran yang dikenal yaitu: rentang, rentang antar quartil,
simpangan quartil, rata-rata simpangan, simpangan baku, koefisien variasi, koefisien kemiringan, dan
koefisien kurtosis.

1. Data Tunggal
a. Range/rentang (R)
Sebagai dasar untuk memberikan gambaran kenapa pentingnya untuk memahami penyebaran
data tunggal, berikut diberikan data hasil panen tiga varietas padi (kp er petak), masing-masing
terdiri dari 5 petak.
Varietas I : 45 42 42 41 40
Varietas II : 54 48 42 36 30
Kita dapat melihat bahwa nilai mean varietas I dan II bernilai sama, 42 kg, namun apabila kita
perhatikan, keragaman kedua varietas tersebut berbeda. Varietas I mungkin lebih dipilih
karena lebih konsisten. Hal ini terlihat dari data hasil pada varietas I lebih seragam
dibandingkan dengan Varietas II. Pada Varietas I, hasilnya tidak terlalu jauh dari nilai pusatnya,
42 kg, sedangkan pada Varietas II, sebaran datanya sangat beragam (perhatikan gambar
berikut).

Ukuran penyebaran yang paling sederhana adalah Range (Jangkauan/Rentang, terkadang di


beberapa literatur diterjemahkan dengan istilah wilayah). Rentang atau range adalah selisih
data terbesar (DB) dan data terkecil (DK), atau rentang
𝑅 = 𝐷𝐵 – 𝐷𝐾
Misalnya, range untuk Varietas I pada contoh di atas adalah 45 – 40 = 5 (45 adalah nilai terbesar
dan 40 adalah nilai terkecil). Seringkali kita mengatakan range dengan pernyataan seperti
“hasil berkisar antara 40 – 45 kg per petak”. Kisarannya lebih sempit dibandingkan dengan
pernyataan “hasil berkisar antara 40 – 60 kg per petak”. Pernyataan pertama menggambarkan
bahwa variasi hasil padi tidak terlalu beragam, sedangkan pada pernyataan kedua, terjadi hal
sebaliknya.

Range hanya memperhitungkan dua nilai, yaitu nilai maksimum dan nilai minimum dan tidak
memperhitungkan semua nilai, sehingga sangat tidak stabil atau tidak dapat diandalkan
sebagai indikator dari ukuran penyebaran. Hal ini terjadi karena range sangat dipengaruhi oleh
nilai-nilai ekstrim. Pada contoh di atas, jika hasil tertinggi varietas I adalah 60 kg/petak, bukan
45 kg/petak, maka range-nya = 60-40= 20 kg/petak.

Jelas, interpretasi kita akan berubah. Kita lebih sepakat mengatakan bahwa variasi hasil sangat
beragam. Benarkah demikian? Apabila kita perhatikan kembali, nilai hasil padi lainnya hampir
seragam, berkisar antara 40-44 kg/petak. Namun dengan adanya pencilan hasil, 60 kg/petak,
interpretasinya jadi lain, kita cenderung mengatakan bahwa hasil beragam, padahal
keragaman tersebut sebenarnya tidak mewakili semua nilai dalam sampel/populasinya.

Hasil sebesar 60 kg/petak merupakan contoh dari nilai ekstrem dan tidak biasa. Nilai tersebut
merupakan pencilan (outlier) dan sebaiknya di periksa kembali kebenaran datanya atau
dihilangkan dari data pengamatan, karena akan menghasilkan kesimpulan yang tidak tepat.

Dari contoh ini, kita tau bahwa harus ada alternatif lain untuk menjelaskan penyebaran data
atau variabilitas data.

b. Rentang Antar Quartil (RAQ)


Karena range sangat sensitif terhadap data ekstrim, maka dibuat alternatif lain sebagai
indikator penyebaran data, yaitu rentang antar quartil. Rentang antar quartil dihitung dengan
cara menghapus nilai-nilai yang terletak di bawah kuartil pertama dan nilai-nilai di atas kuartil
ketiga, sehingga nilai-nilai ekstrem, baik yang berada di bawah ataupun di atas distribusi data,
dihilangkan. Rentang antar quartil adalah nilai quartil ke-3 dikurangi nilai quartil ke-1 atau
𝑅𝐴𝑄 = 𝑄3 – 𝑄1
Untuk selanjutnya, kita gunakan contoh data nilai mahasiswa berikut 9, 7, 6, 5, 5, 6, 4,
7, 8, 8, 7 penentuan rentang sebagai berikut.
4, 5, 5, 6, 6, 7, 7, 7, 8, 8, 9
Q1 Q2 Q3
Sehingga
𝑅𝐴𝑄 = 8 – 5 = 3

c. Simpangan Quartil (SQ)


Simpangan quartil adalah setengah dari rentang antar quartil (RAQ) atau bisa kita katakan
bahwa SQ merupakan rata-rata dari Q1 dan Q3, rumusnya adalah
1
𝑆𝑄 = (𝑄3 – 𝑄1)
2
Untuk contoh di atas diperoleh
1
𝑆𝑄 = × 3 = 1,5
2

d. Rata-Rata Simpangan (RS)


Simpangan rata-rata merupakan penyimpangan nilai-nilai individu dari nilai rata-ratanya. Rata-
rata bisa berupa mean atau median. Untuk data mentah simpangan rata-rata dari median
cukup kecil sehingga simpangan ini dianggap paling sesuai untuk data mentah. Namun pada
umumnya, simpangan rata-rata yang dihitung dari mean yang sering digunakan untuk nilai
simpangan rata-rata. Simpangan rata-rata dihitung dengan formula berikut:
∑|𝑋𝑖 − 𝑋̅ |
𝑅𝑆 =
𝑁
Sehingga untuk data 9, 7, 6, 5, 5, 6, 4, 7, 8, 8, 7 diperoleh nilai
4 + 5 + 5 + 6 + 6 + 7 + 7 + 7 + 8 + 8 + 9 72
𝑋̅ = = = 6,55
11 11
Sehingga
|4 − 6,55| + 2. |5 − 6,55| + 2 × |6 − 6,55| + 3 × |7 − 6,55| + 2 × |8 − 6,55| + |9 − 6,55|
𝑅𝑆 =
11
= 1,223

e. Standar Deviasi dan Variansi (SD)


Standar deviasi untuk sampel diberi simbol s dan standar deviasi untuk populasi diberi simbol
𝜎. Pangkat dua dari standar deviasi disebut variansi. Sehingga variansi sampel adalah s2 dan
variansi populasi adalah 𝜎². Statistik standar deviasi untuk sampel s dalam bentuk distribusi
frekuensi dirumuskan sebagai berikut.
2 (∑ 𝑓𝑥𝑖 )² (∑ 𝑓𝑥𝑖 )²
√∑ 𝑓𝑥1 − √ ∑ 𝑓𝑥12 −
𝑠= 𝑛 dan 𝜎 = 𝑛
𝑛−1 𝑛
Standar deviasi untuk data 9, 7, 6, 5, 5, 6, 4, 7, 8, 8, 7 dapat dihitung dengan menggunakan
tabel sebagai berikut.
Tabel 1 Perhitungan Varians dan Standar Deviasi
𝒙𝒊 𝒇𝒊 𝒙𝟐𝒊 𝒇𝒊 𝒙 𝒊 𝒇𝒊 𝒙𝟐𝒊
4 1 16 4 16
5 2 25 10 50
6 2 36 12 72
7 3 49 21 147
8 2 64 16 128
9 1 81 9 81
Jumlah 11 - 72 494

Sehingga standar deviasi sampel dan populasi:


2 (∑ 𝑓𝑥𝑖 )² 2 (∑ 𝑓𝑥𝑖 )²
√∑ 𝑓𝑥1 − 𝑛 √∑ 𝑓𝑥1 − 𝑛
𝑠= dan 𝜎 =
𝑛−1 𝑛
(72)² (72)²
√494 − 11 √494 − 11
𝑠= dan 𝜎 =
11 − 1 11
𝑠 = √2,2727 dan 𝜎 = √2,0661
𝑠 = 1, 508 dan 𝜎 = 1,437
Sedangkan variansi sampel dan variansi populasi masing-masing adalah s2 = 2,274 dan 𝜎2 =
2,064. Untuk menentukan rumus mana yang digunakan, kita harus mengetahui terlebih
dahulu, data apa yang kita punya. Jika data yang kita punya adalah data sampel, maka standar
deviasinya adalah s = 1,508, tetapi jika yang dipunyai adalah data populasi maka standar
deviasinya adalah 1,437. Dengan logika yang sama, kita dapat menjelaskan variansi sampel dan
populasi.

f. Koefisien Varians (KV)


Jika nilai pada poin a hingga e digunakan untuk menjelaskan penyebaran data yang sebanding,
maka berbeda dengan koefisien varians. Koefisien varians, disebut juga koefisien variasi, biasa
digunakan untuk membandingkan dua data yang sumbernya berbeda. Merupakan sebuah
kelemahan, jika ingin membandingkan pada dua kelompok data, contohnya pada 10
perusahaan besar di negara AS dengan yang berada di negara Indonesia atau harga sepuluh
mobil (juta rupiah) dengan harga sepuluh ekor ayam (ribuan rupiah). Koefisien varians
dinyatakan dalam persen dengan rumus:
𝑆𝑡𝑎𝑛𝑑𝑎𝑟 𝐷𝑒𝑣𝑖𝑎𝑠𝑖
𝐾𝑉 = × 100%
𝑅𝑎𝑡𝑎 − 𝑅𝑎𝑡𝑎

Sehingga koefisien varians untuk data 9, 7, 6, 5, 5, 6, 4, 7, 8, 8, 7 adalah:


𝑆𝑡𝑎𝑛𝑑𝑎𝑟 𝐷𝑒𝑣𝑖𝑎𝑠𝑖
𝐾𝑉 = × 100%
𝑅𝑎𝑡𝑎 − 𝑅𝑎𝑡𝑎
1,508
𝐾𝑉 = × 100%
6,55
𝐾𝑉 = 23,02%

Contoh lain untuk menunjukkan kegunaan Koefisien varians: Pada lampu taman yang memiliki
rata-rata 2.800 jam dan simpangan baku yakni 700 jam, Pada lampu kota akan dipakai dengan
rata-rata 3.500 jam dan memiliki simpangan 1.050 jam. Lalu, lampu manakah yang lebih baik
dari 2 lampu tersebut?
Koefisien variasi lampu taman:
700
𝐾𝑉 = × 100%
2800
= 25%
Koefisien variasi lampu kota:
1050
𝐾𝑉 = × 100%
3500
= 30%
Dari perbandingan koefisien variasi, lampu taman lebih baik dari pada lampu kota, karena KV
lampu taman < KV lampu kota.
g. Koefisien Kemiringan (𝜶𝟑 )
Sebuah distribusi simetris adalah satu di mana rata-rata, median, dan modus bertepatan
dengan satu sama lain, dan kedua bagian distribusi adalah bayangan cermin satu sama lain.
Secara praktis, sulit untuk menemukan distribusi simetris. Distribusi yang paling sering diamati
adalah distribusi asimetris atau miring.

Distribusi yang tidak simetris disebut miring (swekness). Distribusi miring ada dua yaitu miring
positif dan miring negatif. Distribusi miring positif atau landai kanan bila ekor kanan lebih
panjang dari ekor kiri. Sedangkan distribusi miring negatif atau landai kiri bila ekor kiri lebih
panjang dari ekor kanan.

(i) Miring Positif (ii) Miring Negatif

Perhatikan bahwa gambar diatas hanya ditujukan untuk memberikan contoh data yang
simetris, miring positif, dan miring negatif dan berbeda dengan data yang kita gunakan pada
contoh modul ini.
Koefisien kemiringan pearson dihitung dengan rumus:
(𝑥̅ − 𝑚𝑒) 𝑥̅ − 𝑚𝑜
𝜎3 = atau 𝜎3 =
𝑠 𝑠
Sehingga untuk data 4, 5, 5, 6, 6, 7, 7, 7, 8, 8, 9 telah diperoleh 𝑥̅ = 6,55 dan mo = 7, sehingga
jika menggunakan rumus
𝑥̅ − 𝑚𝑜 6,55 − 7
𝜎3 = = ( ) = −2,98
𝑠 1,508
Karena berharga negatif, maka distribusi data miring negatif atau landai kiri.

h. Koefisien Kurtosis (𝜶𝟒 )


Koefisien kurtosis adalah ukuran keruncingan dari distribusi data. Makin runcing suatu kurva
maka makin kecil simpangan baku sehingga data makin mengelompok atau homogen.
Ukuran keruncingan suatu distribusi dinyatakan dengan koefisien kurtosis, dengan rumus
sebagai berikut.
1
(𝑄3 − 𝑄1 )
𝛼4 = 2
𝑃90 − 𝑃10
Di mana :
Q1 = Quartil pertama
Q3 = Quartil ketiga
P90 = Persentil ke-90
P10 = Persentil ke-10
Kriteria untuk koefisien 𝛼4 sebagai berikut.
a. Jika 𝛼4 > 0,263 maka model kurva runcing (leptokurtis)
b. Jika 𝛼4 = 0,263 maka model kurva normal (mesokurtis)
c. Jika 𝛼4 < 0,263 maka model kurva datar (platikurtis)
Untuk data 4, 5, 5, 6, 6, 7, 7, 7, 8, 8, 9, diperoleh nilai Q1 = 5, Q3 = 8, P10 = 4,2, P90 = 8,8. Sehingga

1 1
2 (𝑄3 − 𝑄1 ) (8 − 5) 1,5
𝛼4 = = 2 = = 0,326 > 0,263
𝑃90 − 𝑃10 8,8 – 4,2 4,6

maka model kurvanya adalah runcing (leptokurtis).


2. Data Kelompok
Secara teori, ukuran penyebaran atau variabilitas untuk data tunggal dan kelompok memiliki fungsi
yang sama, hanya berbeda cara menghitungnya. Untuk memahami penyebaran data kelompok
menggunakan contoh data distribusi frekuensi kemampuan koneksi matematis 100 siswa yaitu
sebagai berikut.
Tabel 2 Distribusi Frekuensi Kemampuan Koneksi Matematis
Nilai frekuensi
45 – 50 4
51 – 56 4
57 – 62 8
63 – 68 30
69 – 74 31
75 – 80 20
81 – 86 2
87 – 92 1
Jumlah 100
Berdasarkan pada perhitungan yang dilakukan pada Modul sebelumnya telah diperoleh hasil-hasil
perhitungan, sebagaimana disajikan pada tabel berikut.
Tabel 3 Statistik Kemampuan Koneksi Matematis
Statistik f
n 100
Min 45
Maks 90
Mean 68,68
Median 69,27
Modus 69
Q1 64,3
Q3 74,11
P10 58
P90 76,45
a. Rentang (R)
R = Data terbesar (DB) – data terkecil (DK) = 90 – 45 = 45

b. Rentang Antar Quartil (RAQ)


RAQ = Q3 – Q1 = 74,11 – 64,3 = 9,81

c. Simpangan Quartil (SQ)


1 1
SQ = 2 (Q3 – Q1) = 2 × 9,81 = 4,905

d. Rata-Rata Simpangan (RS)


Rata-rata simpangan adalah jumlah harga mutlak dari jarak setiap data terhadap rata-rata
dibagi banyaknya data atau dirumuskan sebagai berikut:
∑ 𝑓|𝑋𝑖 − 𝑋̅|
𝑅𝑆 =
𝑁
Langkah selanjutnya adalah membuat tabel untuk menentukan rata-rata simpangan data
kelompok.
Tabel 4 Perhitungan Rata-Rata Simpangan
𝑿𝒊 𝒇 ̅
𝑿 𝑿𝒊 − 𝑿 ̅ | 𝑿𝒊 − 𝑿 ̅| 𝒇. |𝑿𝒊 − 𝑿̅|
47,5 4 68,68 -21,18 21,18 84,72
53,5 4 68,68 -15,18 15,18 60,72
59,5 8 68,68 -9,18 9,18 73,44
65,5 30 68,68 -3,18 3,18 95,40
71,5 31 68,68 2,82 2,82 87,42
77,5 20 68,68 8,82 8,82 176,40
83,5 2 68,68 14,82 14,82 29,64
89,5 1 68,68 20,82 20,82 20,82
Jumlah 100 - - - 628,56
Sehingga rata-rata simpangan

∑ 𝑓|𝑋𝑖 − 𝑋̅| 628,56


𝑅𝑆 = = = 6,2856
𝑁 100

e. Standar Deviasi dan Varians


Perhitungan standar deviasi atau simpangan baku sampel s dan simpangan baku populasi 𝜎
menggunakan rumus sebagai berikut.
2 (∑ 𝑓𝑥𝑖 )² 2 (∑ 𝑓𝑥𝑖 )²
√∑ 𝑓𝑥1 − 𝑛 √∑ 𝑓𝑥1 − 𝑛
𝑠= dan 𝜎 =
𝑛−1 𝑛
Untuk perhitungan simpangan baku sampel dan populasi data distribusi frekuensi kemampuan
koneksi matematis dapat dibuat tabel bantu sebagai berikut.
Tabel 5 Perhitungan Standar Deviasi dan Varians
𝑿𝒊 𝒇𝒊 𝑿𝟐𝒊 𝒇𝒊 𝑿 𝒊 𝒇𝒊 𝑿𝟐𝒊
47,5 4 2256,25 190,00 9025,00
53,5 4 2862,25 214,00 11449,00
59,5 8 3540,25 476,00 28322,00
65,5 30 4290,25 1965,00 128707,50
71,5 31 5112,25 2216,50 158479,75
77,5 20 6006,25 1550,50 120125,00
83,5 2 6972,25 167,82 13944,50
89,5 1 8010,25 89,50 8010,25
Jumlah 100 - 6868 478063
Sehingga standar deviasi dan varians:
2 (∑ 𝑓𝑥𝑖 )² 2 (∑ 𝑓𝑥𝑖 )²
√∑ 𝑓𝑥1 − 𝑛 √∑ 𝑓𝑥1 − 𝑛
𝑠= 𝑑𝑎𝑛 𝜎 =
𝑛−1 𝑛
(6868)² (6868)²
√478063 − 100 √478063 − 100
𝑠= 𝑑𝑎𝑛 𝜎 =
100 − 1 100
𝑠 = √64,33091 𝑑𝑎𝑛 𝜎 = √63,6876
𝑠 = 8,021 𝑑𝑎𝑛 𝜎 = 7,981
Sedangkan varians sampel dan varians populasi masing-masing s2 = 64,331 dan 𝜎2 = 63,696

f. Koefisien Varian (KV)


Koefisien varians dinyatakan dalam persen dengan rumus:
𝑆𝑡𝑎𝑛𝑑𝑎𝑟 𝐷𝑒𝑣𝑖𝑎𝑠𝑖
𝐾𝑉 = × 100%
𝑅𝑎𝑡𝑎 − 𝑅𝑎𝑡𝑎
Sehingga koefisien korelasi dari data distribusi frekuensi kemampuan koneksi matematis
adalah sebagai berikut:
𝑆𝑡𝑎𝑛𝑑𝑎𝑟 𝐷𝑒𝑣𝑖𝑎𝑠𝑖
𝐾𝑉 = × 100%
𝑅𝑎𝑡𝑎 − 𝑅𝑎𝑡𝑎
8,021
𝐾𝑉 = × 100%
68,68
𝐾𝑉 = 11,68%

g. Koefisien Kemiringan
Koefisien kemiringan pearson dihitung dengan rumus:
(𝑥̅ − 𝑚𝑒) 𝑥̅ − 𝑚𝑜
𝜎3 = 𝑎𝑡𝑎𝑢 𝜎3 =
𝑠 𝑠
Berdasarkan hasil perhitungan pada Tabel 3 dan Tabel 5 dapat ditentukan nilai koefisien
kemiringan data distribusi frekuensi kemampuan koneksi matematis sebagai berikut.
𝑥̅ − 𝑚𝑜 68,68 − 69
𝜎3 = = ( ) = −0,039
𝑠 8,021
Jadi distribusi data miring negatif atau landai di sebelah kiri.

h. Koefisien Kurtosis
Ukuran keruncingan suatu distribusi dinyatakan dengan koefisien kurtosis, dengan rumus
sebagai berikut.
1
(𝑄3 − 𝑄1 )
𝛼4 = 2
𝑃90 − 𝑃10
Di mana :
Q1 = Quartil pertama
Q3 = Quartil ketiga
P90 = Persentil ke 90
P10 = Persentil ke 10
Kriteria untuk koefisien 𝛼4 sebagai berikut.
a. Jika 𝛼4 > 0,263 maka model kurva runcing (leptokurtis)
b. Jika 𝛼4 = 0,263 maka model kurva normal (mesokurtis)
c. Jika 𝛼4 < 0,263 maka model kurva datar (platikurtis)
Berdasarkan hasil perhitungan yang disajikan pada Tabel 3 diperoleh Q1 = 64,3, Q3 = 74,11, P10
= 58, P90 = 76,45. Sehingga nilai koefisien kurtosis:

1 1
(𝑄3 − 𝑄1 ) (74,11 − 64,30) 4,905
𝛼4 = 2 = 2 = = 0,266 > 0,263
𝑃90 − 𝑃10 76,45 – 58 18,45

maka model kurvanya adalah runcing (leptokurtis).

Anda mungkin juga menyukai