Di Susun Oleh :
Satrya Zullyanova (G0B017009)
Prodi :
D3 Gizi
Dosen Pengampu :
Dr. Ir. Rahayu Astuti, M.Kes
Statistik/data merupakan poin penting dalam statistika. Ada bermacam-macam data yang dikenal
dalam statistika, antara lain:
Data kualitatif yaitu data yang berbentuk kalimat, kata atau gambar. Contoh dari data
kualitatif adalah tidak enak, enak, sangat enak.
Data kuantitatif yaitu data berupa angka. Data kuantitatif dapat dikelompokkan menjadi
dua besar yaitu diskrit dan kontinu. Data diskrit adalah data yang diperoleh dari hasil
menghitung atau membilang (bukan mengukur) Contohnya jumlah mahasiswa mipa
matematika ada 500 orang, peserta seminar mathfair berjumlah 300 orang, dan himpunan
bilangan asli dari 1 sampai 8 A= {1,2,3,4,5,6,7,8}.
Data diskrit yaitu data data yang tidak dikonsepsikan adanya nulai-nilai di antara data
(bilangan) lain yang terdekat contoh banyaknya jumlah anak di suatu keluarga, jumlah
rumah di suatu kampung. Misalnya juka bilangan 2 dan 3 menunjukan jumlah anak anak
di keluarga A dan keluarga B, maka di antara kedua bilangan tersebut tidak ada bilangan-
bilangan lain. Tidak pernah kita mengatakan bahwa jumlah anak di suatu keluarga adalah
2,4 atau 2,9.
Data kontinu yaitu data yang didapat dari hasil pengukuran. Data hasil pengukuran
diperoleh dari tes, kuesioner ataupun alat ukur lain yang sudah terstandar misalnya
timbangan, panjang ataupun data psikologis yang lain. yang termasuk data kontinum ini
adalah interval dan rasio.
Data didapatkan dari perhitungan dan pengukuran. Pengukuran adalah penggunaan aturan
untuk menetapkan bilangan pada obyek atau peristiwa. Dengan kata lain, pengukuran
memberikan nilai-nilai variabel dengan notasi bilangan. Aturan penggunaan notasi
bilangan dalam pengukuran disebut data atau tingkat pengukuran (scales of
measurement).Secara lebih rinci, dalam statistik terdapat 4data pengukuran yaitu
nominal, ordinal, interval dan rasio.
Data nominal adalah data mengelompokkan obyek atau peristiwa dalam berbentuk
kategori. Data nominal diperoleh dari pengukuran nominal yaitu suatu proses
mengklasifikasian obyek-obyek yang berbeda kedalam kategori-kategori berdasarkan
beberapa karakteristik tertentu.
Karakteristik data nominal adalah
• Kategori data bersifat mutually eksklusif (setiap obyek hanya memiliki satu kategori)
• Kategori data tidak disusun secara logis
Contoh : Jenis Kelamin, warna kulit, dan agama, pada contoh tersebut kita memahami
bahwa data nominal kita hanya dapat mengetahui bahwa subjek termasuk ke dalam
kategori tertentu (pria atau wanita, hitam atau putih atau sawo matang, Islam atau Kristen
atau Budha atau lainya). Perbedaan subjek dalam data nominal bersifat kualitatif dan
tidak mempunyai makna kuantitatif.
Data ordinal adalah data yang menunjukkan perbedaan tingkatan subjek secara
kuantitatif. Contoh :Data ini biasanya dipergunakan dalam menentukan ranking
seseorang dibandingkan dengan yang lain. misalnya ranking siswa dikelas dibuat dari
nilai tertinggi sampai nilai terendah. Ranking pertama dan kedua tidak memiliki jarak
rentangan yang sama dengan ranking kedua dan ketiga. Contoh lain data ordinal adalah
nilai mahasiswa dalam bentuk huruf, A, B, C, D dan E.data ordinal memiliki
karakteristik:
• Kategori data bersifat mutually eksklusif (setiap obyek hanya memiliki satu kategori)
• Kategori data tidak disusun secara logis
• Kategori data disusun berdasarkan urutan logis dan sesuai dengan besarnya karakteristik
yang dimiliki
Secara singkat, dapat dikata bahwa data ordinal, disamping memiliki sifat yang dimiliki
data nominal juga menunjukan kedudukan (tingkatan) subjek dalam suatu kelompok pada
suatu variable.
Data interval adalah data yang yang memiliki jarak yang sama antar datanya akan tetapi
tidak memiliki nol mutlak. Nol mutlak artinya tidak dianggap ada. Selain memiliki kedua
ciri di atas (menunjukan klasifikasi dan kedudukan subjek dalam kelompok), data interval
juga memiliki sifat kesamaan jarak (equality of interval) antara nilai yang satu dengan
nilai yang lain. Skor mentah (raw score) yang dihasilkan dari suatu tes hasil belajar atau
tes kecerdasan sering disebut sebagai data yang berdata interval (data interval). Salah satu
ciri matematis yang dimiliki data interval adalah penjumlahan. Dengan demikian, kita
dapat membuat operasi penambahan atau pengurangan. Misalnya, jarak pada temperature
tertentu. Jarak antara 250F dengan 500F sama dengan jarak 750F dengan 1000F. akan
tetapi, data suhu ini tidak memiliki titik nol mutlak sehingga kita tidak bisa melakukan
operasi perkalian dan pembagian. Untuk itu maka ada satu lagi data yaitu data rasio.
Data rasio adalah data yang bersekala rasio hampir sma dengan data interval, yakni
keduanya memiliki ketiga sifat di atas (menunjukan klasifikasi dan kedudukan subjek
dalam suatu kelompok, serta sifat persamaan jarak). Data rasio berbeda dari data interval
karena pertama data rasio memiliki nilai mutlak nol. Data pengukuran yang memiliki nol
mutlak sehingga dapat dilakukan operasi perkalian dan pembagian. Misalnya berat badan,
tinggi badan, pendapatan dan lain sebagainya. untuk melakukan pengujian hipotesis,
maka data yang kita miliki minimal berdata interval. jika data berdatanominal atau
ordinal, data tersebut harus ditransfer dulu kedata. Contoh : perbandingan (rasio) antara
skor-skor yang berdata rasio, 20 kg adalah 2 kali 10 kg, 15 m = 3 m x 5 m dan
sebagainya.
II. VARIABEL
Variabel penelitian pada dasarnya adalah segala sesuatu yang berbentuk apa saja yang ditetapkan
peneliti untuk dipelajari sehingga diperoleh informasi tentang hal tersebut, kemudian ditarik
kesimpulan (Sugiyono, 2003:38).
Menurut hubungan antara satu variabel dengan variabel yang lain maka macam-macam variabel
dalam penelitian dapat dibedakan menjadi:
1. Variabel Independent
2. Variabel Dependen
3. Variabel Moderator
4. Variabel Intervening
5. Variabel Kontrol
Variabel Independent. Variabel ini sering di sebut sebagai variabel stimulus, prediktor,
antecedent. Dalam bahasa Indonesia sering disebut variabel bebas. Variabel bebas adalah
variabel yang mempengaruhi atau menjadi sebab perubahannya atau timbulnya variabel
dependen (terikat)
Variabel Dependen sering disebut sebagai variabel output kriteria, konsekuen. Dalam bahasa
Indonesia sering disebut sebagai variabel terikat. Variable terikat merupakan variabel yang
dipengaruhi atau menjadi akibat, karena adanya variable bebas.
Variabel Intervening adalah variabel yang secara teoritis mempengaruhi hubungan antara
variabel indenpenden dengan dependen menjadi hubungan yang tidak langsung dan dapat
diamati dan diukur.
Variabel Kontrol yaitu variabel yang dikendalikan atau dibuat konstan sehingga pengaruh
variabel indenpenden terhadap dependen tidak dipengaruhi oleh faktor luar yang diteliti.
Variabel kontrol sering dipergunakan peneliti, bila akan melakukan penelitian yang bersifat
membandingkan
Sementara pakar lain dalam menentukan variabel penelitian menganut variabel pokok dengan
tetap mengemukakan variabel independen dan dependen. Husaini Usman, Purnomo Setiady
Akbar (2009: 42) menyatakan penentuan variabel pokok yang meliputi variabel independen dan
dependen berdasarkan rumusan hipotesis yang telah dibuat terdahulu. Sebaliknya, hubungan
antar variabel pokok ini dibuat gambarnya. Kemudian, dilanjutkan dengan definisi
operasionalnya, termasuk di dalamnya tentang cara mengukur serta skala pengukurannya.
Notoadmodjo (2005) mengemukakan Variabel penelitian adalah sesuatu yang digunakan sebagai
sifat, ukuran atau ciri yang dimiliki atau didapat oleh suatu penelitian tentang suatu konsep
pengertian dan berdasarkan hubungan fungsional antara variabel independent dan dependent.
Ukuran Pemusatan Data merupakan salah satu pengukuran data dalam statistika. Ukuran
Pemusatan data terdiri dari penghitungan rata-rata (Mean), nilai tengah (Median), dan nilai
yang sering muncul (Modus).
Ukuran pemusatan Data adalah sembarang ukuran yang menunjukkan pusat segugus data, yang
telah diurutkan dari yang terkecil sampai yang terbesar atau sebaliknya dari yang terbesar sampai
yang terkecil.
Salah satu kegunaan dari ukuran pemusatan data adalah untuk membandingkan dua ( populasi )
atau contoh, karena sangat sulit untuk membandingkan masing-masing anggota dari masing-
masing anggota populasi atau masing-masing anggota data contoh.
Dapat kita ketahui dari data statistik diatas menjelaskan tentang jumlah sekrup baja yang cacat
pada setiap produksi. Data tersebut berfungsi untuk mengevaluasi kegiatan produksi, sehingga
untuk produksi kedepannya dapat meminimalisasi produk yang gagal. Melalui data tersebut,
dapat dilihat bahwa cara pengumpulan datanya melalui survey dengan metode stratified random
sampling. Dimana sampel yang digunakan dapat mewakili dari produk setiap dilakukan
produksi.
Selanjutnya data yang telah didapat disajikan menjadi diagram batang seperti pada gambar
tersebut. Tampilannya yang mudah dipahami dan cukup representatif apabila digunakan untuk
evaluasi kinerja. Namun apabila kita ingin menelisik lebih jauh dan menginginkan tampilan yang
lebih kompleks, dapat kita coba dengan menggunakan tabel distribusi frekuensi.
5–6 5
7–8 6
9 – 10 5
11 – 12 7
13 – 14 6
15 – 16 1
Jumlah 30
Nah, dari data berkelompok tersebut kita akan mencari mean, median, dan modusnya. Tapi,
sebelumnya, Kita review tentang apasih mean, median, dan modus itu? Dan apa perbedaan dari
mean, median, dan modus dari data tunggal dan data berkelompok? Oke langsung cus aja yuk!
a. Mean
Mean atau rata-rata hitung adalah nilai yang diperoleh dari jumlah sekelompok data dibagi
dengan banyaknya data. Rata-rata disimbolkan dengan x.
Rata-Rata untuk Data Tunggal
Keterangan:
ẋ = mean
n= banyaknya data
Contoh Rataan Data tunggal
Hitunglah nilai rata-rata dari nilai ujian matematika kelas 3 SMU berikut ini: 2, 4, 5, 6, 6, 7, 7, 7,
8, 9.
Jawab:
Keterangan :
fi = frekuensi
xi = nilai tengah
Nilai tengah adalah jumlah tepi bawah dan tepi atas di bagi 2.
Data berkelompok :
b. Median
Median adalah nilai data yang terletak di tengah setelah data diurutkan. Dengan demikian,
median membagi data menjadi dua bagian yang sama besar. Median (nilai tengah) disimbolkan
dengan Me.
Keterangan:
Me = Median
n = jumlah data
x = nilai data
Contoh Median Data Tunggal
Tentukan median dari data berikut.
1. 8,6,4,3,7,5,8,10,8,9,8,5
2. Sepuluh orang siswa dijadikan sampel dan dihitung tinggi badannya. Hasil pengukuran
tinggi badan kesepuluh siswa tersebut adalah sebagai berikut.
172, 167, 180, 171, 169, 160, 175, 173, 170, 165
Hitunglah median dari data tinggi badan siswa!
Jawab :
1. Data diurutkan : 3 4 5 5 6 7 8 8 8 8 9 10
N= 12 (genap)
Jadi, mediannya adlah 7,5
2. Karena jumlah data genap, maka penghitungan median menggunakan rumus median untuk
data genap. Proses penghitungannya adalah sebagai berikut.
Untuk melanjutkan penghitungan, kita harus terlebih dahulu mengetahui nilai x5 dan x6.
Kedua nilai data tersebut dapat diperoleh dengan mengurutkan semua data. Hasil pengurutan
adalah sebagai berikut.
160, 165, 167, 169, 170, 171, 172, 173, 175, 180
Dari pengurutan tersebut diperoleh nilai x5 sama dengan 170 dan x6 sama dengan 171.
Dengan demikian penghitungan median dapat dilanjutkan.
Keterangan :
Tb = Tepi bawah kelas median (Batas bawah – 0,5)
F = Frekuensi kumulatif sebelum median
f = Frekuensi
c = Panjang kelas
n = Jumlah frekuensi
Yuk kita coba lagi, menggunakan data berkelompok yang telah kita punya :
Letak kelas median: Setengah dari seluruh data = 30, terletak pada kelas ke-3 (jumlah 9-10)
Tb = 9 – 0,5 = 8,5
c =2
n = 80, f = 24
f = 5 (frekuensi kelas median)
F = 5 + 6 = 11
c. Modus
Modus adalah data yang paling sering muncul atau memiliki frekuensi tertinggi. Modus
dilambangkan dengan Mo. Beberapa kemungkinan tentang modus suatu gugus data:
Apabila pada sekumpulan data terdapat dua modus, maka gugus data tersebut
dikatakan bimodal.
Apabila pada sekumpulan data terdapat lebih dari dua modus, maka gugus data tersebut
dikatakan multimodal.
Apabila pada sekumpulan data tidak terdapat modus, maka gugus data tersebut
dikatakan tidak mempunyai modus.
Modus untuk data tunggal
Modus dari data tunggal adalah data yang paling sering muncul.
Contoh :
Tentukan modus dari data berikut !
4, 8, 7, 4, 6, 3, 6, 8, 6, 3
Jawab :
Data yang paling sering muncul adalah 6, maka Mo = 6
Modus untuk data berkelompok
Keterangan :
Kecondongan suatu kurva dapat dilihat dari perbedaan letak mean, median dan modusnya. Jika
ketiga ukuran pemusatan data tersebut berada pada titik yang sama, maka dikatakan simetris atau
data berdistribusi normal. Sedangkan jika tidak berarti data tidak simetris atau tidak berdistribusi
normal.
Ukuran kecondongan data terbagi atas tiga bagian, yaitu :
Kecondongan data ke arah kiri (condong negatif) dimana nilai modus lebih dari nilai mean
(modus > mean).
Kecondongan data simetris (distribusi normal) dimana nilai mean dan modus adalah sama
(mean = modus).
Kecondongan data ke arah kanan (condong positif) dimana nilai mean lebih dari nilai modus
(mean > modus).
Dari gambar grafik diatas dapat kita lihat bahwa nilai modus lebih dari pada nilai mean
(modus>mean). Sehingga Skewness (kecondongan) dari data tersebut adalah Skewed to the left
or negatively skewed (Kecondongan data ke arah kiri atau condong negatif)
UKURAN PENYEBARAN DATA
Ukuran tendensi sentral (mean, median, mode) merupakan nilai pewakil dari suatu distribusi
frekuensi, tetapi ukuran tersebut tidak memberikan gambaran informasi yang lengkap mengenai
bagaimana penyebaran data pengamatan terhadap nilai sentralnya. Sebagai contoh, kita
mempunyai distribusi hasil panen dua varietas padi (kg per plot), masing-masing terdiri dari 5
plot. Andaikan distribusi datanya sebagai berikut:
Varietas I : 45 42 42 41 40
Varietas II : 54 48 42 36 30
Varietas III : 45 40 44 41 40
Kita dapat melihat bahwa nilai mean varietas I dan II bernilai sama, 42 kg, namun apabila kita
perhatikan, keragaman kedua varietas tersebut berbeda. Varietas I mungkin lebih dipilih karena
lebih konsisten. Hal ini terlihat dari data hasil pada varietas I lebih seragam dibandingkan dengan
Varietas II. Pada Varietas I, hasilnya tidak terlalu jauh dari nilai pusatnya, 42 kg, sedangkan pada
Varietas II, sebaran datanya sangat beragam (perhatikan gambar berikut).
Pada contoh tersebut, jelas bahwa ukuran tendensi sentral saja tidak cukup untuk
menggambarkan distribusi frekuensi. Selain itu kita harus memiliki ukuran persebaran data
pengamatan. Ukuran penyebaran atau ukuran keragaman pengamatan dari nilai rata-ratanya
disebut simpangan (deviation/dispersi). Terdapat beberapa ukuran untuk menentukan dispersi
data pengamatan, seperti jangkauan/rentang (range), simpangan kuartil (quartile deviation),
simpangan rata-rata (mean deviation), dan simpangan baku (standard deviation).
Jangkauan (Range)
Misalnya, range untuk Varietas I pada tabel di atas adalah 45 – 40 = 5 (45 adalah nilai
maksimum dan 40 adalah nilai minimum). Seringkali kita mengatakan range dengan pernyataan
seperti “hasil berkisar antara 40 – 45 kg per petak”. Kisarannya lebih sempit dibandingkan
dengan pernyataan “hasil berkisar antara 40 – 60 kg per petak”. Pernyataan pertama
menggambarkan bahwa variasi hasil padi tidak terlalu beragam, sedangkan pada pernyataan
kedua, terjadi hal sebaliknya.
Range hanya memperhitungkan dua nilai, yaitu nilai maksimum dan nilai minimum dan tidak
memperhitungkan semua nilai, sehingga sangat tidak stabil atau tidak dapat
diandalkan sebagai indikator dari ukuran penyebaran. Hal ini terjadi karena range sangat
dipengaruhi oleh nilai-nilai ekstrim. Pada contoh di atas, jika hasil tertinggi varietas I adalah 60
kg/petak, bukan 45 kg/petak, maka range-nya = 60-40= 20 kg/petak.
Jelas, interpretasi kita akan berubah. Kita lebih sepakat mengatakan bahwa variasi hasil sangat
beragam. Benarkah demikian? Apabila kita perhatikan kembali, nilai hasil padi lainnya hampir
seragam, berkisar antara 40-44 kg/petak. Namun dengan adanya pencilan hasil, 60 kg/petak,
interpretasinya jadi lain, kita cenderung mengatakan bahwa hasil beragam, padahal keragaman
tersebut sebenarnya tidak mewakili semua nilai dalam sampel/populasinya.
Hasil sebesar 60 kg/petak merupakan contoh dari nilai ekstrem dan tidak biasa. Nilai tersebut
merupakan pencilan (outlier) dan sebaiknya di periksa kembali kebenaran datanya atau
dihilangkan dari data pengamatan, karena akan menghasilkan kesimpulan yang tidak tepat.
Simpangan kuartil dihitung dengan cara menghapus nilai-nilai yang terletak di bawah kuartil
pertama dan nilai-nilai di atas kuartil ketiga, sehingga nilai-nilai ekstrem, baik yang berada di
bawah ataupun di atas distribusi data, dihilangkan.
Simpangan kuartil didapatkan dengan cara menghitung nilai rata-rata dari kedua kuartil tersebut,
Q1 dan Q3.
Simpangan kuartil lebih stabil dibandingkan dengan Range karena tidak dipengaruhi oleh nilai
ekstrem. Nilai-nilai ekstrim sudah dihapus. Meskipun demikian, sama seperti Range, simpangan
kuartil juga tetap tidak memperhatikan dan memperhitungkan penyimpangan semua gugus
datanya. Simpangan kuartil hanya memperhitungkan nilai pada kuartil pertama dan kuartil ketiga
saja.
Simpangan rata-rata merupakan penyimpangan nilai-nilai individu dari nilai rata-ratanya. Rata-
rata bisa berupa mean atau median. Untuk data mentah simpangan rata-rata dari median cukup
kecil sehingga simpangan ini dianggap paling sesuai untuk data mentah. Namun pada umumnya,
simpangan rata-rata yang dihitung dari mean yang sering digunakan untuk nilai simpangan rata-
rata. Simpangan rata-rata dihitung dengan formula berikut:
Formula tersebut tentu memenuhi dua kriteria sebelumnya, dihitung dari semua data dan
menunjukkan dispersi rata-rata dari mean, tetapi tidak memenuhi kriteria ketiga. Bagaimanapun
dispersi dari data, semua perhitungan dengan rumus ini akan selalu menghasilkan nilai nol. Hal
ini karena pembilang dari rumus di atas menunjukkan bahwa hasil penjumlahannya
akan selalu sama dengan nol.
Terdapat dua cara untuk mengantisipasi masalah ini, keduanya akan menghilangkan tanda-tanda
negatif dari perhitungan.
Sampel:
Populasi:
Simpangan rata-rata yang dihitung dari distribusi frekuensi data yang dikelompokkan
menggunakan nilai data perkiraan, bukan data aslinya. Data pewakil tersebut disimbolkan
dengan m. Untuk membuat perhitungan dari data yang sudah dikelompokkan kita harus
menganggap, bahwa semua nilai dalam sebuah kelas, sama dengan nilai pewakilnya (tanda
kelasnya, mi). Selanjutnya, nilai perkiraan simpangan rata-rata dapat dihitung dengan
menggunakan rumus:
Pada formula di atas, pembilangnya akan selalu bernilai positif, karena yang diambil adalah nilai
mutlaknya, perhatikan tanda modulus || yang berarti baik hasilnya negatif ataupun positif akan
selalu diperlakukan sebagai data positif.
Cara kedua adalah dengan menggunakan jumlah kuadrat dari semua nilai simpangan datanya.
Cara ini dikenal dengan istilah Ragam (varians) dan standar deviasi.
Secara matematis hal tersebut tidak benar. Cara kedua, yaitu dengan mengkuadratkan nilai
simpangan sehingga nilai negatif berubah menjadi positif. Cara ini lebih tepat. Rata-rata dari
jumlah nilai simpangan dikenal dengan ragam(varians). Setelah nilai ragam diperoleh,
selanjutnya nilai ragam tersebut diakarkan untuk mendapatkan kembali satuan asal dari variabel
tersebut (bukan kg2/petak2, tapi kg/petak ) . Cara pengukuran keragaman seperti ini dikenal
dengan Standar deviasi.
Standar deviasi populasi disimbolkan dengan ? (baca ‘sigma’) dan standar deviasi
sampel disimbolkan dengans. Standar deviasi sampel yang baik seharusnya merupakan ukuran
yang tidak bias terhadap standar deviasi populasinya, karena kita menggunakan ukuran standar
deviasi sampel untuk memperkirakan nilai standar deviasi populasi. Untuk itu, nilai n pada
formula di atas diganti dengan n – 1 sehingga formula untuk standar deviasi sampel adalah
sebagai berikut:
Mengapa harus diganti dengan n-1?! Pembuktiannya diluar bahasan blog ini.
Data pada tabel distribusi frekuensi:
Data Tunggal:
Sama seperti pada perhitungan simpangan rata-rata. Standar deviasi dan ragam yang dihitung
dari distribusi frekuensi data yang sudah dikelompokkan menggunakan nilai data perkiraan,
bukan data aslinya. Data pewakil tersebut disimbolkan dengan m. Untuk membuat
perhitungan dari data yang sudah dikelompokkan kita harus menganggap, bahwa semua nilai
dalam sebuah kelas, sama dengan nilai pewakilnya (tanda kelasnya, mi). Selanjutnya, nilai
perkiraan standar deviasi dapat dihitung dengan menggunakan rumus:
Nilai kuadrat dari standar deviasi dikenal dengan ragam (variance). Pada teknik analisis
varian, dikenal dengan Jumlah Kuadrat (Sum of Square), dan ragam (varian)
dikenal dengan istilah Kuadrat Tengah/Rata-rata Jumlah Kuadrat (Mean Square).
Standar deviasi merupakan ukuran penyebaran yang paling banyak digunakan. Semua gugus data
dipertimbangkan sehingga lebih stabil dibandingkan dengan ukuran lainnya. Namun, apabila
dalam gugus data tersebut terdapat nilai ekstrem, standar deviasi menjadi tidak sensitif lagi, sama
halnya seperti mean.
Standar Deviasi memiliki beberapa karakteristik khusus lainnya. SD tidak berubah apabila setiap
unsur pada gugus datanya di tambahkan atau dikurangkan dengan nilai konstan tertentu. SD
berubah apabila setiap unsur pada gugus datanya dikali/dibagi dengan nilai konstan tertentu. Bila
dikalikan dengan nilai konstan, standar deviasi yang dihasilkan akan setara dengan hasilkali dari
nilai standar deviasi aktual dengan konstan.
Ukuran sebaran relatif (Measures of Relative Dispersion)
Perhatikan contoh kasus Varietas I vs Varietas II di atas. Kedua varietas tersebut mempunyai
nilai rata-rata yang sama. Untuk dua distribusi data dengan nilai rata-rata yang sama atau hampir
sama, kita dapat secara langsung membandingkan keragaman kedua distribusi tersebut dengan
melihat nilai standar deviasinya. Kita sepakat untuk mengatakan bahwa Varietas II lebih
beragam dibandingkan dengan Varietas I. Namun apabila rata-rata dari kedua distribusi data
tersebut jauh berbeda, kita tidak dapat membandingkan keragamannya dengan menggunakan
nilai standar deviasinya secara langsung. Pada kasus tersebut, untuk membandingkan tingkat
keragaman dari kedua distribusi datanya, kita harus menggunakan ukuran penyebaran relatif.
Terdapat beberapa ukuran penyebaran relatif untuk Range, Simpangan Kuartil, Simpangan Rata-
rata, dan Standar deviasi. Koefisien Keragaman (coefficient of variation) yang paling penting
dan sering digunakan adalah ukuran penyebaran relatif dari Standar Deviasi.
Koefisien Keragaman merupakan ukuran yang bebas satuan dan selalu dinyatakan dalam bentuk
persentase. Nilai KK yang kecil menunjukkan bahwa data tidak terlalu beragam dan di katakan
lebih konsisten. KK tidak dapat diandalkan apabila nilai rata-rata hampir sama dengan 0 (nol).
KK juga tidak stabil apabila skala pengukuran data yang digunakan bukan skala rasio.
Rata-rata dan ukuran penyebaran dapat menggambarkan distribusi data tetapi tidak cukup untuk
menggambarkansifat distribusi. Untuk dapat menggambarkan karakteristik dari suatu distribusi
data, kita menggunakan konsep-konsep lain yang dikenal sebagai kemiringan (skewness) dan
keruncingan (kurtosis).
Skewness
x 1 2 3 4 5
frek (f) 5 9 12 9 5
Pada contoh gambar berikut, distribusi data tidak simetris. Gambar pertama miring (menjulur) ke
arah kiri dan gambar ke-2 miring ke arah kanan.
Pada distribusi data yang simetris, mean, median dan modus bernilai sama.
Beberapa langkah-langkah perhitungan digunakan untuk menyatakan arah dan tingkat
kemiringan dari sebaran data. Langkah-langkah tersebut diperkenalkan oleh Pearson.
Interpretasi: Untuk distribusi data yang simetris, Sk = 0. Apabila distribusi data menjulur ke
kiri (negatively skewed), Sk bernilai negatif, dan apabila menjulur ke kanan (positively
skewed), SK bernilai positif. Kisaran untuk SK antara -3 dan 3.
dimana:
Interpretasi:
Distribusi dikatakan simetris apabila nilai b1 = 0. Skewness positif atau negatif tergantung pada
nilai b1 apakah bernilai positif atau negatif.
Kurtosis
dimana:
Interpretasi:
Distribusi dikatakan: