Anda di halaman 1dari 21

DATA, VARIABEL, PEMUSATAN DATA,

DAN PENYEBARAN DATA

Di Susun Oleh :
Satrya Zullyanova (G0B017009)
Prodi :
D3 Gizi

Dosen Pengampu :
Dr. Ir. Rahayu Astuti, M.Kes

FAKULTAS ILMU KEPERAWATAN DAN KESEHATAN

UNIVERSITAS MUHAMMADIYAH SEMARANG


I. MACAM-MACAM DATA DALAM STATISTIKA

Statistik/data merupakan poin penting dalam statistika. Ada bermacam-macam data yang dikenal
dalam statistika, antara lain:

 Data kualitatif yaitu data yang berbentuk kalimat, kata atau gambar. Contoh dari data
kualitatif adalah tidak enak, enak, sangat enak.
 Data kuantitatif yaitu data berupa angka. Data kuantitatif dapat dikelompokkan menjadi
dua besar yaitu diskrit dan kontinu. Data diskrit adalah data yang diperoleh dari hasil
menghitung atau membilang (bukan mengukur) Contohnya jumlah mahasiswa mipa
matematika ada 500 orang, peserta seminar mathfair berjumlah 300 orang, dan himpunan
bilangan asli dari 1 sampai 8 A= {1,2,3,4,5,6,7,8}.
 Data diskrit yaitu data data yang tidak dikonsepsikan adanya nulai-nilai di antara data
(bilangan) lain yang terdekat contoh banyaknya jumlah anak di suatu keluarga, jumlah
rumah di suatu kampung. Misalnya juka bilangan 2 dan 3 menunjukan jumlah anak anak
di keluarga A dan keluarga B, maka di antara kedua bilangan tersebut tidak ada bilangan-
bilangan lain. Tidak pernah kita mengatakan bahwa jumlah anak di suatu keluarga adalah
2,4 atau 2,9.
 Data kontinu yaitu data yang didapat dari hasil pengukuran. Data hasil pengukuran
diperoleh dari tes, kuesioner ataupun alat ukur lain yang sudah terstandar misalnya
timbangan, panjang ataupun data psikologis yang lain. yang termasuk data kontinum ini
adalah interval dan rasio.
Data didapatkan dari perhitungan dan pengukuran. Pengukuran adalah penggunaan aturan
untuk menetapkan bilangan pada obyek atau peristiwa. Dengan kata lain, pengukuran
memberikan nilai-nilai variabel dengan notasi bilangan. Aturan penggunaan notasi
bilangan dalam pengukuran disebut data atau tingkat pengukuran (scales of
measurement).Secara lebih rinci, dalam statistik terdapat 4data pengukuran yaitu
nominal, ordinal, interval dan rasio.
 Data nominal adalah data mengelompokkan obyek atau peristiwa dalam berbentuk
kategori. Data nominal diperoleh dari pengukuran nominal yaitu suatu proses
mengklasifikasian obyek-obyek yang berbeda kedalam kategori-kategori berdasarkan
beberapa karakteristik tertentu.
Karakteristik data nominal adalah
• Kategori data bersifat mutually eksklusif (setiap obyek hanya memiliki satu kategori)
• Kategori data tidak disusun secara logis
Contoh : Jenis Kelamin, warna kulit, dan agama, pada contoh tersebut kita memahami
bahwa data nominal kita hanya dapat mengetahui bahwa subjek termasuk ke dalam
kategori tertentu (pria atau wanita, hitam atau putih atau sawo matang, Islam atau Kristen
atau Budha atau lainya). Perbedaan subjek dalam data nominal bersifat kualitatif dan
tidak mempunyai makna kuantitatif.
 Data ordinal adalah data yang menunjukkan perbedaan tingkatan subjek secara
kuantitatif. Contoh :Data ini biasanya dipergunakan dalam menentukan ranking
seseorang dibandingkan dengan yang lain. misalnya ranking siswa dikelas dibuat dari
nilai tertinggi sampai nilai terendah. Ranking pertama dan kedua tidak memiliki jarak
rentangan yang sama dengan ranking kedua dan ketiga. Contoh lain data ordinal adalah
nilai mahasiswa dalam bentuk huruf, A, B, C, D dan E.data ordinal memiliki
karakteristik:
• Kategori data bersifat mutually eksklusif (setiap obyek hanya memiliki satu kategori)
• Kategori data tidak disusun secara logis
• Kategori data disusun berdasarkan urutan logis dan sesuai dengan besarnya karakteristik
yang dimiliki
Secara singkat, dapat dikata bahwa data ordinal, disamping memiliki sifat yang dimiliki
data nominal juga menunjukan kedudukan (tingkatan) subjek dalam suatu kelompok pada
suatu variable.
 Data interval adalah data yang yang memiliki jarak yang sama antar datanya akan tetapi
tidak memiliki nol mutlak. Nol mutlak artinya tidak dianggap ada. Selain memiliki kedua
ciri di atas (menunjukan klasifikasi dan kedudukan subjek dalam kelompok), data interval
juga memiliki sifat kesamaan jarak (equality of interval) antara nilai yang satu dengan
nilai yang lain. Skor mentah (raw score) yang dihasilkan dari suatu tes hasil belajar atau
tes kecerdasan sering disebut sebagai data yang berdata interval (data interval). Salah satu
ciri matematis yang dimiliki data interval adalah penjumlahan. Dengan demikian, kita
dapat membuat operasi penambahan atau pengurangan. Misalnya, jarak pada temperature
tertentu. Jarak antara 250F dengan 500F sama dengan jarak 750F dengan 1000F. akan
tetapi, data suhu ini tidak memiliki titik nol mutlak sehingga kita tidak bisa melakukan
operasi perkalian dan pembagian. Untuk itu maka ada satu lagi data yaitu data rasio.
 Data rasio adalah data yang bersekala rasio hampir sma dengan data interval, yakni
keduanya memiliki ketiga sifat di atas (menunjukan klasifikasi dan kedudukan subjek
dalam suatu kelompok, serta sifat persamaan jarak). Data rasio berbeda dari data interval
karena pertama data rasio memiliki nilai mutlak nol. Data pengukuran yang memiliki nol
mutlak sehingga dapat dilakukan operasi perkalian dan pembagian. Misalnya berat badan,
tinggi badan, pendapatan dan lain sebagainya. untuk melakukan pengujian hipotesis,
maka data yang kita miliki minimal berdata interval. jika data berdatanominal atau
ordinal, data tersebut harus ditransfer dulu kedata. Contoh : perbandingan (rasio) antara
skor-skor yang berdata rasio, 20 kg adalah 2 kali 10 kg, 15 m = 3 m x 5 m dan
sebagainya.
II. VARIABEL

Variabel penelitian pada dasarnya adalah segala sesuatu yang berbentuk apa saja yang ditetapkan
peneliti untuk dipelajari sehingga diperoleh informasi tentang hal tersebut, kemudian ditarik
kesimpulan (Sugiyono, 2003:38).

Menurut hubungan antara satu variabel dengan variabel yang lain maka macam-macam variabel
dalam penelitian dapat dibedakan menjadi:
1. Variabel Independent
2. Variabel Dependen
3. Variabel Moderator
4. Variabel Intervening
5. Variabel Kontrol
Variabel Independent. Variabel ini sering di sebut sebagai variabel stimulus, prediktor,
antecedent. Dalam bahasa Indonesia sering disebut variabel bebas. Variabel bebas adalah
variabel yang mempengaruhi atau menjadi sebab perubahannya atau timbulnya variabel
dependen (terikat)

Variabel Dependen sering disebut sebagai variabel output kriteria, konsekuen. Dalam bahasa
Indonesia sering disebut sebagai variabel terikat. Variable terikat merupakan variabel yang
dipengaruhi atau menjadi akibat, karena adanya variable bebas.

Variabel Moderator adalah variabel yang mempengaruhi (memperkuat dan memperlemah)


hubungan antara variabel independen dengan variabel dependen.

Variabel Intervening adalah variabel yang secara teoritis mempengaruhi hubungan antara
variabel indenpenden dengan dependen menjadi hubungan yang tidak langsung dan dapat
diamati dan diukur.

Variabel Kontrol yaitu variabel yang dikendalikan atau dibuat konstan sehingga pengaruh
variabel indenpenden terhadap dependen tidak dipengaruhi oleh faktor luar yang diteliti.
Variabel kontrol sering dipergunakan peneliti, bila akan melakukan penelitian yang bersifat
membandingkan

Sementara pakar lain dalam menentukan variabel penelitian menganut variabel pokok dengan
tetap mengemukakan variabel independen dan dependen. Husaini Usman, Purnomo Setiady
Akbar (2009: 42) menyatakan penentuan variabel pokok yang meliputi variabel independen dan
dependen berdasarkan rumusan hipotesis yang telah dibuat terdahulu. Sebaliknya, hubungan
antar variabel pokok ini dibuat gambarnya. Kemudian, dilanjutkan dengan definisi
operasionalnya, termasuk di dalamnya tentang cara mengukur serta skala pengukurannya.
Notoadmodjo (2005) mengemukakan Variabel penelitian adalah sesuatu yang digunakan sebagai
sifat, ukuran atau ciri yang dimiliki atau didapat oleh suatu penelitian tentang suatu konsep
pengertian dan berdasarkan hubungan fungsional antara variabel independent dan dependent.

III. UKURAN PEMUSATAN DATA


Apakah yang dimaksud dengan ukuran pemusatan data?

Ukuran Pemusatan Data merupakan salah satu pengukuran data dalam statistika. Ukuran
Pemusatan data terdiri dari penghitungan rata-rata (Mean), nilai tengah (Median), dan nilai
yang sering muncul (Modus).

Ukuran pemusatan Data adalah sembarang ukuran yang menunjukkan pusat segugus data, yang
telah diurutkan dari yang terkecil sampai yang terbesar atau sebaliknya dari yang terbesar sampai
yang terkecil.

Salah satu kegunaan dari ukuran pemusatan data adalah untuk membandingkan dua ( populasi )
atau contoh, karena sangat sulit untuk membandingkan masing-masing anggota dari masing-
masing anggota populasi atau masing-masing anggota data contoh.

Suatu data berkelompok yang tersaji seperti gambar berikut :

Dapat kita ketahui dari data statistik diatas menjelaskan tentang jumlah sekrup baja yang cacat
pada setiap produksi. Data tersebut berfungsi untuk mengevaluasi kegiatan produksi, sehingga
untuk produksi kedepannya dapat meminimalisasi produk yang gagal. Melalui data tersebut,
dapat dilihat bahwa cara pengumpulan datanya melalui survey dengan metode stratified random
sampling. Dimana sampel yang digunakan dapat mewakili dari produk setiap dilakukan
produksi.
Selanjutnya data yang telah didapat disajikan menjadi diagram batang seperti pada gambar
tersebut. Tampilannya yang mudah dipahami dan cukup representatif apabila digunakan untuk
evaluasi kinerja. Namun apabila kita ingin menelisik lebih jauh dan menginginkan tampilan yang
lebih kompleks, dapat kita coba dengan menggunakan tabel distribusi frekuensi.

Interval Jumlah Sekrup Cacat Frekuensi (f)

5–6 5

7–8 6

9 – 10 5

11 – 12 7

13 – 14 6

15 – 16 1

Jumlah 30
Nah, dari data berkelompok tersebut kita akan mencari mean, median, dan modusnya. Tapi,
sebelumnya, Kita review tentang apasih mean, median, dan modus itu? Dan apa perbedaan dari
mean, median, dan modus dari data tunggal dan data berkelompok? Oke langsung cus aja yuk!

a. Mean

Mean atau rata-rata hitung adalah nilai yang diperoleh dari jumlah sekelompok data dibagi
dengan banyaknya data. Rata-rata disimbolkan dengan x.
 Rata-Rata untuk Data Tunggal

Keterangan:
ẋ = mean
n= banyaknya data
Contoh Rataan Data tunggal
Hitunglah nilai rata-rata dari nilai ujian matematika kelas 3 SMU berikut ini: 2, 4, 5, 6, 6, 7, 7, 7,
8, 9.
Jawab:

 Rata-Rata untuk Data Berkelompok

Keterangan :
fi = frekuensi
xi = nilai tengah
Nilai tengah adalah jumlah tepi bawah dan tepi atas di bagi 2.

Data berkelompok :
b. Median

Median adalah nilai data yang terletak di tengah setelah data diurutkan. Dengan demikian,
median membagi data menjadi dua bagian yang sama besar. Median (nilai tengah) disimbolkan
dengan Me.

 Median untuk Data Tunggal


1. Jika banyaknya data n ganjil

2. Jika banyaknya data n genap

Keterangan:
Me = Median
n = jumlah data
x = nilai data
Contoh Median Data Tunggal
Tentukan median dari data berikut.

1. 8,6,4,3,7,5,8,10,8,9,8,5
2. Sepuluh orang siswa dijadikan sampel dan dihitung tinggi badannya. Hasil pengukuran
tinggi badan kesepuluh siswa tersebut adalah sebagai berikut.
172, 167, 180, 171, 169, 160, 175, 173, 170, 165
Hitunglah median dari data tinggi badan siswa!
Jawab :

1. Data diurutkan : 3 4 5 5 6 7 8 8 8 8 9 10
N= 12 (genap)
Jadi, mediannya adlah 7,5
2. Karena jumlah data genap, maka penghitungan median menggunakan rumus median untuk
data genap. Proses penghitungannya adalah sebagai berikut.
Untuk melanjutkan penghitungan, kita harus terlebih dahulu mengetahui nilai x5 dan x6.
Kedua nilai data tersebut dapat diperoleh dengan mengurutkan semua data. Hasil pengurutan
adalah sebagai berikut.
160, 165, 167, 169, 170, 171, 172, 173, 175, 180
Dari pengurutan tersebut diperoleh nilai x5 sama dengan 170 dan x6 sama dengan 171.
Dengan demikian penghitungan median dapat dilanjutkan.

 Median untuk data berkelompok

Keterangan :
Tb = Tepi bawah kelas median (Batas bawah – 0,5)
F = Frekuensi kumulatif sebelum median
f = Frekuensi
c = Panjang kelas
n = Jumlah frekuensi
Yuk kita coba lagi, menggunakan data berkelompok yang telah kita punya :

 Letak kelas median: Setengah dari seluruh data = 30, terletak pada kelas ke-3 (jumlah 9-10)
 Tb = 9 – 0,5 = 8,5
 c =2
 n = 80, f = 24
 f = 5 (frekuensi kelas median)
 F = 5 + 6 = 11

c. Modus

Modus adalah data yang paling sering muncul atau memiliki frekuensi tertinggi. Modus
dilambangkan dengan Mo. Beberapa kemungkinan tentang modus suatu gugus data:

 Apabila pada sekumpulan data terdapat dua modus, maka gugus data tersebut
dikatakan bimodal.
 Apabila pada sekumpulan data terdapat lebih dari dua modus, maka gugus data tersebut
dikatakan multimodal.
 Apabila pada sekumpulan data tidak terdapat modus, maka gugus data tersebut
dikatakan tidak mempunyai modus.
 Modus untuk data tunggal

Modus dari data tunggal adalah data yang paling sering muncul.

Contoh :
Tentukan modus dari data berikut !

4, 8, 7, 4, 6, 3, 6, 8, 6, 3

Jawab :
Data yang paling sering muncul adalah 6, maka Mo = 6
 Modus untuk data berkelompok

Keterangan :

Tb = Tepi bawah kelas modus


d1 = Selisih antara frekuensi modus dengan frekuensi sebelumnya
d2 = selisih antara frekuensi modus dengan frekuensi sesudahnya
c = Panjang kelas
Nah, berapa nilai modus dari data berkelompok yang kita punya?

 Kelas modul = kelas ke-4


 Tb = 11-0.5 = 10.5
 b1 = 7 – 5 = 2
 b2 = 7 – 6 = 1
 c=2
SKEWENESS (KECONDONGAN)

Kecondongan suatu kurva dapat dilihat dari perbedaan letak mean, median dan modusnya. Jika
ketiga ukuran pemusatan data tersebut berada pada titik yang sama, maka dikatakan simetris atau
data berdistribusi normal. Sedangkan jika tidak berarti data tidak simetris atau tidak berdistribusi
normal.
Ukuran kecondongan data terbagi atas tiga bagian, yaitu :
 Kecondongan data ke arah kiri (condong negatif) dimana nilai modus lebih dari nilai mean
(modus > mean).
 Kecondongan data simetris (distribusi normal) dimana nilai mean dan modus adalah sama
(mean = modus).
 Kecondongan data ke arah kanan (condong positif) dimana nilai mean lebih dari nilai modus
(mean > modus).

Dari gambar grafik diatas dapat kita lihat bahwa nilai modus lebih dari pada nilai mean
(modus>mean). Sehingga Skewness (kecondongan) dari data tersebut adalah Skewed to the left
or negatively skewed (Kecondongan data ke arah kiri atau condong negatif)
UKURAN PENYEBARAN DATA

Ukuran tendensi sentral (mean, median, mode) merupakan nilai pewakil dari suatu distribusi
frekuensi, tetapi ukuran tersebut tidak memberikan gambaran informasi yang lengkap mengenai
bagaimana penyebaran data pengamatan terhadap nilai sentralnya. Sebagai contoh, kita
mempunyai distribusi hasil panen dua varietas padi (kg per plot), masing-masing terdiri dari 5
plot. Andaikan distribusi datanya sebagai berikut:

Varietas I : 45 42 42 41 40
Varietas II : 54 48 42 36 30
Varietas III : 45 40 44 41 40

Kita dapat melihat bahwa nilai mean varietas I dan II bernilai sama, 42 kg, namun apabila kita
perhatikan, keragaman kedua varietas tersebut berbeda. Varietas I mungkin lebih dipilih karena
lebih konsisten. Hal ini terlihat dari data hasil pada varietas I lebih seragam dibandingkan dengan
Varietas II. Pada Varietas I, hasilnya tidak terlalu jauh dari nilai pusatnya, 42 kg, sedangkan pada
Varietas II, sebaran datanya sangat beragam (perhatikan gambar berikut).

Pada contoh tersebut, jelas bahwa ukuran tendensi sentral saja tidak cukup untuk
menggambarkan distribusi frekuensi. Selain itu kita harus memiliki ukuran persebaran data
pengamatan. Ukuran penyebaran atau ukuran keragaman pengamatan dari nilai rata-ratanya
disebut simpangan (deviation/dispersi). Terdapat beberapa ukuran untuk menentukan dispersi
data pengamatan, seperti jangkauan/rentang (range), simpangan kuartil (quartile deviation),
simpangan rata-rata (mean deviation), dan simpangan baku (standard deviation).
Jangkauan (Range)

Ukuran penyebaran yang paling sederhana adalah Range (Jangkauan/Rentang, terkadang di


beberapa literatur diterjemahkan dengan istilah wilayah). Range dari suatu kelompok data
pengamatan adalah selisih antara nilai minimum dan maksimum.

Misalnya, range untuk Varietas I pada tabel di atas adalah 45 – 40 = 5 (45 adalah nilai
maksimum dan 40 adalah nilai minimum). Seringkali kita mengatakan range dengan pernyataan
seperti “hasil berkisar antara 40 – 45 kg per petak”. Kisarannya lebih sempit dibandingkan
dengan pernyataan “hasil berkisar antara 40 – 60 kg per petak”. Pernyataan pertama
menggambarkan bahwa variasi hasil padi tidak terlalu beragam, sedangkan pada pernyataan
kedua, terjadi hal sebaliknya.

Range hanya memperhitungkan dua nilai, yaitu nilai maksimum dan nilai minimum dan tidak
memperhitungkan semua nilai, sehingga sangat tidak stabil atau tidak dapat
diandalkan sebagai indikator dari ukuran penyebaran. Hal ini terjadi karena range sangat
dipengaruhi oleh nilai-nilai ekstrim. Pada contoh di atas, jika hasil tertinggi varietas I adalah 60
kg/petak, bukan 45 kg/petak, maka range-nya = 60-40= 20 kg/petak.

Jelas, interpretasi kita akan berubah. Kita lebih sepakat mengatakan bahwa variasi hasil sangat
beragam. Benarkah demikian? Apabila kita perhatikan kembali, nilai hasil padi lainnya hampir
seragam, berkisar antara 40-44 kg/petak. Namun dengan adanya pencilan hasil, 60 kg/petak,
interpretasinya jadi lain, kita cenderung mengatakan bahwa hasil beragam, padahal keragaman
tersebut sebenarnya tidak mewakili semua nilai dalam sampel/populasinya.

Hasil sebesar 60 kg/petak merupakan contoh dari nilai ekstrem dan tidak biasa. Nilai tersebut
merupakan pencilan (outlier) dan sebaiknya di periksa kembali kebenaran datanya atau
dihilangkan dari data pengamatan, karena akan menghasilkan kesimpulan yang tidak tepat.

Simpangan kuartil (Quartile Deviation)

Simpangan kuartil dihitung dengan cara menghapus nilai-nilai yang terletak di bawah kuartil
pertama dan nilai-nilai di atas kuartil ketiga, sehingga nilai-nilai ekstrem, baik yang berada di
bawah ataupun di atas distribusi data, dihilangkan.

Simpangan kuartil didapatkan dengan cara menghitung nilai rata-rata dari kedua kuartil tersebut,
Q1 dan Q3.
Simpangan kuartil lebih stabil dibandingkan dengan Range karena tidak dipengaruhi oleh nilai
ekstrem. Nilai-nilai ekstrim sudah dihapus. Meskipun demikian, sama seperti Range, simpangan
kuartil juga tetap tidak memperhatikan dan memperhitungkan penyimpangan semua gugus
datanya. Simpangan kuartil hanya memperhitungkan nilai pada kuartil pertama dan kuartil ketiga
saja.

Simpangan Rata-rata (Mean Deviation)

Simpangan rata-rata merupakan penyimpangan nilai-nilai individu dari nilai rata-ratanya. Rata-
rata bisa berupa mean atau median. Untuk data mentah simpangan rata-rata dari median cukup
kecil sehingga simpangan ini dianggap paling sesuai untuk data mentah. Namun pada umumnya,
simpangan rata-rata yang dihitung dari mean yang sering digunakan untuk nilai simpangan rata-
rata. Simpangan rata-rata dihitung dengan formula berikut:

Formula tersebut tentu memenuhi dua kriteria sebelumnya, dihitung dari semua data dan
menunjukkan dispersi rata-rata dari mean, tetapi tidak memenuhi kriteria ketiga. Bagaimanapun
dispersi dari data, semua perhitungan dengan rumus ini akan selalu menghasilkan nilai nol. Hal
ini karena pembilang dari rumus di atas menunjukkan bahwa hasil penjumlahannya
akan selalu sama dengan nol.

Terdapat dua cara untuk mengantisipasi masalah ini, keduanya akan menghilangkan tanda-tanda
negatif dari perhitungan.

Cara pertama adalah dengan menggunakan formula berikut:

Sampel:

Populasi:

Untuk data yang sudah disusun dalam bentuk tabel frekuensi:


Data Tunggal (tidak di grupkan berdasarkan selang kelas):

Data kelompok (sudah digrupkan berdasarkan selang tertentu):

Simpangan rata-rata yang dihitung dari distribusi frekuensi data yang dikelompokkan
menggunakan nilai data perkiraan, bukan data aslinya. Data pewakil tersebut disimbolkan
dengan m. Untuk membuat perhitungan dari data yang sudah dikelompokkan kita harus
menganggap, bahwa semua nilai dalam sebuah kelas, sama dengan nilai pewakilnya (tanda
kelasnya, mi). Selanjutnya, nilai perkiraan simpangan rata-rata dapat dihitung dengan
menggunakan rumus:

Pada formula di atas, pembilangnya akan selalu bernilai positif, karena yang diambil adalah nilai
mutlaknya, perhatikan tanda modulus || yang berarti baik hasilnya negatif ataupun positif akan
selalu diperlakukan sebagai data positif.

Cara kedua adalah dengan menggunakan jumlah kuadrat dari semua nilai simpangan datanya.
Cara ini dikenal dengan istilah Ragam (varians) dan standar deviasi.

Ragam dan Standar deviasi

Ukuran penyebaran dengan menggunakan perhitungan simpangan rata-rata diperoleh dengan


mengabaikan tanda-tanda penyimpangan.

Secara matematis hal tersebut tidak benar. Cara kedua, yaitu dengan mengkuadratkan nilai
simpangan sehingga nilai negatif berubah menjadi positif. Cara ini lebih tepat. Rata-rata dari
jumlah nilai simpangan dikenal dengan ragam(varians). Setelah nilai ragam diperoleh,
selanjutnya nilai ragam tersebut diakarkan untuk mendapatkan kembali satuan asal dari variabel

tersebut (bukan kg2/petak2, tapi kg/petak ) . Cara pengukuran keragaman seperti ini dikenal
dengan Standar deviasi.

Secara matematis, standar deviasi dapat dihitung dengan menggunakan formula:

Standar deviasi populasi disimbolkan dengan ? (baca ‘sigma’) dan standar deviasi
sampel disimbolkan dengans. Standar deviasi sampel yang baik seharusnya merupakan ukuran
yang tidak bias terhadap standar deviasi populasinya, karena kita menggunakan ukuran standar
deviasi sampel untuk memperkirakan nilai standar deviasi populasi. Untuk itu, nilai n pada
formula di atas diganti dengan n – 1 sehingga formula untuk standar deviasi sampel adalah
sebagai berikut:

Mengapa harus diganti dengan n-1?! Pembuktiannya diluar bahasan blog ini.
Data pada tabel distribusi frekuensi:

Data Tunggal:

Data kelompok (sudah digrupkan berdasarkan selang tertentu):

Sama seperti pada perhitungan simpangan rata-rata. Standar deviasi dan ragam yang dihitung
dari distribusi frekuensi data yang sudah dikelompokkan menggunakan nilai data perkiraan,
bukan data aslinya. Data pewakil tersebut disimbolkan dengan m. Untuk membuat
perhitungan dari data yang sudah dikelompokkan kita harus menganggap, bahwa semua nilai
dalam sebuah kelas, sama dengan nilai pewakilnya (tanda kelasnya, mi). Selanjutnya, nilai
perkiraan standar deviasi dapat dihitung dengan menggunakan rumus:

Nilai kuadrat dari standar deviasi dikenal dengan ragam (variance). Pada teknik analisis

varian, dikenal dengan Jumlah Kuadrat (Sum of Square), dan ragam (varian)
dikenal dengan istilah Kuadrat Tengah/Rata-rata Jumlah Kuadrat (Mean Square).

Standar deviasi merupakan ukuran penyebaran yang paling banyak digunakan. Semua gugus data
dipertimbangkan sehingga lebih stabil dibandingkan dengan ukuran lainnya. Namun, apabila
dalam gugus data tersebut terdapat nilai ekstrem, standar deviasi menjadi tidak sensitif lagi, sama
halnya seperti mean.

Standar Deviasi memiliki beberapa karakteristik khusus lainnya. SD tidak berubah apabila setiap
unsur pada gugus datanya di tambahkan atau dikurangkan dengan nilai konstan tertentu. SD
berubah apabila setiap unsur pada gugus datanya dikali/dibagi dengan nilai konstan tertentu. Bila
dikalikan dengan nilai konstan, standar deviasi yang dihasilkan akan setara dengan hasilkali dari
nilai standar deviasi aktual dengan konstan.
Ukuran sebaran relatif (Measures of Relative Dispersion)

Perhatikan contoh kasus Varietas I vs Varietas II di atas. Kedua varietas tersebut mempunyai
nilai rata-rata yang sama. Untuk dua distribusi data dengan nilai rata-rata yang sama atau hampir
sama, kita dapat secara langsung membandingkan keragaman kedua distribusi tersebut dengan
melihat nilai standar deviasinya. Kita sepakat untuk mengatakan bahwa Varietas II lebih
beragam dibandingkan dengan Varietas I. Namun apabila rata-rata dari kedua distribusi data
tersebut jauh berbeda, kita tidak dapat membandingkan keragamannya dengan menggunakan
nilai standar deviasinya secara langsung. Pada kasus tersebut, untuk membandingkan tingkat
keragaman dari kedua distribusi datanya, kita harus menggunakan ukuran penyebaran relatif.

Terdapat beberapa ukuran penyebaran relatif untuk Range, Simpangan Kuartil, Simpangan Rata-
rata, dan Standar deviasi. Koefisien Keragaman (coefficient of variation) yang paling penting
dan sering digunakan adalah ukuran penyebaran relatif dari Standar Deviasi.

Koefisien Keragaman Standar deviasi dihitung dengan formula berikut:

Koefisien Keragaman merupakan ukuran yang bebas satuan dan selalu dinyatakan dalam bentuk
persentase. Nilai KK yang kecil menunjukkan bahwa data tidak terlalu beragam dan di katakan
lebih konsisten. KK tidak dapat diandalkan apabila nilai rata-rata hampir sama dengan 0 (nol).
KK juga tidak stabil apabila skala pengukuran data yang digunakan bukan skala rasio.

Skewness and Kurtosis

Rata-rata dan ukuran penyebaran dapat menggambarkan distribusi data tetapi tidak cukup untuk
menggambarkansifat distribusi. Untuk dapat menggambarkan karakteristik dari suatu distribusi
data, kita menggunakan konsep-konsep lain yang dikenal sebagai kemiringan (skewness) dan
keruncingan (kurtosis).

Skewness

Kemiringan (skewness) berarti ketidaksimetrisan. Sebuah distribusi dikatakan simetris apabila


nilai-nilainya tersebar merata disekitar nilai rata-ratanya. Sebagai contoh, distribusi data berikut
simetris terhadap nilai rata-ratanya, 3.

x 1 2 3 4 5
frek (f) 5 9 12 9 5
Pada contoh gambar berikut, distribusi data tidak simetris. Gambar pertama miring (menjulur) ke
arah kiri dan gambar ke-2 miring ke arah kanan.

Pada distribusi data yang simetris, mean, median dan modus bernilai sama.
Beberapa langkah-langkah perhitungan digunakan untuk menyatakan arah dan tingkat
kemiringan dari sebaran data. Langkah-langkah tersebut diperkenalkan oleh Pearson.

Koefisien kemiringan(Coefficient of Skewness):

Interpretasi: Untuk distribusi data yang simetris, Sk = 0. Apabila distribusi data menjulur ke
kiri (negatively skewed), Sk bernilai negatif, dan apabila menjulur ke kanan (positively
skewed), SK bernilai positif. Kisaran untuk SK antara -3 dan 3.

Ukuran kemiringan yang lain adalah koefisien β1 (baca ‘beta-satu’):

dimana:

Interpretasi:

Distribusi dikatakan simetris apabila nilai b1 = 0. Skewness positif atau negatif tergantung pada
nilai b1 apakah bernilai positif atau negatif.

Kurtosis

Kurtosis merupakan ukuran untuk mengukur keruncingan distribusi data.


Distribusi pada gambar di atas semuanya simetris terhadap nilai rata-ratanya. Namun bentuk
ketiganya tidak sama. Kurva berwarna biru dikenal sebagai mesokurtik (kurva normal), kurva
berwarna merah dikenal sebagaileptokurtik (kurva runcing) dan kurva berwarna hijau dikenal
sebagai platikurtik (kurva datar).

Kurtosis dihitung dengan menggunakan koefisien Pearson, β2 (baca ‘beta – dua’).

dimana:

Interpretasi:

Distribusi dikatakan:

 Mesokurtik (Normal) jika b2 = 3


 Leptokurtik jika b2 > 3
 platikurtik jika b2 < 3

Anda mungkin juga menyukai