Anda di halaman 1dari 60

PENGUMPULAN DATA

Pendekatan kuantitatif pada bidang geologi memerlu-


kan sesuatu langkah/kajian yang lebih besar dari-
pada sekedar tinjauan lapangan.

Oleh karena itu, ahli geologi dituntut tidak saja mampu


merekam variabel-variabel batuan namun juga mema-
hami pentingnya skala pengukuran fisik & matematik.
Secara umum data dapat dikelompokkan menjadi:

DATA

DATA DATA
KUALITATIF KUANTITATIF

DATA DATA DATA DATA


NOMINAL ORDINAL INTERVAL RASIO
☻ DATA KUALITATIF:
Sering disebut sebagai data Atribut yang merupa-
kan data yang bukan berupa angka/bilangan,
sehingga tidak dapat dilakukan operasi matematik,
seperti penjumlahan, pengurangan, perkalian dan
pembagian.
☺ Data Nominal (Data Kategori):
Jika pengambilan data terhadap suatu objek ha-
nya menghasilkan satu dan hanya satu-satunya
kategori (peringkat) pada objek tersebut. Data ini
dapat ditandai dengan nama, label atau simbol.
Contoh:  Jenis kelamin, kota kelahiran;
 Jenis litologi, struktur sedimen.
☺ Data Ordinal:
Data ordinal adalah data yang diperoleh dari suatu
pengambilan data terhadap suatu objek yang
menghasilkan lebih dari satu kategori yang pe-
ringkat (bobotnya) tidak dapat disamakan.
Contoh:  Prestasi Mahasiswa, Kualitas Air.
 Skala Kekerasan Mohs, Ukuran butir.
☻ DATA KUANTITATIF:
Data kuantitatif merupakan data yang berbentuk
angka/bilangan (data numerik), tentunya data ini
dapat dilakukan operasi matematis.
☺ Data Interval:
Dinamakan demikian karena ditunjukkan oleh
panjang kisaran intervalnya. Dengan demikian
skala interval tidak akan mempunyai nilai nol,
atau suatu titik dimana magnitutnya tidak ada.
Contoh:  Temperatur udara antara 22-30oC.
 Ketebalan batulampung dalam suatu
sikuen adalah 10-50cm.
☺ Data Rasio:
Adalah data yang dapat dinyatakan dengan
bilangan real, dengan demikian dapat mempu-
nyai nilai nol. Data rasio adalah bentuk tertinggi
dari hasil pengukuran yang dapat merepresen-
tasikan sifat-sifat fisik seperti panjang, massa
dan waktu serta dimensi turunannya.
Data mentah pengujian tegangan rusak (105 Pa)
1171 1186 1264 1205 1316 1437 1185 1150 1338 1290
1042 1110 1192 1196 1406 1161 1492 1170 1258 1152
1218 1181 1273 1020 1042 1136 1233 1158 1233 1312
1141 1040 1217 1175 1273 1163 1235 931 1270 1246
1298 1185 1051 1218 1303 1055 1081 1162 1333 1285
1083 1197 1146 1231 923 1393 1302 1249 1368 1327
1225 1095 1051 1250 1021 1152 1482 1028 1341 1106
939 1124 1200 1058 1449 1094 1254 1160 1141 1062
1077 1065 1141 1416 1055 1399 924 1361 1216 1289
1275 1464 1133 1208 1314 1209 1146 1274 1156 1090

Data yang demikian banyak ini, akan lebih baik jika dior-
ganisasikan dalam bentuk yang lebih ringkas, padat de-
ngan tanpa menghilangkan fakta-fakta pentingnya. Hal
ini dapat dicapai dengan mengelompokkan jajaran data
ke dalam sejumlah kelas yang disebut:
distribusi frekuensi.
Pertimbangan dalam Penyusunan Distribusi Frekuensi

1. Interval kelas harus dipilih dengan memastikan:


a. Seluruh data harus diikutsertakan.
b. Setiap unit data hanya dimasukkan sekali saja.
2. Interval kelas umumnya berjumlah antara 5 s/d 20,
tergantung pada beberapa faktor seperti: jumlah data yang
diamati, tujuan disusunnya distribusi frekuensi dan kepen-
tingan-kepentingan dari analisis.
3. Sedapat mungkin lebar interval kelas dibuat sama (biasanya
kelipatan 5, 10, 100, 1000 dsb).
Jika jumlah data tidak banyak, lebar intervalnya:
c = R/K, di mana R≡kisaran data (range) dan K ≡interval kelas
Jika jumlah data terlalu banyak, K dapat dicari dengan meng-
gunakan pendekatan Sturge: yaitu: K = 1 + 3,3 log n
dimana : K = interval kelas
n = jumlah data
4. Sedapat mungkin dihindari interval kelas terbuka (open class
interval). Walaupun interval kelas terbuka dapat diperlukan
jika beberapa nilai data sangat berbeda dibandingkan dengan
nilai data lainnya.
Namun untuk keperluan analisis statistik seperti perhitungan
rata-rata dan deviasi standard, interval kelas terbuka tidak
dapat dipakai.
5. Jika dimungkinkan, inteval kelas dipilih sedemikian rupa se-
hingga nilai tengah kelasnya bersesuaian dengan nilai di
mana data aktual terkonsentrasi.
Distribusi Frekuensi

Breaking Stress Jumlah Presentasi


(kN/m2) (f) {f/n x 100%}
900 – 999 4 4
1000 – 1099 19 19
1100 – 1199 29 29
1200 – 1299 28 28
1300 – 1399 13 13
1400 - 1499 7 7
Total (N) 100 100%
Presentasi Grafik Distribusi Frekuensi

a. Histogram:
Grafik batang yang menggambarkan distribusi data dari
sebuah distribusi frekuensi.

DISTRIBUSI FREKUENSI

35

30

25
Jumlah (f)

20

15

10

0
900 – 999 1000 – 1099 1100 – 1199 1200 – 1299 1300 – 1399 1400 - 1499
Kuat tekan (N/m )
b. Poligon Frekuensi:
adalah suatu grafik garis dari frekuensi-frekuensi interval
kelas yang diplot pada nilai-nilai tengahnya. Poligon dapat
diperoleh dengan menghubungkan titik tengah dari sisi
atas batang-batang histogram.

DISTRIBUSI FREKUENSI

35

30

25
Jumlah (f)

20

15

10

0
900 – 999 1000 – 1099 1100 – 1199 1200 – 1299 1300 – 1399 1400 - 1499
Kuat tekan (N/m )
Beberapa pengertian mengenai distribusi frekuensi:
Interval kelas: mendefinisikan lebar sebuah kelas.
contohnya: 900-999.
Batas kelas: angka-angka pada ujung interval kelas.
Contohnya: angka 900 dan 999. Angka 900 disebut
batas kelas bawah, sedangkan 999 dise-
but batas kelas atas.

Batas kelas nyata: jika pengukuran dilakukan lebih te-


liti, interval kelas 900-999 akan
meliputi nilai yang disebut batas
kelas nyata yaitu: 899,5-999,5.
Angka ini diperoleh dengan membagi dua jumlah dari
batas kelas atas dan kelas bawah interval berikutnya.
Lebar interval kelas: selisih antara batas atas nyata dan
batas bawah nyata.
Biasanya dinotasikan sebagai c = 999,5-899,5 = 100.

Nilai tengah kelas: diperoleh dengan membagi dua


jumlah dari batas kelas bawah dan batas kelas atas.
Untuk interval kelas 900 – 999 nilai tengah kelasnya
adalah (900+999)/2 = 949,5.
Berbagai macam bentuk kurva frekuensi

Simetri Menceng kanan Menceng kiri

Bentuk U Bentuk J Bentuk J terbalik

Bimodal Multimodal
Distribusi Frekuensi Kumulatif

Kadang-kadang informasi mengenai banyaknya data yang


bernilai di bawah (kurang dari) atau di atas (lebih dari) suatu
nilai tertentu lebih diperlukan daripada yang berada dalam
suatu interval tertentu.
Dalam hal ini, distribusi frekuensi dapat diubah menjadi distri-
busi frekuensi kumulatif yang ditampilkan dalam grafik yang
disebut ogive.

Distribusi frekuensi kumulatif dapat dibedakan menjadi:


• Distribusi frekuensi kumulatif kurang dari, disusun dengan
menjumlahkan seluruh frekuensi dari semua nilai yang lebih
kecil daripada batas atas nyata interval kelas.
• Distribusi frekuensi kumulatif lebih dari, disusun dengan
menjumlahkan seluruh frekuensi dari semua nilai yang lebih
besar daripada batas bawah nyata interval kelas.
Distribusi Frekuensi Kumulatif Breaking Jumlah
Stress (fc)
<899.5 0
120
<999.5 4
Jumlah kumulatif (fc)

100 <1099.5 23
<1199.5 52
80 <1299.5 80
<1399.5 93
60
<1499.5 100
40

20

0
899.5 999.5 1099.5 1199.5 1299.5 1399.5 1499.5
Breaking Stress kN/m2
UKURAN PEMUSATAN

Sebaran data sering menunjukkan kecenderungan


terpusat di sekitar suatu nilai. Nilai pusat ini kemu-
dian dapat digunakan sebagai suatu ukuran ringkas
yang menggambarkan karakteristik umum data ter-
sebut. Nilai tersebut dalam statistik disebut sebagai
ukuran pemusatan (central tendency).
Terdapat beberapa ukuran pemusatan yang sering
digunakan dalam statistik. Dalam rumusannya juga
dibedakan antara ukuran yang menunjukkan karak-
teristik populasi (parameter) dengan yang menun-
jukkan karakteristik sampel.
UKURAN PEMUSATAN

Purata (Average)

Median

Modus

Hubungan Mean, Median, Modus

Kuantil : Kuartil, Desil dan Persentil


Purata (Average)
Istilah ‘purata’ (average) meliputi beberapa ukuran
pemusatan yang menunjukkan nilai khas yang
mewakili sifat tengah atau posisi pusat dari kum-
pulan nilai data.
☻ Mean Aritmatik (Arithmetic Mean)
Untuk suatu sampel dengan data yang tidak ter-
kelompok Mean Aritmatik dirumuskan sebagai :

x i
x i 1
n
Untuk sampel terkelompok:

k k Breaking Stress Jumlah Presentasi

fx i m ,i fx i m ,i
(kN/m2)

900 – 999 4
(f) {f/n x 100%}

4
x i 1
k
 i 1 1000 – 1099
1100 – 1199
19 19

f
n 1200 – 1299
29
28
29
28
i 1300 – 1399 13 13
i 1 1400 - 1499 7 7
Total (N) 100 100%
di mana:
x = mean aritmatik untuk sampel terkelompok
fi = frekuensi pada interval kelas ke i
xm,i = nilai tengah dari interval kelas ke i
n = banyak data dalam sampel
k = jumlah interval kelas dalam suatu sampel
☻ Mean Aritmatik Terbobot (Weighted Arithmetic Mean)

Kadang-kadang terhadap suatu nilai perlu diberi


pembobotan untuk menunjukkan keutamaan relatif
dari nilai tersebut.
Untuk suatu sampel dengan data yang tidak terke-
lompok Mean Aritmatik Terbobot dirumuskan:
n

w x i i
xw  i 1
n

w
i 1
i

dimana: wi adalah faktor pembobot.


☻ Mean Harmonik
Untuk kasus-kasus tertentu Mean Harmonik lebih
tepat digunakan daripada Mean Aritmatik.
Untuk suatu sampel dengan data yang tidak ter-
kelompok Mean Harmonik dirumuskan:

1 n
H n
 n
1 1
1
n 
i 1 x i

i 1 x i
☻ Akar Purata Kuadrat (Root Mean Square)
Akar purata kuadrat merupakan ukuran pemusatan
yang sering digunakan dalam kajian sains fisik.
Secara umum dirumuskan:

x
2
i
rms  x 2  i 1
n
Dalam Analisis Kecepatan Gelombang dari suatu
penampang seismik seringkali digunakan para-
meter Vrms (Kecepatan Akar Purata Kuadrat):

V1 t1  V2 t 2  V3 t 3
2 2 2

2
V1,t1 Vrms
t1  t 2  t 3
n
V2, t2  Vk t k 2

 k 1
n

V3, t3 t k 1
k

di mana:
V = kecepatan pada lapisan
t = One Way Time (OWT)
Median
Median menyatakan posisi tengah dari nilai data ter-
jajar (array data). Secara geometris, median merupa-
kan nilai dari absis X yang bertepatan dengan garis
vertikal yang membagi daerah di bawah poligon men-
jadi dua daerah yang luasnya sama.
Untuk suatu sampel dengan data yang tidak ter-
kelompok Median didefinisikan sebagai:
Nilai tengah atau mean aritmatik dari dua nilai tengah
suatu jajaran data.
Median dari data tegangan rusak setelah diurutkan,
adalah mean aritmatik dari data ke-50 dan ke-51, yaitu:
~ 1192  1196
Median  x   1194
2
Breaking Stress Jumlah Presentasi
(kN/m2) (f) {f/n x 100%}
900 – 999 4 4
1000 – 1099 19 19
1100 – 1199 29 29
1200 – 1299 28 28
1300 – 1399 13 13
1400 - 1499 7 7
Total (N) 100 100%

Jika sampel data sudah terkelompok seperti pada


tabel distribusi frekuensi di atas:
2 - (  f) l
 n

Median  x  L i  
~ c

 f median 
dimana : Li = batas bawah nyata kelas dari kelas median
n = banyaknya data (jumlah seluruh frekuensi)
(Σf)l = jumlah frek seluruh kelas yang lebih rendah
fmed = frekuensi kelas median
c = lebar interval kelas median
Modus

Modus dari sekumpulan nilai data adalah nilai yang


paling sering muncul atau yang frekuensinya terbesar.
Dalam suatu kumpulan nilai data, modus tidak selalu
ada; dan kalaupun ada tidak selalu tunggal. Untuk
contoh kasus data tegangan rusak yang datanya ti-
dak terkelompok modusnya adalah 1141 ( f=3).
Untuk data terkelompok:
 1 
Modus  xˆ  Li    c
 1   2 
dimana, Li = batas bawah nyata dari kelas modus
Δ1 = selisih frekuensi kelas modus dengan kelas sebelumnya
Δ2 = selisih frekuensi kelas modus dengan kelas sesudahnya
c = lebar interval kelas median
Karakteristik hubungan Mean, Median dan Modus
Tidak ada aturan umum yang selalu dapat diikuti
untuk mengidentifikasi ukuran pemusatan yang
paling tepat digunakan. Setiap ukuran pemusatan
mempunyai karakteristik masing-masing. Selain itu,
jenis data yang tersedia harus dipertimbangkan.
Memilih ukuran pemusatan yang akan digunakan
pada sebuah distribusi yang simetris akan lebih
mudah karena Mean, Medan dan Modus memiliki
nilai yang sama.

Namun bila datanya menghasilkan distribusi menceng


(Skewed distribution) ketiga nilai tersebut berbeda.
Distribusi Frekuensi Nilai Ujian Petrologi Distribusi Frekuensi Nilai Ujian Fisika Distribusi Frekuensi Nilai Ujian Pancasila

25 25 25

20 20 20

Frekuensi
Frekuensi

Frekuensi
15 15 15

10 10 10

5 5 5

0 0 0
20 40 60 80 100 20 40 60 80 100 20 40 60 80 100

Nilai Ujian Nilai Ujian


Nilai Ujian

Nilai Frekuensi Nilai Frekuensi Nilai Frekuensi


20 5 20 5 20 5
34.7 7 30 8 33 8
43 11 39 13 45 11
50 17 43 15 61 16
60 20 52 20 73 20
70 17 63 15 79 15
77 11 76 11 83 12
85.3 7 88 8 91 8
100 5 100 5 100 5

Mean= 60 Mean = 55.17 Mean = 67.04


Median= 60 Median = 52 Median = 73
Modus = 60 Modus = 52 Modus = 73

Mean
Median
Modus
Kuantil: Kuartil, Desil dan Persentil
Kuantil adalah nilai-nilai yang membagi suatu jajaran
data menjadi bagian-bagian yang sama. Sebagai
contoh, kuantil yang membagi jajaran data menjadi
dua bagian adalah median. Kuantil yang membagi
jajaran data menjadi empat bagian disebut kuartil
(Q1, Q2, Q3); menjadi sepuluh bagian disebut desil
(D1, D2, D3, …, D9); dan menjadi seratus bagian dise-
but persentil (P1, P2, P3, …, P99).

Dengan demikian, median suatu sampel data adalah:


Median = Q2, D5, dan P50.
Breaking Jml Presentasi
Untuk data terkelompok : Stress (f) {f/n x 100%}
(kN/m2)

 n - (f) l, i 
i 900 – 999 4 4

K i  L l, i   c
r 1000 – 1099 19 19

f  1100 – 1199 29 29

 kuantil, i  1200 – 1299


1300 – 1399
28
13
28
13
1400 - 1499 7 7

di mana : Total (N) 100 100%

Ll,i = batas bawah nyata kelas dari kelas kuantil ke-i.


n = banyaknya data (jumlah seluruh frekuensi)
r = konstanta (kuartil r = 4, desil r = 10, persentil r = 100).
(Σf)l,i = jumlah frekuensi seluruh kelas yang lebih rendah
daripada kelas kuantil ke-i.
fkuantil,i = frekuensi kelas kuantil ke-i.
c = lebar interval kelas kuantil
UKURAN PENYEBARAN

Ukuran penyebaran (dispersion) menunjukkan sebe-


rapa jauh data menyebar dari nilai rata-ratanya
(variabilitas data). Pentingnya mengamati ukuran
penyebaran suatu kumpulan nilai data adalah:
1. Untuk membuat suatu penilaian mengenai sebe-
rapa baik suatu nilai rata-rata (ukuran pemusatan)
menggambarkan data.
2. Untuk mengetahui seberapa jauh penyebaran
(scattering) dari data, sehingga antisipasi untuk
mengendalikan variasi tersebut dapat dilakukan.
UKURAN PENYEBARAN

Kisaran (Range)

Kisaran Presentil 10-90

Simpangan Kuartil

Simpangan mutlak purata (Mean Deviation)

Simpangan Baku

Varians

Koefisien Variasi
Kisaran (Range)

Kisaran (jangkauan) menyatakan perbedaan dari nilai


terbesar dan terkecil dari suatu jajaran data.
R = xmax - xmin
di mana: R = kisaran (range)
xmax = nilai data terbesar
xmin = nilai data terkecil

Kisaran Presentil 10-90

Jangkauan ini menyatakan selisih nilai persentil


ke-90 dan ke-10 jajaran data.
RP10-90 = P90 – P10
di mana : RP10-90 = kisaran persentil 10 -90
P90 = nilai persentil ke-90
P10 = nilai persentil ke-10

Simpangan kuartil
Simpangan kuartil sering disebut jangkauan semi-
antarkuartil (semi-interquartil range) didefinisikan:
Q3  Q1
Qd 
2
di mana : Qd = simpangan kuartil
Q3 = nilai kuartil ke-3
Q1 = nilai kuartil ke-1
Simpangan mutlak purata (Mean Deviation)

Simpangan mutlak purata merupakan ukuran penye-


baran yang meninjau besarnya penyimpangan setiap
nilai data terhadap nilai puratanya (mean).

Data tidak terkelompok:


n

 x x i
MDx  i 1
n
Data terkelompok:
k k

f i xm ,i  x f i xm , i  x
MDx  i 1
k
 i 1


n
fi
i 1

di mana :
MDx = simpangan mutlak purata
x = mean aritmatik dari suatu sampel
fi = frek / jumlah pengamatan dlm sebuah
interval kelas
xm,I = nilai tengah dari interval kelas
k = jumlah interval kelas dalam suatu sampel
n = banyaknya data x dalam suatu sampel.
Simpangan baku (Standard Deviation)

Simpangan baku merupakan ukuran penyebaran


yang paling sering diterapakan. Mayoritas nilai data
cenderung berada dalam satu deviasi standard dari
mean, dan hanya sebagian kecil saja yang terletak
di luar dari tiga daviasi standard dari meannya.

Untuk data sampel tidak terkelompok

2
n
 n
2 
n

 ( xi  x)
2
n  xi     xi 
s x  i 1   i 1   i 1 
n 1 n(n  1)
Untuk data sampel terkelompok

   k 
  i m ,i   
k
 
  i m ,i 
2
f i ( xm , i  x ) 2 n f x f x
sx  i 1
    i 1 
n 1 n(n  1)

di mana:
Sx = simpangan baku suatu sampel
x = mean aritmatik dari sampel
fi = frekuensi dalam interval kelas
xm,i = nilai tengah interval kelas
k = jml interval kelas dalam sampel
n = banyaknya data
Varians

Varians merupakan kuadrat dari deviasi standard, (Sx)2.


Sifat penting mengenai varians adalah varians kom-
binasi (combined/pooled varians). Jika terdapat bebe-
rapa kumpulan data (distribusi frekuensi) dengan
masing-masing banyaknya data Ni dan variansnya sx,i2,
maka varians kombinasinya:

 N i s x ,i
2

s x ,c  i 1
j

 Ni
i 1
Koefisien Variasi
Penyebaran yang sebenarnya dari data seperti diten-
tukan dengan simpangan baku atau ukuran penyebar-
an lainnya disebut penyebaran mutlak (absolute dis-
persion). Namun demikian karena variasi sebesar 1 m
dalam mengukur jarak 1000m berbeda artinya de-
ngan variasi 1m untuk jarak 20m; maka
untuk membedakannya digunakan ukuran yang dise-
but penyebaran relatif (relative dispersion):
Penyebaran mutlak
Penyebaran relatif 
Nilai rata - rata
Jika penyebaran mutlak diperoleh dari simpangan
baku dan nilai purata dalam mean, maka penyebaran
relatifnya disebut koefisien variasi / koefisien dispersi.
MOMEN, SKEWNESS DAN KURTOSIS

MOMEN

Momen data tak terkelompok

Momen data terkelompok

Hubungan antar Momen

Metode Pengkodean untuk


perhitungan momen terkelompok
Momen data tak terkelompok
Jika x1, x2, x3, … ,xn adalah n buah variabel x, maka da-
pat didefinisikan kuantitas momen ke-r, : yang sering
disebut momen simpangan terhadap nol.
n

 xi
r

x  x2  x3  ...  xn
r r r r
xr  1  i 1
n n
Dengan demikian momen pertama (utk r=1) adalah
mean aritmatika.
Momen ke-r simpangan terhadap mean didefinisikan:
n
Jadi, jika r = 1 maka mr,x = 0
 ( x  x)
i
r
Dan jika r = 2 maka mr,x =sx2
mr , x  i 1
yang tidak lain adl varians
n
Momen ke-r simpangan terhadap sembarang asal A,
didefinisikan sebagai:
n

 i
( x  A ) r

mr' , x  i1
n
Jadi, jika A=0, maka m’r,x = xr.
Momen data terkelompok
k k

f1x rm,1  f2 x rm, 2  ...  fk x rm,k  fi x r


m ,i  i m,i
f x r

xr   i1
 i 1
f1  f2  ...  fk k
n
 fi
i1
k k

 fi (xm,i  x) r
 i m,i
f ( x  x ) r

mr , x  i1
k
 i1
n
 fi
i 1

k k

 fi (xm,i  A ) r
 i m,i
f ( x  A ) r

m'r , x  i1
k
 i1
n
 fi
i1

Untuk momen dari sampel digunakan simbol:


mr,x dan m’r,x
Untuk momen dari populasi digunakan simbol:
r,x dan ’r,x
Hubungan antar Momen
Antara momen simpangan terhadap mean mr,x dan
momen simpangan terhadap sembarang asal m’r,x,
maka terdapat hubungan:
m2,x = m’2,x – m’1,x2
m3,x = m’3,x – 3m’1,x m’2,x + 2m’1,x3.
m4,x = m’4,x - 4m’1,x m’3,x +6m’1,x2 m’2,x – 3m’1,x2
Perhitungan Momen data terkelompok
menggunakan Metode Pengkodean
Perhitungan momen data terkelompok yang memiliki
lebar kelas (c) yang sama untuk setiap interval kelas
dapat disederhanakan menggunakan Metode Peng-
kodean. Dalam hal ini ditentukan kode (ui) untuk
setiap interval kelas sebagai:
xm , i  A
ui 
c
A ≡ adalah sembarang nilai (biasanya nilai tengah
interval kelas yang di tengah)
xm,i ≡ nilai tengah interval kelas
Dengan menggunakan pengkodean seperti di atas,
maka momen simpangan terhadap sembarang asal
dapat ditentukan:
k k

 
r r
f i ui f i ui
m' r , x  c r i 1
k
 cr i 1


n
fi
i 1

di mana :
fi = frekuensi dalam sebuah interval kelas.
ui = kode untuk suatu interval kelas
SKEWNESS
Skewness (kemencengan) adalah derajat ketidak-
simetrisan atau penyimpangan dari kesimetrisan
suatu distribusi. Jika kurva frekuensi (poligon fre-
kuensi yang dimuluskan) dari sebuah distribusi
mempunyai ekor yang lebih panjang ke arah kanan
dari maksimum di pusat dibandingkan dengan yang
ke arah kiri, dikatakan bahwa distribusi itu men-
ceng ke kanan, atau memiliki kemencengan negatif
(negative skewness).
Pada distribusi yang menceng, mean cenderung ber-
ada pada sisi ekor yang lebih panjang dengan mo-
dus berada pada frekuensi maksimum. Karena itu,
salah satu ukuran ketidaksimetrisan ini diberikan
oleh perbedaan Mean-Mode. Ukuran ini dapat dibuat
tidak berdimensi dengan membaginya terhadap se-
buah ukuran penyebaran seperti deviasi standard,
sehingga dapat didefinisikan:

x  xˆ
S f ,x 
s
Dengan menggunakan hubungan empiris antara
Mean (x), Modus (x) dan Median (x):
x  xˆ  3( x  ~
x)
Diperoleh:
3( x  ~
x)
S f ,x 
s
Di mana :
Sf,x = faktor/koefisien kemencengan
x = mean
x = median
x = modus
Dalam bidang teknik, ukuran kemencengan yang
paling banyak diterapkan adalah menggunakan
momen simpangan terhadap mean ketiga, yang
dinyatakan sebagai Koefisien Momen Kemencengan:

m3, x m3, x m3, x


a3, x  3
 3

s ( m2, x ) m2, x
3

Ukuran tersebut sering dinyatakan dalam b1,x = a3,x2.


Untuk kurva yang simetris sempurna, misalnya kurva
gaussian, a3,x = b1,x adalah nol.
KURTOSIS
Kurtosis adalah derajat keruncingan (peakedness) atau
keceperan (flatness) dari suatu distribusi relatif ter-
hadap distribusi normal.
Sebuah distribusi yang memiliki puncak relatif tinggi
disebut kurva leptokurtic, sedangkan kurva yang pun-
caknya ceper-rata disebut platykurtic. Kurva normal
yang tidak terlalu runcing atau terlalu ceper disebut
kurva mesokurtic.
Salah satu ukuran kurtosis menggunakan momen
simpangan terhadap mean keempat dalam bentuk
tidak berdimensi yang didefinisikan sebagai Koefisien
Momen Keruncingan (Kurtosis):
m4 , x m4 , x
a4 , x  4
 2
s m 2, x

Ukuran ini sering dinyatakan sebagai b2,x. Untuk


suatu distribusi normal; b2,x = a4,x =3. Dengan
alasan ini kurtosis kadang-kadang didefinisikan
sebagai (b2,x-3), yang nilainya akan positif untuk
distribusi leptokurtic; negatif untuk platykurtic, serta
nol untuk distribusi normal (gaussian).

Leptocurtic Platycurtic Mesocurtic


Ukuran lainnya yang dapat digunakan untuk menya-
takan kurtosis adalah kuartil dan persentil yang dise-
but sebagai koefisien persentil kurtosis:

2 (Q3  Q1 )
1
Qd
 
P90  P10 P90  P10

Untuk sebuah distribusi normal κ ≈ 0,263.

Anda mungkin juga menyukai