Anda di halaman 1dari 36

STATISTIKA DESKRIPTIF

PENGUKURAN TENDENSI SENTRAL DAN VARIABILITAS

Setiyono
Pengantar

 Statistika adalah ilmu di mana kesimpulan mengenai fenomena tertentu


dibuat berdasarkan data sampel yang relatif terbatas.
 Statistika memiliki dua bidang utama: statistika matematis dan statistika
terapan.
 Statistika matematis mencakup pengembangan metode inferensi statistik
baru dan membutuhkan pengetahuan detil tentang matematika abstrak
untuk implementasinya.
 Statistika terapan melibatkan penerapan metode statistika matematis
pada bidang permasalahan tertentu, seperti bidang ekonomi, psikologi, dan
kesehatan masyarakat.
 Biostatistika adalah cabang statistika terapan yang menerapkan metode
statistik pada permasalahan medis dan biologis.
DESKRIPSI DATA
 Deskripsi data dengan ANGKA
 Ukuran lokasi: Mean, median, dan mode
 Ukuran variabilitas: range, variance, deviasi standar,
dan koefisien variasi
 Deskripsi data dengan TABEL
 Tabel distribusi data, distribusi frekuensi, dan
distribusi probabilitas
 Deskripsi data dengan GRAFIK
UKURAN LOKASI

 Sebelum digunakan untuk analisis dan menjawab permasalahan, data semestinya


diringkas karena pada umumnya berjumlah besar.
 Jika data yang besar dilihat satu per satu maka ia akan mudah kehilangan
gambaran keseluruhan dari data itu.
 Salah satu jenis ukuran yang berguna untuk meringkas data adalah ukuran pusat,
atau tengah, dari sampel.
 Jenis ukuran ini dinamakan ukuran lokasi.
 Beberapa ukuran lokasi:
 Rata-rata Hitung (Arithmatic Mean)

 Nilai Tengah (Median)

 Modus (Mode)

 Geometric mean

 Weighted mean
Arithmatic Mean
 Rata-rata hitung (arithmatic mean) dari sehimpunan data adalah rata-rata
dari seluruh nilai data tersebut.
 Rata-rata hitung merupakan ukuran lokasi yang paling luas digunakan.
 Membutuhkan data setidaknya berskala interval.
 Sifat-sifat rata-rata hitung:
1. Setiap sehimpunan data berskala interval dan skala rasio memiliki
sebuah rata-rata.
2. Seluruh data dilibatkan dalam penghitungan rata-rata.
3. Jumlah deviasi/simpangan masing-masing data dari rata-rata sama
dengan nol.
4. Dihitung dengan menjumlahkan semua data dan dibagi dengan
jumlah data

3-5
Arithmatic Mean
 Rata-rata sampel ( X) adalah estimator-titik dari rata-rata
populasi ( ).
Rata-rata Sampel: Rata-rata Populasi:

X
 X i
  X i

n N
 Rata-rata dari distribusi X = (3, 4, 8) adalah 5.
 Deviasi masing-masing data jika dijumlahkan = -2 – 1 + 3 = 0
Sifat-sifat Arithmatic Mean

3-7
Arithmatic Mean
Contoh:
 Contoh berat lahir (g) bayi yang lahir hidup di sebuah rumah

sakit swasta di Yogyakarta, selama periode 1 minggu.


i Xi i Xi i Xi i Xi
1 3265 6 3323 11 2581 16 2759
2 3260 7 3649 12 2841 17 3248
3 3245 8 3200 13 3609 18 3314
4 3484 9 3031 14 2838 19 3101
5 4146 10 2069 15 3541 20 2834

 Rata-rata Sampel:
X
 X i

(3265  3260  3245  ...  2834
 3166,9 g
n 20
Median

 Median sehimpunan data adalah nilai di tengah ketika item-item data


telah diurutkan dari yang terkecil menuju yang terbesar.
 Dalam suatu distribusi data, jika ada beberapa nilai yang sangat
besar/ekstrim, maka dapat menginflasi rata-rata (mean).
 Ketika sehimpunan data memiliki nilai ekstrim, median merupakan
ukuran lokasi pusat yang lebih baik.
 Jika ada data ganjil sebanyak n, mediannya adalah data terbesar ke
(n+1)/2.
 Jika ada data genap sebanyak n, mediannya adalah rata-rata dari data
terbesar ke n/2 dan (n/2 +1).
Median

Contoh: Berat bayi lahir


Pertama, data diurutkan dari terkecil ke terbesar:
2069, 2581, 2759, 2834, 2838, 2841, 3031, 3101, 3200, 3245,
3248, 3260, 3265, 3314, 3323, 3484, 3541, 3609, 3649, 4146

Karena berjumlah genap 20, median dihitung dengan merata-


ratakan nilai data ke-10 dan ke-11.
Median = (3245 + 3248)/2 = 3246,5 g
Perbandingan antara Mean dan Median
 Dalam banyak sampel, hubungan antara mean dan median
sampel dapat digunakan untuk menentukan simetris atau
tidaknya distribusi data.
 Secara khusus, untuk distribusi simetris, mean akan
mendekati sama dengan median.
 Untuk distribusi menceng positif (menceng ke kanan), mean
cenderung lebih besar dari median.
 Untuk distribusi menceng negatif (menceng ke kiri), mean
cenderung lebih kecil dari median.
Mode

 Mode sehimpunan data adalah nilai yang berfrekuensi paling


besar kemunculannya.
 Frekuensi terbesar dapat muncul pada dua atau lebih nilai
yang berbeda.
 Jika data memiliki dua mode, maka data tersebut adalah
bimodal.
 Jika data memiliki lebih dari dua mode, maka data tersebut
adalah multimodal.
Mode

Contoh:
Nilai Frekuensi Nilai Frekuensi Nilai Frekuensi
24 5 29 96 34 7
25 10 30 63 35 3
26 28 31 24 36 2
27 64 32 9 37 1
28 185 33 2 38 1

Nilai 28 paling sering terjadi (185 kali)


Jadi, Mode = 28
Rata-rata Tertimbang

 Rata-rata tertimbang sehimpunan nilai X1, X2, ...,


Xn, dengan bobot yang bersesuaian adalah w1,
w2, ..., wn, dapat dihitung dengan formula berikut
ini.
 Rata-rata tertimbang:

3-14
Rata-rata Tertimbang

Contoh:
Perusahaan Konstruksi Carter membayar para karyawan per jam
$16.50, $19.00, atau $25.00. Ada 26 karyawan yang dibayar per
jam, 14 di antaranya dibayar dengan upah per jam $16.50 , 10
dengan upah per jam $19.00, dan 2 di antaranya dengan upah
per jam $25.00.
Berapakah rata-rata upah per jam yang dibayarkan kepada 26
karyawan tersebut?
= = $18.1154

3-15
Rata-rata Geometris

 Metoda ini digunakan untuk menentukan perubahan rerata dari


persentase, rasio-rasio, indeks, atau tingkat pertumbuhan dari
waktu ke waktu.
 Metoda ini banyak diterapkan dalam bisnis dan ekonomi,
misalnya dalam penentuan persentase perubahan penjualan,
upah, dll. Cara penentuannya dengan memajemukkan satu
sama lain.
 Rerata geometris akan selalu kurang dari atau sama dengan
rerata hitung.
 Formula untuk Rerata Geometris:

3-16
Rata-rata Geometris

Contoh 1
Tingkat pengembalian investasi yang diterima oleh Perusahaan
Konstruksi Atkins selama empat tahun berturut-turut adalah: 30
persen, 20 persen, -40 persen, dan 200 persen.
Berapakah rata-rata geometris tingkat pengembalian investasi
tersebut?
Rata-rata tingkat pengembalian investasi:
=
= = 1.294

3-17
Rata-rata Geometris

Contoh 2
Selama dekade 1990an dan ke 2000an, Las Vegas, Nevada
merupakan kota yang berkembang sangat pesat di Amerika
Serikat. Populasinya naik dari 258.295 di tahun 1990 menjadi
607.876 di tahun 2009. Ini merupakan kenaikan populasi
sebanyak 349.581 orang, atau naik 135.3 persen sepanjang
perioda tersebut. Populasi tersebut menjadi lebih dari dua
kalinya.
Berapakah kenaikan tahunan rata-rata?

3-18
Rata-rata Geometris

JAWAB:
Persen Rata-rata Kenaikan Populasi Sepanjang Waktu:
- 1
= - 1
= 1.0461 - 1
= 0,0461

3-19
UKURAN VARIABILITAS

 Ukuran variabilitas dan ukuran lokasi sama-sama


dibutuhkan dalam pengambilan keputusan.
 Sebagai contoh pada pemilihan pemasok A atau pemasok B,
kita tidak hanya mempetimbangkan waktu pengiriman rata-
rata namun juga variabilitas waktu setiap pengirimannya.
 Beberapa ukuran variabilitas:
 Jarak (Range)
 Kuantil (Quantiles) atau Persentil (Percentiles)
 Variansi (Variance)
 Deviasi Standar (Standard Deviation)
 Koefisien Variasi (Coefficient of Vatiation)
Jarak

 Jarak sehimpunan data adalah perbedaan antara nilai data


terbesar dan nilai data terkecil.
 Ini merupakan ukuran variabilitas yang paling sederhana.
 Nilainya sangat sensitif terhadap nilai data terendah dan
tertinggi.
Jarak

Contoh: Berat bayi lahir (gram)


2069, 2581, 2759, 2834, 2838, 2841, 3031, 3101, 3200,
3245, 3248, 3260, 3265, 3314, 3323, 3484, 3541, 3609,
3649, 4146

Jarak = nilai data terbesar - nilai data terkecil


Jarak = 4146 - 2069 = 2077
Persentil

 Suatu persentil menyediakan informasi tentang


bagaimana data tersebar dalam interval nilai data
terkecil hingga terbesar.
 Persentil ke-p dari sehimpunan data adalah suatu
nilai yang membuat setidaknya p persen item-
item data memuat nilai tersebut atau nilai yang
kurang darinya, dan setidaknya (100 – p) persen
item-item data memuat nilai tersebut atau nilai
yang lebih darinya.
Persentil

Cara menentukan Persentil:


1. Urutkan data dari terkecil menuju terbesar.
2. Tentukan posisi persentil ke-p, yaitu data ke
= (p / 100) n

n = jumlah observasi
4. Jika diperoleh angka bukan bilangan bulat, maka dibulatkan
naik. Persentil ke-p adalah nilai pada posisi tersebut.
5. Jika diperoleh angka bilangan bulat, maka persentil ke-p
adalah rata-rata nilai pada posisi tersebut dan sesudahnya.
Persentil ke-80

Contoh: Berat bayi lahir (gram)


2069, 2581, 2759, 2834, 2838, 2841, 3031, 3101, 3200,
3245, 3248, 3260, 3265, 3314, 3323, 3484, 3541, 3609,
3649, 4146

Posisi P80: i = (p/100) n = (80/100) 20 = 16 (bilangan bulat)


Posisi P80 adalah data ke (16+17)/2 = 16,5
Dengan merata-rata nilai data ke-16 dan ke-17, maka:
Persentil ke-80 = (3484 + 3541)/2 = 3512,5
Variansi
 Variansi adalah ukuran variabilitas yang melibatkan seluruh
data.
 Variansi adalah rata-rata perbedaan kuadrat antara setiap nilai
X sampel, dan  untuk
data (Xi) dan reratanya ( untuk
populasi).
 Variansi dihitung sebagai berikut:

s2 
 (xi  x) 2

σ2 
 i
(x  μ)2

n1 N
Untuk suatu Untuk suatu
sampel populasi
Deviasi Standar

 Deviasi standar sehimpunan data adalah akar kuadrat dari


variansi.
 Nilainya diukur dengan satuan unit yang sama dengan data
aslinya, sehingga membuatnya lebih mudah diinterpretasikan
daripada variansi.
 Deviasi standar dihitung sebagai berikut:

2 2
s s σ σ
Untuk suatu Untuk suatu
sampel populasi
Koefisien Variasi

 Koefisien variasi mengindikasikan berapa besar deviasi


standar dalam kaitannya dengan rata-rata.
 Koefisien variasi dihitung sebagai berikut:

s   
  100 %   100 %
x   
Untuk suatu Untuk suatu
sampel populasi
Variansi, Deviasi Standar dan Koefisien Variasi

Contoh: Berat bayi lahir (gram)


2069, 2581, 2759, 2834, 2838, 2841, 3031, 3101, 3200,
3245, 3248, 3260, 3265, 3314, 3323, 3484, 3541, 3609,
3649, 4146

Hitunglah variansi, deviasi standar dan koefisien variasi dari


distribusi data berat bayi lahir tersebut!
Variansi, Deviasi Standar dan Koefisien Variasi

Xi (Xi X Xi (Xi - X )2
s2 
 i
(x  x )2

- )2
n1
3265 9623,61 2581 343278,81
9623,61  8667,61  ...  110822,41
3260 8667,61 2841 106210,81 
19
3245 6099,61 3609 195452,41
3768147,8
3484 100552,41 2838 108175,21   198323,57 g
19
4146 958636,81 3541 139950,81
3323 24367,21 2759 166382,41 s  s 2  198323,57  445,34
3649 232420,41 3248 6577,21
deviasi standar
3200 1095,61 3314 21638,41
sekitar 11% dari
3031 18468,81 3101 4342,81 mean
2069 1205384,41 2834 110822,41
s   445,34 
CV    100  %    100  %  14,06%
x   3166,9 
UKURAN BENTUK

 Ukuran bentuk distribusi data:


 Skewness: mengukur kemencengan/kesimetrisan
distribusi
 Kurtosis: mengukur keruncingan/kegendutan distribusi
Skewness

 Sample skewness: n(n  1)


G1  g1
n2
 Di mana:
g 1  m3 / m23/2
m3   (X  X)3 / n
m2   (X  X)2 / n

 Statistik tes: Zg1 = G1/SES


6n(n  1)
SES 
(n  2)(n  1)n  3
Skewness

Rule of thumb:
 Jika skewness kurang dari −1 atau lebih dari +1, maka
distribusi tersebut sangat menceng (highly skewed).
 Jika skewness antara −1 dan −½ atau antara +½ dan +1, maka
distribusi tersebut cukup menceng (moderately skewed).
 Jika skewness antara −½ dan +½, maka distribusi tersebut
mendekati simetris (approximately symmetric).
Kurtosis
Tes Signifikansi
6n(n  1)
 Statistik tes: Zg1 = G1/SES, dimana: SES 
(n  2)(n  1)n  3
 Nilai kritis dari Zg1 adalah 2 (Ini merupakan uji dua sisi terhadap skewness  ≠ 0
dengan tingkat signifikansi 0,05)

 Jika Zg1 < −2, populasi kemungkinan besar menceng secara negatif.

 Jika Zg1 antara −2 dan +2, sulit disimpulkan mengenai skewness: mungkin
simetris, atau mungkin menceng dengan arah positif atau negatif.

 Jika Zg1 > 2, populasi kemungkinan besar menceng secara positif.


Skewness
Xi (Xi -X )2 (Xi - X )3 Xi (Xi - X )2 (Xi - X )3
Contoh: 3265 9623,61 944076,141 ... ... ...
Data berat 3260 8667,61 806954,491 2581 343278,81 -201127054,8

bayi lahir (gram) 3245 6099,61 476379,541 2841 106210,81 -34614102,98


3484 100552,41 31885169,21 3609 195452,41 86409510,46
4146 958636,81 938601300,7 2838 108175,21 -35578826,57
3323 24367,21 3803721,481 3541 139950,81 52355598,02
3649 232420,41 112049879,7 2759 166382,41 -67867385,04
3200 1095,61 36264,691 3248 6577,21 533411,731
3031 18468,81 -2509911,279 3314 21638,41 3183010,111
2069 1205384,41 -1323391544 3101 4342,81 -286191,179
... ... ... 2834 110822,41 -36892780,29
X 3166,9
m2
188407,39
m3
- 23.559.126
g1 - 0,288079447
G1 - 0,312
SES 0,51210
Zg1 -0,61
Peringkasan Data Dengan SPSS

 Hasil perhitungan nilai mean,


median, mode, deviasi standar,
varians, skewness, range, dan
nilai maksimum-minimum,
dengan software SPSS.

Anda mungkin juga menyukai