Anda di halaman 1dari 66

Descriptive Statistics

SFR 2017
Descriptive Statistics
 Descriptive Statistics Digunakan oleh peneliti untuk
melaporkan tentang populasi dan sampel

 In Sociology:
Kesimpulan gambaran hasil pengukuran (variabel)
yang diambil tentang kelompok manusia

 Sebagai informasi kesimpulan secara menyeluruh


dari karakteristik suatu kelompok

SFR 2017
Sample vs. Population

Population Sample

SFR 2017
Descriptive Statistics
Illustrasi:
Grup mana yang lebih pintar ?
Kelas A--IQs dari 13 Siswa Kelas B--IQs dari 13 Siswa
102 115 127 162
128 109 131 103
131 89 96 111
98 106 80 109
140 119 93 87
93 97 120 105
110 109
Setiap individu mungkin berbeda. Jika kita ingin memahami kelompook dengan melihat
kualitas perorangan, maka kita akan salah memahami suatu kelompok
SFR 2017
Descriptive Statistics
Grup mana yang lebih pintar ?

Kelas A--Average IQ Kelas B--Average IQ

110.54 110.23

Mereka hampir sama!

Dengan statistik deskriptif, akan lebih mudah untuk


menjawab pertanyaan.
SFR 2017
Descriptive Statistics
Jenis Statistik Deskriptif:
 Pengorganisasian Data
 Tabel
 Grafik

 Kesimpulan Data
 Central Tendency
 Variation

SFR 2017
Descriptive Statistics
Jenis Statistik Deskriptif:
 Pengorganisasian Data
 Tables
 Frequency Distributions
 Relative Frequency Distributions
 Graphs
 Bar Chart or Histogram
 Stem and Leaf Plot
 Frequency Polygon

SFR 2017
SPSS Output Untuk
Frequency Distribution
IQ

Cumulative
Frequency Percent Valid Percent Percent
Valid 82.00 1 4.2 4.2 4.2
87.00 1 4.2 4.2 8.3
89.00 1 4.2 4.2 12.5
93.00 2 8.3 8.3 20.8
96.00 1 4.2 4.2 25.0
97.00 1 4.2 4.2 29.2
98.00 1 4.2 4.2 33.3
102.00 1 4.2 4.2 37.5
103.00 1 4.2 4.2 41.7
105.00 1 4.2 4.2 45.8
106.00 1 4.2 4.2 50.0
107.00 1 4.2 4.2 54.2
109.00 1 4.2 4.2 58.3
111.00 1 4.2 4.2 62.5
115.00 1 4.2 4.2 66.7
119.00 1 4.2 4.2 70.8
120.00 1 4.2 4.2 75.0
127.00 1 4.2 4.2 79.2
128.00 1 4.2 4.2 83.3
131.00 2 8.3 8.3 91.7
140.00 1 4.2 4.2 95.8
162.00 1 4.2 4.2 100.0
Total 24 100.0 100.0

SFR 2017
Frequency Distribution
Frequency Distribution of IQ for Two Classes

IQ Frequency

82.00 1
87.00 1
89.00 1
93.00 2
96.00 1
97.00 1
98.00 1
102.00 1
103.00 1
105.00 1
106.00 1
107.00 1
109.00 1
111.00 1
115.00 1
119.00 1
120.00 1
127.00 1
128.00 1
131.00 2
140.00 1
162.00 1

Total 24

SFR 2017
Relative Frequency
Distribution
Relative Frequency Distribution of IQ for Two Classes

IQ Frequency Percent Valid Percent Cumulative Percent

82.00 1 4.2 4.2 4.2


87.00 1 4.2 4.2 8.3
89.00 1 4.2 4.2 12.5
93.00 2 8.3 8.3 20.8
96.00 1 4.2 4.2 25.0
97.00 1 4.2 4.2 29.2
98.00 1 4.2 4.2 33.3
102.00 1 4.2 4.2 37.5
103.00 1 4.2 4.2 41.7
105.00 1 4.2 4.2 45.8
106.00 1 4.2 4.2 50.0
107.00 1 4.2 4.2 54.2
109.00 1 4.2 4.2 58.3
111.00 1 4.2 4.2 62.5
115.00 1 4.2 4.2 66.7
119.00 1 4.2 4.2 70.8
120.00 1 4.2 4.2 75.0
127.00 1 4.2 4.2 79.2
128.00 1 4.2 4.2 83.3
131.00 2 8.3 8.3 91.7
140.00 1 4.2 4.2 95.8
162.00 1 4.2 4.2 100.0

Total 24 100.0 100.0

SFR 2017
SPSS Output for Histogram

SFR 2017
Histogram

SFR 2017
Bar Graph

SFR 2017
Stem and Leaf Plot
Stem and Leaf Plot of IQ for Two Classes

Stem Leaf
8 279
9 3678
10 235679
11 159
12 078
13 1
14 0
15
16 2

Note: SPSS does not do a good job of producing these.

SFR 2017
Descriptive Statistics
Summarizing Data:

 Central Tendency (or Groups’ “Middle Values”)


 Mean
 Median
 Mode

 Variation (or Summary of Differences Within Groups)


 Range
 Interquartile Range
 Variance
 Standard Deviation

SFR 2017
Mean
Sering disebut “average.”

Jumlahkan semua nilai dari setiap kasus dan bagi dengan jumlah
total kasus

X-bar = (X1 + X2 + . . . + Xn)


n

X-bar = Σ Xi
n

SFR 2017
Mean
Kelas A--IQs dari13 Siswa Kelas B--IQs dari13 Siswa
102 115 127 162
128 109 131 103
131 89 96 111
98 106 80 109
140 119 93 87
93 97 120 105
110 109
Σ Xi = 1437 Σ Xi = 1433

X-barA = Σ Xi = 1437 = 110.54 X-barB = Σ Xi = 1433 = 110.23


n 13 n 13

SFR 2017
Mean
Rerata merupakan “balance point.”

1 lb at 1 lb at 1 lb at
93 cm 106 cm 110 cm 131 cm

17 21
4
units
units 0
units
units

Nilainya seimbang karena …


17 + 4 di kiri = 21 di kanan
SFR 2017
Mean
1. Rerata terpengaruh buruk oleh outlier
2. Outlier membuat rerata tidak mewakili
central tendency atau gambaran umum
Income in the U.S.

Bill Gates
All of Us
Mean Outlier

SFR 2017
Median
Nilai tengan setelah nilai-nilai diurutkan dari rendah ke
tinggi. Nilai tengah membagi distribusi data menjadi
dua bagian yang sama.
Saat data sudah diurutkan, titik median membagi 50%
kasus ke bawah dan 50% kasus ke atas.

50th percentile.

SFR 2017
Median
Kelas A--IQs dari 13 Siswa
89
93
97
98
102
106 Median = 109
109 (enam kasusdi bawah, enam di
110 atas)
115
119
128
131
140 SFR 2017
Median
Jika siswa pertama keluar dri kelas A, akan
mendapatkan median yang baru :
89
93
97
98
102
106
109
Median = 109.5
110
109 + 110 = 219/2 = 109.5
115
119 (enam kasusdi bawah, enam di
atas)
128
131 SFR 2017

140
Median
1. Media tdk terpengaruh oleh outlier,
menjadikannya lebih baik untuk mengukur
central tendency, lebih baik menjelaskan
“typical person” dari pada rerata jika
distribusi data menceng.

All of Us Bill Gates


outlier

SFR 2017
Median
2. Jika distribusi data simetrik, median dan
rerata identik.
3. Pada distribusi yang menceng, rerata akan
bergerak ke arah menceng kurva
dibandingkan dengan median.
Symmetric Skewed

Mean Mean

Median Median
SFR 2017
Mode
Data yang paling banyak muncul disebut mode.

Gabungan score IQ untuk Kelas A & B:


80 87 89 93 93 96 97 98 102 103 105 106 109 109 109 110 111 115 119 120
127 128 131 131 140 162
mode!!

Sangat mungkin muncul mode lebih dari satu

SFR 2017
Mode
1. Pada distribusi yang simetrik rerata, median, dan mode
adalah sama.
2. Pada skewed data, rerata dan median lebih cenderung
ke arah menceng dari pada mode.
Symmetric Skewed

Mean
Median
Mode Mode Median Mean

SFR 2017
Descriptive Statistics
Summarizing Data:

 Central Tendency (or Groups’ “Middle Values”)


 Mean
 Median
 Mode

 Variation (or Summary of Differences Within Groups)


 Range
 Interquartile Range
 Variance
 Standard Deviation

SFR 2017
Range
Jarak antara nilai terendah dengan nilai tertinggi pada
variabel
Untuk mendapatkan range dari variabel, kita harus
menentukan nilai terendah dan tertinggi

Class A--IQs of 13 Students Class B--IQs of 13 Students


102 115 127 162
128 109 131 103
131 89 96 111
98 106 80 109
140 119 93 87
93 97 120 105
110 109
Range kelas A= 140 - 89 = 51 Range kelas B = 162 - 80 = 82
SFR 2017
POSISI KUARTIL KELOMPOK
DATA
 Membagi data menjadi 4 bagian yang sama besarnya (jumlah
datanya)
 Dengan demikian dikenal
Q1, Q2, Q3, dan Q4

Data 1 Data 2 Data 3 Data 4 Data 5 Data 6 Data 7 Data 8 Data 9 Data 10 Data 11 Data 12

25% 25%
data data
25% 25%
data data

SFR 2017

0 250 500 750 1000


PROSES PENENTUAN
KUARTIL
 Data diurutkan dari yang terkecil sampai
terbesar
 Menentukan lokasi data yang akan dihitung
Qk  {k(n 1)} / 4

 Qk = Lokasi data yang ke k


 n = Jumlah Data
 k = Data urutan ke I yg akan ditentukan
lokasinya
SFR 2017
Contoh :

NO DATA NO DATA NO DATA NO DATA NO DATA


1 10 6 24 11 35 16 50 21 70
2 20 7 26 12 40 17 51 22 78
3 21 8 27 13 42 18 58
4 22 9 29 14 45 19 59
5 24 10 32 15 47 20 60

Qk  {k(n 1)} / 4
Maka :
Q1 = 5,75  24 25 % data nilanya ≤ 24
Q2 = 11,5  37,5 50 % data di bawah nilai 37,5
Q3 = 17,25  52,75 75 % data di bawah nilai 52,75

SFR 2017
BOX PLOT

Nilai Maks dan


Minimal

Q3
Lower dan Upper hinges
Median = Q2 atau batas kotak
menunjukkan persentil 25%
dan persentil 75%. Tinggi
antar kedua titik tersebut
disebut hspread
Q1

Pada grafik Boxplot akan timbul simbol 0 atau outlier apabila data
berada 1,5 kali hspread. Sedangkan simbol * atau extreme akan
muncul untuk menunjukkan data pada 3 hspread
SFR 2017
Range dan Rentang Interquartil
 Range :
 Cara paling sederhana mengukur variasi data
 Range = Data terbesar – Data terkecil
 Jika range sekelompok data besar, maka data
tersebut cenderung terdispersi dari nilai rata-
ratanya

SFR 2017
Descriptive Statistics

N Range Minimum Maximum Mean Std. Deviation Variance


ALP pada kelompok
20 78.00 141.00 219.00 170.1000 22.63881 512.516
trimester 1
ALP pada kelompok
20 400.00 163.00 563.00 223.6000 98.08020 9619.726
trimester 2
ALP pada kelompok
20 324.00 239.00 563.00 401.9000 105.73746 11180.411
trimester 3
Valid N (listwise) 20

Walaupun range sudah diukur, namun karena range hanya


memperhatikan data terbesar dan terkecil, maka range
bukanlah alat ukur dispersi yang baik karena tidak
memperhatikan isi dari data secara keseluruhan

SFR 2017
600.00
39

500.00
Aktivitas ALP dalam serum

40
400.00

300.00

200.00

100.00

1.00 2.00 3.00

Kelompok trimester

SFR 2017
Range Interkuartil
 Mencoba mempersempit jarak yang akan
diukur
 Data yang digunakan adalah data yang
lebih dekat ke titik pusat data. Karena
sekelompok data cenderung
bergerombol di pusat data, sehingga
lebih tepat dalam memperkirakan variasi
data
SFR 2017
INTERKUARTIL :

Dimana :
Q3 = Kuartil ke 3, yang meliputi 75 % data
Q1 = Kuartil ke 1, yang meliputi 25 % data

Semakin besar nilai Q, semakin terdispersi data


tersebut.
Semakin kecil nilai Q, semakin homogen data
tersebut (variasi data terhadap rata-ratanya relatif
sedikit

SFR 2017
600.00
39

500.00

Aktivitas ALP dalam serum


40
400.00

300.00

200.00

100.00

1.00 2.00 3.00

Kelompok trimester

KELOMPOK I KELOMPOK II KELOMPOK III

Range 78 400 324


Interkuartil 42,5 61 196,5

SFR 2017
Boxplot example
100th Procentile
75th Procentile
Mean( *)
Median
25th Procentile

25th Procentile

Outliers
SFR 2017
NILAI SEBARAN
Adalah suatu ukuran yang menggambarkan berpencarnya data.
Rata-rata hitung dan median hanya menunjukkan titik tengah data (nilai pemusatan
data) tidak memberikan informasi penyebaran data.
Distribusi yang mempunyai rata2 yang sama tidak selalu identik bentuk
distribusinya.
Perbedaan bentuk kedua distribusi tsb bisa dari bentangan pencaran, dispersi
ataupun variabilitasnya dari nilai masing2 distribusinya.
Ukuran pencaran absolut dinyatakan dalam unit sesuai dengan ukuran data atau
pengamatan asal mis. Ukuran dalam kg, meter, dsb
Dapat dilihat/dihitung dengan grafik atau perhitungan.

SFR 2017
Distribusi B

Disttribusi A

SFR 2017
SIMPANGAN BAKU
Ukuran sebaran yang paling banyak digunakan dalam
analisis statistik.
Sutau nilai yang menunjukan tingkat variasi suatu
kelompok data.
Prinsipnya adalah penyimpangan nilai pengamatan
individu terhadap nilai rata2
Makin besar penyimpangan makin besar SD dan selalu
menghasilkan ukuran positif
Ukuran ini dihitung dari rata-rata sebagai titik tolak
perhitungannya.
SFR 2017
SD dapat digunakan untuk :
-  Memberi gambaran ttg penyimpangan tiap nilai hasil pengamatan thd rata2
suatu distribusi.
Menyatakan penyimpangan brp distribusi

1. 68,3 % terletak antara interval x – 1SD dan x – 1SD


2. 95,4 % terletak antara interval x – 2SD dan x – 2SD
3. 99,7 % terletak antara interval x – 3SD dan x – 3SD

SFR 2017
Koefisien variasi
Merupakan perbandingan antara simpangan baku dengan rata2 yang
dinyatakan dalam persen.
Mengukur dua set data dan dilihat mana yang lebih bervariasi.
S
Rumus CV = X 100%
X

X = rata-rata hitung
S = SD

SFR 2017
PRAKTEK
o Transformasi data
 Recode
 Compute

o Analisis Frekuensi
o Analisis Deskripsi
o Analisis Explore

SFR 2017
Latihan Statistik
Deskriptif

SFR 2017
No Lapangan Staf No Lapangan Staf
1 16.7 13.9 16 17.4 15.1
2 15.8 15.2 17 18.8 16.2
3 16.5 15.7 18 13.0 12.5
4 13.0 12.5 19 19.1 12
5 17 16.1 20 18.3 15.6
6 15.6 15.2 21 17 15.5
7 16 13.0 22 12.5 16.3
8 16 14.9 23 18.6 17.2
9 16.7 16.1 24 19.2 13.5
10 17 15 25 15.8 15.7
11 12.5 12.0 26 12.9 13.0
12 17.2 14.7 27 16.7 18
13 17.5 13.0 28 16.4 13.0
14 15.9 15.2 29 17.5 15.1
15 17.4 13.4 30 17.1 12.0
Dilakukan pemeriksaan Hb terhadap 2 kelompok pekerja
1. Entry data Hb ke dalam 1 kolom. Pada kolom berikutnya buat pengelompokan
staf dan lapangan dengan cara mengisi values pada variabel view !
2. Buat pengelompokan Hb Normal dengan Hb anemi (patokan Hb normal di atas
15) dng menggunakan transform, recode,
SFR 2017
into defferent variables !
3. Bagaimana gambaran kedua kelompok data ? (lakukan analyze, deskriptif stat,
explore)
Entry data Hb ke dalam 1 kolom. Pada kolom berikutnya buat
pengelompokan staf dan lapangan dengan cara mengisi values pada
variabel view !

SFR 2017
SFR 2017
Buat pengelompokan Hb Normal dengan Hb anemi (patokan Hb normal di
atas 15) dng menggunakan transform, recode, into defferent variables !

SFR 2017
SFR 2017
SFR 2017
SFR 2017
SFR 2017
Bagaimana gambaran kedua kelompok data ? (lakukan analyze, deskriptif
stat, explore)

SFR 2017
SFR 2017
Descriptives

KELOMPOK Statistic Std. Error


HB Petugas Lapangan Mean 17.0267 .19363
95% Confidence Lower Bound 16.6306
Interval for Mean Upper Bound
17.4227

5% Trimmed Mean 17.0056


Median 17.0000
Variance 1.125
Std. Deviation 1.06056
Minimum 15.10
Maximum 19.20
Range 4.10
Interquartile Range 1.5750
Skewness .410 .427
Kurtosis -.381 .833
Staf ruangan Mean 15.3267 .18766
95% Confidence Lower Bound 14.9429
Interval for Mean Upper Bound
15.7105

5% Trimmed Mean 15.2981


Median 15.2000
Variance 1.057
Std. Deviation 1.02786
Minimum 13.40
Maximum 18.00
Range 4.60
Interquartile Range 1.1750
Skewness .441 .427
Kurtosis SFR 2017 .715 .833
Tests of Normality
a
Kolmogorov-Smirnov Shapiro-Wilk
KELOMPOK Statistic df Sig. Statistic df Sig.
HB Petugas Lapangan .100 30 .200* .966 30 .436
Staf ruangan .116 30 .200* .973 30 .612
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction

Frequency Stem & Leaf


1.00 13 . 4
2.00 13 . 59
2.00 14 . 13
5.00 14 . 67799
7.00 15 . 0112222
6.00 15 . 566778
4.00 16 . 1123
.00 16 .
2.00 17 . 02
1.00 Extremes (>=18.0)
Stem width: 1.00
Each leaf: 1 case(s) SFR 2017
20

19

18 57

17

16

15

14
HB

13
N= 30 30

Petugas Lapangan Staf ruangan

KELOMPOK
SFR 2017
SFR 2017
SFR 2017
KELOMPOK * KEL_HB Crosstabulation

KEL_HB
Anemi Tdk Anemi Total
KELOMPOK Petugas Lapangan Count 0 30 30
% of Total .0% 50.0% 50.0%
Staf ruangan Count 11 19 30
% of Total 18.3% 31.7% 50.0%
Total Count 11 49 60
% of Total 18.3% 81.7% 100.0%

40

30

20

10
KEL_HB
Coun t

Anemi

0 Tdk Anemi
Petugas Lapangan Staf ruangan
SFR 2017

KELOMPOK
Now you are qualified use descriptive
statistics!

Questions?
SFR 2017
Glukosa Glukosa Glukosa
No 1 2 3
Dilakukan suatu perlakuan terhadap sekelompok
1 440 425 191 orang dalam suatu kurun waktu
2 201 151 258 Pada setiap objek penelitian dilakukan
3 137 134 164 pemeriksaan glukosa darah
4 239 219 191 sebelum perlakuan, pertengahan perlakuan dan
5 259 230 155 akhir perlakuan
6 227 159 92 1. Entry data Glukosa ke dalam 1 kolom. Pada
7 171 102 85 kolom berikutnya buat pengelompokan
perlakuan 1, perlakuan 2, perlakuan 3 dengan
8 260 140 140
cara mengisi values pada variabel view !
9 76 116 68 2. Bagaimana gambaran ketiga kelompok data ?,
10 93 70 61 apakah ketiga data berdistribusi normal ?
11 76 64 60 (lakukan analyze, deskriptif stat, explore)
12 85 81 75
13 98 101 99
14 116 110 102
15 88 85 76

SFR 2017
No Trm 1 Trm 2 Trm 3
Dilakukan pemeriksaan aktivitas enzim ALP pada
1 196 200 297
tiga kelompok ibu hamil
2 183 189 239
3 145 200 416 1. Entry data ALP ke dalam 1 kolom. Pada
4 219 185 456 kolom berikutnya buat pengelompokan
5 197 180 473 Trimester 1, Trimester 2, Trimester 3 dengan
6 182 200 503 cara mengisi values pada variabel view !
7 165 199 417 2. Buat pengelompokan ALP Normal dengan
8 180 183 318 ALP tidak normal (jika patokan ALP normal
9 145 190 555 di bawah 150) dng menggunakan transform,
10 148 202 275 recode, into defferent variables !
11 142 200 563 3. Bagaimana gambaran ketiga kelompok
12 152 193 412 data ?, apakah ketiga data berdistribusi
13 145 198 432 normal ? (lakukan analyze, deskriptif stat,
14 176 195 270 explore)
15 195 189 299 4. Berapa persentasi ALP yang tidak normal
16 141 183 545 untuk setiap kelompok ? Buat grafik yg
17 172 195 362 cocok untuk persentasi ALP normal dengan
18 159 200 299 tdk normal (Gunakan analyze, Deskriptif
19 190 190 545 stat, crosstab, Kelompok trimester
20 170 200 362 masukkan ke row, kelompok ALP normal/tdk
masukkan
SFR 2017 ke kolom)
Dilakukan pemeriksaan GGT
terhadap pekerja lab kimia
Lama Lama
No GGT Kerja No GGT Kerja dilkelompokkan berdasarkan lama kerja

1 5 25 16 16.3 15 <=10 thn, 11-20 thn, > 20 thn

2 13 13 17 41.8 20 Nilai normal GGT < 30 IU

3 14 18 18 20.9 34 1. Entry data GGT ke dalam 1 kolom.


Pada kolom berikutnya buat
4 6 10 19 39.1 35 pengelompokan lama kerja <=10
5 43 25 20 6.1 34 thn, 11-20 thn, > 20 thn dengan cara
mengisi values pada variabel view !
6 17.1 18 21 355.7 30
2. Buat pengelompokan GGT Normal
7 14.8 30 22 22.4 34 dengan GGT tidak normal! (dng
menggunakan transform, recode,
8 23.9 30 23 55.5 23
into defferent variables !)
9 92 31 24 24.3 19 3. Bagaimana gambaran ketiga
10 66.5 25 25 12.5 2 kelompok data ?, apakah ketiga data
berdistribusi normal ? (lakukan
11 26.6 24 26 25.8 2 analyze, deskriptif stat, explore)
12 38.4 23 27 32.3 24 4. Kelompok mana yang memiliki
persentase terbanyak untuk GGT
13 30.4 23 28 35 23 tidak normal. Buat grafik yg cocok
14 76.4 24 29 17.1 10 untuk persentasi GGT normal
15 19.8 29 30 13.7 1 dengan tdk normal (Gunakan
analyze, Deskriptif stat, crosstab,
Kelompok lama kerja masukkan ke
SFR 2017 row, kelompok GGT normal/tdk
masukkan ke kolom)

Anda mungkin juga menyukai