Anda di halaman 1dari 67

1

STATISTIK
DESKRIPTIF
YENI MAHWATI
2 LEARNING OBJECTIVES:

• Memahami statistik deskriptif


• Menyajikan data dalam bentuk tabel dan grafik
• Menghitung ukuran pemusatan
• Menghitung ukuran penyebaran
• Menghitung rate dan rasio
3 STATISTIK DESKRIPTIF

• Pengorganisasian dan peringkasan hasil pengamatan yang dapat


memberikan gambaran umum dari sekelompok data.
• Dapat menggunakan beberapa bentuk yang berbeda, diantaranya
adalah tabel, grafik, ukuran pemusatan dan penyebaran.
4

TABEL
5 PRINSIP PEMBUATAN TABEL

• Judul tabel harus singkat, jelas dan lengkap hendaknya menjawab apa yang
disajikan, dimana kejadiannya dan kapan terjadi
• Nomor tabel
• Keterangan (catatan kaki = foot note) yaitu keterangan yang diperlukan
untuk menjelaskan hal-hal tertentu yang tidak bisa ditulisakan dalam badan
tabel.
• Sumber, bila mengutip tabel dari laporan orang lain maka harus
mencantumkan sumber dari mana tabel itu dikutip.
6 DISTRIBUSI FREKUENSI

• Pada data besar, ringkasan tabel dibuat dengan menyusun data ke


dalam kelompok kelas (atau kategori)
• Bentuk susunan tabel disebut distribusi frekuensi
7 CONTOH DISTRIBUSI FREKUENSI SATU ARAH

Tabel 3.2 Distribusi frekuensi jenis kelamin dan pendidikan 100 lansia

Karekteristik Jumlah lansia Persentase


(n)
Jenis kelamin Laki-laki 45 45,0
  Perempuan 55 55,0
Pendidikan Tidak sekolah 15 15,0
Rendah 73 73,0
Menengah/ 12 12,0
Tinggi
Total   100 100,0

Lima puluh persen lebih lansia adalah laki-laki, dan lebih dari 70 persen adalah lansia dengan
pendidikan rendah.
8 CONTOH DISTRIBUSI FREKUENSI

Tabel 3.3 Distribusi frekuensi kelompok umur 100 lansia

Kelompok umur Jumlah lansia Persentase


60 - 64 26 26,0
65 - 69 37 37,0
70 - 74 22 22,0
75 - 79 9 9,0
80 dan lebih 6 6,0

Total 100 100,0

Lebih dari sepertiga lansia berusia 65-69 tahun. Perhatikan bahwa jumlah persen harus 100
persen, meskipun ada angka desimalnya.
9 DISTRIBUSI FREKUENSI

 Penentuan Jumlah Kelas dan Interval Kelas


 Jika terlalu banyak interval, maka ringkasan data tidak akan jauh berbeda dengan data
mentahnya. Jika terlalu sedikit maka beberapa informasi penting dapat hilang.
 Aturan Sturgess
 M=1+3.3 log N (M=jumlah kelas, N=jumlah data)
 Interval Kelas=R/M (R=range)
 Cara lain
 Tentukan banyaknya interval kelas dan range
 Bagilah range dengan banyaknya interval kelas
 Tentukan batas bawah kelas pada interval kelas pertama dan tambahkan dengan interval kelas
sebagai batas atas kelas
10 TABEL DISTRIBUSI FREKUENSI DUA ARAH

• Dibentuk oleh tabulasi silang dua variabel, menunjukkan


hubungan antara variabel.
• Biasa disebut sebagai tabel kontingensi (crosstabs)
11 CONTOH TABEL DISTRIBUSI FREKUENSI DUA ARAH

Tabel 3.5 Tabulasi silang Indeks Massa Tubuh (IMT) dan jenis kelamin pada 100 lansia
dengan perhitungan persentase berdasarkan kolom
Indeks Massa Tubuh (IMT) Jenis Kelamin Jumlah
Laki-laki Perempuan

Kurang dari 18,50 (kurus) 11 (24,4%) 15 (27,3%) 26 (26,0%)


18,50 – 22,99 (normal) 20 (44,4%) 21 (38,2%) 41 (41,0%)
23,00 – 24,99 (overweight) 7 (15,6%) 6 (10,9%) 13 (13,0%)
25,00 dan lebih (obesitas) 7 (15,6%) 13 (23,6%) 20 (20,0%)
Total 45 55 100

Persentase obesitas lebih tinggi pada lansia perempuan dibandingkan lansia laki-
laki, tetapi perhitungan ini didasarkan pada ukuran sampel yang kecil.
12
Tabel 3.6 Karakteristik 100 lansia.

Karakteristik   Persentase (n=100)

Jenis kelamin Laki-laki 45,0


  Perempuan 55,0
Pendidikan Tidak sekolah 15,0
  Rendah 73,0
  Menengah/Tinggi 12,0
Usia 60-64 26,0
  65-69 37,0
  70-74 22,0
  75-79 9,0
  80 lebih 6,0
Indeks Massa Tubuh Kurus (<18,50) 26,0
Normal (18,50-22,99) 41,0
Overweight(23,00-24,99) 13,0
Obesitas (≥25,00) 20,0
13 DISTRIBUSI KUMULATIF

• Dikenal dengan distribusi frekuensi kumulatif dan poligon


kumulatif memberikan informasi tentang sekelompok data yang
tidak dapat digambarkan oleh distribusi frekuensi saja
14 CONTOH DISTRIBUSI KUMULATIF

Ta bel 1. Distribusi frekuensi kumula tif (kura ng da ri) umur ibu di Kecama ta n X, Ka bupa ten Y, 2015

Kelompok Frekuensi Persenta se Persenta se kumula tif kura ng da ri


Umur
15-19 5 5,0 0,0
20-24 14 14,0 5,0= 0,0+5,0
25-29 29 29,0 19,0= 5,0+ 14,0
30-34 31 31,0 48,0= 5,0+ 14,0+ 29,0
35-39 14 14,0 79,0= 5,0+ 14,0+ 29,0+ 31,0
40-44 6 6,0 93,0= 5,0+ 14,0+ 29,0+ 31,0+ 14,0
45-49 1 1,0 99,0= 5,0+ 14,0+ 29,0+ 31,0+ 14,0+ 6,0
100,0=5,0+ 14,0+29,0+31,0+14,0+ 6,0+ 1,0
Tota l 100 100,0
Sumber: La pora n survey Z, 2015
15 CONTOH DISTRIBUSI KUMULATIF

Ta bel 1. Distribusi frekuensi kumula tif (lebih da ri) umur ibu di Keca ma ta n X, Ka bupa ten Y, 2015

Kelompok Frekuensi Persenta se Persenta se kumula tif lebih da ri


Umur
100,0
15-19 5 5,0 95,0= 14,0+29,0+29,0+31,0+14,0+ 6,0+ 1,0
20-24 14 14,0 81,0= 29,0+31,0+14,0+6,0+ 1,0
25-29 29 29,0 52,0= 31,0+14,0+ 6,0+ 1,0
30-34 31 31,0 21,0= 14,0+6,0+ 1,0
35-39 14 14,0 7,0 = 6,0+ 1,0
40-44 6 6,0 1,0 = 1,0
45-49 1 1,0 0,0
Tota l 100 100,0
Sumber: La pora n survey Z, 2015
16

GRAFIK
17 PRINSIP PEMBUATAN GRAFIK

• Judul grafik harus singkat, jelas dan lengkap hendaknya menjawab apa yang disajikan, dimana
kejadiannya dan kapan terjadi
• Nomor grafik
• Memerlukan 2 sumbu sebagai ordinat dan absis
• Menggunakan skala tertentu
• Keterangan (catatan kaki = foot note) yaitu keterangan yang diperlukan untuk menjelaskan hal-hal
tertentu yang tidak bisa ditulisakan dalam badan tabel.
• Sumber, bila mengutip tabel dari laporan orang lain maka harus mencantumkan sumber dari mana
tabel itu dikutip.
18 GRAFIK GARIS

• Grafik Garis, yaitu grafik yang berbentuk garis untuk menggambarkan trends suatu nilai dari
waktu ke waktu.
19 GRAFIK BATANG

• Grafik Batang, yaitu sajian distribusi frekuensi yang digambarkan dalam bentuk bar (batang)
untuk membandingkan satu satu nilai atau lebih dari beberapa kategori
20 GRAFIK BATANG

Gambar 3.2 Diagram batang menunjukkan proporsi masing-masing


kelompok umur dengan diabetes
21

Tabel 3.8 Hubungan antara IMT dengan umur

Kelompok Umur
Kategori IMT
60-64 65-69 70-74 75-79 ≥ 80
Kurus (<18,50) 6(23,1%) 11 (29,7%) 6 (27,3%) 1 (11,1%) 2 (33,3%)
Normal (18,50-22,99) 12(46,2%) 12 (32,4%) 12 (54,5%) 4 (44,4%) 1 (16,7%)
Overweight(23,00-24,99) 5 (19,2%) 5 (13,5%) 1 (4,5%) 0 (0,0%) 2 (33,3%)
Obesitas (≥25,00) 3 (11,5%) 9 (24,3%) 3 (13,6%) 4 (44,4%) 1 (16,7%)
Total 26 37 22 9 6
22 GAMBAR 3.3 DISTRIBUSI IMT BERDASARKAN KELOMPOK UMUR
LANSIA

Berdasarkan jumlah Berdasarkan persentase


23 GRAFIK BATANG DUA KATEGORI

Gambar 2. Distribusi frekuensi tingkat pendidikan ibu dan suami ibu di Kabupaten
Cirebon, 2004

70 Persentase

60
50
40
30
20
10
0 Tamat SD Tamat SLTP Tamat SLTA

Ibu Suami Ibu


Sumber:Laporan survei SNL, 2004
n=450
24 GRAFIK LINGKARAN (PIE)

• Pie (Lingkaran), yaitu grafik berbentuk lingkaran yang terbagi ke dalam beberapa bagian untuk
membandingkan suatu nilai (proporsi) dari beberapa kategori.

Gambar 3.4 Diagram Lingkaran Tingkat Pendidikan Lansia


25 HISTOGRAM

• Digunakan untuk menggambarkan data numerik yang telah


dikelompokkan ke dalam frekuensi, frekuensi relatif, atau distribusi
persentase
• Variabel yang akan dipresentasikan digambarkan pada sumbu axis (X)
• Sumbu vertikal (Y) menggambarkan jumlah, proporsi, atau persentasi
dari pengamatan per kelas interval
26 HISTOGRAM

Gambar 3.5 Histogram Tekanan Darah Sistolik 100 Lansia


27 POLIGON

Jumlah

14.9 19.9 24.5 29.5 34.5 39.5 44.5 49.5

Umur (tahun)
28 OGIVE

 Ogive (Persentase kumulatif)


Persentase Kumulatif

100

80

60
Laki-laki

50 Perempuan

40

20

14.5 19.5 24.5 31 32 29.5 35 34.5 39.5 44.5 49.5


Umur (tahun)
29 SCATTER PLOT

Scatter Diagram, yaitu grafik yang berupa kumpulan titik-titik yang berserak yang
menyajikan sepasang pengamatan (data) dari suatu hal/keadaan (yang diletakkan pada
sumbu horisontal dan sumbu vertikal) untuk memperlihatkan ada/tidaknya hubungan antara
keduanya
30 STEM AND LEAF
Steam and leaf memisahkan data menurut digit (steam) dan leaf

Umur Ibu (tahun) Stem-and-Leaf Plot


Frequency Stem & Leaf
4.00 1 . 5555
15.00 1 . 666667777777777
24.00 1 . 888888889999999999999999
36.00 2 . 000000000000000000011111111111111111
26.00 2 . 22222222222223333333333333
28.00 2 . 4444444444444555555555555555
11.00 2 . 66666666777
16.00 2 . 8888888889999999
13.00 3 . 0000000111111
6.00 3 . 222222
1.00 3 . 5
5.00 3 . 66677
4.00 Extremes (>=38)
Stem width: 10
Each leaf: 1 case(s)
31 BOX AND WHISKER PLOTS

• A box and whisker chart does not make any


assumptions about the underlying statistical
distribution, and represents variations in samples
of a population; therefore, it is appropriate for
representing nonparametric data.
• A box and whisker chart consists of boxes that
represent interquartile range (one to three), the
median and the mean of the data, and whiskers
presented as lines outside of the boxes.
32 BOX AND WHISKER PLOTS

• Whiskers can be used to present the largest and smallest


values in a set of data or only a part of the data (i.e. 95%
of all the data).
• Data that are excluded from the data set are presented as
individual points and are called outliers.
• The spacing at both ends of the box indicates dispersion
in the data.
• The relative location of the median demonstrated within
the box indicates skewness
33 PICTOGRAM

• Pictogram, yaitu grafik


yang berupa gambar
bentuk-bentuk nyata
seperti gambar orang,
gambar tempat tidur, dan
lain-lain.
34 GRAFIK PETA

• Peta, yaitu grafik yang


diwujudkan dalam bentuk peta
suatu daerah di mana bagian-
bagiannya menunjukkan distribusi
frekuensi. Peta ini terutama
digunakan untuk menunjukkan
distribusi sesuatu dikaitkan dengan
geografi
35

FLOWCHART TABEL DAN GRAFIK


36

Junyong In and Sangseok Lee, 2017


37

UKURAN STATISTIK
(PEMUSATAN DAN PENYEBARAN)
38 DESCRIPTIVE STATISTICS

• “Data reduction:” Summarize data in compact form


• Minimum
• Maximum
• Mean
• Standard deviation
• Range
• Etc…
39 MEASURES OF CENTRAL TENDENCY

• Central tendency is a property of the data that they tend to be clustered about a center
point.
• Mean
• The average, equal to the sum of the observations divided by the number of observations
(Σ(x)/N)
• Median
• The value that divides the frequency distribution in half
• Mode
• The value that occurs most often
• There can be more than one—”multimodal” data.
40

Median = 204.08
Mode = about
200.00
41 WHICH TO USE?

• The mode is appropriate at any level of measurement.


• The median is appropriate with ordinal, interval, or ratio data.
• The mean is appropriate when data are measured at the interval or ratio
level.
• The relationship between measures depends on the frequency distribution.
• When data are normally distributed, all values will be equal.
42 COMMONLY USED SYMBOLS
43 ARITHMETIC MEAN

• Themean or arithmetic mean is the "average" which is


obtained by adding all the values in a sample or population
and dividing them by the number of values.
44 GENERAL FORMULA--POPULATION MEAN 
45 GENERAL FORMULA--SAMPLE MEAN               
46 PROPERTIES OF THE MEAN

1.    Uniqueness -- For a given set of data there is one and


only one mean.
2.    Simplicity -- The mean is easy to calculate.
3.    Affected by extreme values -- The mean is influenced by
each value. Therefore, extreme values can distort the mean.
47 MEDIAN

• Themedian is the value that divides the set of data into two
equal parts.  It is the midpoint of the data set.
•The number of values equal to or greater than the median equals
the number of values less than or equal to the median.  
48 FINDING THE MEDIAN

1.  Arrange (sort) the data in order of increasing value in a sorted list.
2.  Find the median.  
    a.  Odd number of values (n is odd)
49 FINDING THE MEDIAN

b.  Even number of values


(n is even)
     median = average of the two
values in the middle
50 PROPERTIES OF THE MEDIAN

1.    Uniqueness -- There is only one median for each set of data.
2.    Simplicity -- It is easy to calculate.
3.    Effect of extreme values -- The median is not as drastically
affected by extreme values as is the mean.
51
52 MODE

• The mode is the value that occurs most often in a set of


data. 
• It is possible to have more than one mode or no mode.
53 VARIABILITY OF DATA

• Dispersion is a property of the data that they tend to be


spread out.
• Dispersion refers to the variety exhibited by the values
of the data.  The amount may be small when the values
are close together.
54
UKURAN VARIASI DATA

A B

70 thn 60 thn 50 thn 70 thn 65 thn 45 thn

Mean: 50 thn Mean: 50 thn


SD : 15.81 SD : 16.95 thn

40 thn 30 thn 40 thn 30 thn


55
UKURAN VARIASI DATA

Mean sama tetapi Mean berbeda tetapi


variasinya berbeda variasinya sama

85 850
56 MEASURES OF VARIABILITY

• Range (largest score – smallest score)


• Variance (S2=Σ(x-M)2/N)
• Standard deviation
• Square root of the variance, so it’s in the same units as the mean
• In a normal distribution, 68.26% of scores fall within +/- 1 sd of
the mean; 95.44% fall within +/- 2 sd of the mean.
• Coefficient of variation = the standard deviation divided by the
sample mean
57 RANGE

• The range is the difference between the largest and smallest


values in the set of observations. 
• These values are often called the maximum and the minimum.
58 VARIANCE

• Variance is used to measure the dispersion of values relative to the


mean. 
• When values are close to their mean (narrow range) the dispersion
is less than when there is scattering over a wide range.
59 CALCULATION OF THE SAMPLE VARIANCE

                 


  

= sample variance
= individual value
= sample mean
n = number of values
60 VARIANCE OF A POPULATION

              

    = population variance


N = population size
    = population mean
61 DEGREES OF FREEDOM

• In computing the variance there are


n - 1 degrees of freedom because if 
n -1  values are known, the nth one is
determined automatically. 
• This is because all of the values of
( - ) must add to zero.
62 DIFFERENCES IN CALCULATIONS

Values of and are different because  divides by  n-1


whereas   divides by N.
63 SAMPLE STANDARD DEVIATION

The standard deviation is the square root of the variance.  The standard
deviation expresses the dispersion in terms of the original units.  Since the
variance of a sample is , we take the square root.
64 POPULATION STANDARD DEVIATION

For a population, the standard deviation is  which is the square


root of the population variance.
65
66 COEFFICIENT OF VARIATION

Coefficient of variation is a measure of the relative amount of


variation as opposed to the absolute variation.

C.V. is independent of the units of measure. It can be useful for


comparing different results from people investigating the same
variable.
67

MEAN, MEDIAN, AND MODE

Anda mungkin juga menyukai