Anda di halaman 1dari 36

Statistika Sosial

Pertemuan 02
Koding dan tabulasi data
Tujuan Pertemuan 02

Setelah mempelajari bagian ini, peserta


mata kuliah mampu :
•Menjelaskan Perbedaan Data Kategorik dan
Numerical
•Menjelaskan cara melakukan pengkodean data
•Melakukan Tabulasi data
•Membuat Grafik Data
Tipe-tipe Data
Data

Categorical Numerical

Contoh:


Status perkawinan (SK, BK)
Jenis Kelamin (LK, PR)
Discrete Continuous
 Tingkat Pendidikan (SD, SMP,SMA,
DIV, S1, S2 & S3) Contoh: Contoh:
 Status Merokok (M, TM)
 Banyaknya anak (1, 2, 3 dst)  Berat Badan (45,50 Kg, 67 Kg, 89
 Banyaknya rusak per jam (1, Kg)
2, 3 dst)  Hasil panen (1 Ton, 29 KG)
 Konsumsi BBM perliter (10 lt, 20
lt)
Tingkat Pengukuran
Berbeda antar setiap
pengukuran, memiliki Ratio Data
nilai nol mutlak
Quantitative Data

Berbeda antar setiap


pengukuran, tidak Interval Data
memiliki nilai nol
mutlak

Kategorik terurut
(ranking, urutan, or Ordinal Data
skaling)
Qualitative Data

Kategorik (Tidak ada


urutan ) Nominal Data
Skala nominal
• Adalah skala yang semata-mata hanya untuk
memberikan indeks, atau nama saja dan tidak
mempunyai makna yang lain
• Misal anda memberi angka untuk Jenis Pekerjaan
1 = Petani
2 = Pedagang
3 = PNS
Tidak berarti bahwa Petani lebih rendah dari
Pedagang dan PNS, begitu juga sebaliknya. Anda
dapat mengganti angka ketiganya sesuka hati anda
tanpa mempengaruhi arti statistikanya.
Skala ordinal
• Adalah skala ranking, di mana kode yang
diberikan memberikan urutan tertentu
pada data, tetapi tidak menunjukkan selisih
yang sama dan tidak ada nol mutlak
• Misal tingkat kecantikan ranking 1,2,3,4.
• Jelas bahwa ranking 1 lebih cantik dari
ranking 2,3, dan 4. Akan tetapi, tidak
berarti bahwa ranking 1 mempunyai
kecantikan 4 kali dibanding ranking 4,
dst…
Skala interval
• Skala pengukuran yang mempunyai selisih sama
antara satu pengukuran dengan pengukuran
yang lain, tetapi tidak memiliki nilai nol mutlak
• Nilai A setara dengan 4, B dengan 3, C dengan 2
dan D dengan 1. Selisih A dan B sama dengan
selisih B dan C dan juga sama persis dengan
selisih nilai C dan D. Akan tetapi, tidak boleh
dikatakan bahwa A empat kali lebih pintar
dibandingkan D, atau A dua kali lebih pintas
dari pada B. Meskipun selisihnya sama, tetapi
tidak mempunyai nilai nol mutlak.
• Sebagai contoh, suhu, dalam derajat Fahrenheit
atau Celcius, merupakan skala interval. Kita dapat
mengatakan bahwa suhu 50 > 40 derajat,
demikian juga suhu 30 > 20 derajat. Perbedaan
selisih suhu antara 40 dan 50 derajat = perbedaan
suhu antara 20 dan 30 derajat, yaitu 10 derajat.
Perbedaan antara kedua nilai pada skala interval
sudah punya makna yang berarti, berbeda dengan
perbedaan pada skala ordinal yang maknanya
tidak berarti. Misalnya, perbedaan antara suhu 40
dan 50 derajat dua kali lebih besar dibandingkan
dengan perbedaan antara suhu 30 dan 35.
Skala rasio

• Adalah skala pengukuran yang paling


tinggi di mana selisih tiap pengukuran
adalah sama dan mempunyai nilai nol
mutlak
• BB 100 benar-benar 2x BB 50. BB Ayah
anda 60 kg, berat badan anda 40 kg.
Berarti BB ayah anda adalah 1,5 x BB anda.
Skala rasio
• Memang agak sedikit susah membedakan skala
interval dengan rasio. Kuncinya adalah di angka 0,
apakah nilai nol tersebut mutlak atau tidak?
• Suhu bisa berupa skala interval tapi bisa juga skala
rasio, tergantung pada skala pengukuran yang
digunakan. Apabila kita menggunakan skala Celcius
atau Fahrenheit, termasuk skala interval,
• Apabila Kelvin yang digunakan, suhu termasuk skala
rasio. Mengapa? Karena suhu 0 derajat Kelvin adalah
mutlak! Kita tidak saja dapat mengatakan bahwa
suhu 200 derajat lebih tinggi daripada suhu 100
derajat, tetapi benar dua kali lebih tinggi.
Grafik Berdasarkan Variabel Data

• Grafik data berdasarkan variabel Data

Variabel Variabel
Kategorik Numerik

• Distribusi Frequensi • Line chart


• Bar chart • Histogram
• Pie chart • Diagram Batang dan
• Diagram Pareto Daun
• Scatter plot
Tabel Distribusi Frekuensi
Ringkasan data per kategori
Contoh: Banyaknya Pasien Per Unit

Unit RS # Pasien

Cardiac Care 1,052


Emergency 2,245
Intensive Care 340
Maternity 552
Surgery 4,630
(Variabel : Kategorik)
Number of
patients per year

0
1000
2000
3000
4000
5000
Cardiac
Care
Contoh Bar Chart

Emergency

Intensive
Care

Maternity
Hospital Patients by Unit

Surgery
Pie Chart Example

Hospital Number % of
Unit of Patients Total
Hospital Patients by Unit
Cardiac Care 1,052 11.93
Emergency 2,245 25.46 Cardiac Care
Intensive Care 340 3.86 12%
Maternity 552 6.26
Surgery 4,630 52.50

Emergency
Surgery 25%
53%

Intensive Care
(Percentase dibulaskan ke 4%
angka terdekat Maternity
6%
Diagram Pareto
Contoh: 400 barang cacat berdasar faktornya:

Source of
Manufacturing Error Number of defects
Bad Weld 34
Poor Alignment 223
Missing Part 25
Paint Flaw 78
Electrical Short 19
Cracked case 21
Total 400
Diagram Pareto
Step 1: Urutkan berdasar sebab kerusakan
Step 2: Hitunglan prosentasenya
Source of
Manufacturing Error Number of defects % of Total Defects
Poor Alignment 223 55.75
Paint Flaw 78 19.50
Bad Weld 34 8.50
Missing Part 25 6.25
Cracked case 21 5.25
Electrical Short 19 4.75
Total 400 100%
Diagram Pareto grafik
Step 3: Presentasi
Pareto Diagram: Cause of Manufacturing Defect
60% 100%
% of defects in each category

90%

cumulative % (line graph)


50%
80%

70%
(bar graph)

40%

60%

30% 50%

40%

20%
30%

20%
10%

10%

0% 0%
Poor Alignment Paint Flaw Bad Weld Missing Part Cracked case Electrical Short
Grafik data Time-Series
• Plot data time series dibuat dalam grafik garis
digunakan untuk menyajikan nilai-nilai dari
suatu variabel sepanjang waktu tertentu
• Waktu diukur pada sumbu mendatar
• Variabel data diukur pada sumbu vertikal
2006
2005
2004
2003
2002
2001
2000
Aids Victim by Year

1999
Contoh Plot Data TS

1998
1997
1996
1995
1994
1993
1992
1991
1990

0
350

300

250

200

150

100

50
Thousands of Victim
Distribusi Frequensi

Apa Distribusi Frequensi itu ?


• Distribusi frequensi adalah sebuah daftar atau
table …
• Berisi kelas-kelas atau kategori-kategori …
• Dan frekuensi data yang bersesuaian…
Interval Kelas dan Batasnya

• Masing-masing kelas mempunyai lebar yang


sama dengan formula
largest number  smallest number
w  interval width 
number of desired intervals

 Gunakan mininal 5 kelas, tapi tidak lebih 15-20


interval
 Interval kelas tidak overlap
 Bulatkan ke atas lebar interval
Contoh Distribusi Frequensi
Suatu perusahaan insulasi secara random
memilih 20 hari di musim winter dan
Mengukur temperaturnya

24, 35, 17, 21, 24, 37, 26, 46, 58, 30,
32, 13, 12, 38, 41, 43, 44, 27, 53, 27

Urutkan datanya :
12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37,
38, 41, 43, 44, 46, 53, 58
Frequency Distribution
Example

• Hitung range: 58 - 12 = 46
• Pilih banyaknya kelas: 5
• Hitung lebar interval : 10 (46/5 dibulat ke atas )
• Tentukan batas interval: 10 but less than 20, 20
but less than 30, . . . , 60 but less than 70
• Hitung observasi dan masukkan ke kelas
yang sesuai
Distribusi Frequensi

Relative
Interval Frequency Percentage
Frequency

10 but less than 20 3 .15 15


20 but less than 30 6 .30 30
30 but less than 40 5 .25 25

40 but less than 50 4 .20 20


50 but less than 60 2 .10 10

Total 20 1.00 100


Histogram

• Grafik dari data dalam suatu distribusi


frequensi disebut dengan histogram
• Nilai-nilai Interval ditunjukkan pada sumbu
horisontal
• Sumbu vertikal berisi frequensi, atau
frequensi relatif, atau persentase
• Batang tegak menunjukkan banyaknya
observasi atau frekuensi masing-masing kelas
Contoh Histogram

Histogram: Daily High Temperature


7 6
6 5
Frequency

5 4
4 3
3 2
2
1 0 0
0
0 10 20 30 40 50 60
Temperature in Degrees
Bentuk Distribusi

• Bentuk distribusi dikatakan simetrik jika


observasi seimbang, atau terdistribusi di
tengah.
Symmetric Distribution

10
9
8
7
Frequency

6
5
4
3
2
1
0
1 2 3 4 5 6 7 8 9
Bentuk Distribusi
• Bentuk distribusi dikatakan skewed
(menceng) jika observasi tidak symmetric.
Positively Skewed Distribution

Suatu distribusi dikatakan 12

menceng ke kanan jika


10

Frequency
ekornya melebar ke kanan. 6

0
1 2 3 4 5 6 7 8 9

Negatively Skewed Distribution


Suatu distribusi dikatakan 12
menceng ke kiri jika ekornya 10

melebar ke kiri 8
Frequency

0
1 2 3 4 5 6 7 8 9
Diagram Batang dan Daun

• Cara yang mudah untuk melihat distribusi


data set

METHOD: Pisahkan data terurut ke


angka utama (batang) dan
angka tambahan (daun)
Contoh

Data terurut :
21, 24, 24, 26, 27, 27, 30, 32, 38, 41

• Di sini, gunakan puluhan sebagai batangnya:


Batang Daun
 21 ditunjukkan 2 1
 38 ditunjukkan 3 8
Contoh

Data terurut:
21, 24, 24, 26, 27, 27, 30, 32, 38, 41

• Diagram batang dan daun lengkap :

Stem Leaves
2 1 4 4 6 7 7
3 0 2 8
4 1
Contoh lain

• Gunakan ratusan sebagai batang :


▫ Diagram batang dan daun lengkap :

batang daun
Data:
6 136

613, 632, 658, 717, 7 2258


722, 750, 776, 827, 8 346699
841, 859, 863, 891, 9 13368
894, 906, 928, 933,
955, 982, 1034, 10 356
1047,1056, 1140, 11 47
1169, 1224 12 2
Diagram Scatter Plot

• Diagram Scatter Plot digunakan


untuk observasi berpasangan dari
dua variabel numerik

• Diagram Scatter :
▫ Satu variabel diukur untuk sumbu
vertikal dan lainnya digunakan untuk
sumbu horisontal
Contoh Diagram Scatter

B. Age vs. Blood Pressure


Umur Pressure
23 125 250
26 140
200
29 146
33 160 150
B. Pressure

38 167 100
42 170
50
50 188
0
55 195
0 10 20 30 40 50 60 70
60 200
Age
Tabulasi Silang

• Tabulasi Silang digunakan untuk menampilkan


data observasi dua atau lebih variabel
kategorik.
• Kombinasi kategori dari Var I dan II,
dinamakan dengan sel.
• Jika ada r kategiri untuk variabel I (baris), dan
c kategori untuk variabel II (kolom), tabelnya
disebut dengan tabel silang r x c. Ada r x c sel
data.
Contoh Tabel Silang

• Tabulasi silang 4 x 3 untuk Biaya RS untuk 4 kategori


dari 3 RS berbeda (Dalam 100 ribuan )

Kategori Hospital A Hospital B Hospital C

A 46.5 55 57.5
B 32.0 34 39.0
C 15.5 20 13.5
D 16.0 15 7.0

Anda mungkin juga menyukai