Anda di halaman 1dari 22

ANALISIS DATA KATEGORIK

Pertemuan I
Data, variabel random dan distribusi
PENGAMATAN
— Mengapa? =>latarbelakang masalah
— Objek ? =>Populasi-sampel, Sensus-Survey
— Kapan?
— Apanya? =>variabel, atribut
— Caranya? => alat ukur
— Managemen data, analisis
Data
Data
— Data merupakan “keterangan “ berhasil
dicatat/direkam yang berkaitan dengan
atribut objek pengamatan. Data tersebut
dapat berupa atau dinyatakan dalam bilangan
atau bukan bilangan.
— Data berupa bilangan disebut data
kuantitatif sedangkan data bukan bilangan
disebut data kualitatif.
Data
— macam data
kualitatif ànominal
kuantitatif
diskrit à ordinal
kontinu à interval dan rasio
— Data kontinu : data yang diperoleh dari hasil pengukuran
— Data kualitatif : data yang berbentuk kalimat, kata, gambar
— Data kuantitatif : data yang berbentuk angka atau data kualitatif
yang diangkakan (skoring)
— Data diskrit : data yang diperoleh dari hasil menghitung atau
membilang bukan mengukur
— Data Kategorik?
— Variabel Independen (Bebas, eksplanatory) vs Variabel Dependen
(Tidak Bebas, Response)
— Random vs Fixed
VARIABEL RANDOM
Adalah fungsi berharga nyata yang ditentukan outcome-outcome suatu
eksperimen
* dapat merubah outcome bukan angka menjadi outcome angka

Contoh : jika sebuah mata uang dilempar dua kali


S = {MM, MB, BM, BB}
X = banyaknya M
o
S X R

MM
0
MB
1 range
BM
2
BB
BEBERAPA VARIABEL RANDOM TERKENAL ATAU YANG BANYAK
DIGUNAKAN DALAM STATISTIKA

DISKRIT UNIFORM DISKRIT


BINOMIAL
MULTINOMIAL
GEOMERIK
VARIABEL HIPERGEOMETRIK
POISSON
RANDOM BINOMIAL NEGATIP

KONTINU NORMAL
UNIFORM KONTINU
BETA
GAMMA
EXPONENTIAL
WEIBULL
LOGISTIK
CAUCHY
DOUBLE EXPONENTIAL
DISTRIBUSI BINOMIAL

Suatu eksperimen binomial adalah eksperimen yang memenuhi


beberapa hal berikut :

* merupakan gabungan dari n trial (= eksperimen kecil) yang saling


independen
* setiap trial hanya mempunyai dua outcome, yang biasa disebut
sukses (=S) dan gagal (=G)
* dalam setiap trial, P(S) = p dan P(G) = q = 1 - p
* yang menjadi perhatian adalah banyaknya sukses dalam n trial
X = banyaknya S dalam n trial
harga X yang mungkin : 0,1,2,…,n

ænö
f ( x) = P( X = x) = çç ÷÷ p x (1 - p ) n - x , x = 0,1,..., n
è xø
* X adalah Variabel random Binomial

* X dengan fungsi probabilitas


ænö x n!
f ( x) = çç ÷÷ p (1 - p ) =
n- x
p x (1 - p ) n - x
è xø (n - x) ! x !
dikatakan
X berdistribusi binomial
atau
X ~ Bin (n , π )

berdistribusi
parameter distribusi binomial

* mean = µ x = np
* var iansi = s x2 = np (1 - p )
* deviasi s tan dar = s x = np (1 - p )
Contoh : jika diamati 15 orang mahasiswa mengikuti ujian, berapakah
probabilitas mendapat 9 orang dengan nilai A ? Berapakah rata jumlah
mhs yang mendapat nilai A ?
Objek : MHS. Sebanyak 15 orang. Yang diamati : Mendapat A (Sukses)
dan selain A (Gagal).
Dapat dijawab jika ada asumsi peluang masing-masing mhs mendapatkan
nilai A besarnya sama, yaitu p. Misal p= 1/5
X = banyaknya yang mendapat nilai A
X adalah variabel random Binomial dengan n = 15 dan p = 1/5
9 15 -9
æ15 ö æ 1 ö æ4ö
f (9) = P( X = 9) = çç ÷÷ ç ÷ ç ÷ Rata-rata jumlah mhs
è 9 ø è5ø è5ø
mendapat nilai A
9 6
15! æ 1 ö æ 4 ö µ = np
= ç ÷ ç ÷
9! 6! è 5 ø è 5 ø
1
= P( X £ 9 ) - P( X £ 8) = 15 .
5
= ...
Distribusi Multinomial
— Kejadian binomial hanya terdapat dua kemuangkinan hasil (sukses
atau gagal). Jika terdapat lebih dari dua kemungkinan hasil maka
termasuk kejadian multinomial. Ciri-ciri selengkapnya
— Percobaan terdiri atas n ulangan
— ulangan-ulangan itu bersifat bebas satu sama lain
— dalam setiap ulangan hasilnya dapat digolongkan kedalam beberapa
sifat (misal k sifat).
— peluang berhasil untuk sifaf ke-i dilambangkan pi dan untuk setiap
ulangan adalah sama (tidak berubah-ubah)
Distribusi Multinomial
— Sebaran peluang multinom dapat nyatakan ke dalam rumus:
ìæ n ö x1 k k

ïç ÷p 1 ,..., p k ; dengan å x i = n dan å π ι = 1


xk

f ( x1 ,..., xk ; p 1 ,..., p k ; n) = íçè x1 ,..., xk ÷ø i =1 ι =1


ï0 untuk x yang lainnya
î
— denganE(Xi) = πi dan Var(Xi) = nπi(1- πi)
Distribusi Poisson
— Percobaan Poisson memiliki ciri-ciri sebagai berikut
— banyaknya hasil percobaan yang terjadi dalam selang waktu atau
suatu daerah tertentu, tidak tergantung pada banyaknya hasil
percobaan yang terjadi pada selang waktu atau daerah lain yang
terpisah
— peluang terjadinya suatu hasil percobaan selama suatu selang waktu
yang singkat sekali atau dalam suatu daerah yang kecil, sebanding
dengan panjang selang waktu atau besarnya daerah tersebut, dan
tidak tergantung pada banyaknya hasil percobaan yang terjadi
diluar selang waktu atau daerah tersebut.
— peluang bahwa lebih dari satu hasil percobaan akan terjadi dalam
selang waktu yang singkat tersebut atau dalam daerah yang kecil
tersebut, dapat diabaikan.
Distribusi Poisson
— Sebaran poisson dapat dituliskan ke dalam rumus
ì e - l lx
ï ; x = 0, 1, ....
P( x) = í x!
ï0 untuk x yang lainnya
î
— e = 2,71828 dan l adalah rata-rata banyaknya hasil
percobaan yanga terjadi selama selang waktu atau dalam
daerah yang dinyatakan.
— E(X) = l dan Var(X) =l
DISTRIBUSI NORMAL
2
1 æ x -µ ö
1 - ç
2è s ø
÷
X ~ f (x) = e , -¥ < x < ¥ ,
2ps2 -¥ < µ < ¥ , s>0

X ~ N(µ,s2)
dibaca
X berdistribusi normal dengan mean = µ dan variansi = s2

µ X
menghitung P(a < X < b) = ?
2
b 1 æ x -µ ö
1 ç ÷

ò
P (a < X < b) = 2è s ø
e dx
a 2ps 2
sukar diselesaikan !!!
* gunakan tabel
* tapi yang ada tabel distribusi normal standar
* distribusi normal standar adalah distribusi normal dengan
µ = 0 dan s = 1
* transformasi

X - µx
z=
sx

membawa distribusi normal

ke distribusi normal standar


A = P(0 < Z < zo)

0 zo Z
zo 0 1 2 … 7 8 9
0,0 0,0000 0,0040 0,0080 0,0279 0,0319 0,0359
0,1 0,0398 0,0348 0,0478 0,0675 0,0714 0,0754
0,2 0,0793 0,0832 0,0871 0,1064 0,1103 0,1141
.
.
.
1,0 0,3413 0,3438 0,3461 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3980 0,3997 0,4015
.
.
.
2,5 0,4938 0,4940 0,4941 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4972 0,4973 0,4974
Pendekatan dengan distribusi Normal

(b)
(a)

(c) (d)
Gambar 2.2. Distribusi Binomial pada p=0.2 dan beberapa ukuran n (a) n=10 (b) n=30 (c) n=100 (d)
n=100
Pendekatan dengan distribusi Normal
Contoh
1. Hitung peluang diperoleh 5 sukses dari 10 pengamatan, jika diketahui
peluang sukses setiap pengamatan sebesar 0,7
2. Hitung peluang diperoleh sukses pertama pada pengamatan ke- 10,
jika diketahui peluang sukses setiap pengamatan sebesar 0,7
3. Hitung peluang diperoleh sukses ke-5 pada pengamatan ke- 10, jika
diketahui peluang sukses setiap pengamatan sebesar 0,7
4. Hitung peluang terdapat 6 mahasiswa terlambat, jika diketahui rata-
rata jumlah mahasiswa yang terlambat setiap pertemuan sebesar 3
5. Direstoran terdapat 4 menu (A, B, C, D), peluang masing-masing
menu dipilih pelanggan sebesar pA=0,3; pB=0,2; pC=0,1; pD=0,4.
Dari 15 pelanggan, hitung peluang terdapat 3 org memilih A, 4 org
memilih B, 6 org memilih C, 2 org memilih D.
6. Hitung peluang diperoleh 5 sukses dari 100 pengamatan, jika
diketahui peluang sukses setiap pengamatan sebesar 0,01
Menghitung Peluang pada
Distribusi Normal

P(a<X<b) = Luas Arsir P(a<X) = P(X>a) = Luas Arsir

Jika berdistribusi Normal Standar;


P(a<Z) = P(Z>a) = Luas Arsir
P(a<Z<b) = Luas Arsir
Distribusi Chi-Square

P(a<X<b) = Luas Arsir

Anda mungkin juga menyukai