[Materi Statistika]
• Minggu 13 Review
1
1 Statistika Deskriptif
[Definisi] Statistika adalah ilmu yang digunakan untuk mengumpulkan,
mengorganisasi, melakukan inferensi dan menafsirkan data. Secara luas,
statistika adalah ilmu yang mempelajari dan menginterpretasikan data agar
mempunyai makna.
Lalu, bagaimana dengan Statistik?
[Statistika Deskriptif]
Statistika deskriptif membahas cara atau metode mengumpulkan, menyeder-
hanakan dan menyajikan data sehingga bisa memberikan informasi. Kesim-
pulan yang diberikan dalam statistika deskriptif bersifat subyektif. Meskipun
demikian, kesimpulan yang salah akan terlihat.
Bagaimana dengan Statistika Inferesia?
Data
Data adalah hasil observasi tunggal (datum) yang didapat baik secara lang-
sung ataupun tidak langsung. Dalam praktiknya, data yang kita kumpulkan
dapat dikelompokkan menjadi data kategorik atau data numerik. Berdasarkan
skala pengukuran data dapat dibedakan menjadi:
Penyajian Data
[Parameter] Suatu nilai yang digunakan untuk mendeskripsikan/menggam-
barkan sifat POPULASI. Misalkan: mean (µ); simpangan baku (σ)
2
[Statistik] Suatu nilai yang digunakan untuk mendeskripsikan/menggam-
barkan sifat SAMPEL. Misalkan: mean (X); simpangan baku (s).
[Median] Median atau nilai tengah dilakukan pada data yang sudah
diurutkan. Median didefinisikan sebagai data (observasi) ke- n+1
2
R = ymax − ymin
3
(b) Variansi Sampel:
4
Box-Whisker Plot
Grafik data yang terdiri lima informasi ringkasan data:
Minimum – Q1 – Median – Q3 – Maximum
[Latihan]
Perusahaan A: 9.3; 8.8; 6.8; 8.7; 8.5; 6.7; 8.0; 6.5; 9.2; 7.0
Perusahaan B: 11.0; 9.8; 9.9; 10.2; 10.1; 9.7; 11.0; 11.1; 10.2; 9.6
5
2. Berikut ini merupakan diagram Batang-Daun data waktu pengeringan
(dalam menit) kain pada sebuah perusahaan kain latex.
Batang Daun
0 234
1 0223
1 66779
2 01344
2 5689
3 13
3 8999
4
4
5 789
6
2 Peluang dan Aturan Bayes
Statistics may be defined as ’a body of methods for making wise decisions in
the face of uncertainty’ - Wallis
Terdapat dua kategori kejadian atau event yaitu kejadian deterministik dan
stokastik. Kejadian stokastik berkaitan erat dengan peluang, sehingga kejadi-
an stokastik sering disebut sebagai kejadian probabilistik. Berikut beberapa
definisi yang berkaitan dengan peluang,
1. Ruang Sampel: himpunan kejadian semua hasil yang mungkin dari su-
atu percobaan. Ruang sampel terdiri dari ruang sampel diskrit (pelem-
paran dadu, jumlah anak) dan kontinu (curah hujan (mm), berat badan
(kg))
2. Kejadian: himpunan bagian dari ruang sampel. Tipe kejadian,
• Gabungan dua peristiwa A dan B ditulis A ∪ B adalah himpunan
semua kejadian yang ada didalam A atau B termasuk didalam
keduanya.
• Irisan dua peristiwa A dan B ditulis A∩B adalah himpunan semua
kejadian yang ada didalam A dan B.
• Komplemen kejadian A ditulis Ac adalah himpunan semua keja-
dian yang tidak didalam A
3. Dua kejadian dikatakan saling bebas (independent) jika terjadinya ke-
jadian yang satu tidak mempengaruhi terjadinya kejadian yang lain.
Contoh: ...
4. Dua kejadian dikatakan saling lepas jika kedua kejadian tersebut tidak
dapat terjadi secara bersamaan. Contoh: ...
[Ilustrasi]
1. Seorang mahasiswa ingin menyusun 6 komik dan 3 novel dalam satu
rak berjajar. Setiap jenis buku harus berdekatan. Berapa banyak cara
mahasiswa tersebut menyusun buku ...
2. Ani melempar koin dua kali, peluang mendapat ’Angka’ (A) pada lem-
paran pertama lalu mendapat ’Gambar’ (G) pada lemparan kedua
adalah ...
3. Ketika memilih bola secara acak dari keranjang yang berisi 3 bola biru,
2 bola hijau, dan 5 bola merah, peluang mendapat bola biru atau merah
adalah ...
7
[Peluang] Misalkan S adalah ruang sampel, dengan A adalah kejadian,
maka peluang kejadian A,
n(A) n(A)
P (A) = lim =
n→∞ n n(S)
Aksioma Peluang,
2. P (S) = 1
P (A ∩ B)
P (B|A) =
P (A)
[Ilustasi]
8
[Teorema Bayes] Jika kejadian - kejadian A1 , A2 , A3 , ..., Ak adalah partisi
dari ruang sampel S, maka untuk kejadian B sedemikian sehingga P (B) > 0,
berlaku,
P (Ai ∩ B)
P (Ai |B) =
P (B)
P (B|Ai )P (Ai )
= Pk
i=1 P (B|Ai )P (Ai )
2. P (S|A) = 1
Latihan
1. Tentukan peluang bahwa sebuah dadu diundi satu kali akan meng-
hasilkan angka yang kurang dari 4 jika (a) Tidak diberikan informasi
lain (b) Diketahui lemparan tersebut menghasilkan angka ganjil.
2. Bagi keluarga yang tinggal disuatu kota, peluang bahwa istri ikut
kegiatan olah raga 0.21, peluang suami ikut kegiatan olah raga 0.28
9
dan peluang suami dan istri ikut olah raga 0.15. Berapa peluang,(a)
Paling sedikit salah seorang ikut kegiatan olah raga (b) Seorang istri
ikut olah raga, bila diketahui suaminya olah raga (c) Seorang suami
ikut olah raga,diketahui istrinya olah raga.
3. Dari data diketahui bahwa mobil yang dijual di pasaran, 70% nya
dilengkapi dengan air conditioning (AC), 40% dilengkapi dengan CD
player (CD) dan 20% dilengkapi kedua alat tersebut (a) Berapa pelu-
ang sebuah mobil dilengkapi CD player, jika diketahui mobil tersebut
juga dilengkapi AC (b) Berapa peluang sebuah mobil dilengkapi AC,
jika diketahui mobil tersebut tidak dilengkapi CD.
6. Diberikan populasi sarjana disuatu kota yang dibagi menurut jenis ke-
lamin dan status pekerjaan. Akan diambil seorang dari mereka untuk
ditugaskan melakukan promosi barang. Ternyata yang terpilih adalah
dalam status bekerja, berapakah probabilitasnya bahwa dia (a) Laki-
laki (b) Wanita
10
20% dari perusahaan Y, dan 50% dari perusahaan Z. Berdasarkan pen-
galaman, 3% microchip perusahaan X cacat, 5% microchip perusa-
haan Y cacat, dan 4% microchip perusahaan Z cacat. Pada saat mi-
crochips tersebut sampai di pabrik, mereka langsung menempatkannya
dalam kotak tanpa inspeksi atau mengidentifikasi asal microchip ter-
lebih dahulu. Seorang pekerja mengambil sebuah microchip secara acak
dan ternyata cacat. Berapa peluang bahwa microchip tersebut berasal
dari perusahaan Y?
11
[Materi Ujian II]
1. p.a Diskrit: fungsi massa peluang, fungsi distribusi, nilai variansi
2. p.a Kontinu: fungsi kepadatan peluang, nilai ekpektasi/variansi
3. p.a Bivariat (Diskrit dan Kontinu): fungsi peluang gabungan, indepen-
den, nilai kovariansi
[Latihan]
1. 10
28
x = 0,
15
p(x) = 28
x = 1,
3
x=2
28
Tentukan F (1.5)?
2.
0 x < 0,
10
28
0 ≤ x < 1,
F (x) = 25
1 ≤ x < 2,
28
1 x≥2
Tentukan p(1)?
3. Tentukan fungsi distribusi berdasarkan fungsi peluang berikut,
0.1 x = 1,
0.3 x = 2,
f (x) = 0.4 x = 3,
0.2 x = 4,
0 lainnya
x 0 ≤ x < 1,
f (x) = 2 − x 1 ≤ x < 2,
0 lainnya
4.
x2
−1 < x < 2,
f (x) = 3
0 lainnya
(a) Periksalah apakah f (x) memenuhi syarat sebagai fungsi rapat prob-
abilitas?
(b) Berapakah probabilitas antara 0 dan 1?
12
5.
0.1 x = 0,
kx x = 1, 2,
p(x) =
k(6 − x) x = 3, 4,
0 lainnya
Misalkan g(y) = 4x − 3,
y = 4x − 3
y+3
x= = g −1 (y)
4
Selanjutnya, menentukan |J|
−1
dg (y)
|J| =
dy
d y+3
4
=
dy
1
=
4
13
diperoleh,
2. Σx Σy P ((X = x, Y = y) = 1
Fungsi Marjinal
Misalkan p.a X dan Y memiliki fungsi peluang gabungan f (x, y). Misalkan
fungsi peluang marjinal untuk X adalah g(x) dan fungsi peluang marjinal
untuk Y adalah h(y)
14
1. Untuk X dan Y diskrit
g(x) = Σy f (x, y) = Σy P (X = x, Y = y)
h(y) = Σx f (x, y) = Σx P (X = x, Y = y)
4. Kovariansi
[Latihan]
1. Dalam sebuah kotak buah terdapat 3 buah jeruk, 2 apel dan 3 pisang,
diambil secara acak 4 buah. Jika X adalah banyaknya buah jeruk dan
Y adalah banyaknya buah apel. Tentukan,
(a) Fungsi peluang gabungan f (x, y)
(b) P (X + Y ≤ 2)
2. Suatu restoran cepat saji menyediakan fasilitas pemesanan untuk dibawa
pulang melalui drive in dan walk in. Pada suatu hari yang dipilih secara
acak, diperhatikan waktu yang dibutuhkan untuk menyiapkan peme-
sanan (dalam satuan waktu pelayanan) masing-masing untuk drive
in dan walk in, yang berturut-turut dinotasikan sebagai peubah acak
X dan Y . Misalkan fungsi kepadatan peluang gabungan dari kedua
peubah acak tersebut adalah:
2
3
(x + 2y) 0 ≤ x ≤ 1, 0 ≤ y ≤ 1,
f (x, y) =
0 lainnya
15
(b) Hitung peluang bahwa pada suatu hari ditemukan waktu pelayanan
pada fasilitas drive in dan walk in masing-masing kurang dari setengah?
Z 1 Z 1
2 2 2 1
P (X < 0.5, Y < 0.5) = (x + 2y)dxdy = ... =
0 0 3 8
16
3 Distribusi Peubah Acak Diskrit
Jika himpunan p.a mencirikan salah satu karakteristik jenis distribusi, anal-
isis statistika akan dapat dilakukan dengan lebih efektif. Terdapat banyak
jenis distribusi dalam statistika, secara khusus dibagi dalam distribusi p.a
diskrit dan p.a kontinu. Berdasarkan hal tersebut, perlu diketahui karakter-
istik jenis distribusi yang melekat pada p.a.
[Distribusi Bernoulli]
Jika X menyatakan p.a berdistribusi Bernoulli, ditulis sebagai X ∼ BIN (1, p).
Karakteristik,
1. Percobaan dilakukan hanya satu kali dan independent
[Distribusi Binomial]
Jika X menyatakan p.a berdistribusi Binomial, ditulis sebagai X ∼ BIN (n, p).
Karakteristik,
1. Merupakan proses Bernoulli yang dilakukan sebanyak n kali
17
dengan peluang 0.2. Tentukan peluang dari 3 produk terdapat tepat ada dua
produk yang cacat? kurang dari 2 produk cacat?
[Distribusi Poisson]
Jika X menyatakan p.a berdistribusi Poisson, ditulis sebagai X ∼ P OI(λ).
Karakteristik,
e−λ λx
P (X = x) = p(x; λ) =
x!
dengan x banyaknya outcome selama percobaan, λ menyatakan laju
outcome per satuan waktu atau daerah, e bilangan eksponensial 2.718...
Ex. Banyaknya kecelakaan yang terjadi di tol setiap hari berdistribusi Pois-
son dengan rata-rata kecelakaan 3 per hari. Berapa peluang tidak ada kece-
lakaan pada hari ini?
[Proses Poisson]
Proses menghitung (counting process) dengan laju (parameter) λ > 0, den-
gan X(t) menyatakan banyaknya peristiwa yang terjadi selama waktu t,
X ∼ P OI(λt). Karakteristik,
e−λt (λt)x
P (X = x) = p(x; λt) =
x!
dengan x banyaknya outcome selama percobaan, e bilangan eksponen-
sial 2.718...
18
Ex. Menurut perusahaan asuransi T ditentukan bahwa peluang pria beru-
mur 25 tahun akan meninggal tahun depan adalah 0.0002. Jika perusahaan
asuransi T tahun ini menjual 4000 polis terhadap pria berumur 25 tahun,
berapa peluang mereka akan membayar tepat 1 polis?
[Note] Jika X adalah p.a distribusi Binomial, maka jika jumlah percobaan-
nya besar sekali n → ∞ dan peluang sukses p kecil sekali n → 0, dengan
rata-rata µ = np maka distribusi Binomial dapat diaproksimasi dengan dis-
tribusi Poisson.
[Distribusi Hipergeometrik]
Misalkan suatu populasi yang berukuran N terdapat D item cacat dan N −D
item tidak cacat. Sebuah sampel diambil dengan ukuran sampel n, ternyata
X diantaranya merupakan item cacat. Jika X menyatakan p.a berdistribusi
Hipergeometrik, ditulis sebagai X ∼ HY P (n, N, D). Karakteristik,
q q
nD(N −D) N −n
2. Rata-rata (µ) = nD N
dan variansi (σ 2
) = N2 N −1
dengan
q
N −n
N −1
disebut faktor koreksi populasi terbatas (finite population)
[Hipergeometrik vs Binomial]
Jika ukuran sampel n jauh lebih kecil dari ukuran populasinya N maka dis-
D
tribusi HYP sangat mirip dengan BIN, dimana peluang sukses (p = N ) dan
19
peluang gagal (1 − p), sehingga,
D
µ = np = n
N
2 D D
σ = np(1 − p) = n 1−
N N
seringkali diterapkan jika Nn < 5% maka digunakan distribusi Binomial seba-
gai pengganti distribusi Hipergeometrik.
Ex. Sebuah pabrik ban menyatakan dari 5000 ban yang dikirim ke distrib-
utor sebanyak 1000 warnanya sedikit pudar. Seorang pelanggan membeli 10
ban dari distributor secara acak saja. Berapa peluang bahwa ada 3 buah
ban yang warnanya sedikit pudar?
[Latihan]
1. Berdasarkan data masa lalu, probabilitas mahasiswa lulus dari ma-
ta kuliah statistik 0,45. Jika diambil sampel sebanyak 5 mahasiswa.
Hitung peluang (a) Tepat 3 mahasiswa yang tidak lulus? (b) Paling
sedikit 4 mahasiswa yang lulus? (c) Paling banyak ada 5 mhs yang
lulus?
2. Sebuah percobaan dilakukan untuk mencari katalis yang sesuai untuk
produksi ethylenediaine. Bila seorang insinyur kimia memilih 3 katalis
dari 10 katalis yang terdiri dari 6 katalis yang mempunyai low adicity
dan 4 high acidity. Hitung peluang: (a) Tidak ada katalis highly acidity
yang dipilih? (b) Tepat satu katalis yang high acidity?
3. Jika X variabel random yang menyatakan jumlah retak yang terjadi
per spesimen untuk campuran semen. Rata-rata retak per spesimen
2,5. Hitung peluang: (a) Terjadi 5 retak dalam satu spesimen? (b)
Ada 2 atau lebih retak yang terjadi?
4. Bagian Quality Control perusahaan laptop menemukan bahwa produk-
si laptop yang cacat mencapai 1,5% dari total produksi yang ada. Bila
dari seluruh produksi tersebut diambil sebanyak 200 laptop secara ran-
dom. Tentukan peluang: (a) Laptop yang cacat paling banyak 1%?
(b) Laptop yang cacat antara 2% sampai 4%?
5. Jumlah pasien di suatu klinik diketahui mengikuti distribusi Poisson.
Jika peluang tidak ada pasien di klinik tersebut adalah sebesar 0,1.
Tentukan peluang terdapat paling banyak terdapat dua orang pasien
di klinik tersebut?
20
6. Pada tahun 2012, sebuah kota di pedalaman Watampone, diperoleh
data bahwa rata-rata terdapat 2,5 orang albino per 175 orang. 525
orang diambil sebagai sampel percobaan. Tentukanlah peluang: (a)
Tidak ada yang albino (b) Ada Albino
[Distribusi Uniform]
Jika X menyatakan p.a berdistribusi Uniform pada interval (a, b), ditulis
sebagai X ∼ U N IF (a, b). Karakteristik,
1. p.a Uniform muncul dalam situasi dimana semua nilai dalam selang/in-
terval tertentu mempunyai peluang sama untuk muncul.
b+a (b−a)2
3. Rata-rata (µ) = 2
dan variansi (σ 2 ) = 12
[Distribusi Eksponensial]
Jika X menyatakan p.a berdistribusi Eksponensial dengan parameter λ yang
terdefinisi pada selang (0, ∞), ditulis sebagai X ∼ EXP (λ). Karakteristik,
21
1. Distribusi Eksponensial sering digunakan sebagai model distribusi wak-
tu tunggu.
1 − e−λx x ≥ 0,
F (x) =
0 lainnya
1 1
4. Rata-rata (µ) = λ
dan variansi (σ 2 ) = (λ)2
[Distribusi Beta]
p.a X menyatakan p.a berdistribusi Beta dengan parameter α dan β dengan
α, β > 0, ditulis sebagai X ∼ B(α, β). Karakteristik,
Γ(α)Γ(β)
dengan B(α, β) = Γ(α+β)
α αβ
2. Rata-rata (µ) = α+β
dan variansi (σ 2 ) = (α+β+1)(α+β)2
[Latihan]
1. Diketahui p.a X berdistribusi Uniform dalam interval (a, b). Jika E(X) =
10 dan V ar(X) = 12. Tentukan nilai a dan b?
22
2. Waktu kegagalan suatu komponen elektronik diketahui berdistribusi
Eksponensial dengan rata-rata 3 tahun. Perusahaan pembuat kompo-
nen tersebut memberi jaminan untuk pemakaian satu tahun pertama.
Apabila perusahaan tersebut berhasil menjual 50 buah komponen, be-
rapa peluang perusahaan tersebut harus membayar lebih dari 40 klaim
dari pembeli?
[Distribusi Beta]
p.a X menyatakan p.a berdistribusi Beta dengan parameter α dan β dengan
α, β > 0, ditulis sebagai X ∼ B(α, β). Karakteristik,
Γ(α)Γ(β)
dengan B(α, β) = Γ(α+β)
α αβ
2. Rata-rata (µ) = α+β
dan variansi (σ 2 ) = (α+β+1)(α+β)2
[Latihan]
1. Diketahui p.a X berdistribusi Uniform dalam interval (a, b). Jika E(X) =
10 dan V ar(X) = 12. Tentukan nilai a dan b?
23
paling banyak 10 sambungan telpon dalam selang waktu 2 jam? (b)
Berapa peluang menunggu lebih dari 15 menit antara 2 sambungan
yang berturutan?
[Distribusi Normal]
p.a X menyatakan p.a berdistribusi Beta dengan parameter µ dan σ 2 , ditulis
sebagai X ∼ N (µ, σ 2 ) atau X ∼ N OR(µ, σ 2 ). Karakteristik,
24
Ex. Misalkan X ∼ N (8, 25). Tentukan nilai X dimana 20% dibawah kurva
Normal? √
Sol. µ = 8; σ = 25 = 5; P (X ≤ x) = 0.20.
(1) Tentukan nilai z,
x = µ + zσ
= ...
= 3.80
[Normal vs Binomial]
Jika p.a diskit diubah menjadi p.a kontinu, maka nilai p.a tersebut perlu
mendapat penyesuaian dengan memberikan koreksi kontinuitas,
Jika p mendekati 0.5, dan n cukup besar, maka pendekatan distribusi Nor-
mal
p dapat diterapkan untuk distribusi Binomial, dengan µ = np dan σ =
np(1 − p)
25
standar
X −µ
P (X ≤ 180) = P (Z ≤ )
σ
= ...
= P (Z ≤ −1.54) = 0.0618
5 Distribusi Sampling
Dalam melakukan observasi suatu percobaan atau kejadian, tidak memu-
ngkinkan untuk mengamati keseluruhan populasi observasi. Sampling meru-
pakan pengambilan data atau informasi terhadap suatu populasi, data sam-
pel hasil sampling diharapkan dapat mewakili (dekat) dengan karakteristik
populasi.
• Populasi (X): banyaknya populasi (N ), mean (µ), variansi (σ 2 )
µX̄ = µ
2 σ
σX̄ =√
n
µX̄ = µ
r
2 σ N −n
σX̄ =√
n N −1
q
N −n
dengan N −1
merupakan faktor koreksi.
[Catatan] (1) Jika proporsi Nn ≤ 0.05 maka faktor koreksi dapat diabaikan.
(2) Apabila n ≥ 30, maka distribusi sampling mendekati distribusi Normal.
26
• Minimum variance, σX̄ < σ
• Galat/eror (e)
[Contoh]
Z 2α p(1 − p)
2
n=
e2
(1.96)2 (0.5)(0.5)
= = ...
(0.05)2
27
[Sol.]
7.8 − µX̄ X̄ − µ 8.2 − µX̄
P (7.8 < X̄ < 8.2) = P < <
σX̄ σX̄ σ
! X̄
7.8 − µ 8.2 − µ
=P σ <Z< σ
√ √
n n
[Latihan]
28
4. Suatu sampel acak berukuran n = 25 yang diambil dari populasi
berhingga dengan p.a X. Fungsi padat peluang untuk X,
1 − x2 0 < x < 2,
f (x) =
0 lainnya
29