... ???
STATISTIK & DATA
Statistik : ukuran yang menjelaskan karakteristik dari sebagian objek
pengamatan.
Penyajian Data
• Tabel
- Tabel baris-kolom.
- Tabel kontingensi.
- Tabel distribusi frekuensi
• Diagram
- Diagram batang.
- Diagram garis.
- Diagram lambang atau diagram simbol.
- Diagram lingkaran.
- Diagram peta atau kartogram.
- Diagram pencar atau diagram titik.
Dr. Ngudiantoro
Program Pascasarjana Unsri
HP: 08129827133
Email: ngudiantoro@unsri.ac.id Tahap A: pengambilan unit sampel dari populasi.
Tahap B: pengambilan data dari sampel.
Definisi:
- Penolakan hipotesis nol yang benar disebut kesalahan jenis I.
- Penerimaan hipotesis nol yang salah disebut kesalahan jenis II.
Suatu jenis vaksin influenza diketahui hanya 25% efektif setelah periode 2 Peluang melakukan kesalahan jenis I disebut taraf nyata uji, dilambangkan .
tahun. Untuk menentukan apakah suatu vaksin baru lebih unggul dalam
Kesalahan jenis I terjadi bila 9 orang atau lebih berhasil melampaui periode 2
memberikan perlindungan terhadap virus yang sama untuk periode yang lebih
tahun dengan baik tanpa terkena penyakit influenza dengan menggunakan
lama, maka diambil 20 orang secara acak dan diinokulasi dengan vaksin baru
vaksin baru yang sama efektifnya dengan vaksin yang digunakan sekarang.
tersebut. Apabila terdapat 9 atau lebih di antara yang menerima vaksin baru
terbebas dari virus influenza selama periode 2 tahun, maka vaksin baru = 𝑃(Kesalahan Jenis I)
tersebut dinilai lebih unggul daripada vaksin yang digunakan sekarang. 1
= 𝑃(𝑋 ≥ 9 bila 𝑝 = )
4
20 1
Hipotesis: = 𝑥=9 𝑏(𝑥; 20, 4)
1 8 1
𝐻0 ∶ 𝑝 = 4 (vaksin yang baru sama efektifnya setelah periode 2 tahun =1− 𝑥=0 𝑏(𝑥; 20, 4)
dengan vaksin yang digunakan sekarang) = 1 − 0.9591
1
𝐻1 ∶ 𝑝 > 4 = 0.0409 ∎
1
Hipotesis nol (𝑝 = 4) sedang diuji dengan taraf nyata = 0.0409.
Peluang kesalahan jenis II, dilambangkan 𝛽, dapat dihitung apabila terdapat Jika ditetapkan 𝐻1 ∶ 𝑝 = 0.7, maka
hipotesis alternatif yang spesifik. 𝛽 = 𝑃(Kesalahan Jenis II)
1 = 𝑃 𝑋 < 9 bila 𝑝 = 0.7
Misalkan ditetapkan 𝐻1 ∶ 𝑝 = , maka
2
= 0.0051 ∎
𝛽 = 𝑃(Kesalahan Jenis II)
1 Dengan nilai 𝛽 yang cukup kecil, maka kecil pula kemungkinannya bahwa
= 𝑃(𝑋 < 9 bila 𝑝 = ) vaksin baru akan ditolak, bila ternyata vaksin tersebut 70% efektif setelah
2
= 0.2517 ∎ periode 2 tahun.
Nilai 𝛽 yang cukup besar menunjukkan bahwa prosedur uji tersebut kurang
baik. Artinya, cukup besar kemungkinan kita akan menolak vaksin baru,
padahal sebenarnya lebih unggul daripada yang digunakan sekarang.
1
Untuk 𝐻1 ∶ 𝑝 = 2 , jika ditetapkan X = 8, maka Untuk kasus yang sama, tetapi dengan sampel acak sebanyak 100 orang. Andaikan
terdapat 37 orang atau lebih yang berhasil melampaui periode 2 tahun.
= 𝑃(Kesalahan Jenis I)
1 Dengan hampiran normal diperoleh 𝜇 = 𝑛𝑝 = 25 dan 𝜎 = 𝑛𝑝𝑞 = 4.33, sehingga
= 𝑃(𝑋 ≥ 8 bila 𝑝 = )
4
= 𝑃(Kesalahan Jenis I)
= 0.1018 ∎ 1
= 𝑃(𝑋 > 36.5 bila 𝑝 = 4)
𝛽 = 𝑃(Kesalahan Jenis II)
1 = 𝑃(𝑍 > 2.66)
= 𝑃(𝑋 < 7 bila 𝑝 = )
2 = 0.0039 ∎
= 0.1316 ∎
1
Bila 𝐻0 salah dan yang benar adalah 𝐻1 ∶ 𝑝 = , maka 𝜇 = 𝑛𝑝 = 50 dan
2
Dengan prosedur uji tersebut, maka peluang melakukan kesalahan jenis II 𝜎 = 𝑛𝑝𝑞 = 5, sehingga
dapat diperkecil, tetapi peluang melakukan kesalahan jenis I menjadi lebih
besar. 𝛽 = 𝑃(Kesalahan Jenis II)
1
= 𝑃(𝑋 < 36.5 bila 𝑝 = )
2
= 𝑃(𝑍 < −2.7)
= 0.0035 ∎
KESIMPULAN
Pengujian Hipotesis
Ukuran wilayah kritis, yang berarti juga peluang melakukan kesalahan jenis I,
selalu dapat diperkecil dengan mengubah nilai kritisnya.
Bila hipotesis nol salah, nilai 𝛽 akan akan sangat besar jika nilai
parameternya dekat dengan nilai yang dihipotesiskan. Semakin besar jarak
antara nilai yang sesungguhnya dengan nilai yang dihipotesiskan, maka
semakin kecil nilai 𝛽.
Dr. Ngudiantoro
FMIPA Universitas Sriwijaya
Jl. Raya Palembang-Prabumulih Km 32
Inderalaya, Ogan Ilir Sumatera Selatan 30662
Email: ngudiantoro@unsri.ac.id ; ngudiantoro@yahoo.com
HP: +62-812-9-827133
Nyatakan hipotesis nol, yaitu 𝐻0 : 𝜃 = 𝜃0 . Sample t-test adalah uji hipotesis yang digunakan untuk menguji
apakah ada perbedaan rata-rata pada sampel.
Pilih hipotesis alternatif, yaitu 𝐻1 : 𝜃 < 𝜃0 atau 𝐻1 : 𝜃 > 𝜃0 atau
𝐻1 : 𝜃 ≠ 𝜃0 . Sample t-test dibagi menjadi tiga, yaitu:
One sample t-test;
Tentukan taraf nyata .
Paired samples t-test; dan
Pilih statistik uji yang sesuai dan tentukan wilayah kritisnya. Independent samples t-test.
Dr. Ngudiantoro Analisis varians dengan dua sampel akan memberikan hasil yang sama
dengan uji-t untuk dua rerata (mean).
FMIPA Universitas Sriwijaya
Jl. Raya Palembang-Prabumulih Km 32
Inderalaya, Ogan Ilir Sumatera Selatan 30662
Email: ngudiantoro@unsri.ac.id ; ngudiantoro@yahoo.com
HP: +62-812-9-827133
Data berdistibusi normal, karena pengujiannya menggunakan uji Uji Normalitas Chi-Kuadrat, Lilliefors, Kolmogorov-Smirnov
F-Snedecor. Hipotesis:
𝐻0 : Populasi berdistribusi normal
Varians atau ragamnya homogen, dikenal sebagai homoskedastisitas,
karena hanya digunakan satu penduga (estimate) untuk varians dalam
Uji Kehomogenan Ragam Bartlett, Levene, F
sampel.
Hipotesis:
Masing-masing faktor saling bebas (independent). 𝐻0 ∶ 𝜎12 = 𝜎22 = ⋯ = 𝜎𝑘2
𝐻1 ∶ paling sedikit ada satu 𝜎𝑖2 ≠ 𝜎𝑗2
Komponen-komponen dalam modelnya bersifat aditif (saling
menjumlah).
Uji Kebebasan Chi-Kuadrat (Uji Kecocokan)
Hipotesis:
𝐻0 : Kedua faktor saling bebas
ANOVA ANOVA
KLASIFIKASI SATU ARAH KLASIFIKASI DUA ARAH
Hipotesis: Hipotesis:
𝐻0 ∶ μ1 = μ2 = ⋯ = μ𝑘 𝐻0 ∶ μ1 = μ2 = ⋯ = μ𝑘
𝐻1 ∶ paling sedikit ada satu μ𝑖 = μ𝑗 𝐻1 ∶ paling sedikit ada satu μ𝑖 = μ𝑗
Dr. Ngudiantoro
TEOREMA:
Nilai tengah dan variansi dari sebaran binomial 𝑓 𝑥 yaitu
FMIPA Universitas Sriwijaya μ = 𝐸 𝑋 = 𝑛𝑝
Jl. Raya Palembang-Prabumulih Km 32 dan
Inderalaya, Ogan Ilir Sumatera Selatan 30662
σ2 = 𝑉𝑎𝑟 𝑋 = 𝑛𝑝𝑞
Email: ngudiantoro@unsri.ac.id ; ngudiantoro@yahoo.com
HP: +62-812-9-827133
TEOREMA: DEFINISI:
Bila X adalah peubah acak binom dengan nilai tengah μ = 𝑛𝑝 dan Bila setiap ulangan menghasilkan salah satu dari k hasil percobaan
variansi σ2 = 𝑛𝑝𝑞 untuk 𝑞 = 1 − 𝑝, maka peubah acak 𝐸1 , 𝐸2 , … , 𝐸𝑘 , dengan peluang 𝑝1 , 𝑝2 , … , 𝑝𝑘 , maka distribusi peluang peubah
𝑋 − 𝑛𝑝 acak 𝑋1 , 𝑋2 , … , 𝑋𝑘 , yang menyatakan banyaknya 𝐸1 , 𝐸2 , … , 𝐸𝑘 terjadi dalam
𝑍= n ulangan yang bebas, adalah:
𝑛𝑝𝑞
𝑛 𝑥 𝑥 𝑥
berdistribusi normal baku untuk 𝑛 → ∞. 𝑓 𝑥1 , 𝑥2 , … , 𝑥𝑘 ; 𝑝1 , 𝑝2 , … , 𝑝𝑘 , 𝑛 = 𝑥 , 𝑥 , … , 𝑥 𝑝1 1 𝑝2 2 … 𝑝𝑘 𝑘
1 2 𝑘
𝑘 𝑘
dengan 𝑖=1 𝑥𝑖 = 𝑛 dan 𝑖=1 𝑝𝑖 = 1.
σ2 = 𝑉𝑎𝑟 𝑋 =
𝑁−𝑛
. 𝑛.
𝑘
1−
𝑘 Asumsi:Uji Binomial tidak memerlukan asumsi bentuk
𝑁 −1 𝑁 𝑁 distribusi. Data hanya diasumsikan dihasilkan dari
contoh acak
Contoh: Jawab:
Pada sebuah penelitian tentang efek stress, sebanyak 18 Hipotesis:
mahasiswa diambil secara acak sebagai sampel dan diajarkan cara
1
mengikat simpul tali dengan dua metode (A dan B). Separuh dari 𝐻0 ∶ 𝑝 =
mahasiswa (9 orang) diajarkan dengan metode A kemudian metode 2
1
B, dan separuh mahasiswa lainnya diajarkan dengan urutan 𝐻1 ∶ 𝑝 <
sebaliknya. Setelah 4 jam mengikuti ujian akhir, setiap mahasiswa 2
diminta untuk mengikat simpul tali seperti yang telah diajarkan. 𝛼 = 0.05
Data penelitian adalah sebagai berikut:
1
Metode Frekuensi
Wilayah kritis: 𝑃 𝑋 ≤ 2 𝑝 = 2 < 0.05
𝛼 = 0.05 𝛼 = 0.05
1 Wilayah kritis: 𝑍0.05 < −1.645
Wilayah kritis: 𝑃 𝑋 ≥ 16 𝑝 = < 0.05
2
Statistik Uji:
Statistik Uji: 2.5−18(0.5)
𝑍= = −3.064 (sig.=0.001)
1 1 18(0.5)(0.5)
𝑃 𝑋 ≥ 16 𝑝 = = 1 − 𝑃 𝑋 ≤ 15 𝑝 = = 0.001
2 2 Kesimpulan:
Kesimpulan: Tolak 𝐻0 , artinya efek stress akan mendorong mahasiswa
Tolak 𝐻0 , artinya efek stress akan mendorong mahasiswa untuk memilih metode yang pertama diajarkan.
untuk memilih metode yang pertama diajarkan.
Contoh: Jawab:
Suatu perusahaan otomotif memproduksi dua jenis mobil Hipotesis:
1
minibus, yaitu mobil yang berbahan bakar bensin dan solar. 𝐻0 ∶ 𝑝 =
2
1
Perusahaan ingin mengetahui apakah masyarakat lebih senang 𝐻1 ∶ 𝑝 <
2
mobil berbahan bakar bensin atau solar. Berdasarkan 24
sampel yang dipilih secara acak, ternyata 19 orang memilih 𝛼 = 0.05
mobil berbahan bakar bensin dan 5 orang memilih mobil Wilayah kritis: 𝑃 𝑋 ≤ 5 𝑝 =
1
< 0.05
berbahan bakar solar. Lakukan pengujian untuk mengetahui 2
Jawab: Jawab:
Hipotesis: Hipotesis:
1
𝐻0 ∶ 𝑝 = 𝐻0 ∶ 𝑝 = 2
1
2
1
𝐻1 ∶ 𝑝 > 1
2 𝐻1 ∶ 𝑝 <
2
𝛼 = 0.05
𝛼 = 0.05
1
Wilayah kritis: 𝑃 𝑋 ≥ 19 𝑝 = < 0.05 Wilayah kritis: 𝑍0.05 < −1.645
2
Statistik Uji: Statistik Uji:
1 1 5.5−24(0.5)
𝑃 𝑋 ≥ 19 𝑝 = 2 = 1 − 𝑃 𝑋 ≤ 18 𝑝 = 2 = 0.003 𝑍= = −2.654 (sig.=0.004)
24(0.5)(0.5)
Kesimpulan: Kesimpulan:
Tolak 𝐻0 , artinya masyarakat memiliki kecenderungan Tolak 𝐻0 , artinya masyarakat memiliki kecenderungan
dalam memilih mobil, yaitu lebih memilih mobil yang
dalam memilih mobil, yaitu lebih memilih mobil yang
berbahan bakar bensin.
berbahan bakar bensin.
Tolak 𝐻0 , artinya masyarakat memiliki kecenderungan Tolak 𝐻0 , artinya masyarakat memiliki kecenderungan
dalam memilih mobil, yaitu lebih memilih mobil yang dalam memilih mobil, yaitu lebih memilih mobil yang
berbahan bakar bensin. berbahan bakar bensin.
Sama seperti uji Binom, uji Chi-Kuadrat didasarkan pada Untuk menguji kecocokan data hasil pengamatan dengan
skala pengukuran nominal. teori (yang diharapkan) digunakan persamaan:
Pada uji Binom, variabel yang akan diuji bersifat 𝑘
𝑂𝑖 − 𝐸𝑖 2
dichotomous, tetapi pada uji Chi-Kuadrat bisa polychotomous 2 =
(lebih dari 2 kategori). 𝐸𝑖
𝑖=1
Pada kasus data yang berasal dari satu sampel, uji atau
Chi-Kuadrat digunakan sebagai uji Kecocokan (Test of 𝑘
Goodness of Fit). 𝑂𝑖2
2 = −𝑁
𝐸𝑖
Uji kecocokan digunakan untuk menguji apakah data hasil 𝑖=1
pengamatan memiliki kecocokan dengan yang diharapkan. dengan
𝑂𝑖 : frekuensi hasil pengamatan ke-i;
𝐸𝑖 : frekuensi harapan ke-i; dan
N : total frekuensi.
Kesimpulan: Kesimpulan:
Tolak 𝐻0 , artinya efek stress akan mendorong mahasiswa Tolak 𝐻0 , artinya masyarakat memiliki kecenderungan
untuk memilih metode yang pertama diajarkan. dalam memilih mobil, yaitu lebih memilih mobil yang
berbahan bakar bensin.
Misalkan X dan Y menyatakan dua peubah kategori. Apabila X Peubah respon memiliki 2 kategori (sukses atau gagal) peubah
memiliki I kategori dan Y memiliki J kategori, maka akan terdapat biner
I x J kombinasi klasifikasi yang mungkin.
Baris grup/kelompok
Pasangan peubah (X,Y) yang dipilih secara acak dari suatu populasi - Baris 1 : 𝜋1 (sukses), 1 − 𝜋1 (gagal)
yang memiliki distribusi peluang, dapat disajikan dalam suatu tabel
- Baris 2 : 𝜋2 (sukses), 1 − 𝜋2 (gagal)
yang memiliki I baris untuk kategori X dan J kolom yang
menyatakan kategori Y, sehingga banyaknya sel dalam tabel ada Kolom respon
sebanyak I x J.
Respon I Respon II Total
Apabila setiap sel pada tabel yang berukuran I x J berisikan nilai Grup I
frekuensi hasil pengamatan, maka tabel tersebut dinamakan Tabel Grup II
Kontingensi atau Tabel Klasifikasi-Silang (Cross-Classification Table)
Total
yang berukuran I x J.
Uji Chi-kuadrat efisien jika ukuran contoh besar. Didasarkan pada distribusi Hipergeometrik.
Uji Chi-kuadrat tidak valid jika ukuran contoh relatif kecil (lebih dari
25% sel memiliki nilai harapan < 5).
Apabila ukuran contoh kecil, inferensi dilakukan dengan melihat
exact distributions.
Hipotesis nol pada uji Eksak Fisher adalah kedua peubah (baris dan
kolom) saling bebas.
Uji Eksak Fisher berlaku untuk semua ukuran contoh (tidak hanya
untuk ukuran contoh kecil).
Untuk ukuran contoh besar, uji Eksak Fisher memerlukan waktu
komputasi yang lama. P-Value yang dihasilkan akan mendekati
P-Value pada uji Chi-kuadrat.
Beberapa ukuran yang dapat digunakan untuk melihat faktor resiko untuk dua
peubah yang skalanya nominal atau ordinal antara lain:
Y
1 2
1 𝑛11 𝑛12 𝑛1.
X
2 𝑛21 𝑛22 𝑛2.
𝑛.1 𝑛.2 n
Misalkan π adalah peluang kejadian sukses dan 1 – π adalah peluang kejadian gagal.
Y
1 2
1 1 1 − 1
X
2 2 1 − 2
Misalkan 1 adalah peluang atau resiko untuk subjek yang terpapar dan 2 untuk
subjek yang tidak terpapar. Sebagai contoh, 1 adalah peluang subjek terkena kanker paru
jika diketahui subjek merokok, dan 2 adalah peluang subjek terkena kanker paru jika
diketahui subjek tidak merokok. Selisih resiko, rasio resiko dan odds ratio akan dijelaskan
berdasarkan 1 dan 2 di atas. 1
Rasio resiko didefinisikan sebagai rasio antara dua peluang, yaitu 𝑅𝑅 = 1 ⁄2 .
Karena 1 = 𝑅𝑅2 , maka rasio resiko mengukur perubahan pada skala multiplikatif. Jika
RR > 1, maka paparan berkaitan dengan kenaikan peluang terkena penyakit. Jika RR < 1,
maka paparan berkaitan dengan penurunan probabilitas terkena penyakit, dan jika RR = 1,
maka paparan tidak berkaitan dengan penyakit tersebut.
Meskipun peluang dan odds merepresentasikan informasi yang sama, tetapi nilai rentang
tidak sama dengan π, dimana 0 ≤ π ≤ 1 dan > 0. Apabila didefinisikan 1 = 1−1 dan
1
2
2 = 1− , maka Odds ratio adalah rasio antara dua odds 1 dan 2 , sehingga
2
1 1 (1 − 2 )
𝑂𝑅 = =
2 2 (1 − 1 )
Odds ratio (OR) mirip dengan rasio resiko (RR) dalam hal perubahannya yang diukur
secara multiplikatif. Interpretasi nilai OR juga ekivalen dengan RR.
Untuk desain penelitian cohort dan prospekstif atau follow-up, diasumsikan bahwa
peluang marginal X adalah tetap, dengan menganggap bahwa X adalah peubah penjelas
atau peubah paparan (exposure) dan Y adalah respon, dengan 𝑗|𝑖 adalah peluang bersyarat.
Untuk menyederhanakan penulisan, maka 1|1 ditulis sebagai 1 , dan 1|2 ditulis sebagai
2 .
Y
1 2
1 1|1 1|2 1
X
2 2|1 2|2 1
̂ = ̂ 1 − ̂ 2 2
𝑅𝐷
1 (1 − 1 ) 2 (1 − 2 )
(̂ 1 − ̂ 2 ) = √ +
𝑛1 𝑛2
̂ 1
̂ =
𝑅𝑅
̂ 2
̂ adalah
Galat baku (standard error) untuk log 𝑅𝑅
(1 − 1 ) (1 − 2 )
̂) = √
(log 𝑅𝑅 +
1 𝑛1 2 𝑛2
̂ ± 𝑍𝛼⁄
log 𝑅𝑅 ̂)
̂(log 𝑅𝑅
2
𝑛11 𝑛22
̂ =
𝑂𝑅
𝑛12 𝑛21
̂ adalah
Galat baku (standard error) untuk log 𝑂𝑅
1 1 1 1
̂)=√
(log 𝑂𝑅 + + +
𝑛11 𝑛12 𝑛21 𝑛22
1. Koefisien Phi
Merupakan ukuran asosiasi dua peubah dikhotomi. Koefisien Phi () mengkoreksi
Chi-kuadrat secara proporsional terhadap n. Koefisien Phi () dihitung dengan persamaan
2
=√
𝑛
atau
𝑎𝑑 − 𝑏𝑐
=
√(𝑎 + 𝑏)(𝑐 + 𝑑)(𝑎 + 𝑐)(𝑏 + 𝑑)
2. V Cramer
Merupakan modifikasi Phi untuk ukuran tabel yang lebih besar. V Cramer dihitung
dengan persamaan
2
𝑉=√
𝑛(𝑘 − 1)
2
𝐶=√
𝑛 + 2