0% menganggap dokumen ini bermanfaat (0 suara)
2K tayangan625 halaman

Fix Statistika

Dokumen ini berisi soal-soal UAS Statistika Lanjut untuk tahun ajaran 2020-2021, mencakup berbagai topik seperti estimator, interval konfidensi, uji hipotesis, dan teknik sampling. Terdapat juga soal latihan dan jawaban yang menjelaskan konsep-konsep statistik secara mendetail. Soal-soal ini dirancang untuk menguji pemahaman mahasiswa terhadap teori dan aplikasi statistika.

Diunggah oleh

nadyarrahpersonal
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
2K tayangan625 halaman

Fix Statistika

Dokumen ini berisi soal-soal UAS Statistika Lanjut untuk tahun ajaran 2020-2021, mencakup berbagai topik seperti estimator, interval konfidensi, uji hipotesis, dan teknik sampling. Terdapat juga soal latihan dan jawaban yang menjelaskan konsep-konsep statistik secara mendetail. Soal-soal ini dirancang untuk menguji pemahaman mahasiswa terhadap teori dan aplikasi statistika.

Diunggah oleh

nadyarrahpersonal
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd

SUMBANGAN SOAL UAS STATISTIKA LANJUT ATA 2020-2021

1. Di bawah ini merupakan sifat yang harus dipenuhi oleh estimator titik, kecuali …
a. Efisien c. Koefisien
b. Konsisten d. Sufisien

2. Untuk estimasi interval nilai rerata populasi, ukuran sampel minimum tergantung pada …
a. Tingkat Keyakinan Estimasi √ c. Jumlah Sampel
b. Jumlah Populasi d. Parameter

3. Manakah pernyataan di bawah ini yang benar …


a. Jika nilai statistik penguji terletak pada daerah kritis distribusi samplingnya, maka
kesimpulannya hipotesis alternatif tidak ditolak
b. Jika nilai statistik penguji terletak di luar daerah kritis, maka kesimpulannya hipotesis nol
tidak ditolak
c. Jika nilai statistik penguji terletak pada daerah kritis distribusi samplingnya, maka
kesimpulannya hipotesis alternatif tidak ditolak
d. Jika nilai statistik penguji terletak di luar daerah kritis, maka kesimpulannya hipotesis nol
ditolak

4. Jika dari hasil suatu penelitian, dinyatakan bahwa interval konfidensi 95% nilai rerata tinggi
badan penduduk Indonesia (dalam cm) adalah [145 ; 165]. Pernyataan ini berarti …
a. 95% nilai-nilai ȳ (tinggi badan penduduk Indonesia) terletak dalam interval [145 ; 165]
b. 95% nilai-nilai ȳ terletak dalam interval [145 ; 165]
c. Nilai μ memiliki probabilitas 95% untuk berada dalam interval [145 ; 165]
d. Semuanya salah

5. Tingkat signifikansi α adalah …


a. Probabilitas untuk tidak menolak H0 yang salah
b. Probabilitas untuk menolak H0 yang salah
c. Probabilitas untuk tidak menolak H0 yang benar √
d. Probabilitas untuk menolak H0 yang benar

6. Kesalahan tipe II yaitu …


a. Probabilitas untuk tidak menolak H0 yang salah √
b. Probabilitas untuk menolak H0 yang salah
c. Probabilitas untuk tidak menolak H0 yang benar
d. Probabilitas untuk menolak H0 yang benar

7. Kesalahan tipe I adalah …


a. Probabilitas untuk tidak menolak H0 yang salah
b. Probabilitas untuk menolak H0 yang salah
c. Probabilitas untuk tidak menolak H0 yang benar
d. Probabilitas untuk menolak H0 yang benar √

8. Kekuatan uji statistik (1-β) adalah …


a. Probabilitas untuk menolak H0 yang benar
b. Probabilitas untuk tidak menolak H0 yang benar
c. Probabilitas untuk menolak H0 yang salah √
d. Probabilitas untuk tidak menolak H0 yang salah

9. Koreksi populasi berhingga tidak digunakan pada …


a. Sampling dengan pengembalian
b. Sampling tanpa pengembalian
c. A dan B benar √
d. A dan B salah

10. Peneliti membuka kesempatan dengan mengumumkan penarikan sampel di media massa,
sehingga responden mendaftar menjadi anggota sampel. Teknik sampling tersebut
dinamakan …
a. Self – Selection Sample √ c. Snowball Sample
b. Judgemental Sample d. Quota Sample

11. Antar kelas bersifat homogen dan anggota dalam suatu kelas bersifat heterogen. Disebut
teknik sampling …
a. Systematic Sampling c. Area Sampling
b. Stratified Sampling √ d. Cluster Sampling

12. Distribusi t digunakan pada estimasi interval nilai rerata populasi jika …
a. n besar dan populasi berdistribusi normal
b. n besar dan populasi berdistribusi sembarang
c. n kecil, populasi berdistribusi normal dan σ tidak diketahui √
d. n kecil, populasi berdistribusi normal, dan σ diketahui

13. Misalkan hendak diestimasi rerata tekanan darah atlet peserta Pelatda dengan lebar interval
tidak lebih daripada 20 mm Hg. Apabila diketahui standar deviasi populasinya adalah 40
mm Hg, maka ukuran sampel minimum yang dibutuhkan untuk memperoleh estimasi
interval rerata populasinya dengan tingkat keyakinan 95% adalah …
a. 16 c. 157
b. 62 d. 44

14. Sampel yang baik diperoleh dengan memperhatikan hal-hal berikut, kecuali …
a. Distribusi sampling √
b. Randomness
c. Ukuran
d. Teknik penarikan sampel (sampling)

15. Pada pengujian hipotesis satu rerata sampel dengan hipotesis H0 : μ = μ0, syarat
penggunaan uji t ialah …
a. Ukuran sampel kecil c. Populasi berdistribusi normal
b. Variansi populasi tak diketahui d. Semuanya benar √

16. Pada uji Z terhadap rerata satu populasi dengan hipotesis nol H0 : μ ≥ μ0, maka daerah
kritisnya (daerah penolakan) terletak pada …
a. Ekor kiri dan kanan distribusi sampling statistik penguji √
b. Ekor kanan distribusi sampling statistik penguji
c. Ekor kiri distribusi sampling statistik penguji
d. Semuanya salah

17. Dari 150 orang mahasiswa yang dipilih secara acak, 44 orang berkaca mata untuk melihat
jauh. Interval konfidensi 95%, proporsi mahasiswa yang berkaca mata adalah …
a. 0,197 < P < 0,389 c. 0,232 < P < 0,354
b. 0,220 < P < 0,366 d. 0,246 < P < 0,341

18. Pada soal no. 17 di atas, apabila dengan tingkat keyakinan yang sama diinginkan lebar
estimasi yang tidak lebih daripada 12%, ukuran sampel minimum yang dibutuhkan adalah …
a. 222 c. 95
b. 381 d. 155

Untuk soal No. 19 s/d 20:


Sebuah penelitian dilakukan untuk membandingkan keterampilan bermain musik siswa
perkotaan dan pedesaan. Dua sampel acak diambil masing-masing dari populasi siswa SLTP
perkotaan dan pedesaan. Hasil tes mereka adalah sebagai berikut (diasumsikan σ1² ≠ σ2²)

Perkotaan Pedesaan

Ukuran sampel 100 90


Rerata 81,2 76,4
SD 7,6 8,2

19. Uji statistik yang relevan untuk menilai ada tidaknya perbedaan keterampilan bermain
musik siswa perkotaan dan pedesaan adalah
a. Uji t berpasangan c. uji Z
b. Uji t independen d. Semuanya salah

20. Besar statistik pengujinya adalah


a. 0,58 c. 1,56
b. 4,17 d. 2,45

1. Pada sampel acak 100 orang usia kerja disebuah kecamatan


didapatkan 25 orang penganggur. Dengan tingkat keyakinan 99%, hitunglah interval konfidensi
tingkat pengangguran di kecamatan tersebut: 13,85% < P < 36,15%

2. Misalkan hendak diestimasi proporsi keluarga yang


memiliki rumah sendiri di kota Depok dengan tingkat
keyakinan 95% dan lebar estimasi tidak melebihi 10%,
maka ukuran sampel minimum yang dibutuhkan adalah: 385

3. Misalkan dimiliki data proporsi dengan proporsi sampel


sebesar p dan ukuran sampel n. Pada uji hipotesis Ho:P=Po,
estimator standar error p yang digunakan untuk menghitung
statistik penguji adalah: SE (P) = (pq)n;q=1-p

4. Pada data soal No. 3 diatas, apabila n<<N (N adalah


ukuran populasi), estimasi standard error p yang digunakan
untuk menghitung estimatornya interval proporsi populasi
P adalah: SE(P)=np0q ; q0=1-p0

5. Interval konfidensi 95% proporsi lulusan Universitas


Gunadarma yang berhasil memperoleh pekerjaan dalam
tahun pertama setelah lulus adalah [64% ; 78%]. Uji 2-sisi
terhadap Ho akan menghasilkan kesimpulan: H0 : tidak ditolak pada a = 0,05

6. Data lampau menunjukkan bahwa persentase rabun jauh di


antara pemuda seusia mahasiswa adalah 20%. Untuk
membuktikan adanya peningkatan persentase rabun jauh
pada populasi mahasiswa, hipotesis nol yang perlu diuji
adalah: H0 : P< 0,20

7. Dengan tingkat signifikansi c=0.05, daerah kritis untuk uji


hipotesis pada soal No. 6 tersebut adalah: Z > 1,96

8. Jika di antara sampel acak berupa 100 orang mahasiswa


didapatkan 25 penderita rabun jauh, kesimpulan yang
diperoleh untuk uji hipotesis pada soal No. 6 dan 7 yaitu: H0 : ditolak

9. Untuk menguji proporsi kepuasan mahasiswa, hipotesis nol


yang relevan adalah : p > 90%

10. Statistik pengujinya adalah.. Z uji = -0,179

11. Dengan tingkat signifikansi q=0.05 dan uji satu sisi: H0: ditolak

12. Interval konfidensi 90% untuk persentase mahasiswa


Gunadarma yang merasa puas dengan pengajaran yang
diperolehnya adalah: 84,60% < p < 91,40%

13. Dari 150 orang mahasiswa yang dipilih secara acak, 44


orang berkaca mata untuk melihat jauh. Interval konfidensi
95% proporsi mahasiswa yang berkaca mata adalah: 0,232 < p < 0,354

14. Pada soal No. 13 di atas, apabila dengan tingkat keyakinan


yang sama diinginkan lebar estimasi yang tidak lebih
daripada 12%, ukuran sampel minimum yang dibutuhkan
adalah: 95
SOAL DAN JAWABAN KUIS

A. Isian Singkat (45 POIN)


1. Nilai dari Z 1,89 adalah ... (0,4706)
2. Berapa banyak sampel yang dibutuhkan jika populasi berjumlah 1200 dengan
rumus Krejcie-Morgan... (291)
3. Metode yang berkaitan dengn pengumpulan dan penyajian data adalah
statistika ...... (deskriptif)
4. Sampel dianggap besar apabila berjumlah... (kurang dari 30) dan harus
menggunakan distribusi tabel … (t)
5. Penolakan hipotesis nol yang benar merupakan galat jenis .... (1) yang dinotasikan
sebagai .... (Alpha)
6. Arti dari tanda σ adalah ...... (standar deviasi)
7. Sebuah perusahaan minyak goreng rata-rata setiap hari menghasilkan 50 juta
kemasan minyak goreng. Rata-rata isi setiap kemasan adalah 500 ml dengan
standar deviasi 15 ml. Rata-rata populasi dianggap menyebar normal. Hitunglah
galat baku jika setiap hari diambil 50 kemasan sebagai sampel acak dengan
pemulihan. Soal ini dikerjakan dengan rumus dalil (dalil 1), karena (sampel
berukuran besar ≥30, diambil dengan pemulihan)
8. Nilai yang menyatakan sampel disebut ..... (statistik)
9. Teknik pengambilan sampel yang populasinya terdiri dari beberapa kelas atau
kelompok, sifat antar kelompok cenderung homogen, sedangkan antar anggota
kelompok bersifat heterogeny adalah teknik..... (cluster sampling)
10. Pada pengujian hipotesis dengan uji ..... (2) arah, nilai α dibagi dua karena
diletakkan di kedua sisi selang.
11. Diketahui daerah penolakan Ho adalah t < -3.5 dan t > 3.5. Jika hasil statistik hitung
= 5.5, maka kesimpulan yang didapatkan yaitu Hipotesis nol (Ho) ....... (ditolak)
12. Salah satu dari teknik pengambilan sampel acak sederhana adalah (…………) (simple
random sampling, stratified sampling, systematic sampling, cluster sampling).
13. Pada pendugaan parameter, jika nilai σ2 tidak ada maka dapat diganti dengan
nilai ... (s2)
14. Rumus pendugaan 1 nilai rata-rata sampel besar adalah...

𝜎 𝜎
𝑥̅ − (𝑧𝛼 × ) < 𝜇 < 𝑥̅ + (𝑧𝛼 × )
2 √𝑛 2 √𝑛
15. D melakukan pengujian hipotesis dengan SPSS. D mendapatkan bahwa nilai
signifikansi dari penelitiannya adalah sebesar 0.000. Kesimpulan dari hasil uji
hipotesis D adalah… (Ho tolak dan H1 diterima)

B. Esai
1. Dari 550 karyawan diketahui skor rata-rata kinerjanya adalah 90 dengan ragam
729. Jika akan diambil 150 orang karyawan sebagai sampel acak dengan pemulihan
dan rata-rata skor kinerjanya diasumsikan berdistribusi normal, Hitunglah: (30
POIN)
a. Galat Baku (signifikansi 1 angka dibelakang koma)
b. Peluang rata-rata skor lebih dari 95 (signifikansi 2 angka dibelakang
koma)
c. Gambarkan kurvanya

Diketahui:

• N = 550
• µ = 90
• σ2 = 729 σ = √729 = 27
• n = 150

Ditanya:

a. 𝜎𝑥̅
b. P( 𝑥̅ > 92) = P(Z > ? )
c. Kurva

Jawab:
a. Galat baku

𝜎 27 27
𝜎𝑥̅ = = = = 𝟐, 𝟐
√𝑛 √150 12,25
b. Peluang rata-rata skor lebih dari 95.
P( 𝑥̅ > 92) = P(Z > ? )

𝑥̅ − 𝜇 95 − 90 5
𝒛= 𝜎 = = = 𝟐, 𝟐𝟕
2,2 2,2
√𝑛
P (Z > 2,27) = 0,5 – 0,4884 = 0,0116
= 0,0116 x 100% = 1,16%

c. Gambarkan kurvanya.

0,0446

0,4554

82 85
Jawaban Latihan Ujian

JAWABAN LATIHAN UJIAN AKHIR


STATISTIKA DAN PROBABILITAS
PROGRAM SARMAG TEKNIK SIPIL
TA 2010/2011

1. Ukuran-ukuran tertentu yang mendeskripsikan karakteristik suatu populasi, yang


nilai sesungguhnya umumnya tidak diketahui dengan pasti dinamakan:
Jawab: B. Parameter.
Penjelasan: Ukuran-ukuran tertentu yang mendeskripsikan karakteristik suatu
populasi dinamakan parameter. Populasi yang dipelajari dalam Statistika umumnya
adalah populasi tak berhingga, sehingga nilai parameter sesungguhnya tidak pernah
diketahui.

2. Ukuran-ukuran tertentu yang nilainya diperoleh dari sampel dinamakan:


Jawab: A. Statistik.
Penjelasan: Sebagai penaksir (estimator) bagi nilai parameter populasi (lihat
jawaban soal nomor 1) digunakan ukuran yang diperoleh dari sampel, yang
dinamakan statistik.

3. Cabang Statistika yang mempelajari tentang metode untuk menggeneralisasikan


hasil temuannya terhadap kelompok objek yang lebih luas dinamakan:
Jawab: D. Statistika inferensi.
Penjelasan: Dalam Statistika inferensi, dilakukan pengambilan sampel dan
dengan mengolah serta menganalisis data yang diperoleh dari sampel dapat ditarik
berbagai kesimpulan mengenai karakteristik populasi, atas dasar anggapan bahwa
karakteristik sampel yang diperoleh secara acak (random) merepresentasikan
karakteristik populasi yang hendak dipelajari.

4. Yang tergolong dalam data kualitatif ialah:


Jawab: A. Data nominal dan ordinal.
Penjelasan: Berdasarkan skala pengukurannya, data dibedakan atas data
nominal, data ordinal, data interval, dan data rasio. Data nominal dan ordinal
tergolong dalam data kualitatif (kategorik), karena hanya menyatakan kategori
subjek yang dipelajari.

5. Yang tergolong dalam data kuantitatif ialah:


Jawab: B. Data interval dan rasio.

1
Jawaban Latihan Ujian

Penjelasan: Data interval dan rasio (lihat jawaban soal nomor 6) tergolong dalam
data kuantitatif (numerik), karena menyatakan nilai-nilai numerik untuk
karakteristik subjek yang dipelajari.

6. Contoh data diskret di antara yang tersebut di bawah ini yaitu:


Jawab: C. Jumlah motor yang diparkir setiap hari di halaman kampus
Gunadarma Pondokcina
Penjelasan: Data diskret adalah data yang diperoleh dengan ‘pencacahan’,
sehingga menghasilkan nilai-nilai diskret (bilangan bulat dan non-negatif).
Jawaban:
A) Lama hidup tikus percobaan yang telah diangkat kelenjar anak ginjalnya,
B) Curah hujan tahunan di kota Jakarta, dan
D) Biaya hidup rata-rata bulanan mahasiswa Gunadarma,
adalah data yang diperoleh melalui ‘pengukuran’, sehingga menghasilkan nilai-nilai
kontinu (lihat juga jawaban soal nomor 7).

7. Contoh data kontinu di antara yang tersebut di bawah ini yaitu:


Jawab: C. Nilai tes esai bahasa Inggris mahasiswa .
Penjelasan: Data kontinu adalah data yang diperoleh melalui ‘pengukuran’,
sehingga menghasilkan nilai-nilai kontinu (dapat terletak di setiap
titik pada garis bilangan). Jawaban:
A) Jumlah gigi sehat tanpa karies pada anak TK,
B) Banyak peluru kendali yang ditembakkan pasukan koalisi per hari selama
Perang Teluk I, dan
D) Jumlah kematian akibat kecelakaan lalu lintas per bulan di jalan tol
Jagorawi,
adalah data yang diperoleh dengan ‘mencacah’, sehingga menghasilkan data diskret
(lihat jawaban soal nomor 6).

8. Data yang diperoleh langsung dari subjek yang ingin diketahui karakteristiknya
dinamakan:
Jawab: C. Data primer.
Penjelasan: Data primer adalah data yang langsung diperoleh dari subjek yang
hendak dipelajari (lihat juga jawaban soal nomor 9).

9. Data yang diperoleh dari pihak ketiga, yang biasanya telah dikumpulkan
sebelumnya untuk keperluan lain dari subjek yang hendak dipelajari dinamakan:
Jawab: D. Data sekunder.

2
Jawaban Latihan Ujian

Penjelasan: Data yang tidak diperoleh langsung dari subjek yang hendak
dipelajari, melainkan dari sumber data lain yang telah mengumpulkannya terlebih
dahulu untuk keperluan berbeda, disebut sebagai data sekunder (lihat juga jawaban
soal nomor 8).

10. Luas lantai berbagai tipe rumah di sebuah real estate merupakan contoh data:
Jawab: D. Rasio.
Penjelasan: Lihat kembali sifat-sifat data nominal, ordinal, interval, dan rasio pada
matriks 1.1 serta algoritma untuk menentukan skala pengukuran pada Lampiran 1B
dalam buku teks. Luas lantai dinyatakan dalam angka (numerik) dan memiliki nol
mutlak (selalu bernilai non-negatif), sehingga tergolong dalam data rasio.

11. Jumlah halaman pada buku-buku di sebuah perpustakaan merupakan contoh data:
Jawab: C. Rasio dan diskret.
Penjelasan: Jumlah halaman buku adalah data rasio (berupa angka dan memiliki
nol mutlak) yang bersifat diskret (diperoleh dengan mencacah).

12. Nilai IPK mahasiswa semester akhir Gunadarma merupakan contoh data:
Jawab: D. Rasio dan kontinu.
Penjelasan: Nilai IPK adalah data rasio (berupa angka dan memiliki nol mutlak)
yang bersifat kontinu (nilainya dapat terletak di setiap titik pada garis bilangan)

13. Contoh di bawah ini merupakan data berskala ordinal, kecuali:


Jawab: A. Jenis kelamin subjek.
Penjelasan: Jenis kelamin adalah data dikotomi (binomial), sehingga tergolong
dalam data nominal (tidak mungkin memiliki urutan / orde). Jawaban:
B) Kelompok usia subjek,
C) Golongan kepangkatan pada PNS, dan
D) Status sosial-ekonomi responden,
seluruhnya adalah data ordinal (trikotomi atau politomi serta memiliki urutan /
orde).

14. Contoh berikut adalah data berskala interval, kecuali:


Jawab: C. Usia penduduk Desa Tamansari pada HUT terakhirnya.
Penjelasan: Tanggal lahir / HUT adalah data interval (pada penanggalan tidak ada
titik waktu nol mutlak), tetapi usia adalah data rasio (tidak ada usia negatif).

3
Jawaban Latihan Ujian

15. Contoh data berskala rasio di antara pilihan di bawah ini adalah:
Jawab: C. Suhu dalam skala Kelvin.
Penjelasan: Suhu dalam skala Celsius dan Fahrenheit (serta Reaumur) adalah data
interval (mungkin bernilai negatif), tetapi suhu dalam skala Kelvin adalah data rasio
(memiliki titik nol mutlak).

16. Pilihlah pernyataan yang benar:


Jawab: A. Semua sifat skala interval dimiliki oleh skala rasio.
Penjelasan: Semua sifat yang ada pada skala pengukuran yang lebih rendah akan
dimiliki pula oleh skala pengukuran yang lebih tinggi (lihat kembali ringkasan sifat-
sifat keempat skala pengukuran pada matriks 1.1 dalam buku teks).

17. Yang tidak benar di antara pernyataan berikut ialah:


n n n
Jawab: C. ∑ ( xi . y i ) = ∑ xi ∑ y i .
i =1 i =1 i =1

Penjelasan: Sumasi perkalian dua variabel tidak sama dengan perkalian dua
sumasi variabel. Jawaban:
n
A) ∑k = n k
i =1
; k konstante ,
n n
B) ∑ k xi = k ∑ xi , dan
i =1 i =1
n n n
D) ∑( x
i =1
i + y i ) = ∑ xi + ∑ y i ,
i =1 i =1
merupakan sifat-sifat dasar bagi notasi sigma.

18. Sebuah tabel yang lengkap sekurang-sekurangnya terdiri atas:


Jawab: C. Judul tabel, stub, column caption, body.
Penjelasan: Lihat Lampiran 2A: Bagian-bagian tabel pada buku teks.

19. Tabel yang baik ialah tabel yang:


Jawab: C. bersifat self-explanatory dan sederhana.
Penjelasan: Tabel yang baik harus bersifat self-explanatory1, yaitu dapat dipahami
oleh pembaca tanpa harus menelusuri narasinya secara lengkap. Adakalanya tidak
dapat dihindari penyajian tabel yang bersifat kompleks misalnya master table,
namun secara umum tabel yang baik adalah tabel yang bersifat sederhana.

4
Jawaban Latihan Ujian

20. Dari grafik di bawah ini dapat disimpulkan bahwa:

20 −
Diagram. Jumlah penjualan komputer
15 − di Toko A, B, dan C
Agustus 2000
10 −

5
A B C
Jawab: D. A) dan B) salah:
A) Jumlah penjualan di Toko B kurang lebih dua kali
penjualan di Toko A.
B) Jumlah penjualan di Toko A kurang lebih sepertiga penjualan di
Toko C.
Penjelasan: Grafik di atas merupakan salah satu bentuk penyajian yang tidak
dianjurkan untuk dipergunakan (buku: How to lie with Statistics), karena baik
disengaja ataupun tidak, dapat mengecoh pembaca. Perhatikan bahwa titik awal
pada sumbu tegak bukan 0, melainkan 5.

21. Jumlah seluruh angka data dalam kelompoknya dibagi dengan banyaknya data
disebut:
Jawab: A. Rerata hitung (arithmetic mean)

Penjelasan: Rumus rerata hitung: x = ∑ xi n ; rerata geometrik:


log GM = ∑ log xi n , rerata harmonik: 1 HM = ∑ [ 1 xi ] n ; dan rerata terpangkas
adalah rerata data yang telah diurutkan dan dipangkas 10% nilai terendah serta 10%
nilai tertinggi-nya.

22. Jika setengah di antara seluruh observasi nilai-nilainya lebih kecil daripada suatu
nilai tertentu, dan setengah observasi lainnya nilai-nilainya lebih besar daripada
nilai tertentu tersebut, nilai tertentu itu adalah:
Jawab: B. Median.
Penjelasan: Median adalah nilai yang terletak ditengah-tengah kumpulan data
yang telah diurutkan menurut besarnya.

23. Variansi (data tersebar) bagi populasi berhingga adalah:


Jawab: B. Rata-rata kuadrat deviasi data observasi terhadap rerata-nya
Penjelasan: Rumus definisi variansi data tersebar bagi populasi berhingga adalah
Var ( X ) = ∑ ( X i − µ ) N .
2

5
Jawaban Latihan Ujian

n
24. ∑( x
i =1
i − x)

Jawab: B. Selalu sama dengan nol


Penjelasan: Lihat kembali Lampiran 3C.

∑( x − x) =
2
25. i
i =1
2
 n 
Jawab: C. n 2  ∑
 xi 
∑ xi − i =1 
i =1 n

Penjelasan: Lihat kembali Lampiran 3C:


n n  n  2  n 2
∑ ( xi − x ) = ∑ xi −  ∑ xi  n  = ∑ xi − n x 2 .
2 2

i =1 i =1  i =1   i =1

Untuk soal nomor 26 s.d. 28:

Diketahui data hasil ujian Ilmu Alamiah Dasar sekelompok mahasiswa sebagai
berikut: 72, 86, 63, 59, 74, 67, 74, 77, 63, 74, 82, 67.

26. Rerata-nya (mean) ialah:


Jawab: A. 71.50
Penjelasan:
12
n = 12 ∑x = x + x
i =1
i 1 2 + ... + x12 = 72 + 86 + . . . + 67 = 858
12

∑x i
=
858
= 71.50
x= i =1
12
12

27. Mediannya adalah:


Jawab: B. 73.00
Penjelasan: Array: 59, 63, 63, 67, 67, 72, 74, 74, 74, 77, 82, 86
Karena n = 12 genap, median (cara eksak) adalah:
x 6 + x( 7 )
Med = ( )
2
72 + 74
= = 73.00
2

6
Jawaban Latihan Ujian

n
28. Jika diketahui ∑x
i =1
2
i = 62, 058 , dengan menggunakan pembagi ( n −1) hitunglah

variansi dan standar deviasinya:


Jawab: B. 64.64 dan 8.04
Penjelasan:
∑ x −( ∑ x )
2
2
n 62, 058 − 8582 12
Var ( x ) = i i
= = 64.64
n −1 12 − 1
SD ( x ) = Var ( x ) = 64.64 = 8.04

Untuk soal nomor 29 dan 30:

Misalkan dimiliki data hasil ujian Statistika 10 orang mahasiswa: 75, 40, 80, 55, 90,
70, 55, 60, 60, 55.

29. Rerata data tersebut adalah:


Jawab: C. 64

Penjelasan:
10
n = 10 ∑x = x + x
i =1
i 1 2 + ... + x10 = 75 + 40 + . . . + 55 = 640
10

∑x i
=
640
= 64
x= i =1
10
10

30. Median data tersebut adalah:


Jawab: B. 60

Penjelasan:
Array: 40, 55, 55, 55, 60, 60, 70, 75, 80, 90.
n = 10 (genap)
x( 5) + x( 6 ) 60 + 60
Med = = = 60
2 2

31. Anggota himpunan gabungan (union) dua peristiwa A, B adalah:

Jawab: D. Semuanya benar:


A) Unsur yang termasuk dalam A
B) Unsur yang termasuk dalam B
C) Unsur yang termasuk dalam keduanya

7
Jawaban Latihan Ujian

Penjelasan: Anggota himpunan gabungan (union) dua peristiwa A, B mencakup


unsur-unsur yang termasuk dalam A, termasuk dalam B, dan termasuk dalam
keduanya.

32. Anggota himpunan irisan (interseksi) A, B adalah:


Jawab: C. Unsur yang termasuk dalam keduanya
Penjelasan: Anggota himpunan irisan (interseksi) A, B mencakup hanya unsur
yang termasuk dalam A dan B sekaligus.

33. Sebuah dadu yang setimbang dilemparkan dua kali berturut-turut. Probabilitas
untuk mendapatkan jumlah angka 7 pada kedua pelemparan adalah:

11 1
Jawab: C. 6     =
66 6

Penjelasan: Ada 6 cara untuk mendapatkan jumlah angka 7 pada kedua


pelemparan:
(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), dan (6, 1)
Masing-masing memiliki probabilitas sebesar (1/6)(1/6) untuk terjadi, sehingga
probabilitas untuk mendapatkan jumlah angka 7 pada kedua pelemparan adalah:
11 1
6   =
66 6

34. Sebuah dadu dan sebuah mata uang, keduanya setimbang, dilemparkan bersama-
sama. Probabilitas untuk mendapatkan angka lebih besar daripada 4 pada dadu dan
sisi belakang mata uang bersama-sama adalah:

2 1 1
Jawab: D. . =
6 2 6

Penjelasan: Probabilitas untuk mendapatkan angka lebih besar daripada 4 pada


dadu, yaitu {5, 6} adalah 2/6, sedangkan probabilitas untuk mendapatkan sisi
belakang mata uang adalah 1/2. Keduanya merupakan peristiwa saling independen,
sehingga probabilitas keduanya untuk terjadi bersama-sama adalah:
2 1 1
. =
6 2 6

35. Tiga buah lampu tanda darurat masing-masing mempunyai probabilitas 0.7 akan
menyala. Dengan anggapan ketiga lampu itu menyala secara independen, maka
probabilitas bahwa ketiganya menyala adalah:
Jawab: B. 0.343
Penjelasan: Probabilitas tiga peristiwa yang saling independen untuk terjadi
bersama-sama dapat dihitung dengan hukum perkalian:
(0.7)(0.7)(0.7) = 0.73 = 0.343

8
Jawaban Latihan Ujian

36. Kurve normal memiliki sifat-sifat berikut, kecuali:

Jawab: B. Mempunyai titik belok pada x = µ + 2σ

Penjelasan: Kurve normal simetris terhadap sumbu vertikal melalui µ ,


mempunyai titik belok pada x = µ + σ , dan memotong sumbu horizontal secara
asimptotis.

37. Jika pada suatu distribusi diketahui bahwa rerata, median, dan modusnya berimpit,
maka distribusi tersebut:

Jawab: A. Belum tentu berdistribusi normal

Penjelasan: Pada distribusi normal, rerata, median, dan modusnya berimpit,


sebaliknya distribusi dengan rerata, median, dan modus berimpit adalah distribusi
simetris, tetapi belum tentu berdistribusi normal.

38. Pada kurve normal berlaku:

Jawab: D. A) dan C) benar:


A) P [ | X| < x + σ ] ≈ 68%.
C) P [ µ − 2σ < X < µ + 2σ ] ≈ 95%

Penjelasan: Pada kurve normal: P [ | X| < x + σ ] ≈ 68%; P [ µ − 2σ < X < µ +


2σ ] ≈ 95%; dan P [ µ − 3σ < X < µ + 3σ ] ≈ 99%.

39. Distribusi t (Student's t) memiliki sifat:


Jawab: B. Nilai-nilainya lebih menyebar dibandingkan dengan distribusi Z
Penjelasan: Kurve distribusi t ekornya lebih tebal daripada distribusi Z, nilai-
nilainya lebih menyebar dibandingkan distribusi Z, selain itu distribusi
probabilitasnya secara praktis dapat dianggap sama dengan distribusi Z pada derajat
bebas lebih besar daripada 30.

40. Jika distribusi populasi adalah normal, maka distribusi sampling nilai rerata-nya:
Jawab: A. Selalu berdistribusi normal.
Penjelasan: Jika distribusi parental X normal, maka distribusi sampling X akan
selalu berdistribusi normal, tak tergantung pada ukuran sampel (lihat matriks 1 pada
Lampiran 6A).

41. Jika distribusi populasi sebarang, maka distribusi sampling nilai rerata-nya:
Jawab: B. Dapat berdistribusi normal jika ukuran sampelnya besar.

9
Jawaban Latihan Ujian

Penjelasan: Jika distribusi parental X adalah normal, maka distribusi sampling X


tergantung pada ukuran sampelnya: berdistribusi normal jika ukuran sampel besar
dan tak diketahui distribusinya jika ukuran sampel kecil (lihat matriks 1 pada
Lampiran 6A).
42. Persyaratan agar teorema limit pusat yang menyatakan bahwa distribusi sampling
nilai rerata berdistribusi normal dengan rerata µ dan variansi σ 2/n berlaku antara
lain yaitu:
Jawab: B. Nilai n besar.
Penjelasan: Pernyataan di atas berlaku jika nilai n besar dan pengambilan sampel
dengan pengembalian.

43. Manfaat sampling antara lain yaitu:


Jawab: D. Semuanya benar:
A) Mengurangi jumlah data yang dibutuhkan.
B) Mempersingkat jangka waktu penelitian.
C) Mengefisienkan penggunakan dana / sumber daya lainnya.
Penjelasan: Ketiga jawaban A), B), dan C) merupakan manfaat sampling.

44. Validitas data antara lain ditentukan oleh faktor berikut, kecuali:
Jawab: D. Semua faktor di atas ikut menentukan validitas data:
A) Subjek / objek yang diukur
B) Instrumen pengukuran
C) Subjek pelaku pengukuran
Penjelasan: Semua faktor yang dinyatakan pada jawaban A), B), dan C) tanpa
kecuali ikut menentukan validitas data.

45. Data yang ‘bias’ adalah data yang:


Jawab: A. Tidak menyatakan keadaan yang sesungguhnya hendak diukur.
Penjelasan: Data yang ‘bias’ adalah data yang tidak valid ataupun validitasnya
kurang, yaitu tidak menyatakan keadaan yang sesungguhnya hendak diukur.

46. Kumpulan elemen yang ‘terdaftar’ sebagai calon anggota sampel dinamakan:
Jawab: D. Kerangka sampel.
Penjelasan: Kumpulan elemen yang ‘terdaftar’ sebagai calon anggota sampel
adalah kerangka sampel. Kerangka sampel diharapkan, namun dalam kenyataan
tidak selalu identik dengan populasi aktual, yaitu kumpulan subjek / objek yang
eligibel untuk diikutsertakan dalam penelitian dan proses sampling.

10
Jawaban Latihan Ujian

47. Populasi target adalah:


Jawab: C. Kumpulan subjek / objek yang sebenarnya hendak diestimasi
parameternya.
Penjelasan: Populasi target adalah kumpulan subjek / objek yang menjadi target
penelitian sebenarnya, sehingga parameter populasi inilah yang sebenarnya hendak
diestimasi.

48. Tiap elemen anggota populasi memiliki probabilitas yang pasti sama untuk terpilih
menjadi anggota sampel pada:
Jawab: A. Sampling acak sederhana.
Penjelasan: Probabilitas yang pasti sama untuk terpilih bagi tiap elemen anggota
populasi hanya terjadi pada sampling acak sederhana. Pada sampling acak
stratifikasi, probabilitas terpilih anggota satu stratum belum tentu sama dengan
probabilitas terpilih anggota stratum lainnya, demikian pula pada sampling acak
klaster, probabilitas terpilih anggota satu klaster juga belum tentu sama dengan
probabilitas terpilih anggota klaster lainnya, walaupun demikian probabilitas
tersebut diketahui / ditetapkan oleh peneliti.

49. Yang tidak termasuk dalam sampling probabilitas di antara prosedur sampling
berikut yaitu:
Jawab: A. Sampling purposif (purposive sampling)
Penjelasan: Sampling purposif, kuota, haphazard, dan judgment adalah cara-cara
pengambilan sampel yang tergolong dalam sampling non-probabilitas (lihat matriks
6.1 pada buku teks).

50. Inferensi statistik berlaku secara valid pada penelitian yang menggunakan:
Jawab: B. Sampel acak.
Penjelasan: Inferensi statistik hanya berlaku secara valid pada penarikan sampel
secara objektif atas dasar probabilitas, yaitu pada sampel acak.

51. Pernyataan bahwa interval konfidensi 95% nilai rerata adalah [ yB ; y A ] berarti:

Jawab: D. Yang benar lebih daripada satu:


B) 95% nilai-nilai y berada dalam interval [ yB ; y A ]
C) Pada penarikan sampel berulang, 95% nilai-nilai y akan terletak
dalam interval [ yB ; y A ]

Penjelasan: Pernyataan B) merupakan interpretasi probabilitas terhadap distribusi


sampling y , sedangkan pernyataan C) merujuk pada cara perolehan nilai-nilai y
yang membentuk distribusi sampling tersebut.

11
Jawaban Latihan Ujian

52. Jika dari hasil suatu penelitian, dinyatakan bahwa interval konfidensi 95% nilai
rerata tinggi badan penduduk Indonesia (dalam cm) adalah [145 ; 165], pernyataan
ini berarti:
Jawab: D. Semuanya salah
Penjelasan: Jika suatu interval konfidensi telah dimuati dengan nilai-nilai tertentu,
hanya ada dua kemungkinan: rerata populasi µ terletak dalam rentang interval
tersebut (probabilitas berada dalam interval sama dengan satu) atau berada di luar
rentang tersebut (probabilitas berada dalam interval sama dengan nol). Rerata
populasi µ hanya memiliki probabilitas 95% untuk berada rentang interval
konfidensi 95% selama interval tersebut masih bersifat konseptual dan belum
dimuati dengan nilai-nilai tertentu.

53. Pilihlah pernyataan yang benar:


Jawab: C. Semakin rendah tingkat keyakinan pada pengestimasian interval,
semakin sempit interval estimasinya.
Penjelasan: Lihat diagram 1.2 pada buku teks yang memperlihatkan gambaran
distribusi sampling y serta interval  µ − Zα 2 .SE ( y ) ; µ + Zα 2 .SE ( y )  : Pada
ukuran sampel n yang sama, semakin besar tingkat keyakinan 100 ( 1 − α ) % ,
semakin lebar interval konfidensi, begitu pula sebaliknya. Untuk sifat-sifat
estimator titik, lihat kembali pembahasan pada buku teks.

54. Apabila nilai IPK mahasiswa dianggap berdistribusi normal dan dari hasil proses
sampling diperoleh interval konfidensi 90% nilai IPK lulusan Universitas
Gunadarma adalah [2.20 ; 3.10], maka nilai rerata sampelnya adalah:
Jawab: B. 2.65
Penjelasan: Apabila nilai IPK berdistribusi normal, distribusi sampling nilai rerata
akan selalu normal (simetris), sehingga nilai rerata sampel y terletak tepat di
2.20 + 3.10
tengah interval konfidensi [2.20 ; 3.10], yaitu = 2.65.
2

55. Upaya memperkecil biaya pada proses sampling untuk pengestimasian interval
dapat dilakukan antara lain dengan:
Jawab: B. Menurunkan tingkat keyakinan estimasi
Penjelasan: Upaya memperkecil biaya pada proses sampling adalah dengan
memperkecil ukuran sampel, dan hal ini dapat terlaksana dengan:
a. Memperkecil nilai Zα 2 [menurunkan tingkat keyakinan 100 ( 1 − α ) % ]
b. Memperkecil variansi σ 2 atau s 2 (mencari populasi yang lebih homogen)

12
Jawaban Latihan Ujian

c. Memperbesar lebar interval maksimum I yang diinginkan

[Ingat rumus ukuran sampel minimum pada estimasi interval adalah n = ( α 2 )


2
Z σ2
I2

atau n = ( α 2 )
2
Z s2
]
I2

56. Tingkat signifikansi α adalah:

Jawab: A. Probabilitas untuk menolak H 0 yang benar.

Penjelasan: Tingkat signifikansi α adalah probabilitas untuk menolak H 0 dengan


syarat H 0 benar (lihat kembali pembahasan pada buku teks, serta diagram 1.3 dan
matriks 1.2).

57. Kesalahan tipe II adalah:

Jawab: D. Probabilitas untuk tidak menolak H 0 yang salah.

Penjelasan: Kesalahan tipe II atau β adalah probabilitas untuk tidak menolak H 0 ,


dengan syarat H 0 salah ( H A yang benar). Perhatikan bahwa kesalahan tipe II atau
β hanya dapat ditentukan ataupun dihitung jika nilai parameter menurut hipotesis
alternatif ditentukan secara spesifik (tidak hanya lebih besar daripada; lebih kecil
daripada; ataupun tidak sama dengan nilai menurut hipotesis nol).

58. Kekuatan uji statistik (1 – β ) adalah:

Jawab: C. Probabilitas untuk menolak H 0 yang salah.

Penjelasan: Kekuatan uji statistik (1 – β ) adalah probabilitas untuk menolak H 0 ,


dengan syarat H 0 salah (lihat juga jawaban untuk soal No. 2).

59. Pernyataan yang benar mengenai α (kesalahan tipe I), β (kesalahan tipe II), dan
kekuatan uji (power) pada ukuran sampel yang sama adalah:
Jawab: D. Yang benar lebih daripada satu:
A) Semakin besar nilai α , semakin kecil nilai β
C) Semakin kecil nilai α , semakin kecil nilai kekuatan uji
Penjelasan: Baik diagram 1.3, 1.4, ataupun 1.5 dapat dilihat bahwa pergeseran
titik kritis c ke kanan akan memperkecil nilai α , namun memperbesar nilai β
serta memperkecil nilai kekuatan uji (1 - β ), demikian pula sebaliknya:
Pergeseran titik kritis c ke kiri akan memperbesar nilai α , tetapi memperkecil
nilai β

13
Jawaban Latihan Ujian

60. Nilai p (p-value) satu-sisi adalah:


Jawab: B. Probabilitas untuk mendapatkan nilai statistik sebagaimana yang
diperoleh dari data sampel atau lebih ekstrim dengan syarat H 0 benar.

Penjelasan: Lihat diagram 1.6 dan 1.7: Nilai p (satu-sisi) menyatakan luas area di
luar titik statistik penguji pada distribusi sampling H 0 (di sisi ekor yang menjauhi
pusat distribusi). Perhatikan bahwa untuk jawaban A), probabilitas untuk
mendapatkan nilai di satu titik tertentu pada distribusi kontinu selalu sama dengan
nol.

61. Keputusan pada uji hipotesis dengan uji Z 2-sisi jika didapatkan nilai p 1-sisi yang
lebih kecil daripada α , namun lebih besar daripada α 2 ialah:

Jawab: B. H 0 tidak ditolak

Penjelasan: Lihat diagram 1.6: Pada uji hipotesis 2-sisi, daerah penolakan adalah
area seluas α 2 pada ekor kiri dan ekor kanan distribusi H 0 . Apabila nilai p satu-
sisi lebih besar daripada α 2 , statistik penguji akan berada di luar daerah kritis, H 0
tidak ditolak.

62. Uji Z terhadap hipotesis H 0 : µ1 = µ2 menghasilkan penolakan hipotesis nol pada


tingkat signifikansi α = 0.05. Apabila digunakan tingkat signifikansi α = 0.10,
maka:

Jawab: A. H 0 pasti ditolak.

Penjelasan: Hipotesis H 0 : µ1 = µ2 ditolak pada tingkat signifikansi α = 0.05,


berarti statistik penguji Zuji terletak pada daerah penolakan (daerah kritis), yaitu
pada area sebesar 2.5% di sisi kiri ataupun 2.5% di sisi kanan distribusi H 0 .
Memperbesar luas area ini menjadi 5% di sisi kiri atau di sisi kanan ke arah pusat
distribusi (jika digunakan tingkat signifikansi α = 0.10), tidak akan mengubah
posisi statistik penguji yang tetap berada pada daerah penolakan, sehingga H 0 tetap
ditolak.

63. Dalam pengujian statistik yang tidak mencakup penelitian negatif, pernyataan
verbal yang hendak dibuktikan diubah menjadi pernyataan matematik dalam
bentuk:
Jawab: B. Hipotesis alternatif.
Penjelasan: Pada pengujian statistik yang tidak mencakup penelitian negatif,
pernyataan verbal yang hendak dibuktikan selalu dikonversikan menjadi hipotesis

14
Jawaban Latihan Ujian

alternatif (lihat kembali pembahasan dalam Lampiran 1B: Hipotesis penelitian dan
hipotesis statistik).

64. Di antara batu baterei produksi pabrik XYZ, hanya 70% yang memenuhi kualitas
standar. Konsultan pabrik mengajukan hipotesis (verbal) bahwa cara produksi baru
yang disarankannya dapat menghasilkan persentase yang lebih tinggi yang
memenuhi kualitas standar. Pada pengujian statistik, hipotesis verbal yang hendak
dibuktikan ini ditransformasikan menjadi:
Jawab: B. Hipotesis alternatif
Penjelasan: Setiap penggantian cara lama dengan cara baru hanya dapat
dibenarkan jika cara baru itu terbukti lebih baik daripada cara lama, dan dalam uji
hipotesis, pernyataan (untuk dibuktikan) bahwa cara baru lebih baik daripada cara
lama dikonversikan menjadi hipotesis alternatif.

65. Untuk soal No. 64 di atas, pernyataan verbal yang hendak dikaji tersebut dianggap
terbukti kebenarannya jika pada akhir pengujian statistik:

Jawab: A. H 0 ditolak.

Penjelasan: Pernyataan verbal yang ingin dibuktikan dan telah dikonversi menjadi
hipotesis alternatif dianggap terbukti kebenarannya jika pada uji hipotesis, hipotesis
nol ditolak.

66. Apabila efek yang diuji dianggap memiliki nilai penting secara substantif, namun
hasil pengujian ternyata tidak menunjukkan kemaknaan statistik, maka:
Jawab: C. Pengujian secara statistik perlu diulangi dengan ukuran sampel yang
lebih besar.
Penjelasan: Hasil pengujian yang tidak menunjukkan kemaknaan statistik dapat
terjadi karena ukuran sampel yang digunakan terlalu kecil (kekuatan uji terlalu
rendah), karena itu jika efek tersebut dianggap memiliki nilai penting secara
substantif, pengujian secara statistik perlu diulangi dengan ukuran sampel yang
lebih besar.

67. Apabila efek yang diuji bermakna secara statistik, namun secara substantif dianggap
tidak penting, maka:
Jawab: B. Efek tersebut tidak penting, dan hasil uji statistik tidak perlu
diperhatikan.
Penjelasan: ‘Kemaknaan secara substantif’ selalu lebih penting daripada
‘kemaknaan secara statistik’, sehingga efek yang dianggap tidak penting secara
substantif, walaupun hasil ujinya bermakna secara statistik, untuk selanjutnya tidak
perlu diperhatikan lagi.

15
Jawaban Latihan Ujian

68. Dari sampel yang berukuran n = 36 diperoleh interval konfidensi 95% untuk rerata
populasinya adalah 80 < µ < 120, maka bagi nilai rerata sampelnya disimpulkan:

Jawab: B. y = 100

Penjelasan: Karena ukuran sampel besar (n > 30), rerata sampel y berdistribusi
normal (simetris) dan nilai y terletak tepat di tengah-tengah rentang estimasi
intervalnya:
80+120
y = = 100
2

69. Untuk soal No. 68 juga dapat disimpulkan bagi standar deviasi sampelnya:
Jawab: A. s < 80
Penjelasan: Interval konfidensi 95% untuk rerata populasi adalah:
s s
y − Z 0.025 . < µ < y + Z 0.025 .
n n
s s
yaitu: y − (1.96) < µ < y + (1.96)
36 36
sehingga lebar interval konfidensi adalah:
s
(2)(1.96) = 120 – 80 = 40
36
Diperoleh: s = 61.22
(Untuk perhitungan cepat, jika Z 0.025 ≈ 2, maka s ≈ 60)

70. Pada uji Z terhadap rerata satu populasi dengan hipotesis nol H 0 : µ ≥ µ0 , maka
daerah kritisnya (daerah penolakan) terletak pada:
Jawab: A. Ekor kiri distribusi sampling statistik penguji.
Penjelasan: Pada uji Z terhadap rerata satu populasi dengan hipotesis nol
H 0 : µ ≥ µ0 , hipotesis alternatifnya adalah H1 : µ < µ0 dengan daerah kritis terletak
pada ekor kiri distribusi H 0 , yaitu Z < − Zα .

71. Pada uji Z terhadap H 0 : θ ≥ θ 0 vs H1 : θ < θ 0 dengan menggunakan tingkat


signifikansi α = 0.05, daerah kritis (daerah penolakan) uji hipotesis ini adalah:

Jawab: B. Z < − Z 0.05

Penjelasan: Daerah kritis pada uji Z 1-sisi dengan hipotesis alternatif H1 : θ < θ 0
dan tingkat signifikansi α = 0.05 adalah Z < − Zα atau Z < − Z 0.05 .

16
Jawaban Latihan Ujian

72. Interval konfidensi 95% proporsi lulusan Universitas Gunadarma yang berhasil
memperoleh pekerjaan dalam tahun pertama setelah lulus adalah [64% ; 78%]. Uji
2-arah terhadap H 0 : P = 65% akan menghasilkan kesimpulan:

Jawab: C. H 0 tidak ditolak pada α = 0.05

Penjelasan: Hasil estimasi interval dengan tingkat keyakinan 100(1 – α )%


ekivalen dengan uji hipotesis 2-arah pada tingkat signifikansi α . Apabila interval
konfidensi 95% adalah [64% ; 78%], kesimpulan yang dapat dibuat adalah untuk uji
2-sisi dengan tingkat signifikansi α = 0.05, yaitu:
Hipotesis H 0 : P = 65% tidak ditolak, karena nilai P0 = 65% masih berada dalam
rentang interval [64% ; 78%].

73. Ujian tingkat mahir bahasa Inggris yang telah distandardisasi menghasilkan nilai
rerata 62 dengan standar deviasi 12. Kelompok yang terdiri dari 30 orang yang
telah menyelesaikan kursus bahasa Inggris memperoleh nilai rerata 65 untuk ujian
tersebut. Untuk menguji manfaat kursus bahasa Inggris tersebut, hipotesis nol yang
relevan adalah:

Jawab: A. µ < 62
Penjelasan: Kursus yang bermanfaat diharapkan meningkatkan nilai rerata ujian,
sehingga hipotesis alternatif yang perlu dibuktikan ialah H1 : µ > 62, dan hipotesis
nol-nya ialah H 0 : µ < 62.

74. Data lampau menunjukkan bahwa persentase rabun jauh di antara pemuda seusia
mahasiswa adalah 20%. Untuk membuktikan adanya peningkatan persentase rabun
jauh pada populasi mahasiswa, hipotesis nol yang perlu diuji adalah:

Jawab: A. H 0 : P < 0.20

Penjelasan: Untuk membuktikan adanya peningkatan proporsi rabun jauh pada


populasi mahasiswa, hipotesis alternatif-nya adalah H1 : P > 0.20, dan hipotesis nol-
nya adalah H 0 : P < 0.20.

75. Panitia penilai kualitas dosen Universitas Gunadarma menyatakan bahwa 90%
mahasiswa puas dengan pengajaran yang diperolehnya. Tuan Hasan, seorang
aktivis mahasiswa, merasa bahwa pernyataan ini terlalu berlebihan. Untuk menguji
proporsi kepuasan mahasiswa, hipotesis nol yang relevan adalah:
Jawab: C. P > 90%

17
Jawaban Latihan Ujian

Penjelasan: Karena pernyataan bahwa 90% mahasiswa puas dianggap terlalu


berlebihan, hipotesis alternatif yang hendak dibuktikan adalah H1 : P < 90%,
sehingga hipotesis nol-nya adalah H 0 : P > 0.90.

76. Pada penggunaan uji Z bagi kesamaan 2 rerata sampel berukuran besar n1 dan n2 ,
yang dimaksud dengan pernyataan ‘sampel berukuran besar’ ialah:

Jawab: C. n1 > 30 dan n2 > 30

Penjelasan: Pada inferensi statistik selisih rerata dua populasi, normal atau
sebarang, dengan sampel besar dipersyaratkan ukuran sampel masing-masing n1 >
30 dan n2 > 30 (lihat pembahasan pada buku teks, bab 3, subbab 3.1).

77. Pernyataan yang benar mengenai variansi dan SE selisih rerata 2 populasi
independen adalah:

Jawab: B. Var ( y1 − y2 ) = Var ( y1 ) + Var ( y2 )

Penjelasan: Var ( y1 − y2 ) = Var ( y1 ) – 2 Cov ( y1; y2 ) + Var ( y2 ) ;


Cov ( y1; y2 ) menyatakan kovariansi (variansi bersama) y1 dan y2 . Jika y1 dan y2
independen maka Cov ( y1; y2 ) = 0, sehingga:
Var ( y1 − y2 ) = Var ( y1 ) + Var ( y2 ) .
Standard error ( y1 − y2 ) adalah:
SE ( y1 − y2 ) = Var ( y1 − y2 ) = Var ( y1 ) + Var ( y2 )

78. Misalkan dimiliki data sampel acak nilai IQ mahasiswa Fakultas Ilmu Komputer
dan Fakultas Ekonomi Universitas Gunadarma (diasumsikan σ 1 ≠ σ 2 )
2 2

Filkom: n1 = 40 y1 = 131 s1 = 15
FE: n 2 = 36 y2 = 126 s 2 = 17
Jika diperoleh statistik penguji Zuji = 1.35, maka dengan daerah kritis untuk H 0 :
µ1 − µ2 = 0 berupa | Z| > 1.96 untuk tingkat signifikansi α = 0.05, kesimpulan
yang diperoleh yaitu:

Jawab: B. H 0 tidak ditolak

Penjelasan: Dengan α = 0.05, daerah kritis (daerah penolakan) adalah Z < −1.96
atau Z > 1.96. Statistik penguji Zuji = 1.35 tidak terletak pada daerah kritis tersebut,
sehingga H 0 tidak ditolak.

Untuk soal No. 79 dan 80:

18
Jawaban Latihan Ujian

Misalkan dimiliki data sampel acak gaji guru pria dan wanita di suatu daerah
(diasumsikan σ 1 ≠ σ 2 ):
2 2

Pria: n1 = 100 y1 = Rp. 478.928 s1 = Rp. 24.620


Wanita: n 2 = 150 y2 = Rp. 466.150 s 2 = Rp. 20.420

79. Hipotesis nol yang sesuai untuk uji di atas adalah:

Jawab: B. µ1 − µ2 = 0
Penjelasan: Tanpa ada penjelasan lebih lanjut mengenai tujuan penelitian, uji
statistik yang paling relevan di sini adalah uji 2-sisi, yang bertujuan untuk mengkaji
ada tidaknya perbedaan antara rerata gaji guru pria dan gaji guru wanita, dengan
hipotesis H 0 : µ1 − µ2 = 0.

80. Dengan tingkat signifikansi α = 0.05 dan daerah kritis untuk uji 2-sisi adalah | Z|
> 1.96, jika diperoleh statistik penguji Zuji = 4.30, maka kesimpulan yang
diperoleh yaitu:

Jawab: A. H 0 ditolak

Penjelasan: Dengan tingkat signifikansi α = 0.05 (daerah penolakan sebagaimana


pada jawaban soal No. 4), Z uji = 4.30 terletak pada daerah kritis, sehingga hipotesis
H 0 : µ1 − µ2 = 0 ditolak.

Untuk soal No. 81 dan 82:


Untuk membandingkan efektivitas 2 metode pengajaran statistika, 100 orang diajar
dengan cara lama dan 150 orang dengan cara baru. Di antara peserta cara lama, yang
lulus adalah 63 orang, sedangkan peserta cara baru yang lulus berjumlah 107 orang.

81. Hipotesis nol yang perlu diuji untuk membuktikan efektivitas metode pengajaran
dengan cara baru itu ialah ( P1 menyatakan proporsi yang lulus pada cara baru dan
P2 pada cara lama):

Jawab: D. H 0 : P1 < P2

Penjelasan: Setiap cara baru dalam bidang apapun penerapannya hanya boleh
dilakukan apabila telah terbukti lebih baik daripada cara lama, karena itu hipotesis
alternatif yang harus dibuktikan adalah H1 : P1 > P2 (proporsi yang lulus dengan
cara baru lebih besar daripada proporsi yang lulus dengan cara lama), sehingga
hipotesis nol-nya adalah H 0 : P1 < P2 .

19
Jawaban Latihan Ujian

82. Jika daerah kritis untuk uji hipotesis tersebut adalah Z > 1.64 untuk α = 0.05 dan Z
> 1.28 untuk α = 0.10, sedangkan statistik penguji untuk uji hipotesis tersebut
adalah Zuji = 1.37, maka kesimpulan yang diperoleh adalah:

Jawab: B. Ditemukan peningkatan efektivitas pada metode pengajaran dengan


cara baru yang bermakna secara statistik pada tingkat signifikansi α =
0.10

Penjelasan:
- Dengan α = 0.05, daerah kritis adalah Z > 1.64 ( Zuji = 1.37 tidak terletak pada
daerah kritis), sehingga H 0 : P1 < P2 tidak ditolak, berarti:
‘Tidak ditemukan peningkatan efektivitas pada metode pengajaran dengan cara
baru yang bermakna secara statistik pada tingkat signifikansi α = 0.05’
- Dengan α = 0.10, daerah kritis adalah Z > 1.28 ( Zuji = 1.37 terletak pada
daerah kritis), sehingga H 0 : P1 < P2 ditolak, berarti:
‘Ditemukan peningkatan efektivitas pada metode pengajaran dengan cara baru
yang bermakna secara statistik pada tingkat signifikansi α = 0.10’

83. Pada uji khi-kuadrat terhadap tabel kontijensi r × c (r baris dan c kolom), statistik
penguji yang dihasilkan memiliki derajat bebas sebesar:

Jawab: C. (r – 1) × (c – 1)

Penjelasan: Derajat bebas untuk tabel kontijensi r × c adalah (r – 1) × (c – 1).

84. Frekuensi harapan pada tabel r × c menyatakan:


Jawab: B. Frekuensi yang diharapkan akan terjadi jika variabel baris tidak
memiliki asosiasi dengan variabel kolom.
Penjelasan: Frekuensi harapan adalah frekuensi yang diharapkan akan terjadi jika
hipotesis nol benar, yaitu jika tidak ada asosiasi antara variabel baris dengan
variabel kolom (atau: variabel baris dan variabel kolom saling independen).

Untuk soal No. 85 s.d. 87:


Untuk menguji kebenaran dugaan bahwa kelompok orang usia lanjut lebih sedikit
tidurnya dibandingkan kelompok orang usia muda, diambil sampel acak 250 orang
berusia 30-40 tahun dan 250 orang berusia 60-70 tahun, lalu ditanyakan kebiasaan
tidurnya. Hasilnya adalah sebagai berikut:

Jam tidur Umur (tahun)


(jam/hari) 30-40 60-70
<8 172 120
>8 78 130

20
Jawaban Latihan Ujian

85. Uji statistik untuk data di atas tergolong dalam:


Jawab: B. Uji homogenitas
Penjelasan: Data di sini diperoleh dari 2 sampel, yaitu 250 orang berusia 30-40
tahun dan 250 orang berusia 60-70 tahun, sehingga uji statistik yang diperlukan
adalah uji homogenitas proporsi / kesamaan proporsi antara 2 sampel.

86. Jika P1 menyatakan proporsi orang usia muda yang tidurnya kurang daripada 8
jam/hari, dan P2 menyatakan proporsi hal yang sama pada orang usia lanjut, maka
dengan menggunakan uji khi-kuadrat untuk data di atas, hipotesis yang diuji ialah:

Jawab: B. H 0 : P1 = P2

Penjelasan: Pada uji Z untuk kesamaan proporsi, konversi dugaan yang hendak
dibuktikan bahwa kelompok orang usia lanjut lebih sedikit tidurnya dibandingkan
kelompok orang usia muda menjadi hipotesis alternatif menghasilkan H1 : P1 < P2 ,
sehingga hipotesis nol-nya adalah H 0 : P1 ≥ P2 , namun uji khi-kuadrat untuk tabel
kontijensi selalu merupakan uji 2-sisi (tetapi 1-ekor), sehingga hipotesis nol-nya
adalah H 0 : P1 = P2 .

87. Statistik penguji untuk data di atas besarnya adalah 22.26 dengan derajat bebas 1.
Dengan nilai kritis 3.84 untuk tingkat signifikansi α = 5%, kesimpulan yang
diperoleh yaitu:
Jawab: A. Pada tingkat signifikansi 5%, terdapat perbedaan proporsi individu
yang tidur lebih sedikit yang bermakna secara statistik di antara
kelompok usia muda dan kelompok usia lanjut.

Penjelasan: Pada tingkat signifikansi 5%, statistik penguji Wuji = 22.26 terletak
pada daerah kritis, sehingga hipotesis H 0 : P1 = P2 ditolak. Karena nilai p < 0.05,
maka pada tingkat signifikansi 10% hipotesis nol juga pasti ditolak.

88. Tabel di bawah ini menunjukkan hasil uji coba sebuah vaksin baru terhadap hewan
ternak, yaitu jumlah ternak yang hidup dan mati pada saat wabah.

Fatal Non-fatal
Vaksinasi 6 114
Tanpa vaksinasi 18 162

Pada pengujian statistik dengan uji khi-kuadrat Pearson diperoleh statistik penguji
sebesar 2.446. Dengan nilai kritis sebesar 3.84 untuk tingkat signifikansi α = 5%,
kesimpulan yang diperoleh yaitu:

21
Jawaban Latihan Ujian

Jawab: B. Pada tingkat signifikansi 5%, tidak terdapat perbedaan proporsi


kematian ternak yang bermakna secara statistik di antara kelompok
dengan vaksinasi dan kelompok tanpa vaksinasi.

Penjelasan: Lihat matriks di bawah ini:


Wuji α Daerah kritis Kesimpulan
5% W > 3.841 H 0 tidak ditolak
2.446
10% W > 2.705 H 0 tidak ditolak

Baik untuk tingkat signifikansi 5% maupun 10%, statistik penguji tidak terletak
pada daerah kritis, sehingga untuk kedua tingkat signifikansi H 0 tidak ditolak.

89. Seorang pekerja sosial berdasarkan hasil wawancaranya terhadap pasangan-pasangan


suami isteri yang mengurus perceraian, hendak meneliti apakah ada kaitan antara
masa penjajakan pra-nikah (lama hubungan sebelum menikah) dengan usia
perkawinan (lama perkawinan dapat dipertahankan). Data yang ada yaitu:

Usia perkawinan
Masa penjajagan pra-nikah
< 4 tahun > 4 tahun
Kurang daripada ½ tahun 11 8
½ - 1 ½ tahun 28 24
Lebih daripada 1 ½ tahun 21 19

Pada pengujian H 0 : Tidak ada asosiasi antara masa penjajagan pra-nikah dengan
usia perkawinan, jika diperoleh statistik penguji sebesar 0.15, maka dengan nilai
kritis untuk statistik penguji sebesar 5.991 untuk tingkat signifikansi α = 5%,
kesimpulan yang diperoleh yaitu:
Jawab: D. Semuanya salah:
A) Pada tingkat signifikansi 1%, terdapat asosiasi yang bermakna
secara statistik antara masa penjajagan pra-nikah dengan usia
perkawinan.
B) Pada tingkat signifikansi 5%, terdapat asosiasi yang bermakna
secara statistik antara masa penjajagan pra-nikah dengan usia
perkawinan.
C) Pada tingkat signifikansi 10%, terdapat asosiasi yang bermakna
secara statistik antara masa penjajagan pra-nikah dengan usia
perkawinan.
Penjelasan: Lihat matriks di bawah ini:
Wuji α Daerah kritis Kesimpulan

22
Jawaban Latihan Ujian

1% W > 9.210 H 0 tidak ditolak


0.15 5% W > 5.991 H 0 tidak ditolak
10% W > 4.605 H 0 tidak ditolak

Untuk tingkat signifikansi 1%, 5%, dan 10%, statistik penguji tidak terletak pada
daerah kritis, sehingga pada ketiga keadaan tersebut H 0 tidak ditolak.

90. Pada analisis variansi terhadap suatu himpunan data, akan diperoleh kesimpulan
yang mengarah pada adanya perbedaan nilai rerata (mean) antar kelompok
perlakuan, jika:
Jawab: C. Variansi antar-kelompok besar dan variansi dalam-kelompok kecil.
Penjelasan: Perbedaan rerata antar kelompok pada analisis variansi akan semakin
jelas jika:
a) Variansi antar-kelompok (between-groups) lebih besar.
b) Variansi dalam-kelompok (within-group) lebih kecil.
(lihat kembali diagram 6.1)

91. Pada uji ANOVA, variansi dalam-kelompok (within-groups) diestimasi oleh:


Jawab: D. Kuadrat rerata galat (error mean square).
Penjelasan:
- Kuadrat rerata galat (KRG) merupakan estimator bagi variansi dalam-kelompok.
- Kuadrat rerata perlakuan (KRP) merupakan estimator bagi variansi antar
kelompok.

Untuk soal No. 92 s.d. 95:


Sebuah pabrik benang mempunyai lima mesin pintal A, B, C, D, dan E yang
diharapkan dapat menghasilkan benang yang memiliki kekuatan sama. Untuk
memeriksanya, diambil sampel acak masing-masing 6 potong benang dari hasil produksi
tiap mesin. Pemeriksaan kekuatannya menghasilkan data sebagai berikut:

Mesin
A B C D E
4.2 3.9 4.1 3.6 3.8
4.1 3.8 4.0 3.9 3.6
4.2 3.7 4.2 3.5 3.9
4.3 3.8 4.0 4.0 3.5
4.4 3.6 4.1 4.1 3.7
4.0 3.5 3.8 3.8 3.6

92. Hipotesis nol dan hipotesis alternatif analisis variansi ini dirumuskan sebagai:

Jawab: C. H 0 : µ1 = µ 2 = µ3 = µ 4 = µ5

23
Jawaban Latihan Ujian

H1 : tidak semua µi , i = 1, 2, 3, 4, 5, sama

Penjelasan: Hipotesis pada analisis variansi adalah:


H 0 : µ1 = µ2 = ... = µk vs H1 : Tidak semua nilai rerata sama.

Jawaban A), B) dan D) salah:


A) Secara matematis, ketidaksamaan hanya boleh mencakup 2 ruas.
( )
B) Satu pasangan nilai rerata µi ; µ j ; i ≠ j, yang tidak sama sudah cukup untuk
menghasilkan penolakan hipotesis nol (tidak harus semuanya berbeda).
D) Analisis variansi tidak hanya digunakan untuk menguji nilai-nilai rerata yang
sama dengan nol, tetapi hipotesis nol dapat dituliskan sebagai:
H 0 : τ1 = τ 2 = τ 3 = τ 4 = τ 5
τ i menyatakan efek perlakuan pada kelompok ke-i, sedemikian hingga:
µi = µ + τ i atau τ i = µi − µ

93. Dengan α = 0.05, daerah kritis hipotesis ini adalah:


Jawab: D. F > 2.76
Penjelasan: Daerah kritis adalah:
F > F( 4; 25; 0.05) yaitu F > 2.759

94. Nilai statistik penguji Fuji sama dengan:

Jawab: A. 10.768
Penjelasan: Statistik penguji adalah:
KRP JKP ( k − 1)
Fuji = =
KRG JKG ( n − k )
1.169 4
= = 10.768
0.678 25

Tabel ANOVA adalah:


Sumber variansi JK db KR Fuji Ftabel
Perlakuan 1.169 4 0.292 10.768 2.759
Galat 0.678 25 0.027
Total 1.847 29

95. Berdasarkan nilai statistik penguji, tersebut maka terhadap H 0 : µ1 = µ2 = µ3


disimpulkan bahwa:

Jawab: C. H 0 ditolak pada α = 0.10

24
Jawaban Latihan Ujian

Penjelasan:
Fuji α Ftabel Kesimpulan
0.01 4.177 H 0 ditolak
10.768 0.05 2.759 H 0 ditolak
0.10 2.184 H 0 ditolak

Untuk soal No. 96 dan 97:


Ibu Leoni menyatakan pendapatnya bahwa siswa pada berbagai tingkatan sekolah
dan mahasiswa menghabiskan waktu sama banyaknya untuk menonton acara TV. Untuk
membuktikan pendapatnya ia mengambil sampel acak beberapa siswa SMP, SMU, dan
mahasiswa, serta menanyakan berapa menit mereka menonton TV sejak pulang sekolah /
kuliah sampai dengan waktu tidur setiap hari. Diperoleh data berikut:

Siswa SMP Siswa SMU Mahasiswa


459 115 272
311 153 88
152 201 374
293 30 178

Tabel ANOVA (α = 0.05):

Sumber variansi JK db KR Fuji Ftabel


Perlakuan 64,586.17 2 32,293.08 2.693 4.256
Galat 108,335.50 9 12,037.28
Total 172,921.67 11

96. Untuk uji hipotesis H 0 : µ1 = µ2 = µ3 , statistik pengujinya adalah:

Jawab: D. 2.69
Penjelasan: Statistik penguji adalah:
KRP JKP ( k − 1)
Fuji = =
KRG JKG ( n − k )
64,586.17 2
= = 2.693
108,335.50 9

97. Dengan tingkat signifikansi α = 0.05, diperoleh kesimpulan:

25
Jawaban Latihan Ujian

Jawab: C. Tidak ditemukan perbedaan lama menonton TV antar siswa SMP,


SMU, dan mahasiswa yang bermakna secara statistik.

Penjelasan: Nilai statistik penguji Fuji lebih kecil daripada nilai titik kritis Ftabel
(tidak terletak pada daerah kritis:
Fuji = 2.693 lebih kecil daripada F( 2; 9; 0.05) = 4.256
sehingga hipotesis H 0 : µ1 = µ2 = µ3 tidak ditolak.

98. Dua macam pupuk (P dan Q) digunakan dalam kuantitas 1 kg dan 2 kg per petak.
Dilakukan eksperimen faktorial 2x2 dengan empat observasi replikasi dengan hasil
sebagai berikut:

B: Dosis pemupukan
1 kg 2 kg
P 17, 16, 15, 18 13, 13, 14, 12
A: Jenis pupuk
Q 21, 20, 19, 18 14, 16, 16, 14

Selanjutnya dilakukan analisis variansi dengan hipotesis:


H A : α1 = α 2 = 0
H B : β1 = β 2 = 0
H AB : (αβ )11 = (αβ )12 = (αβ )21 = (αβ )22 = 0

Tabel ANOVA adalah:


Ftabel
Sumber variasi JK db KR Fuji
(α = 0.05)
Jenis pupuk (A) 25 1 25 18.75 4.747
Dosis pupuk (B) 64 1 64 48.00 4.747
Interaksi (AB) 1 1 1 0.75 4.747
Galat 16 12 1.33
Total 106 15

Dengan tingkat signifikansi α = 5% disimpulkan


Jawab: B. H B ditolak

Penjelasan: Pada tabel ANOVA tampak bahwa statistik penguji FA dan FB


terletak pada daerah kritis, karena lebih besar daripada nilai titik kritis F( 1; 12; 0.05) ,
sehingga hipotesis H A dan H B ditolak, sedangkan hipotesis H AB tidak ditolak.

26
Jawaban Latihan Ujian

Untuk soal No. 99 dan 100:


Data berikut menyatakan jumlah unit produksi yang dihasilkan per hari oleh 4
orang pekerja dengan menggunakan 3 tipe mesin yang berbeda.

B: Pekerja
B1 B2 B3 B4
A1 44 46 34 43
A:
A2 38 40 36 38
Tipe mesin
A3 47 52 44 46

Selanjutnya dilakukan analisis variansi dengan hipotesis:


H A : α1 = α 2 = α 3 = 0
H B : β1 = β 2 = β3 = β4 = 0
Tabel ANOVA adalah:
J K Ftabel
Sumber variasi db Fuji
K R (α = 0.05)
Tipe mesin (A) 173.17 2 86.58 17.61 5.143
Pekerja (B) 98 3 32.67 6.64 4.757
Galat 29.5 6 4.92
Total 300.67 11

99. Pada uji analisis variansi 2-arah (two-way ANOVA) terhadap data dengan 1
pengamatan / observasi per sel, model statistik yang dapat digunakan ialah:
A. yij = µ + αi + β j + εij C. Keduanya dapat digunakan.
B. yij = µ + αi + β j + ( αβ ) ij + εijk D. Keduanya tidak dapat digunakan.

100. Dengan tingkat signifikansi α = 5% disimpulkan:


A. H A tidak ditolak C. Keduanya benar
B. H B ditolak D. Keduanya salah

27
Upah rata-rata 50 pekerja di suatu perusahaan adalah $500 dengan simpangan baku $60. Diketahui
ukuran sampel kurang dari 5% ukuran populasi. Tentukan standard error data tersebut!

Select one:

a. 8.07

b. 1.02

c. 8.48

d. 7.07

Nilai F untuk nilai taraf nyata = 1% ; db numerator = 7 ; db denumerator = 9 adalah 6.72

Select one:

True

False

Jika ditentukan nilai α = 5% dan didapatkan nilai signifikansi 0.02 maka hipotesis nol diterima

Select one:

True

False

α = 5% = 0.05
sig= 0.02
0.02 < 0.05 = sig < α maka hipotesis nol ditolak
The correct answer is 'False'.

Dari populasi pengguna gadget yang berukuran 8.7 juta, diketahui rata-rata mengeluarkan uang
sebesar $6986.91 per tahun untuk membeli gadget dengan simpangan baku $298.45. Data dapat
dinyatakan terdistribusi normal Jika dari populasi tersebut diambil sampel acak sebanyak 2209
orang, tentukan nilai Z jika ingin diketahui peluang rata-rata biaya belanja gadget dalam sampel
tersebut kurang dari $7000 per tahun ...

Select one:

a. 0.48

b. 2.06

c. 0.10

d. 1.05
Dari 20 pemilik gadget yang dipilih sebagai sampel acak, diketahui rata-rata setiap bulan melakukan
168 (kali) komunikasi dengan orang-orang terdekat melalui gadget dan simpangan baku 19.60
dengan data diasumsikan terdistribusi normal. Selang Kepercayaan 95% untuk menduga rata-rata
banyak komunikasi antara pemilik gadget dengan orang-orang terdekat yang dilakukan melalui
gadget yaitu ...

Select one:

a. 158.82 &lt; μ &lt; 177.17

b. 125.82 &lt; μ &lt; 177.07

c. 128.52 &lt; μ &lt; 171.17

d. 152.28 &lt; μ &lt; 171.07

Terdapat dua jenis perhitungan dalam ANOVA dua jalur berdasarkan ada tidaknya interaksi

Select one:

True

False

Hipotesis nol menyatakan kondisi yang menjadi dasar perbandingan

Select one:

True

False

Nilai T Tabel untuk data berjumlah 9, selang kepercayaan 95%, dalam penelitian dua arah adalah
2.262

Select one:

True

False

Pasangkan dengan pernyataan yang tepat

Data yang diperoleh dengan mencatat semua elemen yang Answer 1


menjadi obyek penelitian dan merupakan true value Parameter Populasi
Answer 2
Choose...

Answer 3
Menguji parameter populasi melalui statistik Statistika Parametrik

Answer 4
Menguji distribusi Statistika Non Parametrik

Nilai F untuk nilai taraf nyata = 1% ; db numerator = 7 ; db denumerator = 9 adalah ...

Select one:

a. 3.68

b. 3.29

c. 5.61

d. 6.72

1. Tentukan nilai F jika diketahui nilai taraf nyata = 5% ; db numerator = 25 ; db denumerator = 8!


Jawab hanya menggunakan angka dan titik! (Misalnya: 2.54)

Answer: 3.11

2. Hipotesis nol menyatakan kondisi yang menjadi dasar perbandingan

Answer: True

3. Dari 20 pemilik gadget yang dipilih sebagai sampel acak, diketahui rata-rata setiap bulan
melakukan 168 (kali) komunikasi dengan orang-orang terdekat melalui gadget dan simpangan baku
19.60 dengan data diasumsikan terdistribusi normal. Selang Kepercayaan 95% untuk menduga rata-
rata banyak komunikasi antara pemilik gadget dengan orang-orang terdekat yang dilakukan melalui
gadget yaitu ...

Answer: 158.82 &lt; μ &lt; 177.17

4. Upah rata-rata 50 pekerja di suatu perusahaan adalah $500 dengan simpangan baku $60.
Diketahui ukuran sampel kurang dari 5% ukuran populasi. Tentukan standard error data tersebut!

Answer: 8.48
5. Setiap pengunjung di supermarket tadinya tidak perlu cek suhu tubuh ketika akan berbelanja,
karenanya rata-rata waktu yang dibutuhkan untuk berbelanja hanya 60 menit. Tetapi semenjak
penyebaran covid-19, semua pengunjung diwajibkan untuk cek suhu tubuh. Peneliti ingin
membuktikan bahwa rata-rata waktu yang dibutuhkan pengunjung untuk berbelanja semakin
panjang semenjak adanya peraturan baru tersebut. Maka hipotesis alternatif yang dirumuskan
sebagai berikut: 𝐻1 : μ > 60 menit

Answer: True

6. Jika ditentukan nilai α = 1% dan didapatkan nilai signifikansi 0.003 maka hipotesis nol ditolak dan
hipotesis alternatif diterima

Answer: True

α = 1% = 0.01

sig= 0.003

0.003 < 0.01 = sig < α maka hipotesis nol ditolak

7. Terdapat dua kategori yang dipertimbangkan dalam anova dua jalur

Answer: True

8. Jika ditentukan nilai α = 5% dan didapatkan nilai signifikansi 0.450 maka hipotesis nol diterima

Answer: True

9. Nilai F jika diketahui nilai taraf nyata = 5% ; db numerator = 25 ; db denumerator = 8 ...

Answer: 3.11

10. Penyataan di bawah ini adalah benar, kecuali ...

Answer: Dalam pengujian hipotesis dua arah, nilai α tidak dibagi dua

Suatu hipotesis diterima karena hipotesis tersebut benar dan ditolak karena hipotesis tersebut salah

Select one:

True

False

Feedback
The correct answer is 'False'.

Question 2

Correct

Mark 1 out of 1

Flag question

Question text

Jika ditentukan nilai α = 5% dan didapatkan nilai signifikansi 0.02 maka hipotesis nol diterima

Select one:

True

False

Feedback

The correct answer is 'False'.

Question 3

Correct

Mark 1 out of 1

Flag question

Question text

Terdapat dua jenis perhitungan dalam ANOVA dua jalur berdasarkan ada tidaknya interaksi

Select one:

True

False

Feedback

The correct answer is 'True'.

Question 4

Correct
Mark 1 out of 1

Flag question

Question text

Nilai F untuk nilai taraf nyata = 1% ; db numerator = 7 ; db denumerator = 9 adalah 6.72

Select one:

True

False

Feedback

The correct answer is 'False'.

Question 5

Correct

Mark 1 out of 1

Flag question

Question text

Dari 20 pemilik gadget yang dipilih sebagai sampel acak, diketahui rata-rata setiap bulan melakukan
168 (kali) komunikasi dengan orang-orang terdekat melalui gadget dan simpangan baku 19.60
dengan data diasumsikan terdistribusi normal. Selang Kepercayaan 95% untuk menduga rata-rata
banyak komunikasi antara pemilik gadget dengan orang-orang terdekat yang dilakukan melalui
gadget yaitu ...

Select one:

a. 128.52 &lt; μ &lt; 171.17

b. 152.28 &lt; μ &lt; 171.07

c. 158.82 &lt; μ &lt; 177.17

d. 125.82 &lt; μ &lt; 177.07

Feedback

The correct answer is: 158.82 &lt; μ &lt; 177.17


Question 6

Correct

Mark 1 out of 1

Flag question

Question text

ANOVA dua jalur dengan interaksi memperhitungkan dua kategori

Select one:

True

False

Feedback

The correct answer is 'False'.

Question 7

Correct

Mark 1 out of 1

Flag question

Question text

Jika ditentukan nilai α = 5% dan didapatkan nilai signifikansi 0.450 maka hipotesis nol diterima

Select one:

True

False

Feedback

The correct answer is 'True'.

Question 8
Correct

Mark 1 out of 1

Flag question

Question text

Jika ditentukan nilai α = 1% dan didapatkan nilai signifikansi 0.003 maka hipotesis nol ditolak dan
hipotesis alternatif diterima

Select one:

True

False

Feedback

The correct answer is 'True'.

Question 9

Correct

Mark 1 out of 1

Flag question

Question text

150 orang anak perempuan memiliki rata-rata berat badan 56 kg dan standar deviasi 8 kg. Dari total
tersebut akan diambil 64 orang anak sebagai sampel acak tanpa pemulihan. Jika rata-rata berat
badan mereka terdistribusi normal, tentukan nilai dari P (x >̅ 57)!

Select one:

a. 1.33

b. 0.0918

c. 0.9082

d. 0.4082
Feedback

The correct answer is: 0.0918

Question 10

Correct

Mark 1 out of 1

Flag question

Question text

Dari populasi pengguna gadget yang berukuran 8.7 juta, diketahui rata-rata mengeluarkan uang
sebesar $6986.91 per tahun untuk membeli gadget dengan simpangan baku $298.45. Data dapat
dinyatakan terdistribusi normal Jika dari populasi tersebut diambil sampel acak sebanyak 2209
orang, tentukan nilai Z jika ingin diketahui peluang rata-rata biaya belanja gadget dalam sampel
tersebut kurang dari $7000 per tahun ...

Select one:

a. 2.06

b. 1.05

c. 0.10

d. 0.48

Feedback

The correct answer is: 2.06

1. 150 orang anak perempuan memiliki rata-rata berat badan 56 kg dan standar deviasi 8 kg. Dari
total tersebut akan diambil 64 orang anak sebagai sampel acak tanpa pemulihan. Jika rata-rata berat
badan mereka terdistribusi normal, tentukan nilai dari P (x >̅ 57)!

Select one:

c. 0.0918

2. Pada SPSS penerimaan/penolakan hipotesis nol dilakukan dengan membandingkan nilai


signifikansi dengan nilai α

Select one:
True

3. Untuk memastikan kebenaran suatu hipotesis kita dapat mengambil sampel acak dan
menggunakan informasi dari sampel itu untuk menerima atau menolak suatu hipotesis

Select one:

True

4. Upah rata-rata 50 pekerja di suatu perusahaan adalah $500 dengan simpangan baku $60.
Diketahui ukuran sampel kurang dari 5% ukuran populasi. Tentukan standard error data tersebut!

Select one:

d. 8.48

5. Dalam sebuah inspeksi pabrik diambil 36 makanan kaleng yang memiliki berat kotor rata-rata
290ml dan simpangan baku 42ml. Dengan menggunakan taraf nyata 5%, ujilah hipotesis yang
menyatakan bahwa berat kotor rata-rata populasi makanan kaleng di pabrik tersebut sama dengan
295ml. Berikut adalah pernyataan yang tepat mengenai soal tersebut, kecuali ...

Select one:

a. Pengujian dilakukan dengan 1 arah (one-tailed)

6. Nilai F jika diketahui nilai taraf nyata = 5% ; db numerator = 25 ; db denumerator = 8 ...

Select one:

d. 3.11

7. Dalam sebuah inspeksi pabrik diambil 36 makanan kaleng yang memiliki berat kotor rata-rata
290ml dan simpangan baku 42ml. Dengan menggunakan taraf nyata 5%, ujilah hipotesis yang
menyatakan bahwa berat kotor rata-rata populasi makanan kaleng di pabrik tersebut sama dengan
295ml. Nilai statistik hitung dari data tersebut adalah ...

Select one:

b. -0.71

8. Diketahui rata-rata skor penerimaan diri mahasiswi adalah 127 dengan ragam (varians) = 119
sedangkan rata-rata skor penerimaan diri mahasiswa adalah 124 dengan ragam (varians) 181.
Diasumsikan kedua populasi berukuran besar, kemudian diambil 100 orang mahasiswi dan 100
mahasiswa sebagai sampel. Probabilitas adanya perbedaan rata-rata skor penerimaan diri kedua
kelompok kurang dari 2 adalah ...
Select one:

b. 25.61%

9. Dari 20 pemilik gadget yang dipilih sebagai sampel acak, diketahui rata-rata setiap bulan
melakukan 168 (kali) komunikasi dengan orang-orang terdekat melalui gadget dan simpangan baku
19.60 dengan data diasumsikan terdistribusi normal. Selang Kepercayaan 95% untuk menduga rata-
rata banyak komunikasi antara pemilik gadget dengan orang-orang terdekat yang dilakukan melalui
gadget yaitu ...

Select one:

b. 158.82 < μ < 177.17

10. Penyataan di bawah ini adalah benar, kecuali ...

Select one:

b. Dalam pengujian hipotesis dua arah, nilai α tidak dibagi dua

1. Terdapat dua kategori yang dipertimbangkan dalam anova dua jalur

Select one:

True

False

2. Jika ditentukan nilai α = 1% dan didapatkan nilai signifikansi 0.003 maka hipotesis nol ditolak dan
hipotesis alternatif diterima

Select one:

True

False

3. Diketahui rata-rata skor penerimaan diri mahasiswi adalah 127 dengan ragam (varians) = 119
sedangkan rata-rata skor penerimaan diri mahasiswa adalah 124 dengan ragam (varians) 181.
Diasumsikan kedua populasi berukuran besar, kemudian diambil 100 orang mahasiswi dan 100
mahasiswa sebagai sampel. Probabilitas adanya perbedaan rata-rata skor penerimaan diri kedua
kelompok kurang dari 2 adalah ...

Select one:
a. 25.61%

b. 0.57%

c. 74.39%

d. 24.39%

4. Dalam sebuah inspeksi pabrik diambil 36 makanan kaleng yang memiliki berat kotor rata-rata
290ml dan simpangan baku 42ml. Dengan menggunakan taraf nyata 5%, ujilah hipotesis yang
menyatakan bahwa berat kotor rata-rata populasi makanan kaleng di pabrik tersebut sama dengan
295ml. Nilai statistik hitung dari data tersebut adalah ...

Select one:

a. 0.71

b. -1.96

c. 1.96

d. -0.71

5. Pada SPSS penerimaan/penolakan hipotesis nol dilakukan dengan membandingkan nilai


signifikansi dengan nilai α

Select one:

True

False

6. Upah rata-rata 50 pekerja di suatu perusahaan adalah $500 dengan simpangan baku $60.
Diketahui ukuran sampel kurang dari 5% ukuran populasi. Tentukan standard error data tersebut!

Select one:

a. 1.02

b. 8.48

c. 7.07

d. 8.07
7. Setiap pengunjung di supermarket tadinya tidak perlu cek suhu tubuh ketika akan berbelanja,
karenanya rata-rata waktu yang dibutuhkan untuk berbelanja hanya 60 menit. Tetapi semenjak
penyebaran covid-19, semua pengunjung diwajibkan untuk cek suhu tubuh. Peneliti ingin
membuktikan bahwa rata-rata waktu yang dibutuhkan pengunjung untuk berbelanja semakin
panjang semenjak adanya peraturan baru tersebut. Maka hipotesis alternatif yang dirumuskan
sebagai berikut:
𝐻1 : μ > 60 menit

Select one:

True

False

8. 150 orang anak perempuan memiliki rata-rata berat badan 56 kg dan standar deviasi 8 kg. Dari
total tersebut akan diambil 64 orang anak sebagai sampel acak tanpa pemulihan. Jika rata-rata berat
badan mereka terdistribusi normal, tentukan nilai dari P (x >̅ 57)!

Select one:

a. 0.4082

b. 0.9082

c. 1.33

d. 0.0918

9. Nilai F jika diketahui nilai taraf nyata = 5% ; db numerator = 25 ; db denumerator = 8 ...

Select one:

a. 5.26

b. 2.54

c. 3.32

d. 3.11

10. Dari populasi pengguna gadget yang berukuran 8.7 juta, diketahui rata-rata mengeluarkan uang
sebesar $6986.91 per tahun untuk membeli gadget dengan simpangan baku $298.45. Data dapat
dinyatakan terdistribusi normal Jika dari populasi tersebut diambil sampel acak sebanyak 2209
orang, tentukan nilai Z jika ingin diketahui peluang rata-rata biaya belanja gadget dalam sampel
tersebut kurang dari $7000 per tahun ...

Select one:
a. 0.48

b. 2.06

c. 0.10

d. 1.05

1. Hipotesis alternatif ditulis dalam bentuk persamaan (=)Select one:

True❌

False

~>Hipotesis nol ditulis dalam bentuk persamaan (=), sedangkan hipotesis alternatif ditulis dalam
bentuk pertidaksamaan (<;>;≠)

The correct answer is 'False'.

2. Nilai F untuk nilai taraf nyata = 1% ; db numerator = 7 ; db denumerator = 9 adalah ...

Select one:

a. 3.68

b. 5.61

c. 3.29

d. 6.72

3. Nilai F jika diketahui nilai taraf nyata = 5% ; db numerator = 25 ; db denumerator = 8 ...

Select one:

a. 5.26

b. 3.11

c. 2.54

d. 3.3

4. Jika diketahui daerah penolakan H0 adalah t < -t (15;0.5%) dan t > t (15;0.5%), kemudian nilai t
hitung nya adalah 1.065 maka kesimpulan yang dapat diambil adalah H0 nya diterima

True
False

5. 150 orang anak perempuan memiliki rata-rata berat badan 56 kg dan standar deviasi 8 kg. Dari
total tersebut akan diambil 64 orang anak sebagai sampel acak tanpa pemulihan. Jika rata-rata berat
badan mereka terdistribusi normal, tentukan nilai dari P (x >̅ 57)!

Select one:

a. 0.9082

b. 0.4082

c. 0.0918

d. 1.33❌

The correct answer is: 0.0918

6. Dari populasi pengguna gadget yang berukuran 8.7 juta, diketahui rata-rata mengeluarkan uang
sebesar $6986.91 per tahun untuk membeli gadget dengan simpangan baku $298.45. Data dapat
dinyatakan terdistribusi normal Jika dari populasi tersebut diambil sampel acak sebanyak 2209
orang, tentukan nilai Z jika ingin diketahui peluang rata-rata biaya belanja gadget dalam sampel
tersebut kurang dari $7000 per tahun ...

Select one:

a. 0.48

b. 1.05❌

c. 0.10

d. 2.06

7. Nilai Z untuk taraf nyata 5% adalah 2.575

Select one:

True❌

False

~>Nilai Z untuk taraf nyata 5% adalah 1.645

The correct answer is 'False'.

8. Dalam sebuah inspeksi pabrik diambil 36 makanan kaleng yang memiliki berat kotor rata-rata
290ml dan simpangan baku 42ml. Dengan menggunakan taraf nyata 5%, ujilah hipotesis yang
menyatakan bahwa berat kotor rata-rata populasi makanan kaleng di pabrik tersebut sama dengan
295ml. Nilai statistik hitung dari data tersebut adalah ...
Select one:

a. -0.71

b. -1.96

c. 1.96

d. 0.71

9. Dalam sebuah inspeksi pabrik diambil 36 makanan kaleng yang memiliki berat kotor rata-rata
290ml dan simpangan baku 42ml. Dengan menggunakan taraf nyata 5%, ujilah hipotesis yang
menyatakan bahwa berat kotor rata-rata populasi makanan kaleng di pabrik tersebut sama dengan
295ml. Nilai statistik hitung dari data tersebut adalah ...

a. -0.71

b. 1.96

c. 0.71

d. -1.96

10. Untuk memastikan kebenaran suatu hipotesis kita dapat mengambil sampel acak dan
menggunakan informasi dari sampel itu untuk menerima atau menolak suatu hipotesis

11. True

Question 1

Correct

Mark 1 out of 1

Flag question

Question text

Dalam sebuah inspeksi pabrik diambil 36 makanan kaleng yang memiliki berat kotor rata-rata 290ml
dan simpangan baku 42ml. Dengan menggunakan taraf nyata 5%, ujilah hipotesis yang menyatakan
bahwa berat kotor rata-rata populasi makanan kaleng di pabrik tersebut sama dengan 295ml.
Berikut adalah pernyataan yang tepat mengenai soal tersebut, kecuali ...

Select one:

a. H_0 diterima
b. H_1 ∶ μ≠295

c. Pengujian dilakukan dengan 1 arah (one-tailed)

d. Statistik uji yang digunakan adalah Distribusi Z

Feedback

The correct answer is: Pengujian dilakukan dengan 1 arah (one-tailed)

Question 2

Correct

Mark 1 out of 1

Flag question

Question text

Nilai F untuk nilai taraf nyata = 1% ; db numerator = 7 ; db denumerator = 9 adalah ...

Select one:

a. 6.72

b. 3.29

c. 3.68

d. 5.61

Feedback

The correct answer is: 5.61

Question 3

Correct

Mark 1 out of 1

Flag question

Question text

Dari populasi pengguna gadget yang berukuran 8.7 juta, diketahui rata-rata mengeluarkan uang
sebesar $6986.91 per tahun untuk membeli gadget dengan simpangan baku $298.45. Data dapat
dinyatakan terdistribusi normal Jika dari populasi tersebut diambil sampel acak sebanyak 2209
orang, tentukan nilai Z jika ingin diketahui peluang rata-rata biaya belanja gadget dalam sampel
tersebut kurang dari $7000 per tahun ...

Select one:

a. 0.48

b. 1.05

c. 2.06

d. 0.10

Feedback

The correct answer is: 2.06

Question 4

Correct

Mark 1 out of 1

Flag question

Question text

Dalam sebuah inspeksi pabrik diambil 36 makanan kaleng yang memiliki berat kotor rata-rata 290ml
dan simpangan baku 42ml. Dengan menggunakan taraf nyata 5%, ujilah hipotesis yang menyatakan
bahwa berat kotor rata-rata populasi makanan kaleng di pabrik tersebut sama dengan 295ml.
Berikut adalah pernyataan yang tepat mengenai soal tersebut, kecuali ...

Select one:

a. Pengujian dilakukan dengan 1 arah (one-tailed)

b. H_0 diterima

c. H_1 ∶ μ≠295

d. Statistik uji yang digunakan adalah Distribusi Z

Feedback

The correct answer is: Pengujian dilakukan dengan 1 arah (one-tailed)

Question 5

Correct

Mark 1 out of 1
Flag question

Question text

Nilai T Tabel untuk data berjumlah 9, selang kepercayaan 95%, dalam penelitian dua arah adalah
2.262

Select one:

True

False

Feedback

The correct answer is 'False'.

Question 6

Correct

Mark 1 out of 1

Flag question

Question text

Statistika non parametrik banyak digunakan untuk untuk menganalisis data nominal dan ordinal

Select one:

True

False

Feedback

The correct answer is 'True'.

Question 7

Correct

Mark 1 out of 1
Flag question

Question text

Upah rata-rata 50 pekerja di suatu perusahaan adalah $500 dengan simpangan baku $60. Diketahui
ukuran sampel kurang dari 5% ukuran populasi. Tentukan standard error data tersebut!

Select one:

a. 7.07

b. 8.07

c. 1.02

d. 8.48

Feedback

The correct answer is: 8.48

Question 8

Correct

Mark 1 out of 1

Flag question

Question text

Nilai F jika diketahui nilai taraf nyata = 5% ; db numerator = 25 ; db denumerator = 8 ...

Select one:

a. 2.54

b. 5.26

c. 3.11

d. 3.32

Feedback

The correct answer is: 3.11

Question 9
Correct

Mark 1 out of 1

Flag question

Question text

150 orang anak perempuan memiliki rata-rata berat badan 56 kg dan standar deviasi 8 kg. Dari total
tersebut akan diambil 64 orang anak sebagai sampel acak tanpa pemulihan. Jika rata-rata berat
badan mereka terdistribusi normal, tentukan nilai dari P (x >̅ 57)!

Select one:

a. 1.33

b. 0.0918

c. 0.9082

d. 0.4082

Feedback

The correct answer is: 0.0918

Question 10

Correct

Mark 1 out of 1

Flag question

Dalam sebuah inspeksi pabrik diambil 36 makanan kaleng yang memiliki berat kotor rata-rata 290ml
dan simpangan baku 42ml. Dengan menggunakan taraf nyata 5%, ujilah hipotesis yang menyatakan
bahwa berat kotor rata-rata populasi makanan kaleng di pabrik tersebut sama dengan 295ml. Nilai
statistik hitung dari data tersebut adalah ...

Select one:

a. -0.71

b. 0.71
c. 1.96

d. -1.96

Feedback

The correct answer is: -0.71

Terdapat dua kategori yang dipertimbangkan dalam anova dua jalur

Select one:

True

False

Feedback

The correct answer is 'True'.

Jika ditentukan nilai α = 5% dan didapatkan nilai signifikansi 0.02 maka hipotesis nol diterima

Select one:

True

False

Feedback

The correct answer is 'False'.

Nilai F jika diketahui nilai taraf nyata = 5% ; db numerator = 25 ; db denumerator = 8 ...

Select one:

a. 5.26

b. 3.32

c. 2.54

d. 3.11

Feedback

The correct answer is: 3.11

Diketahui rata-rata skor penerimaan diri mahasiswi adalah 127 dengan ragam (varians) = 119
sedangkan rata-rata skor penerimaan diri mahasiswa adalah 124 dengan ragam (varians) 181.
Diasumsikan kedua populasi berukuran besar, kemudian diambil 100 orang mahasiswi dan 100
mahasiswa sebagai sampel. Probabilitas adanya perbedaan rata-rata skor penerimaan diri kedua
kelompok kurang dari 2 adalah ...

Select one:

a. 0.57%
b. 74.39%

c. 24.39%

d. 25.61%

Feedback

The correct answer is: 25.61%

Nilai T Tabel untuk data berjumlah 9, selang kepercayaan 95%, dalam penelitian dua arah adalah
2.262

Select one:

True

False

Feedback

The correct answer is 'False'.

Jika diketahui daerah penolakan H0 adalah t < -t (15;0.5%) dan t > t (15;0.5%), kemudian nilai t
hitung nya adalah 1.065 maka kesimpulan yang dapat diambil adalah H0 nya diterima

Select one:

True

False

Feedback

The correct answer is 'True'.

Penyataan di bawah ini adalah benar, kecuali ...

Select one:

a. Hipotesis alternatif ditulis dalam bentuk pertidakpersamaan (&lt;; &gt;; ≠)

b. Jika ditentukan nilai α = 1% dan nilai signifikansi = 0.003 maka hipotesis nol ditolak

c. Dalam pengujian hipotesis dua arah, nilai α tidak dibagi dua

d. Jika ditentukan nilai α = 5% dan nilai signifikansi = 0.450 maka hipotesis nol diterima

Feedback

The correct answer is: Dalam pengujian hipotesis dua arah, nilai α tidak dibagi dua

Diketahui rata-rata skor penerimaan diri mahasiswi adalah 127 dengan ragam (varians) = 119
sedangkan rata-rata skor penerimaan diri mahasiswa adalah 124 dengan ragam (varians) 181.
Diasumsikan kedua populasi berukuran besar, kemudian diambil 100 orang mahasiswi dan 100
mahasiswa sebagai sampel. Probabilitas adanya perbedaan rata-rata skor penerimaan diri kedua
kelompok kurang dari 2 adalah ...

Select one:

a. 0.57%

b. 24.39%

c. 74.39%

d. 25.61%

Feedback

The correct answer is: 25.61%

Setiap pengunjung di supermarket tadinya tidak perlu cek suhu tubuh ketika akan berbelanja,
karenanya rata-rata waktu yang dibutuhkan untuk berbelanja hanya 60 menit. Tetapi semenjak
penyebaran covid-19, semua pengunjung diwajibkan untuk cek suhu tubuh. Peneliti ingin
membuktikan bahwa rata-rata waktu yang dibutuhkan pengunjung untuk berbelanja semakin
panjang semenjak adanya peraturan baru tersebut. Maka hipotesis alternatif yang dirumuskan
sebagai berikut:
𝐻1 : μ > 60 menit

Select one:

True

False

Feedback

The correct answer is 'True'.

1. Diketahui rata-rata skor penerimaan diri mahasiswi adalah 127 dengan ragam (varians) =
119 sedangkan rata-rata skor penerimaan diri mahasiswa adalah 124 dengan ragam (varians)
181. Diasumsikan kedua populasi berukuran besar, kemudian diambil 100 orang mahasiswi
dan 100 mahasiswa sebagai sampel. Probabilitas adanya perbedaan rata-rata skor
penerimaan diri kedua kelompok kurang dari 2 adalah ...

a. 0.57%

b. 24.39%

c. 74.39%

d. 25.61%

2. Data yang diperoleh dengan mencatat semua elemen Answer 1


yang menjadi obyek penelitian dan merupakan true Parameter Populasi
value
Answer 2
Menguji parameter populasi melalui statistik Statistika Parametrik

Menguji distribusi = Statistika Non Parametrik

3. Terdapat dua jenis perhitungan dalam ANOVA dua jalur berdasarkan ada tidaknya interaksi

Select one:

True

False

4. ANOVA dua jalur dengan interaksi memperhitungkan dua kategori

Select one:

True

False

5. Upah rata-rata 50 pekerja di suatu perusahaan adalah $500 dengan simpangan baku $60.
Diketahui ukuran sampel kurang dari 5% ukuran populasi. Tentukan standard error data
tersebut!

Select one:

a. 8.07

b. 8.48

c. 1.02

d. 7.07

6. Untuk memastikan kebenaran suatu hipotesis kita dapat mengambil sampel acak dan
menggunakan informasi dari sampel itu untuk menerima atau menolak suatu hipotesis

Select one:

True

False

7. Hipotesis nol menyatakan kondisi yang menjadi dasar perbandingan

Select one:

True

False

8. Hipotesis alternatif ditulis dalam bentuk persamaan (=)

Select one:
True

False

9. Nilai Z untuk taraf nyata 5% adalah 2.575

Select one:

True

False

10. Dalam pengujian hipotesis satu arah, nilai α dibagi dua

Select one:

True

False
16. Berikut yang merupakan teknik nonprobability sampling adalah..

a. Cluster sampling

b. Systematic random sampling

c. Simple random sampling

d. Accidental sampling

I7. "n" merupakan notasi dari...

a. jumlah populasi

b. jumlah sample

c. rata-rata sample

d. rata-rata populasi

18. Di bawah ini yang bukan termasuk uji statistika non parametrik, kecuali

a. Uji Run(S)

b Uji anova

c. Uji distribusi sampling

d. Uji selang kepercayaan

19. Di bawah ini yang bukan termasuk dari kelebihan uji non parametri

a. Data dapat berupa data kualitatif

b. tidak memanfaatkan semua informasi dari sampel

c. Distribusi data tidak harus normal

d. Perhitungan sederhana dan cepat

20. Kelemahan uji non parametric dapat diperbaiki dengan cara.....

a. Menambah ukuran populasi

b. Mengurangi ukuran populasi

c. Menambah ukuran sampel

d. Mengurangi ukuran sampel


11. Dasar perhitungan analisis varian ditemukan oleh.....

a. Ronald A Fisher

b. Ron A Fisher

c. Randalt A Fisher

d. Rendalt A Fisher

12. Pada pengujian anova HI atau Ha dikatakan diterima jika..

a. Fhit > Ftable

b. Fhit < Ftable

c. Fhit > Ftable

d. Fhit < Ftable

13. Dengan selang kepercayaan 95% tentukanlah nilai Ztable.....

a. 1,645

b. 2,575

c. 2,32

d. 1,96

14. Nilai titik kritis pada pengujian hipotesis didapat dari nilai di bawah ini, kecuali.

a. Nilai N table

b. Nilai Z table

c. Nilai T table

d. Nilai F table

15. Berikut yang merupakan teknik probability sampling adalah.....

a. Snowball sampling

b. Purposive sampling

c. Multistage sampling

d. Judgement sampling
1. Sekumpulan individu dengan karakteristik khas yang menjadi perhatian dalam suatu
penelitian (pengamatan) disebut..
a. Populasi
b. Sampel
c. Variabel
d. Atribut
2. Hubungan antara sampel dan populasi pada statika inferensial adalah adanya proses..
setelah penelitian pada sampel terhadap populasi
a. Generalisasi
b. Spesialisasi
c. Seleksi
d. Reduksi
3. Di bawah ini merupakan syarat sampel yang baik, kecuali..
a. Memiliki variasi yang besar
b. Objektif
c. Representatif (mewakili keadaan yang sebenarnya)
d. Tepat waktu dan relevan
4. Teknik sampling dimana peneliti memiliki beberapa kriteria khusus yang sesuai dengan
penelitian untuk menjadikan suatu individu menjadi sampel penelitiannya adalah..
a. Purposive sampling
b. Accidental sampling
c. Simple random sampling
d. Cluster sampling
5. Pernyataan hipotesis 0 bahwa tidak terdapat perbedaan nilai rata-rata ujian siswa yang
mengikuti kelas tambahan dan tidak mengikuti kelas tambahan, dan H 1 bahwa terdapat
perbedaan nilai rata-rata ujian siswa yang mengikuti kelas tambahan dan tidak mengikuti
kelas tambahan. Jika dilambangkan dengan bahasa statistika akan menjadi..
a. H0: µ1 = µ2 H1:µ1 ≠ µ2
b. H0: µ1 = µ2 H1:µ1 > µ2
c. H0: µ1 = µ2 H1:µ1 < µ2
d. H0: µ1 = µ2 H1: µ1 ≥ µ2
21. Jika ingin diuji proporsi sampel 2 maka berapa PO sama dengan q0 …

0,05

22. Dibawah ini yang bukan langkah pertama pengujian mann-whitney, kecuali…

a. pengurutan nilai dari yang terbesar sampai yang terkecil

b. peringkat tertinggi diberikan pada nilai terkecil

c. Pengurutan dilakukan dengan pemisahan kedua sampel

d. Pengurutan nilai dari yang terkecil sampai yang terbesar

23. Dibawah ini yang merupakan rumus peringkat mann-whitney adalah…

peringkat= £ urutan data yang bernilai sama / banyak data yang bernilai sama
24. 10 pengamen ditanyai dan diketahui setiap bulan mereka makan 2 liter nasi dengan
simpagangan baku = 1.

15 pengemis ditannyai dan diketahui setiap bulan mereka makan 4 liter nasi dengan
simpangan baku = 2. Ragam ke-2 populasi bernilai sama (selang kepercayaan 5).

Hitung ragam dan simpangan baku gabungan ke-2 sampel…

Belum di isi
25. Berdasarkan table di atas, apakah nilai mahasiswa fakultas psikologi lebih
besar di banding mahasiswa sastra, tentukan dengan HO dan H 1..
c. H0 : µ1 = µ2 : HI: µ1 ≥ µ2
26. Berdasarkan table di atas, dengan taraf nyata 5%, berapakah hasil statistik uji
z.....
a. 0.81
b. 0.91
c. 0.71
d. 0.61
27. Berdasarkan hasil statistic uji di atas, tentukan kesimpulan yang paling tepat
untuk soal di atas….
a. Nilai statistika di fakultas psikologi sama dengan fakultas sastra
b Nilai statistika di fakultas psikologi lebib besar dibandingkan dengan fakultas
sastra
b. Nilai statistika di fakultas psikologi lebih kecil dibandingkan dengan fakultas
sastra
d. Nilai statistika di fakultas psikologi tidak sama dengan fiakultas sastra
28. Di bawah ini yang merupakan focus uji peringkat 2 sampel wilcoxon,
adalah.....
a. Sampel dengan ukuran terkecil
b. Sampel dengan ukuran yang sama
c. Sampel dengan ukuran yang terbesar
d. Semua jawaban salah
40 SOAL STATISTIKA
6. Seorang peneliti akan meneliti apakah terdapat perbedaan hasil belajar pada siswa yang
cerdas dan siswa dengan kemampuan intelcgensi rata-rata jika menggunakan metode belajar
Audio, Visual, dan Kinestetik. Untuk menganalisa data hasil penelitian terscbut, peneliti dapat
menggunakan teknik analisis...
a. Uji Hipotesis 1 Arah
b. Anova 1 Arah
c. Anova 2 Arah
d. Uji Hipotesis 2 Arah
7. Pada uji hipotesis 2 arah, daerah penerimaan untuk H1 dan penolakan HO berada di...
a. Sebelah kanan kurva
b. Sebelah kin kurva
c. Sebelah kanan dan kiri kurva
d. Tengah kurva
8. Parameter adalah suatu nilai yang menggambarkan ciri/ karakteristik dari...
a. Sampel
b. Variasi
c. Populasi
d. Variabel
9. Table pengujian analisis varian atau anova adalah..
a. Table Z
b. Table T
c. Table F
d. Table N
10. Analisis varian biasa digunakan untuk menguji.....
a. Pengujian ≥ 2 rata-rata
b. Pengujian ≤ 2 rata-rata
c. Pengujian > 2 rata-rata
d. Pengujian < 2 rata-rata
Untuk soal 37-39
Terdapat 2 metode diet dan 2 golongan usia peserta program diet. Berikut data rata-rata
penurunan berat badan peserta kedua metode dalam dua kelompok umur. Ujilah dengan taraf
nyata 5%!
Kelompok umur Metode 1 Metode 2 Total baris
< 20 tahun 4 6 10
20-40 tahun 2 3 5
Total kolom 6 9 Total = 15

37. hitung JKB berdasarkan data tersebut! C. 6,25


38. Hitunglah JKK! A. 2,55
39. Hitunglah JKT! A. 8,75
40. Ada 15 orang cina ditanyai dan diketahui rata-rata setiap bulan mereka minum 29liter air
dengan simpangan baku = 5. Ada 10 orang swiss ditanyai dan diketahui rata-rata setiap bulan
mereka minum 30liter air dengan simpangan baku = 4. Berapakah derajat bebas bagi distribusi t
A. 21
33. Di bawah ini yang merupakan arti dari H1:R≠0 pada uji spearman adalah..
C. Korelasi tidak sama dengan 0
34. Pada uji spearman peringkat diberikan terpenting kategori…
B. Data

Diketahui sebuah data 4 metode penggemukan, berikut adalah data 10 orang


sampel yang di data rata-rata penaikan berat badan setelah satu bukan
melakukan program anova 1 arah.
Metode 1 Metode 2 Metode 3 Metode 4
Member 1 2 4 4 3
Member 2 3 6 3 4
Member 3 3 - - 2
Total 7 10 7 9 T= 33
Kolom

35. Hitunglah JKT..,


B. 14,3
36. Hitunglah JKG
D. 5,2
29. diibawah ini merupakan rumus statistic uji Z spearman adalah
: Z=Rs(√n-1)
30. Notasi d 1 dalam uji spearman digunakan untuk menentukan
: selisih peringkat pasangan data 1
31. Di bawah ini yang merupakan arti dari H1 : R<0 pada uji spearman adalah :
: Korelasi negative
32. Di bawah ini yang merupakan arti dari H1 : R>0 pada uji spearman adalah :
: korelasi positif
Thomas Widodo, Ir. Dr.
Hp 0812 294 222 40
thomaswidodo57@gmail.com
Komplek DKI, Jln. Taman II, Blok
S. No. 1, Ciganjur
Jagakarsa, Jakarta Selatan
MENU HARI INI

STATISTIKA LANJUTAN

THOMAS WIDODO
Evaluasi

v UTS+Tugas (50 %)
v UAS (50 %)
SAP STATISTIKA 2 (IT-045228)
M POKOK/SUB POKOK BAHASAN
1 Konsep Dasar Sampling
·pengertian populasi, sampel, parameter dan statistik
·manfaat sampling
·metode sampling acak sederhana, sampling acak sistematis,
sampling berstrata dan sampling kelompok.
2 Lanjutan cara penentuan sampel
3 Konsep Selang kepercayaan
• Tabel Z`dan t
• Tingkat signifikansi 90%-99%
M POKOK/SUB POKOK BAHASAN

5 Pendugaan parameter (lanjutan tatap


muka ke-2)
 Penentuan jumlah sampel
 Pendugaan rata-rata (2 populasi)
 Galat (error)
 (lanjutan tatap muka ke-2)
6 Pendugaan parameter, (lanjutan tatap
muka ke-3)
 Penentuan jumlah sampel
 Galat (error)
 Pendugaan proporsi (1 & 2 populasi)
 (lanjutan tatap muka ke-3)
M POKOK/SUB POKOK BAHASAN

8 PENGUJIAN HIPOTESIS
 Konsep dasar uji hipotesis proporsi
 Prosedur uji hipotesis proporsi (1 & 2 populasi)
 Galat dalam pengujian (tipe alpha dan beta

9 Lanjutan tatap muka ke 6

10 Uji chi kuadrat


 Uji goodness of fit

11 Uji kontigensi
Teori dan contoh kasus
12 Uji linear sederhana, Berganda dan uji korelasi
 Persamaan Regresi sederhana
 Korelasi
 Konsep variable dependen dan independen
 Persamaan uji regresi berganda
M POKOK/SUB POKOK BAHASAN

13 Uji linear sederhana, Berganda dan uji korelasi


 Persamaan Regresi sederhana
 Korelasi
 Konsep variable dependen dan independen
 Persamaan uji regresi berganda
14 REVIEW
Daftar Referensi
• Shavelson, Richard J. 1998. Statistical
Reasoning for the Behavioral Science.
Boston : Allyn & Bacon
• Kustituanto, B. & Badrudin, R. 1994.
Statistika 2 – Deskriptif. Seri Diklat Kuliah.
Jakarta : Penerbit Gunadarma
• Glasnapp, D.R. & Poggio, J.P. 1985.
Essentials of Statistical Analysis for The
Behavioral Sciences. Ohio : Charles E. Merrill
Publishing Co
• Mosteller, F, Fiedler, S.E, Rourke. 1983.
Beginning Statistics with Data Analysis.
Massachusetts : Addisson Wesley Publishing
Co
• Sutrisno, H. 1999. Statistik Jilid 2,3,4.
Yogykarta : Andi Offset
PEMBENTUKAN DISTRIBUSI
SAMPLING
Distribusi Sampling

Sampling

DEDUKTIF

POPULASI SAMPLE

INDUKTIF

Generalisasi

Parameter Statistik
POPULASI , SAMPEL DAN PARAMETER

ØPOPULASI ADALAH SEKUMPULAN INDIVIDU


DENGAN KARAKTERISTIK KHAS YANG
MENJADI PERHATIAN DALAM SUATU
PENELITIAN (PENGAMATAN).
ØSAMPEL ADALAH SEBAGIAN ANGGOTA
POPULASI YANG DIAMBIL MENURUT
PROSEDUR TERTENTU YANG BERFUNGSI
SEBAGAI SUMBER INFORMASI.
lanjutan

ØUKURAN SAMPEL ADALAH


BANYAKNYA ANGGOTA SUATU
SAMPEL.
ØPARAMETER ADALAH SUATU
NILAI YANG MENGGAMBARKAN
CIRI/ KARAKTERISTIK POPULASI.
PERBEDAAN ANTARA POPULASI DAN SAMPEL

URAIAN POPULASI SAMPLE

DEFINISI SELURUH UNSUR YANG MEMILIKI SATU ATAU LEBIH CIRI SEBAGIAN UNSUR ATAU ANGGOTA POPULASI YANG DIPILIH
KARAKTERISTIK YANG SAMA YANG BESARNYA DITENTUKAN UNTUK KEBUTUHAN STUDI OLEH PENELITI, YANG DIANGGAP
OLEH PENELITI MEWAKILI POPULASINYA

KARAKTERISTIK DIKENAL SEBAGAI PARAMETER DIKENAL SEBAGAI STATISTIK

SIMBOL µ= RATA-RATA POPULASI X= RATA-RATA SAMPEL


S = STANDAR DEVIASI s = STANDAR DEVIASI
N= JUMLAH POPULASI n= JUMLAHSampel
CONTOH
SEORANG MAHASISWA DALAM MENYUSUN
SKRIPSI TELAH MELAKUKAN PENELITIAN
PENELITIAN TERHADAP 250 SISWA SMA NEGERI
KOTA DEPOK SELATAN. MAHASISWA TERSEBUT
BERTUJUAN INGIN MENGETAHUI APAKAH
TERDAPAT HUBUNGAN ANTARA PRESTASI
AKADEMIK DENGAN KEBIASAAN MEMBACA DAN
KEBIASAAN MENCARI INFORMASI BARU.

POPULASI ?SAMPEL ?PARAMETER?


Kelebihan METODE
SAMPLING

1. MENGHEMAT BIAYA
ØDATASEBAGIAN DARI POPULASI.
ØPETUGAS YANG DIBUTUHKAN
LEBIH SEDIKIT,
ØHEMAT BIAYA PERCETAKAN,
ØHEMAT BIAYA PELATIHAN,
PENCACAHAN, DAN
PENGOLAHAN.
lanjutan

2. MEMPERCEPAT HASIL SURVEI


ØSURVEI SAMPLE LEBIH KECIL DARI
POPULASI.
ØPELAKSANAAN LAPANGAN DAN
PENGOLAHAN LEBIH CEPAT.
3. CAKUPAN MATERI LEBIH LUAS
Ø DATA YANG DIPERLUKAN
BERAGAM
DAN CUKUP BANYAK.
lanjutan

4. AKURASI LEBIH TINGGI


ØFOKUS
ØPETUGAS LEBIH SIAP
ØJAWABAN RESPONDEN LEBIH
TEPAT
KELEMAHAN METODE SAMPLING

1. Penyajian Wilayah Kecil


Penyajian wilayah kecil seperti kecamatan dan desa
dengan sample terbatas tidak dapat dipenuhi. Pada
umumnya jumlah sample yang digunakan sesuai
dengan tingkat ketelitian yang dikehendaki.

2. Penyajian Variable Proporsi Kecil


Survei sample tidak dapat menyajikan variable yang
kejadiannya kecil dalam populasi(proporsi kecil).
3. Trend Data
Apabila data diperlukan secara berkala untuk
mengukur perubahan yang sangat kecil dari satu
period ke periode berikutnya, kemungkinan
sample diperlukan cukup besar.

4. Tidak Tersedianya Kerangka Sampel


Tidak tersedianya kerangka sample sehingga
persyaratan probabilita sampling tidak terpenuhi.
Biaya untuk pembentukan kerangka sample
cukup tinggi sehingga memiliki pengaruh besar
terhadap total biaya.
Syarat sample yang baik

• Obyektif (sesuai dengan


kenyataan yang sebenarnya)
• Representatif (mewakili
keadaan yang sebenarnya)
• Memiliki variasi yang kecil
• Tepat Waktu dan Relevan
RUANG LINGKUP SAMPLING

1 2

DISTRIBUSI DISTRIBUSI
Sampling Sampling
BEDA BEDA
HARGA HARGA
3 4
RATA- DUA RATA-
RATA RATA
DISTRIBUSI
DISTRIBUSI
Sampling
Sampling
BEDA
BEDA DUA
HARGA
HARGA
Proporsi
1.DISTRIBUSI Sampling BEDA
HARGA RATA-RATA

Sampel 1
Rata-rata (1)
5,8,6,10,12,25,20, 10,

Sampel 2
POPULASI 15,8,6,10,12,30,20, 10,
Rata-rata (2)

Sampel 3
Rata-rata (3)
5,8,6,10,12,35,30, 20, 28

APAKAH ADA PERBEDAAN DIANTARA RATA-RATA 1,2,3 ?


1. BEDA HARGA RATA-RATA
2.DISTRIBUSI Sampling BEDA
HARGA DUA RATA-RATA

Sampel A1
5,8,6,10,12,25,, Rata-rata (1)
POPULASI
A Rata-rata (A)

Sampel A2
Rata-rata (2)
15,8,6,10,12,, 10,

Sampel B1 Rata-rata (1)


POPULASI 5,8,6,10,12,25,,
B Rata-rata (B)

Sampel B2
Rata-rata (2)
15,8,6,10,12,, 10,
2. Beda Harga Dua Rata-rata
3.DISTRIBUSI Sampilng BEDA
HARGA PROPORSI

Sampel Ciri khusus Proporsi

Sampel 1
2 PRIA p1
10 mahasiswa

Sampel 2
POPULASI 15 mahasiswa 3 PRIA p2

Sampel 3
2 PRIA p3
20 mahasiswa

APAKAH ADA PERBEDAAN DIANTARA HARGA PROPORSI 1,2,3 ?


3. BEDA HARGA PROPORSI
4.DISTRIBUSI Sampling BEDA
HARGA DUA PROPORSI

Sampel A1
10 mahasiswa (n1) 2 pria
POPULASI
A Proporsi
gabungan(A)
Sampel A2
3 pria
15 mahasiswa(n2)

Sampel B1 4 pria
POPULASI 14 mahasiswa(n1)
B Proporsi
gabungan (B)
Sampel B2
5 pria
16 mahasiswa(n2)

APAKAH ADA PERBEDAAN HARGA PROPORSI A dan B ?


4. Beda Harga Dua Proporsi

Jika proporsi populasi


(p) tidak diketahui
gunakan proporsi
sample
Contoh 1.

SUATU POPULASI YANG MELIPUTI


10.000 MAHASISWA DENGAN NILAI
RATA-RATA MATA KULIAH STATISTIK
158 SATUAN NILAI DENGAN
SIMPANGAN BAKU 6 SATUAN NILAI
DIAMBIL SAMPEL SEBANYAK 50
MAHASISWA. BERAPA PELUANG NILAI
RATA-2 DARI 50 MAHASISWA;
•ANTARA 154 DAN 160 ?
•PALING SEDIKIT 162,5 ?
Contoh 2.
DIKETAHUI DISTRIBUSI IQ MAKSIMAL
DARI 1000 MAHASISWA TERPANDAI DI
INDONESIA MEMILIKI RATA-RATA 148,2
DENGAN SIMPANGAN BAKU 5,4. JIKA
SUATU SAMPEL TERDIRI DARI 100
MHSW TERBAIK DIPILIH SECARA ACAK
TANPA PEMULIHAN DARI POPULASI
TERSEBUT, BERAPA PROBABILITAS
DARI MHS TERSEBUT MEMILIKI IQ
LEBIH DARI 149?
Contoh 3
SEBANYAK 10.000 SISWA SD KELAS 1
DIBERIKAN TES PERMAINAN. RATA-2 NILAI
PERMAINAN HASIL PENGAMATAN ADALAH
500 SATUAN DENGAN SIMPANGAN BAKU 20.
SAMPEL ACAK YG TERDIRI 100 SISWA
DIAMBIL DARI POPULASI TERSEBUT, BERAPA
PELUANG SISWA TSB MEMILIKI NILAI RATA-2
KURANG DR 496 ?
CONTOH 4

4. SEBUAH PERGURUAN TINGGI TERKEMUKA DI JAKARTA,

MENERIMA MAHASISWA BARU 2000 ORG DNG SELEKSI

SANGAT KETAT. DARI JUMLAH TERSEBUT ADA 600

ORANG DARI LUAR JAKARTA. APABILA SAMPEL ACAK

SEBESAR 500 ORG DIAMBIL DARI POPULASI TSB

DENGAN SISTEM PEMULIHAN , BERAPA SAMPEL

PROPORSI MAHASISWA DARI LUAR JAKARTA ;


BL
•KURANG DARI 156 /500 ?
CONTOH 5

DALAM PEMILIHAN KEPALA DAERAH PROPINSI


(GUBERNUR/WAKIL), PASANGAN JOHAK
MEMPEROLEH SUARA 46%. TENTUKAN
PROBABILITASNYA BAHWA DARI:
• JIKA 200 ORANG DIPILIH SECARA RANDOM DARI
SELURUH PEMILIH SECARA MAYORITAS AKAN
MEMBERIKAN SUARANYA UNTUK PASANGAN
JOHAK?
• 1000 ORANG DIPILIH SECARA RANDOM DARI
SELURUH PEMILIH SECARA MAYORITAS AKAN
MEMBERIKAN SUARANYA UNTUK PASANGAN
JOHAK?

4.18
CONTOH 6
DUA KELOMPOK MHSW SANGAT RAJIN DAN RAJIN DIPERKIRAKAN
MENGHABISKAN WAKTU BELAJAR SELAMA SATU TAHUN MASING-2
1.400 JAM DAN 1200 JAM, DNG. SIMPANGAN BAKU 200 JAM DAN
100 JAM. APABILA DARI TIAP KELOMPOK DIAMBIL SAMPEL
SEBANYAK 125 MHSW SELANJUTNYA DITELITI WAKTU BELAJARNYA.
TENTUKAN PROBABILITAS BAHWA KLP. MAHASISWA SANGAT RAJIN
MEMILIKI WAKTU BELAJAR PALING SEDIKIT;
• 160 JAM LEBIH LAMA DARI PADA KLP.RAJIN.
• 250 JAM LEBIH LAMA DARIPADA KLP. RAJIN.

4.19
Contoh 7

SUATU VARIABEL RANDOM YG TERDIRI DARI LULUSAN SARJANA


YANG BERASAL DARI UNIVERSITAS ALOMON DAN UNIVERSITAS
ALMAIDA , MASING-2 SEBANYAK 100 ORANG. DIKETAHI LULUSAN
UNIVERSITAS ALOMON SEBANYAK 80 ORANG LANGSUNG BEKERJA
SEDANGKAN UNIVERSITAS ALMAIDA LEBIH RENDAH YAITU
SEBANYAK 66 LULUSAN. TENTUKAN PROBABILITAS LULUSAN DARI
UNIVERSITAS ALOMON YANG LANGSUNG BEKERJA LEBIH TINGGI
10% DARIPADA UNIVERSITAS ALMAIDA.
Contoh 8
Hasil rekapitulasi daftar hadir Mahasiswa
Falutas Ekonomi memperlihatkan 5 %
tidak hadir dalam perkuliahan sedangkan
untuk Fakultas Psikologi hanya 4 %. Jika
diambil secara acak dari masing-masing
fakultas sebanyak 100 mahasiswa,
tentukan probabilitas mahasiswa Psikologi
lebih tinggi 0,5% ketidakhadirannya
dibandingkan dengan mahasiswa Fakultas
Ekonomi?
PENDUGAAN STATISTIK

INGAT KEMBALI
vNILAI PARAMETER DIDUGA ATAU
DIESTIMASIKAN DENGAN NILAI STATISTIK
DARI SAMPEL RANDOM.
vHARGA SAMPEL YG DIGUNAKAN UNTUK
MENDUGA DISEBUT ESTIMATOR DAN
PENDUGANYA DISEBUT VARIABEL RANDOM.
vHASIL PENDUGAAN INI TIDAK SELALU TEPAT
100 % ATAU SELALU ADA ERROR .
Teknik Sampling

Sampling

POPULASI SAMPLE

Generalisasi

Parameter Statistik
ESTIMATOR YANG BAIK

• TIDAK BIAS
Jika harga statistik (Hst)= harga
parameter (Hp) atau error (E) relatif
kecil

• EFISIEN
PENDUGA EFISIEN JIKA SIMPANGAN
BAKUNYA ( )KECIL
• KONSISTEN
ØPENDUGA TERKONSENTRASI PADA
PARAMETER, MESKIPUN SAMPEL
BERTAMBAH BESAR SAMPAI TIDAK
TERHINGGA. SEMAKIN BESAR ANGGOTA
SAMPEL SEMAKIN KECIL HARGA
SIMPANGAN BAKU.
ØE= (Hp – Hst) = 0 , jk n =∞
• CARA MENDUGA
PENDUGAAN HARGA
TITIK (POINT PARAMETER (Hp)
ESTIMATION)
Harga parameter diduga dengan satu harga statistik sampel. Dalam
pendugaan ini selain menentukan harga statistik ditentukan pula
besarnya kesalahan (error).

= titik pusat pendugaan


= Pendugaan yang salah
CARA MENDUGA HARGA PARAMETER (Hp)
• PENDUGAAN INTERVAL (INTERVAL ESTIMATION)
Hp YG DIDUGA TERLETAK DLM DUA BATAS NILAI YG DTENTUKAN OLEH
BESARNYA PROBABILITAS.

0,5α 0,5α

Pendugaan salah =
Area tembak =
Titik tengah =
Batas probabilitas =
Pendugaan dalam batas =
? ?

0,5α 0,5α
X
-3 -2 -1
0
1 2 3
Z
Area tembak = Tergantung dari probabilitas yg kita tentukan,
umumnya digunakan 90%, 95%, 97,5% atau 99%, ini
disebut sebagi selang kepercayaan (interval of
confidence, interval of probability)
Ingat kurva normal tersebut bernilai 100% atau nilai peluang seluruhnya 1
sehingga jika interval diketahui maka alpha bisa dihitung dan sebaliknya.
RUANG LINGKUP PENDUGAAN

• PENDUGAAN HARGA RATA-RATA POPULASI


• PENDUGAAN HARGA PROPORSI POPULASI
• PENDUGAAN PARAMETER BEDA DUA RATA-RATA
• PENDUGAAN BEDA DUA PROPORSI
A. PENDUGAAN HARGA RATA-RATA POPULASI
• INTERVAL (ESTIMASI ) UTK µ
JK n ≥ 30 DIANGGAP MENYEBAR NORMAL, DIMANA µx = µ dan

1- α p = 95%; α=5%
p(Zα/2 ) = 1,96

0,5 α 0,5 α
µx X
-3 -2 -1,96 -1
0
1 1,96 2 3
Z

-1,96<Z <1,96 -1,96< <1,96

R1
Contoh 1.
Sebuah penelitian ingin mengetahui rata-rata nilai yg diperoleh siswa SMU Kelas 3
pada ujian matematika. Sebuah sampel random sebanyak 100 siswa telah terpilih.
Rata-2 nilai tsb 96 dng simpangan baku 1,6. Hitunglah interval keyakinan 98% untuk
menghitung rata-2 nilai ujian matematika tsb.

=s=1,6
2. MENGHITUNG E ( ERROR)

Jika tidak diketahui diganti dengan nilai s (standar deviasi sampel)

sehingga menjadi maka kita peroleh :

R2

Jika dalam perhitungan Nilai E , misalnya 0,75 artinya nilai harus lebih kecil dari
0,75 atau maksimum 0,75
MENENTUKAN BESARNYA SAMPEL (n)

• kegunaanya utk menentukan jumlah atau


besarnya sampel random agar diperoleh hasil
dengan tingkat ketepatan tertentu.
• tingkat ketepatan diukur dengan besarnya
error (e) maksimum.

R3

n dibaca minimal
Contoh 2.
Sebaran nilai sikap Siswa SMP menyebar
normal dng simpangan baku 0,50. Berapa
sampel yang harus diambil agar rata-2 sampel
tidak akan berbeda dari rata-2 populasinya
lebih dari 0,1. Gunakan selang kepercayaan
95%.
2. PENDUGAAN HARGA PROPORSI POPULASI
1. Interval estimasi untuk p
jika populasi sangat besar dan proporsi p tdk terlalu
dekat dng 0 atau 1 , mk dist.harga proporsi ( ) akan
mendekati dist. normal dan mempuyai rata-2 = proporsi
populasinya, yaitu;

R4

= harga mean proporsi = harga proporsi P = harga proporsi


populasi sampel populasi

Jika proporsi populasi


tidak diketahui dapat R5
diganti dengan
proporsi sampel
Contoh 3.
Sebuah sampel random terdiri dari 250 mahasiswa yang mengambil mata kuliah
Budaya Organisasi(BO). Dari 250 mahassiswa yang mengambil MK. BO tersebut
terdapat 165 mahasiswa yang juga mengambil Psikologi Belajar/Mengajar.
Dengan interval keyakinan 99% buatlah pendugaan proporsi mahasiswa yang
yang mengambil MK.BO juga mengambil mata kuliah Psikologi Belajar/Mengajar.

Jika proporsi populasi


tidak diketahui dapat R5
diganti dengan
proporsi sampel
1. Cara menghitung nilai error (E)

2. Menentukan besarnya sampel (n)


ØKegunaanya utk menentukan jumlah/ besarnya sampel
random agar diperoleh hasil dng tingkat ketepatan
tertentu.
ØTingkat ketepatan diukur dengan besarnya error (e)
maksimum.

R6
Nilai maksimum diperoleh apabila

Harga maks dari f(p) adalah p(1-p) = 0,5x0,5 = 0,25


Contoh 4.
Apabila kita ingin mengetahui proporsi mahasiswa suatu PT yang mengendarai
sepeda motor pergi/pulang untuk kuliah, berapa besar sampel yang harus diambil
dengan probabilitas 0,95 dan kesalahan tidak lebih dari 0,09?

Probabilitas = 0,95 atau α = 1-0,95 = 0,05 ; E = 0,09; berapa n?


PENDUGAAN
• Interval Estimasi PARAMETER BEDA DUA RATA-2
• Dua populasi mempunyai rata2 yaitu µ1 dan µ2 dengan simpangan baku
dan . Untuk menduga beda dua harga mean ;

dengan simpangan baku

R7
Interval 1 - α

Jika simpangan baku


= populasi tdk diketahui
diganti dng S (simpangan
baku sampel)

R8
CONTOH 5.
Sampel random sebanyak 150 mahasiswa sangat rajin dan 200 mahasiswa rajin
diperkirakan menghabiskan waktu belajar masing-2 1.400 jam dan 1200 jam
pertahun , dengan simpangan baku 120 jam dan 80 jam. Dengan interval
konfidensi 95% berapakah perbedaan waktu belajar yang digunakan antara
kelompok mahasiswa sangat rajin dan kelompok mahasiswa rajin?

Jawab.
Interval keyakinan= 95% atau alpha 5% ; n1= 150 n2=200 ; S1 = 120; S2 = 80; X1 =
1400 dan X2 = 1200
Pertanyaan ( µ1 - µ2 )?

=
2. Point estimasi

Dengan interval
1-α

R9
PENDUGAAN BEDA DUA PROPORSI
• Interval estimasi untuk ( p1- p2 )

Interval ( 1- α ) Jika p populasi


tidak diketahui
diganti dengan
p sampel

R1
0
Contoh 6
Dari sampel random sebanyak 400 pemirsa dewasa
dan 600 pemirsa remaja yang mengikuti program
siaran TV “Take Me Out” , diketahui 100 pemirsa
dewasa dan 300 pemirsa remaja menyatakan
menyukai program TV tersebut. Dengan interval
konfidensi 99%, tentukan perbedaan proporsi
pemirsa yang menyukai program TV tersebut
antara semua pemirsa dewasa dan pemirsa
remaja.
PENDUGAAN PARAMETER DENGAN SAMPEL KECIL

Untuk sampel kecil n < 30 digunakan formula


umum distribusi t

α
µx tα
1.Jika µ dengan tidak diketahui dan
populasi tidak terbatas.
Tidak diketahui dapat dihitung dengan S, maka µx
dengan interval (1- α) dapat ditentukan dengan
cara sbb;

df = n-1
Contoh 8.
Sebuah studi kasus terhadap kinerja /prestasi
kerja karyawan telah dilakukan di Pabrik
Sepatu mengenai karyawan di suatu
perusahan. Sampel random sebanyak 25
karyawan dan nilai rata-rata kinerja karyawan
yaitu 2.850 skor; simpangan baku 120 skor.
Hitunglah dengan interval 95% untuk harga
rata-rata nilai kinerja karyawan perusahaan
tersebut.
2.Jika µ dengan tidak diketahui dan
populasi terbatas.

Faktor koreksi

Contoh 9.
Sebuah lembaga Psikologi melakukan tes untuk mengetahui muatan
leadership dari mahasiswa FISIP sebuah PT. Sampel random telah diambil
sebanyak 14 mahasiswa dari 90 mahasiswa yang dianggap memiliki
karakteristik leadership tinggi. Rata-rata nilai yang diperoleh 75,6 dengan
simpangan baku 2,65. Buatlah interval keyakinan sebesar 95% untuk
menduga rata-rata nilai muatan leadership dari mahasiswa FISIP yang
dimaksud.
3. Interval estimasi µ1-µ2, jika dan
tidak diketahui
Jika dan jika tidak
diketahui, maka µ1-µ2 dapat dihitung dengan
interval 1 - α sbb;
4.Apabila ≠ serta maupun tidak diketahui

Simpangan baku yang tidak diketahui dapat


diganti dengan S1 dan S2, maka interval
estimasi dengan (1-α) dihitung sbb:
TOPIK 4. M-10.
ANALISIS KORELASI DAN REGRESI.
Bag.1.
Tgl 19 Juni 2021
Learning Out Come (LO)
(Capaian Pembelajaran)
Mahasiswa setelah mempelajari Materi Pembeajaran diharapkan :
Pengetahuan
Mampu menjelaskan fungsi dan kegunaan alnalisis Korelasi dan Regresi
Sederhana dan Berganda dalam analisis statistic inferensial.
Ketrampilan
Mampu mengaplikasikan analisis korelasi dan regresi berdasarkan data
tersedia baik Korelasi/Regresi sederhana maupun ganda dalam uji hipotesis.
Pengertian Analisis Korelasi
Korelasi merupakan salah satu teknik analisis dalam statistik yang digunakan
utuk mencari hubnungan antara dua variabel yang bersifat kuantitatif.
Hubungan dua variabel tersebut dapat terjadi karena adanya hubungan sebab
akibat atau dapat pula terjadi karena kebetulan saja.
Dua variabel dikatakan berkolerasi apabila perubahan pada variabel yang satu
akan diikuti perubahan pada variabel yang lain secara teratur dengan arah
yang sama (korelasi positif) atau berlawanan (korelasi negatif).
Kedua variabel yang dibandingkan satu sama lain dalam korelasi dapat
dibedakan menjadi variabel predictor (independent) dan variabel Kiterium
(dependen). Sesuai dengan namanya, variabel ktor adalah variabel yang
perubahannya cenderung di luar kendali manusia. Sementara itu variabel
dependen adalah variabel yang dapat berubah sebagai akibat dari perubahan
variabel kriterium.
MANFAAT ANALISA KORELASI DAN
REGRESI
Dapat Menunjukan Kekuatan Hubungan Antar
Variabel;
Dapat Menujukan Sifat Atau Arah Hubungan
Antar Variabel;
Dapat Untuk Mengetahui Kontribusi Suatu
Variabel Terhadap Suatu Perubahan;
Dapat Digunakan Untuk Peramalan Terjadinya
Suatu Peristiwa Yang Akan Datang
Berdasarkan Peubah Bebas Terhadap Peubah
Tidak Bebas
Ruang Lingkup Pembahasan

KORELASI dan REGRESI LINIAIR


SEDERHANA
KORELASI dan REGRESI BERGANDA
UJI HIPOTESIS
Jenis Variabel
Variabel bebas( independent)….. Ananlisis regresi
Variabel yang nilai dapat berubah setiap waktu, baik perubahan itu terjadi
secara alam atau oleh karena direncanakan.
Contoh:
 Jumlah pupuk yang digunakan
 Motivasi petani/karakteristik inovasi
 Orientasi kelompok, dll
Variabel terikat ( dependent),….. Analisis regresi
Variabel yang nilainya berubah yang disebabkan oleh perubahan nilai
variabel bebas.
Contoh :
 Jumlah produksi
 Kinerja petani/penyuluh
 Pendapatan usahatani, dll
Variabel moderasi
Variabel intervening
Notasi atau Lambang Variabel

Variabel bebas (X); predictor; independence variable


Variabel terikat (Y); criterion; dependence variabel
Jika variabel bebas (X) lebih dari satu :
X1:X2:X3:X4: ………………….: Xn:
NOTE:
Posisi variabel bebas atau variabel terikat dapat saling bertukar secara
kontekstual berdasakan rancangan analisis yang digunakan.
Contoh :
Kita ingin menganalisis hubungan antara motivasi dan kinerja
karyawan . Dalam hal ini motivasi adalah variabel bebas sedangkan
kinerja karyawan variabel terikat.
Kita ingin menganalisis hubungan antara kinerja karyawan dan
penghargaan yang diberikan oleh perusahaan. Dalam hal ini kinerja
karyawan variabel bebas sedangkan penghargaan yang diberikan oleh
perusahaan variabel terikat.
Contoh variabel

Kontrol diri
Motivasi berprestasi
Persepsi
Pola Asuh
Efikasi diri, dll

• Impulse buying
• Stress Kerja
• Kebahagiaan
• Komitmen
• Kinerja , dll
Perbedaan ?

KORELASI dan REGRESI LINIEIR


SEDERHANA
Analisis ini hanya meliputi satu Variabel
Tidak Bebas (Y) dan Variabel Bebbas (X)
KORELASI dan REGRESI BERGANDA
Analisis ini hanya meliputi satu Variabel
Tidak Bebas (Y) dan 2 atau lebih Variabel
Bebbas (X)
1. ANALISIS KORELASI LINIER
SEDERHANA
Analisis korelasi sederhana (Bivariate Correlation) digunakan untuk mengetahui
keeratan hubungan antara dua variabel dan untuk mengetahui arah hubungan yang
terjadi. Koefisien korelasi sederhana menunjukkan seberapa besar kekuatan
hubungan yang terjadi antara dua variabel yaitu variabel predictor (X) dan variabel
kriterium (Y).
Kekuatan hubungan diartikan sebagai hubungan kuat, sedang atau lemah sedangkan
arah hubungan yaitu positif atau negative. Arah hubungan positif artinya jika nilai
Variabel X naik maka nilai Variabel Y juga meningkat. Arah hubungan negate
meningkat maka nilai Variabel Y menurun.

Analisis korelasi berkaitan erat dengan regresi, tetapi secara konsep berbeda dengan
analisis regresi. Analisis korelasi adalah mengukur suatu tingkat atau kekuatan
hubungan linear antara dua variabel
Cara Menggambarkan

Korelasi ini secara sederhana dapat diartikan sebagai


gambaran yang menunjukan hubungan antara
variabel tidak bebas dan satu variabel bebas yang
dinyatakan dengan nilai r.

Kontrol diri Stress kerja


(X) (Y)
Koefisien korelasi linier sederhana (r)

Nilai r dapat diperhatikan pada gambar bawah ini, berkisar


antara -1 sd 1;
Nilai r menunjukan (1) kekuatan hubungan antara X dan Y;
(2) arah hubungan antara X dan Y

Nilai r
Lemah
- -0,5 0 +0,5 +1
1

Kuat Kuat
Bentuk hubungan antar variabel

Y = a + bx Y = a - bx Y=a

(a) korelasi positif= r = + (b) korelasi negative=r= - (c) Tidak ada korelasi=r=0

b = koefisien regresi = slope = gradien


a = konstanta = intercept
KARAKTERISTIK KORELASI LINEAR

Nilai r berkisar antara +1 dan -1


Nilai r + , maka nilai b (koefisien regresi (b) juga +
Nilai r - , maka nilai b (koefisien regresi (b) juga –
Nilai r mendekati +1 dan -1 , maka memiliki korelasi linear yang tinggi
Nilai r = +1 atau r = -1 , maka memiliki nilai korelasi linear yang sempurna
Jika nilai r = 0 maka X dan Y tidak memiliki relasi ( hubungan ) linear, maka
tidak memiliki regresi linear akan tetapi analisis dilanjutkan melalui regresi
eksponensial
Kriteria Tingkat Kekuatan Nilai r

Beberapa referensi membuat kategorisasi nilai koefisien korelasi sebagai berikut (


Sugiyono, 2013) :
0.00 < r ≤ 0,199 disebut kekuatan hubungan sangat rendah
0,20 ≤ r ≤ 0,3999 disebut kekuatan hubungan rendah
0,40 ≤ r ≤ 0,5999 disebut kekuatan hubungan sedang
0,60 ≤ r ≤ 0,799 disebut kekuatan hubungan kuat
0,80 ≤ r ≤ 1,000 disebut kekuatan hubungan sangat kuat
Koefisien Determinasi (R = r2)

Nilai Koefisien Determinasi (R) sangat berkaitan erat dengan nilai Koefisien
Korelasi (r).
Untuk melihat seberapa besar tingkat pengaruh variabel bebas (X) terhadap
variabel tidak bebas (Y) pada saat melakukan analisis regresi.
Koefisien determinasi merupakan sebagai ukuran untuk mengetahui
kemampuan dari masing-masing variabel yang digunakan
Koefisien determinasi menjelaskan proporsi variasi dalam variabel dependen
(Y) yang dijelaskan oleh hanya satu variabel independen
KRITERIA ANALISIS KOEFISIEN DETERMINASI (Kd)

Kriteria dalam melakukan analisis koefisien determinasi


adalah sebagai berikut:
Jika Kd mendekati nol (0), berarti pengaruh variabel
independen terhadap variabel dependen lemah, dan
Jika Kdmendekati satu (1), berarti pengaruh variabel
independen terhadap variabel dependen kuat.
Cara menghitung nilai korelasi (r)

Keterangan :
r = koefisien korelasi
X = variabel bebas
Y = variabel tidak bebas
n = jumlah sampel N = jumlah populasi
Contoh 1

Diketahui data skor hasil kepada 5 orang karyawan suatu perusahaan tentang
control diri dan stress kerja pada table dibawah ini( data sifatnya simulative untuk
mempermudah). Ujilah hipotesis yang menyatakan adanya hubungan antara
control diri dan stress kerja dengan signifikansi 1%.

No Skor control diri Skor stress kerja


(X) ( Y)

1 2 5

2 4 6

3 5 8

4 7 10

5 8 11
Pemecahan Contoh 1

 Tentukan variabel bebas X sebagai variable predictor dan variabel


Tidak Bebas Y sebagai Variabel Kriterium . Dalam contoh soal antara
jarak dan banyaknya gangguan dalam berkomunikasi, maka jarak = X
dan jumlah gangguan = Y
 Buat tabel kerja dengan memperhatikan rumus, komponen apa saja yg
perlu dihitung.
 Berdasarkan No. 2, maka tabel soal ditambah kolom dan baris sesuai
komponen yang mau dihitung.
 Lihat tabel kerja ada tambahan kolom XY, X2,dan Y2 serta baris untuk
menghitung ∑ X, ∑Y, ∑XY, ∑X2, dan ∑Y2 . Tabel ini untuk
mempermudah perhitungan persamaan regresi dan koefisien korelasi.
Membuat Tabel kerja berikut untuk mempermudah perhitungan nilai r:

Data Xi Yi XiYi
(X i )2 (Y i )2
1 2 5 10 4 25

2 4 6 24 16 36

3 5 8 40 25 64

4 7 10 70 49 100

5 8 11 88 64 121

∑ 26 40 232 158 346

n=5 ∑Xi ∑Yi ∑Xi ∑(Xi ∑(Yi


Yi )2 )2
( ∑Xi )2 = 262 = 676 ( ∑Yi )2 = 402 = 1600

Note;
Perhitungan semacam ini dalam praktiknya kita menggunakan soft ware.
Menghitung nilai korelasi (r) dengan rumus sebagai berikut;

Ø Berdasarkan nilai koefisien korelasi (r) = 0,33 kekuatan hubungan antara


control diri dan stress kerja memiliki kekuatan hubungan rendah.
Ø Nilai Koefisien Determinasi (R) = r2 = 0,332 = 0,1089 atau 10,89%. Artinya
perubahan nilai Y ( stress kerja ) dapat dijelaskan oleh variasi perubahan nilai
X ( control diri ) sebasar 10,89% dan selebihnya (100%-10,89% = 89,11%) oleh
variabel lainnya selain fakor control diri.
Ø R = adjusted correlation = adjusted R square ( aplikasi )
2. ANALISIS
REGRESI
a. ANALISIS REGRESI DINYATAKAN DALAM BENTUK PERSAMAAN
REGRESI
b. PERSAMAAN YANG MENUJUKAN HUBUNGAN ANTARA PEUBAH Y=a
BEBAS (VARIABEL BEBAS)DENGAN PEUBAH TIDAK BEBAS
(VARIABEL TIDAK BEBAS).
c. SCATTER DIAGARAM YANG MENGGAMBARKAN SEBARAN NILAI-
NILAI OBSERVASI PEUBAH TAK
Y=BEBAS
a - bx DAN PEUBAH
Y = BEBAS.
a
Y = a + bx

b = koefisien regresi = slope = gradien


a = konstanta = intercept
RUMUS PERSAMAAN REGRESI
Y = a + bx
MENGHITUNG NIALAI a dan b
 Y = 2,530 + 1,053 X, kita interpretasikan sebagai berikut :
Ø b = 1, 053 . Artnya setiap perubahan satu unit X ( Kontrol diri ) menyebabkan
perubahan 1,053 unit Y ( Stress kerja )
Ø a= 2,53 . Artinya apapun kondisinya tetap ada stress kerja sebesar 2,53
satuan skor pada pelanggan.

Y = 2,53 + 1,053 X
Y

1,053 Y = 2,53 + 0,75 X

2,530
X
Contoh 7.
Sebuah studi kasus terhadap kinerja /prestasi kerja karyawan telah dilakukan di
Pabrik Sepatu mengenai karyawan di suatu perusahan. Sampel random
sebanyak 25 karyawan dan nilai rata-rata kinerja karyawan yaitu 2.850 skor;
simpangan baku 120 skor. Hitunglah dengan interval 95% untuk harga rata-
rata nilai kinerja karyawan perusahaan tersebut.

Jawaban

df = n-1

n= 25; s = 120;
df = n-1 = 25-1=24;
Contoh 8.
Sebuah lembaga Psikologi melakukan tes untuk mengetahui muatan leadership
dari mahasiswa FISIP sebuah PT. Sampel random telah diambil sebanyak 14
mahasiswa dari 90 mahasiswa yang dianggap memiliki karakteristik leadership
tinggi. Rata-rata nilai yang diperoleh 75,6 dengan simpangan baku 2,65. Buatlah
interval keyakinan sebesar 95% untuk menduga rata-rata nilai muatan
leadership dari mahasiswa FISIP yang dimaksud.
Jawaban.

n= 14; N = 90 , maka n/N > 5% s =2,65;

df = 14-1 =
13;
Analisis Of Varian
(Anova)

1
Kegunaan

Øuntuk menguji hipotesis kesamaan rata-


rata dari tiga atau lebih populasi, dengan
asumsi tertentu.
Øasumsi
üSampel diambil secara random dan
saling bebas (independen)
üPopulasi berdistribusi Normal
üPopulasi mempunyai kesamaan
variansi
2
Ilustrasi
Sampel = n
Menduga nilai
Mhsw F. populasi
Psikologi
(µ1) 22,21,26,23 Apa yang mungkin
(s1)2 -rata-rata, SD, varian terjadi ?

Nilai µ1=µ2=µ3
Atau salah satu
tidak sama
Mhsw F. 22,25,24,25
Ekonomi -rata-rata, SD, varian
Hipotesis
(µ2)
(s2)2
Anova satu arah
Mhsw F.
Teknik Inf
(µ3) 25,29,28,30
-rata-rata, SD, varian
(s3)2
Parameter : kedisiplinan
diukur dengan skor 1-303
Tabel Data Anova Satu ARah
Sampel T
o
t
a
l

1 2 … i … k

x11 x21 … xi1 … Xk1

x12 x22 … xi2 … Xk2

: : : : : :

x1n x2n … xin … xkn

n1 n2 n3 nk

4
Tabel Anova Satu Arah
(jumlah sampel sama)
Sumber Derajat
Jumlah Kuadrat Rata
Variasi bebas Statistik F
kuadrat (SS) -rata (MS)
(SV) (df)
Perlakuan KRP =
k–1 JKP
(BG) JKP/(k – 1 ) F=
Galat KRG = KRP/KRG
k(n-1) JKG
(WG) JKG/(k(n-1))
Total nk – 1 JKT
Keterangan;
k= jumlah kategori populasi ; n= jumlah anggota sampel

H0 ditolak jika F > F{a; k – 1; k(n – 1)}


5
Rumus Hitung Jumlah Kuadrat
(jumlah sampel sama)

JKT =Jumlah Kuadrat Total


JKP = Jumlah Kwadrat Perlakuan
JKG =jumlah Kwadrat Galat

6
Distribusi F

H0 ditolak

Ho diterima α= 0,05

Titik Kritis
F{a; k – 1; k(n – 1)}

Ho diterima , jika Fhit ≤ Ftabel


Ho ditolak , jika Fhit > Ftabel
7
Tabel F0,05
df. for numerator (k atau j)
d
f 1 2 3 4
f
o
1
r 2
d
e 3
n
o 4
m
i
n
a
9 4,26 3,63
t
o
r

J.K

8
Tabel Anova Satu Arah
(Jumlah sampel berbeda)
Dera-
Sumber Jumlah Kuadrat Rata-
jat Statistik F
Variasi kuadrat rata
bebas

Perlakuan
KRP =
(between k–1 JKP
JKP/(k – 1 )
group)
F = KRP/KRG
Galat (within KRG =
N–k JKG
group) JKG/(N - k)

Total N–1 JKT

Tabel Anova Satu Arah


9
(Jumlah sampel sama)
Rumus Hitung Jumlah Kuadrat
(Jumlah sampel berbeda)

JKT =Jumlah Kuadrat Total


JKP =Jumlah Kuadrat Perlakuan
JKG =Jumlah Kuadrat Galat
k =Jumlah Kelompok Populasi
10
Contoh 1, untuk n sama
Sampel Skor kedisiplinan berdasarkan fakultas
1 2 3 Total (T)
1 22 22 25 69
2 21 25 29 75
3 26 24 28 78
4 23 25 30 76
Means 23 24 28 75
Total 92 96 112 T=300
(Ti)2 8464 9216 12544

11
PENYELESAIAN
1. Merumuskan Hipotesis
§ H0: 1 = 2 = 3
§ H1: Ada rata-rata yang tidak sama
2. Menentukan LOS
a = 0.05;
df1= derajat bebas perlakuan =k-1= 2
df2 = derajat bebas galat = n-k = 12-3= 9
F{a; k – 1; (n – k)} .....F(0.05;2;9) = 4,26
3. Kriteria Pengujian
Ho diterima , jika Fhitung ≤ 4,26
Ho ditolak, jika Fhitung > 4,26

12
4. Perhitungan
Sampel Skor kedisiplinan berdasarkan fakultas
1 2 3

Xi (Xi)2 Xi (Xi)2 Xi (Xi)2 Total


1 22 484 22 484 25 625 69
2 21 441 25 625 29 841 75
3 26 676 24 576 28 784 78
4 23 529 25 625 30 900 76
Means 23 529 24 576 28 784 75
Total 92 2130 96 2310 112 3150 300
(Ti)2 8464 9216 12544 ∑(Xi)2 =
7590
∑(Ti)2 =
30.224

13
14
5.Kesimpulan
Dari hasil perhitungsan diperoleh Fhitung = 7,41 > Ftabel= 4,26, maka Ho
ditolak. Artinya 1 = 2 = 3 tidak benar atau dengan kata lain ada yang tidak
sama diantara nilai rata-rata tersebut.

6. Menguji rata-rata yang berbeda


ØBeda Xi – Xii = 23-24 = 1< 4,26........NS
ØBeda Xi – Xiii = 23 – 28 = 5 > 4,26 ..... S
ØBeda Xii - Xiii = 24 – 28 = 4 < 4,26 ...........NS
Jadi yang berbeda adalah rata-rata Xii dengan Xiii

15
Contoh 2, untuk n berbeda

Sampel Skor kedisiplinan berdasarkan fakultas


I II III Total (T)
1 22 22 25 69
2 21 25 29 75
3 26 25 28 51
4 23 25 30 23
Means 23 24 27 72,78
Total 92 72 54 ∑T=218
∑(Xi)2 = 5.281

(Ti)2 8464 5184 2916 ∑(Ti)2 =16.564

n 4 3 2 9
[(Ti)2 ] : n 2116 1728 1458 5302

16
Sumber Derajat Jumlah Kuadrat Rata-
Statistik F
Variasi bebas kuadrat rata

Perlakuan 3 – 1=2 11 5,5


5,5:-0,32 =-
Galat 9 – 3=6 -3,5 -0,32 17,19

Total 9 – 1=8 7
17
5.Kesimpulan
Dari hasil perhitungsan diperoleh Fhitung = -17,19 < Ftabel= 4,26, maka Ho
diterima . Artinya 1 = 2 = 3 adalah benar atau dengan kata lain tidak ada
perbedaan diantara nilai rata-rata tersebut.

18
ANOVA DUA ARAH

19
Tabel data Anova dua arah

Perlakuan V1
Perlakuan
V2
C1 C2 Ck Total
R1 Tr1

R2
Tr2

R3 Tr3

Total Tc1 Tc2 Tck T

20
Tabel Anova Untuk Dua Arah

Sumber Derajat
bebas Jumlah Jumlah Kuadrat Rata
Variasi Fhitung
kuadrat (SS) -rata (MS)
(SV) (df)
1 2 3 4

Baris R R-1 JKR JKRr=JKR /(R – 1 ) F =JKRr/KRE

F
Kolom C C-1 JKC JKCr=JKC/C-1 =JKRc/KRE

F =JKIr/KRE
Interaksi 1 (R-1) (C-1) JKI JKIr= JKI/(J-1)(K-1)

KRE =
Error E RC(n-1) JKE -
JKG/(k(n-1))
Total N-1 JKT - -
21
RUMUS
ANOVA
DUA
ARAH

JKG = JKT-SSR-SSC-SSI
22
Contoh kasus Anova Dua Arah
Seorang mahasiswa di sebuah universitas data; V1= EQ; V2 =
MUATAN LEADERSHIP (uraikan)

Perlakuan V1
Perlakua C1 C2 C3
n V2

R1 10 14 18
13 16 22

R2 13 19 14
16 27 18

R3 9 11 14
14 17 17

23
Langkah Pengujian Hipotesis
Merumuskan Hipotesis
H0: α1=α2 =α2 =0
ß1 = ß2 = ß3=0
(αß)11=(αß)22 = ..........(αß)32 = 0
H1: Paling sedikit satu α tidak sama dengan nol
Paling sedikit satu ß tidak sama dengan nol
Paling sedikit satu (αß) tidak sama dengan nol
LOS
Gunakan F tabel ; α = 5%
§ F(α; R-1; RC) , hasil 4,26
§ F(α; C-1; RC) , hasil 4,26
§ F{α;( R-1)(C-1); J.K} , hasil 3,63

24
3. Kriteria
H0: α1=α2 =α2 =0 diterima, jika Fhit ≤4,26
ß1 = ß2 = ß3=0 diterima, jika Fhit ≤4,26
(αß)11=(αß)22 = ..........(αß)32 = 0 diterima, jika Fhit ≤3,63

H0: α1=α2 =α2 =0 ditolak , jika Fhit >4,26


ß1 = ß2 = ß3=0 ditolak, jika Fhit >4,26
(αß)11=(αß)22 = ..........(αß)32 = 0 ditolak, jika Fhit>3,63

4. Perhitungan

Ø Tabel disempurnakan untuk memudahkan perhtungan.


Ø Gunakan rumus yang tersedia .
ØSetelah selesai semua perhitungan masukan ke dalam Tabel Anova Dua Arah

25
Contoh data; V1= EQ; V2 = MUATAN LEADERSHIP (uraikan)

V1
V2
C1 C2 C3 Tr
R1 10 14 18
13 16 22 93

R2 13 19 14
16 27 18 107

R3 9 11 14 82
14 17 17

26
Jumlah Kuadrat Total (SST)

Jumlah Kuadrat Baris (SSR)

Jumlah Kuadrat Sampel (JKS)

27
Jumlah Kuadrat Kolom (SSC)

Jumlah Kuadrat Interaksi (SSI)

Jumlah Kuadrat Galat(error -SSE)

28
Tabel Anova Untuk Dua Arah
Sumber Derajat Jumlah
Variasi bebas kuadrat Jumlah Kuadrat Rata-
Fhitung
rata
(SV) (df) (SS)
1 2 3 4
26,17/10,44
Baris R 3-1=2 52,33 (52,33)/2=26,17
=2,51
45,17/10,44
Kolom C 3-1=2 90,33 (90.33)/2=45,17 =4,34

20,34/10,44
(3-1)(3-1)
Interaksi 1 81,4 (81,4)/4=20,34 =1,95
=4

Error E 3.3.1=9 94 (94)/9=10,44 -

Total 18-1=17 JKT - -


29
5.Kesimpulan
• Ho diterima, artinya tidak ada perbedaan
antar baris pada alpha 5%;
• Ho ditolak, artinya ada perbedaan antar
kolom;
• Ho diterima, artinya tidak ada efek
interaksi antara baris dan kolom

30
PENGUJIAN HIPOTESIS
Setelah selesai mengikuti
materi pnegujian hipotesis
mahasiswa diharapkan
mampu merumuskan dan
menguji hipotesis .
1. PENGERTIAN
Ø Hypho = kurang /tidak sempurna
Ø Thesis = pendapat
Ø Hyphothesis adalah pendapat sementara berdasarkan asusmsi
yang hrs dibuktikan kebenarannya. Secara umum diartikan
sebagai pernyataan mengenai sesuatu yang harus diuji
kebenarannya.
Ø Pembuktian bisa menghasilkan kesimpulan bahwa pendapat
tersebut benar, artinya hipotesis diterima dan sebaliknya jika
kesimpulan menyatakan bahwa pendapat tsb salah, artinya
hipotesis ditolak.
Ø Proses pembuktian menggunakan langkah-langkah atau cara
untuk memperoleh hipotesis diterima/ ditolak disebut pengujian
hipotesis.
Ø Pengujian hipotesis dilakukan berdasarkan sejumlah sampel.
Dalam menaksir paramater populasi berdasarkan data sampel, kemungkinan akan
terdapat dua kesalahan, yaitu :
Tipe Kesalahan I (α = alpha) adalah kesalahan yang dibuat oleh peneliti karena
menolak hipotesis nol (H0), padahal hipotesis nol itu benar.
Tipe Kesalahan II (ß = beta) adalah kesalahan yang dibuat oleh peneliti karena
menolak hipotesis alternatif (Ha), padahal hipotesis alternatif itu benar atau dengan
kata lain adalah kesalahan karena gagal menolak H0, padahal hipotesis nol itu salah.
Hubungan antara keputusan menolak atau menerima Ho dapat diperhatikan Tebel
berikut:

Kesimpulan uji Hipotesis


hipotesis
Benar Salah
Menolak hipotesis Tipe I, Error Kesimpulan tepat
Menerima hipotesis Kesimpulan tepat Tipe II, Error
§ Keputusan menerima hipotesis Ho yang benar, berarti tidak terjadi
kesalahan.
§ Keputusan menerima hipotesis Ho yang salah, berarti terjadi
kesalahan tipe II (Beta).
§ Keputusan menolak hipotesis Ho yang benar, berarti terjadi
kesalahan tipe I (Alpha).
§ Keputusan menolak hipotesis Ho yang salah, berarti tidak terjadi
kesalahan.
Tingkat kesalahan ini selanjutnya dinamakan tingkat signifikansi / taraf
signifikansi / level of significant yang ditentukan oleh peneliti
terlebih dahulu. Dalam pengujian hipotesis kebanyakan digunakan
kesalahan Tipe I yaitu berapa persen kesalahan untuk menolak
hipotesis nol yang benar (biasa menggunakan nilai Alpha = α).
Seorang psikolog ingin menentukan apakah pasiennya
memerlukan pendampingan selama 2 minggu untuk
mengurangi stress yang dialami. Jika diperkirakan ada
manfaatnya, psikolog tentu akan melakukannya dan
sebaliknya jika tidak ada manfaat tidak perlu
pendampingan.
APA YG MUNGKIN TERJADI?
ØPendampingan bermanfaat (Hipotesis benar) dan
psikolog melakukan.
vpendampingan bermanfaat tetapi psikolog tdk
melakukan. dlm hl ini psikolog membuat kesalahan yg
disebut k. tipe satu (α ).
Ø Pendampingan tidak bermanfaat maka psikolog
tidak melakukan pendampingan.
v pendampingan tdk bermanfaat ( hipotesis salah)
ttp jika psikolog melakukan pendampingan, maka
psikolog tersebut dikatakan telah membuat
kesalahan yg disebut Kesalahan Tipe II.
v APAKAH ( α ) dan (ß ) harus sama dengan 0 ?
Apa artinya jk psikololog melakukan
pendampingan dng α = 0,05 dan ß = 0,10 ?
Ø Untuk dapat mengambil kesimpulan apakah akan menerima
atau menolak hipotesis berdasarkan analisis sampel, harus
digunakan pedoman/peraturan pengujian/kriteria. Pedoman
pengujian biasanya dinyatakan dalam bentuk persentase luas
Kurva Normal. Misalnya kurva normal 95% ditengah, dapat
juga 97,5% atau 99%.
Ø Untuk menarik kesimpulan dengan cara membandingkan
antara harga statistik ( dihitung dari sampel) dengan harga
parameter yang dihipotesiskan. Jika perbedaan kedua harga
itu cukup kecil maka hipotesis diterima, sebaliknya kalau
perbedaan cukup besar hipotesis ditolak.
Ø HIPOTESIS NULL = H0
Ø HIPOTESIS ALTERNATIF = H1 atau Ha
Ø Ho pada dasarnya dirumuskan dari teori-teori yang
digunakan sehingga memiliki karakteristik benar.
Ø Hipotesis yang akan diuji adalah Ho
Note:
H1 atau Ha secara sederhana dapat dirumuskan
sebagai kebalikan dari H0
Ø CONTOH 1;
H0 : Stres kerja berhubungan dengan control diri yang dimiliki
seseorang
H1 : Stres kerja tidak berhubungan dengan control diri yang
dimiliki seseorang.
Ø CONTOH 2;
H0 : Prestasi akademik mahasiswa dipengaruhi oleh lingkungan
belajar.
H1 : Prestasi akademik mahasiswa tidak dipengaruhi oleh
lingkungan belajar.
.
§ Data yang telah dikumpulkan dari lapangan atau dari sampel
(data empiris) tidak cukup mendukung untuk menerima Ho;
§ Ho ditolak, artinya Ha diterima yang bermakna pula teori-teori
yang digunakan tidak terkonfirmasi dengan data empiris;
§ Beberapa penyebab, diantaranya;
Ø karakteristik sample berbeda;
Ø kondisi saat penelitian anomali;
Ø jumlah sampel tidak memadai;
Ø alat pengumpul data tidak valid dan kurang reliabel.
Ø Dalam bahasa Inggris umum, kata, “significant” mempunyai
makna penting; sedang dalam pengertian statistik kata tersebut
mempunyai makna “benar” tidak didasarkan secara kebetulan.
Ø Nilai signifikansi dari suatu hipotesis adalah nilai kebenaran dari
hipotesis yang diterima atau ditolak. Hasil penelitian dapat benar
tapi tidak penting.
Ø Signifikansi/probabilitas/ alpha (α) memberikan gambaran
mengenai bagaimana hasil penelitian itu mempunyai
kesempatan untuk benar. Jika kita memilih signifikansi sebesar
0,01 artinya kita menentukan hasil penelitian nanti mempunyai
kesempatan untuk benar sebesar 99% dan untuk salah sebesar
1%.
Ø LEVEL OF SIGNIFICANCE/CONFIDENCE
COEFICIENT (CC) ATAU TARAF NYATA.
Ø CC PADA DASARNYA MENUNJUKAN TINGKAT
KETELITIAN/KEYAKINAN/PROBABILITAS
KEJADIAAN UJI HIPOTESIS BENAR ATAU
BESARNYA RESIKO JIKA HIPOTESIS DITERIMA.
Ø MISALKAN CC KITA TENTUKAN SEBESAR 95%
ARTINYA RESIKO SALAH MENERIMA HO
SEBESAR 5% ATAU =0,05 DENGAN TINGKAT
KETELITIAN DAERAH TERIMA H0 ADALAH
95%.
Ø Pendapat sementara ( Ho) , kita uji
melalui nilai Harga Statistik (Hst ).
jika H0 diterima pada dasarnya
nilai harga parameter = nilai harga
statistik atau Hp= Hst . Alternatif
lain adalah Ho ditolak, berarti Hp
tidak sama dengan Hst .
Ø Nilai (Hst ) dihitung dan dikonversi
kedalam nilai z atau t atau lainnya
dng rumus yg tersedia .
Ø Nilai (Hst ) dibandingkan dengan
titik kritis yg diperoleh dari tabel.
1- α
Tolak Ho

Terima Ho Tolak Ho

0,5 α 0,5 α
X
0 Angka titik kritis
dibaca dari
Tabel Z; t ;F ,
Titik kritis Titik kritis dll, tergantung
metode yang
digunakan
1. Uji dua sisi
HO: HP = HST
H1: HP ≠ HST
2. Uji satu sisi kanan Setiap model uji
HO: HP = HST hiptesis memilki
H1: HP > HST gambar yang
3. Uji satu sisi kiri berbeda
HO: HP = HST
H1 : HP < HST
1. Uji dua sisi
HO: HP = HST
H1: HP ≠ HST

Secara verbal dapat ditulis:


H1 yang menyatakan bahwa harga para meter (Hp) tidak sama dengan harga yang
dihipotesiskan.
Makna tidak sama dapat berarti lebih besar atau lebih kecil. Dengan kata lain memberi
alternative formulasi dua sisi. Dengan α (alpha) tertentu maka daerah kritisnya terletak di
kedua ekor/ujungnya. Uji dengan dua daerah penolakan disebut uji dua sisi atau dua arah –
two sided test

Uji dua sisi

Ho ditolak Ho ditolak
Ho
0,5 α diterima 0,5 α
0
2. Uji satu sisi kanan
HO: HP = HST
H1: HP > HST

Secara verbal dapat ditulis:


H1 yang menyatakan bahwa harga parameter (Hp) lebih besar dengan harga yang
dihipotesiskan (Hst).
Makna lebih besar dapat berarti arah H1 sudah jelas ke arah kanan . Dengan α (alpha)
tertentu maka daerah kritisnya terletak di ekor/ujung sebelah kanan yang disebut uji satu sisi
sebelah kanan – right sided test.

Uji satu sisi kanan

Ho Ho ditolak
diterima α
0
3. Uji satu sisi kiri
HO: HP = HST
H1 : HP < HST

Secara verbal dapat ditulis:


H1 yang menyatakan bahwa harga para meter (Hp) lebih kecil dengan harga yang
dihipotesiskan (Hst).
Makna lebih kecil d berarti arah H1 sudah jelas ke arah kiri . Dengan α (alpha) tertentu
maka daerah kritisnya terletak di ekor/ujung sebelah kiriyang disebut uji satu sisi sebelah
kanan – leftsided test.

Uji satu sisi kiri

Ho ditolak Ho diterima
α
0
1. Merumuskan Hipotesis
2. Menentukan level of
significansi (LOS)
3. Menentukan Kriteria
Pengujian
4. Menghitung Nilai Z atau t
atau F atau lainnya
sesuai teknik pengujian
yang digunakan
5. Membuat kesimpulan
§ BEDA HARGA RATA-RATA
§ BEDA HARGA DUA RATA
§ BEDA HARGA PROPORSI
§ BEDA DUA HARGA
PROPORSI

PERHATIKAN KEMBALI
RUMUS Z dan t
1. BEDA HARGA RATA-RATA

atau

Note : Faktor koreksi digunakan jika sampel besar

2. BEDA HARGA DUA RATA-RATA


3. BEDA HARGA PROPORSI

4. BEDA HARGA DUA PROPORSI


Uji satu sisi kiri H0 diterima jika Z ≥ -2,33
H0 ditolak jika Z < -2,33
Ho ditolak Ho diterima

α
0
Titik kritis= -2,33
2. Prof. Henry menyatakan bahwa 75% dari para mahasiswa lebih menyukai
belajar secara tatap muka, karena pertimbangan tertentu. Untk menguji
pernyataan tersebut kemudian diambil sampel random sebanyak 320
mahasiswa dan ternyata terdapat 267 mahasiswa yang menyatakan menykai
belajar secara tatap muka. Dengan probabilitas 95% ujilah hipotesis nihil p =
0,75 dengan hipotesis alternatif > 0,75.

Analisis soal ?
………………………………………………………………………………….
………………………………………………………………………………………

Prosedur pengujian hipotesis:


• Merumuskan Hipotesis ( Kasus Beda Harga Proporsi)
H0: P= 0,75
H1: µ> 0,75
Note: rumusan H1 menunjukan UJI SATU SISI SEBELAH KANAN
§ Dalam suatu survai perilaku konsumtif , dipilih secara random 400 wanita karir di Kota Alam
Raya (A). Rata –rata pengeluaran untuk membeli asesoris per hari adalah Rp. 20.000,- dengan
deviasi standar Rp. 6.000,- Survai yang sama di Kota Awan Merah (B) terhadap 400 wanita
karir diperoleh data rata-rata pengeluaran pembelian asesoris adalah Rp.16.000,- per hari
dengan deviasi standar Rp. 7.500,-Dengan alpha 0,05 ujilah hipotesis nihil bahwa perilaku
konsumtif wanita karir di kedua kota tersebut adalah sama.

Analisis Soal ?
……………………………………………………………………………………
…………………………………………….
Prosedur pengujian hipotesis:

1. Merumuskan Hipotesis (Kasus ini adalah kasus Beda Dua Harga Rata-rata)
Misalkan Kota Alam Raya (A) dan Kota Awan Merah (B)
H0: µA= µB atau µA- µB = 0
H1: µA≠ µB atau µA- µB ≠ 0
Note: Rumusan H1 menunjukan UJI DUA SISI

(6-17)
DISTRIBUSI KHAI KWADRAT
(Pertemuan Minggu ke 6)

1.Test Goodness of Fit


2.Test of Indepency

1
TEST GOODNESS OF FIT
( Tes Kesesuaian)

2
KEGUNAAN

➢ KHAI KWADRAT DIMAKSUDKAN UNTUK


MENGANALISIS KESESUAIAN (KECOCOKAN)
FREKUENSI EMPIRIK DAN YANG DIHARAPKAN
DARI KATEGORI POPULASI LEBIH DARI 2 ATAU k >
2.
➢ POPULASINYA DINAMAKAN POPULASI
MULTIMONIAL DAN DISTRIBUSINYA DISEBUT
DISTRIBUSI MULTIMONIAL.
➢ NOTASI YANG DIGUNAKAN 2

3
Tabel kerja
Sampel Sampel 2 Sampel jumlah
1 .....k
Hasil Obs. n1 n2 nk A

Frekuensi A
Harapan (e1) (e2) (ek)

4
Tabel kerja

Kategori Sampel 1 Sampel 2 Sampel .....k jumlah

Baik n11 n12 n1k n11+n12+n1k = X

(e11) (e12) (e1k)

Kurang baik n21 n22 n2k n21+n22+n2k =Y

(e21) (e22) (e2k)

jumlah n11+n21= A n12+n22=B n1k+n2k=C A+B+C=X+Y=D

5
n =jumlah seluruh observasi ;
e = frekuensi yang diharapkan dan harus dihitung
n11 = hasil observasi pada baris satu dan kolom satu,
dst
e11 = frekuensi pada baris satu dan kolom satu , dst
Cara menghitung nila e
e11 = X/D x A.............e21= Y/D x A .............e12=X/DxB
dst

6
Bagaimana
Menguji Hipotesis ?
Kriteria Pengujian
Kriteria pengujian ditetapkan dng cara
membandingkan harga2 yg sebenarnya yg
diperoleh dari sampel yg diambil ( nij=
frekuaensi pengamatan) dng harga2 yg
diharapkan (eij = frekuensi yg diharapkan).
Apabila kedua frekuensi serupa atau
bedanya kecil, maka hipotesis null (H0) bisa
diterima dan sebaliknya.

7
Chi-square distribution

Tolak Ho

Terima Ho

α
tab
2

Titik kritis
(nij − eij )
j k 2

 = 
2
RUMUS
i =1 j =1 eij

8
Contoh 1.
Seorang mahasiswa ingin meneliti kepuasan pernikahan
pasangan suami istri yang telah menikah kurang lebih 10
tahun . Apakah terdapat perbedaan yang berarti
(significant) proporsi ketidakpuasan diantara ketiga
sampel yang terdapat pada data tabel dibawah ini ?
Gunakan probabilitas 95% untuk menguji pendapat
tersebut.

Kepuasan Sampel 1 Sampel 2 Sampel 3 jumlah


Tidak puas 12 15 6 33
Puas 88 105 74 267
Jumlah 100 120 80 300

9
Pemecahan 1

1. Merumuskan hipotesis
Ho : P1=P2=P3 (=P)
H1 : P1≠ P2 ≠P3 ≠ (≠P)
Arti Ho adalah proporsi pasangan tidak puas dari
ketiga sampel sama.
2. Menentukan lOS
α= 0,05 dan tab
2
( :k −1)
k-1=3-1=2 ( 0, 05:2) =5,991
(lihat tabel)
2. Menentukan kriteria pengujian
H0 diterima, jika 2hit≤ 5,991
Ho ditolak, jika 2hit > 5,991

10
4. Perhitungan
e11 = 33/300 x 100 = 11 e21 = 267/300 x 100 = 89
e12 = 33/300 x 120 = 13,2 e22 = 267/300 x 120 = 106,8
e13 = 33/300 x 80 = 8,8 e23 = 267/300 x 80 = 71,2
TABEL KERJA CONTOH 1.

Kategori Sampel Sampel 2 Sampel Jumlah


Pemakai 1 3
AS
Tidak puas 12 15 6 33
(11) (13,2) (8,8)

Puas 88 105 74 267


(89) (106,8) (71,2)

Jumlah 100 120 80 300


11
4.Menghitung nilai χ2

(nij − eij )
j k 2

 = 
2

i =1 j =1 eij
(12 − 11) 2
(15 − 13, 2) 2
( 74 − 71, 2) 2
2 = + +→ = 1,379
11 13,2 71,2

5. Kesimpulan
Nilai χ2hit (1,379) < χ2tab (5,991), maka H0 diterima. Artinya
perbedaan proporsi pasangan suami istri yang tidak puas dari
ketiga sampel tersebut tidak memiliki alasan yang kuat. Atau
tidak terdapat perbedaan proporsi pasangan suami istri yang
mengeluh dari ketiga sampel pada tingkat kepercayaan 95%.
12
PENGUJIAN INDEPENDENSI
( TEST OF INDEPEDENCY)

13
PENGUJIAN INDEPENDENSI
( TEST OF INDEPEDENCY)

➢Test ini dapat dipakai untuk menguji 2 variabel.


➢Tiap variabel dapat dibuat menjadi 2 kategori
atau lebih.
➢Apabila Variabel 1 terdiri dari k kategori dan
Variabel 2 terdiri dari r kategori, maka kita buat
tabel dengan ukuran (r x k) yang disebut TABEL
KONTINGENSI.
r = baris dan k = kolom

14
Tabel kontingensi
(bedakan dengan Tabel kerja Contoh 1)
Var. 1 Var.2
A1 A2 A3 ....... Ak Jmlh

B1 n11 n1k n1.

B2

B3
......

Br nr1 nrk nr
Jmlh n.1 n.2 n.3 n.k n

VARIABEL (1) DAN VARIABEL (2) BERSIFAT INDEPENDENCE


SATU SAMA LAIN

15
Prosedur test of independency
1. Perumusan Hipotesis
H0: P11=P12=...=P1k
P21=P22=...=P2k
Pr1=Pr2 =...=Prk
H1: Tdk semua proporsi sama
2. Menentukan L.o.s
3. Kriteria Pengujian
4. Perhitungan Chi-square
5. Kesimpulan

16
Contoh 2.

• Suatu lembaga riset tertarik untuk meneliti


apakah ada hubungan antara kepuasan
pernikahan dan komitmen pernikahan
pasangan suami istri yang telah menikah
kurang lebih 10 tahun . Berdasarkan data hasil
riset pada Tabel dibawah ini, Ujilah hipotesis
yang menyatakan bahwa tidak ada hubungan
antara komitmen pernikahan dengan
kepuasan pernikahan pada alpha 5%.
17
Tabel data hasil riset
Komitmen Kepuasan pernikahan
pernikahan
Rendah Sedang tinggi Jmlh
Tinggi 14 37 32 83

sedang 19 42 17 78
Rendah 12 17 10 39
Jmlh 45 96 59 200

18
Pemecahan contoh 2 (independency)
1. Merumuskan hipotesis
H0: P11=P12=P13 Artinya komitmen pernikahan indpendence
P21=P22=P23 dengan kepuasan pernikahan atau kepuasan
pernikahan tidak tergantung dari komitmen
P31=P32=P33 pernikahan.
H1: salah satu dari proporsi tersebut tidak sama

2. Menentukan lOS
α= 0,05 dan χ2tab = χ2α;(r-1) (k-1)
χ2 0,05;(3-1) (3-1) .......χ2 (0,05;4) =9,488 (lihat tabel)

3. Menentukan kriteria pengujian


Hp diterima, jika χ2 hit ≤ 9,488
Ho ditolak, jika χ2 hit ≥ 9,488

19
4. Perhitungan
Biaya Volume penjualan
promosi Rendah Sedang tinggi Jmlh
Tinggi 14 37 32 83
(18,7) (39,8) (24,5)

Sedang 19 42 17 78
(17,6) (37,4) (23,0)

Rendah 12 17 10 39
(8,7) (18,8) (11,5)

Jmlh 45 96 59 200

E11 = 83/200 x 45 =18,7 . E12 = 83/200 x 96 = 39,8. E13 = 83/200 x 59 = 24,5


E21 = 78/200 x 45 = 17,6 E22 = 78/200 x 96 = 37,4 E23 = 78/200 x 59 = 23,0
E31 = 39/200 x 45 = 8,7 E32 = 39/200 x 96 = 18,8 E33 = 39/200 x 59 = 11,5
Hasil perhitungan e11 sd. e33 masukan kedalam tabel dan diberi tanda kurung.

( nij − eij ) = (14 − 18,7) (10 − 11,5)2


j k 2 2
 = 
2
+ ............ + = 7,43
i =1 j =1 eij 18,7 11,5 20
Kesimpulan

χ2hit(7,43) <χ2 tab( 9,488), maka H0


diterima. Artinya Komitmen
Pernikahan independen dengan
Kepuasan Pernikahan pada tingkat
konfidensi 95%. Atau Kepuaaan
Pernikahan tidak tergantung dari
Komitmen Pernikahan pada tingkat
ketelitian 95%.

21
Koefisien Kontingensi (C)
 2
C=
N+ 2

Lihat contoh:
2
7,43 55,2049
 = 7,43 , maka
2
C= = = 0,47
200 + 7,43 2
200 + 55,2049
Besarnya angka koefisien menunjukan kekuatan independensi
Komitmen Pernikahan dan Kepuasan Pernikahan.

22
Tabel 
2

df .995 .99 ...... ........ .05 .... .005 df

1 1

2 5,991 2

3 3

4 9.488 4

5 5

6 6

7 7

..... .....

n n

23
24
Materi Pembelajaran - Minggu ke 8.
Bagian 2. Uji Independsi (Independecy
Test )
Learning Out Come (LO)
(Capaian Pembelajaran)
Mahasiswa setelah mempelajari Materi
Pembeajaran diharapkan :
• Pengetahuan
Mampu mengklasifikasi dan membedakan
fungsi dan kegunaan Uji Indepensi.
• Ketrampilan
Mampu memilih , menentukan , dan
menerapkan Uji Independensi untuk berbagai
kasus yang berbeda dalam proses uji hipotesis.
Pengertian

 Uji independensi Kai Kuadrat adalah alat uji statistik yang digunakan untuk
mengetahui apakah dua variabel memiliki hubungan secara signifikan. Kedua
variabel yang diuji merupakan variabel kategorik dan disusun dalam bentuk
tabel kontingensi.
 Uji kebebasan ini digunakan untuk memeriksa kebebasan atau independensi
dari dua variabel (frekuensi observasi dan frekuensi harapan) sehingga kita
dapat menyimpulkan apakah kedua peubah tersebut saling bebas (tidak
berpengaruh) ataukah keduanya saling bertalian (berpengaruh).
 Uji independensi merupakan uji dua arah antara dua variabel, yaituvariabel
kesatu dalam kolom dan variabel kedua dalam baris
Tujuan

Tujuan utama penerapan uji ini adalah untuk mengukur atau mengetahui
linieritas hubungan dua variabel atau lebih dengan skala ordinal atau nominal.
Sehingga kita dapat mengetahui ada tidaknya hubungan diantara dua atau lebih
variabel kualitatif yang dijadikan obyek penelitian. Tentunya dengan hasil uji
tersebut dapat dijadikan landasan untuk dasar pengambilan keputusan.
Mengingat untuk data kualitatif yang menggunakan pengukuran dengan
pendekatan skala nominal atau ordinal belum tentu dapat diyakini ukuran
tersebut mewakili nilai sebenarnya.
Penyajian data

Data yang telah dikumpulkan dari lapangan disajikan dalam bentuk Tabel
dengan ukuran tertentu tergantung rencana analisis terhadap variabel:
Setiap variabel dapat dibuat menjadi 2 kategori atau lebih sesuai dengan
tujuan analisisa yang telah ditentukan.

Apabila Variabel 1 terdiri dari k kategori dan Variabel 2 terdiri dari r


kategori, maka kita buat Tabel kerja dengan ukuran (r x k) yang disebut TABEL
KONTINGENSI.

Data untuk menguji kebebasan dua variabel tersebut disajikan dalam bentuk
Tabel Kontingensi atau Tabel Berkemungkinan yang umumnya berukuran r
baris x k kolom
Contoh Bentuk Tabel Kontingensi
Variabel 1 Variabel 2
A1 A2 A3 ....... Ak Jumlah

B1 n11 n12 … ….. n1k n1.

B2

B3
......

Br nr1 nrk nr
Jumlah n.1 n.2 n.3 n.k n

*) penempatan Variabel 1 dan Variabel 2 tidak masalah jika bertukar


tempat
**) Variabel 1 dan variabel 2 sifatnya independence satu sama laiinya.
Persyaratan Tebel Kontingensi
Tidak ada cell dengan nilai frekuensi hasil observasi
(kenyataan) atau disebut juga Actual Count (nik) sebesar 0
(nol).
Setiap sel hanya berisi 1 (satu) frekuensi harapan ( € ).
Apabila bentuk tabel kontingensi 2 X 2, maka tidak boleh ada 1
cell saja yang memiliki frekuensi harapan atau disebut
juga expected count (“Fh”) kurang dari 5.
Apabila bentuk tabel lebih dari 2 x 2, misal 2 x 3, maka jumlah
cell dengan frekuensi harapan yang kurang dari 5 tidak boleh
lebih dari 20%.
Prosedur Uji Hipotesis
Test of Independency
Prosedur uji hipotesis pada dasarnya sama dengan Uji Kesesuaian ( Goodness of
fit) dan uji hipotesis lainnya. Langkah yang digunakan sebagai berikut:
Merumuskan Hipotesis
H0: P11=P12=...=P1k
P21=P22=...=P2k
Pr1=Pr2 =...=Prk
H1: Tidak semua proporsi sama
2. Menentukan L.o.s
Mengidentifikasi tingkat signifikansi ( α ) berdasakan kasus;
Menentukan besarnya derajad bebas (db atau df) .
Menentukan Kai Kuadrat table berdasarkan butir (a) dan (b)
Rumus dan Titik Kritis Kai Kuadrat

Tolak Ho

Terima Ho

α
Titik
kritis
RUMUS
Koefisien Kontingensi

Koefisien Kontingensi diperoleh dari Tabel Kontingensi yang merupakan


kelanjutan dari Analisa Kai Kuadrat
Koefisien kontingensi adalah metode yang digunakan untuk mengukur
keeratan hubungan (asosiasi atau korelasi) antara 2 variabel yang keduanya
bertipe data nominal (kategorik) atau ordinal.
Teknik korelasi koefisien kontingensi (contingency coefficient correlation)
adalah salah satu teknik analisis korelasional bivariat, dua buah variable yang
akan di korelasikan adalah berbentuk kategori atau merupakan gejala ordinal.
Kegunaanya adalah untuk mengetahui asosiasi atau relasi antara dua
perangkat atribut. Koefisien ini fungsinya sama dengan beberapa jenis
koefisien korelasi lainnya, seperti Koefisien Korelasi Phi, Cramer , Lambda,
Uncertainty, Spearman, Kendall Tau, Gamma, Sommer’s. Namun bedanya
Kontingensi C spesifik untuk data berskala nominal.
Rumus Koefisien Kontingensi

N = jumlah seluruh pengamatan = jumlah sampel


Χ2 = Nilai hasil perhitungan dari Kai Kuadrat
Contoh 1.

Suatu lembaga riset dibidang psikologi tertarik untuk meneliti apakah ada hubungan
antara kontrol diri dan impulsive buying pada kalangan mahasiswi . Untuk itu telah
diambil 200 sampel mahasiswa di suatu universitas. Berdasarkan data hasil riset pada Tabel
dibawah ini, Ujilah hipotesis yang menyatakan bahwa tidak ada hubungan antara kontrol
diri dan impulsive buying pada taraf alpha 5%.
Tabel 1. Sebaran jumlah mahsiswa berdasarkan impulsive buying dan control diri
mahasiswi.
Kontrol diri Impulsive buying

Rendah Sedang Tinggi Jumlah

Tinggi 14 37 32 83
Sedang 19 42 17 78

Rendah 12 17 10 39

Jumlah 45 96 59 200
Langkah pemecahan contoh 1 (Independency Test)

Artinya kontrol diri independence dengan


impulsive buying atau impulsive buying tidak
tergantung control diri pada kalangan
mahasiswi
4. Melakukan perhitungan

Kontrol diri Impulsive buying

Rendah Sedang Tinggi Jumlah

Tinggi 14 37 32 83
(18,7) (39,8) (24,5)

Sedang 19 42 17 78
(17,6) (37,4) (23,0)

Rendah 12 17 10 39
(8,7) (18,8) (11,5)

*) angka dalam kurung adalah nilai frekuensi yang diharapkan (e) dihitung lebih
dahulu, perhatikan Contoh perhitungan)
E11 = 83/200 x 45 =18,7 . E12 = 83/200 x 96 = 39,8. E13 = 83/200 x 59 =
24,5

E21 = 78/200 x 45 = 17,6 E22 = 78/200 x 96 = 37,4 E23 = 78/200 x 59 =


23,0

E31 = 39/200 x 45 = 8,7 E32 = 39/200 x 96 = 18,8 E33 = 39/200 x 59 =


11,5

Hasil perhitungan e11 sd. e33 masukan kedalam tabel dan diberi tanda
kurung.
Menghitung Koefisiens Kontingensi

 Jika diperlukan dapat dilanjutkan dengan analisis Koefisien Kotingensi


sebagai berikut:

Contoh 2

Kita ingin mengetahui apakah ada hubungan antara motivasi berprestasi dan
perilaku kehadiran mengikuti perkuliahan daring di lingkungan mahasiswa. Untuk
tujuan ini dianalisis 100 mahasiswa yang diambil secara acak, Perilaku kehadiran
dan motivasi berprestasi dikelompokan menjadi tiga (3) kategori yaitu tinggi,
sedang, dan rendah pada Tabel 2 berikut ini. Gunakan level signifikansi 5% untuk
menguji hipotesis tersebut.

Tabel 1. Sebaran mahasiswa berdasarkan motivasi berprestasi dan perilaku


kehadiraan.
Motivasi berprestasi Perilaku kehadiran

Tinggi Sedang Rendah Jumlah

Tinggi 14 6 9 29

Sedang 10 16 10 36

Rendah 2 13 20 35

Jumlah 26 35 39 100
Pemecahan 2

Artinya mutu bahan makanan indepen


dengan tingkat pendapatan.
4. Melakukan perhitungan

Mutu bahan Pendapatan


makanan
Tinggi Sedang Rendah Jumlah

Baik 14 6 9 29
(7,54) (10,15) (11,31)
Cukup 10 16 10 36
(9,36) (12,60) (14,04)
Jelek 2 13 20 35
(9,10) (12,25) (13,65)
Jumlah 26 35 39 100

*) angka dalam kurung adalah nilai frekuensi yang diharapkan (e)


dihitung lebih dahulu, perhatikan Contoh perhitungan)
E11 = 29/100 x 26 =7,54 .; E21 = 36/100 x 26 = 9,36; E31 = 35/100 x 26 =
9,10

Dengan cara yang sama dapat dihitung E12 ;E13 ; E22 ; E23; E32 ;dan E33
Hasil perhitungan e11 sd. e33 masukan kedalam tabel dan diberi tanda
kurung.
TOPIK 5. M-11.
ANALISIS KORELASI DAN REGRESI.
Bag.2.
Tgl. 26 JUNI 2021.
Learning Out Come (LO)
(Capaian Pembelajaran)
Mahasiswa setelah mempelajari Materi Pembeajaran diharapkan :
Pengetahuan
Mampu menjelaskan fungsi dan kegunaan alnalisis Korelasi dan Regresi
Sederhana dan Berganda dalam analisis statistic inferensial.
Ketrampilan
Mampu mengaplikasikan Analisis Korelasi dan Regresi Sederhana
berdasarkan data tersedia dalam melakukan uji hipotesis pada Analisis
Statistik Parametrik.
Pengertian Analisis Regresi

Regresi merupakan salah satu teknik analisis dalam statistik yang digunakan
untuk mencari pengaruh antara dua variabel atau lebih yang bersifat
kuantitatif. Pengaruh sebuah variabel terhadap variabel lainnya dapat terjadi
karena adanya hubungan sebab akibat atau dapat pula terjadi karena
kebetulan semata.
Sebuah variabel atau lebih dikatakan berpengaruh terhadap suatu variabel
apabila perubahan pada variabel yang satu akan diikuti perubahan pada
variabel yang lain secara teratur dengan arah yang sama (positif) atau
berlawanan (negatif).
Variabel yang mempengaruhi variabel lainnya dalam analisis regresi dapat
dibedakan menjadi variabel bebas (independent) dan variabel terikat
(dependent). Variabel bebas adalah variabel yang perubahannya cenderung di
luar kendali manusia. Sementara itu variabel terikat adalah variabel yang
dapat berubah sebagai akibat dari perubahan variabel bebas (independent).
Persyaratan Analisis Rgeresi Linier
Sederhana
Hubungan antara Variabel Y dan X bersifat linier.
Data terdistribusi secara normal
Data terdistribusi secara homogen.
Data yang digunakan memiliki Skala Ratio atau Interval.
Dalam melaksanakan analisis regresi terlebih dahulu
dilakukan Uji persyaratan No. 1, 2, dan 3 . Uji persyaratan
akan dibicarakan pada bagian tersendiri
Ruang Lingkup Pembahasan

UJI HIPOTESIS KORELASI LINIER


SEDERHANA
UJI HIPOTESIS REGRESI LINIER
SEDERHANA
Perhatikan Tabel perhitungan yg telah dibuat pada Bag. 1
Membuat Tabel kerja berikut untuk mempermudah perhitungan nilai r:
Data Xi Yi XiYi
(X i )2 (Y i )2
1 2 5 10 4 25

2 4 6 24 16 36

3 5 8 40 25 64

4 7 10 70 49 100

5 8 11 88 64 121

∑ 26 40 232 158 346

n=5 ∑Xi ∑Yi ∑Xi ∑(Xi ∑(Yi


Yi )2 )2
( ∑Xi )2 = 262 = 676 ( ∑Yi )2 = 402 = 1600

Note;
Perhitungan semacam ini dalam praktik keseharian kita menggunakan soft ware.
Standar Error of Estimate ( Se)
Bagaimana Uji Hipotesis Analisis
Korelasi dan Regresi ?
Prosedur Uji Hipotesis pada dasarya sama dengan prosedur uji hipotesis pada
kasus Distribusi Sampling yang pernah dipelajari sebelumnya. Prosedur uji
hipotesis sebagai bebrikut :

• Merumuskan Hipotesis
• Menentukan level of significansi (LOS)
• Menentukan Kriteria Pengujian
• Menghitung Nilai Z atau t atau F atau lainnya
sesuai teknik pengujian yang digunakan
• Membuat kesimpulan
A. Menguji Kasus Korelasi (r)
(perhatikan Contoh 1 sebelumnya dan hasil perhitungannya)

No Jarak tempat tinggal ke provider Banyaknya keluhan


terdekat
1 2 5

2 4 6

3 5 8

4 7 10

5 8 11

Berdasarkan data table tersebut dan hasil perhitungan nilai r = 0,33, ujilah hipotesis
yang menyatakan bahwa terdapat hubungan antara jarak tempat tinggal ke tiang
provaider terdekat dengan banyaknya keluhan pada level signifikansi 5%.
Langkah pengujian hipotesis :

Merumuskan Hipotesis
H0 : Tidak terdapat hubungan antara jarak tempat tinggal ke tiang provaider
terdekat dengan banyaknya keluhan atau H0 : r = 0
H1 : Terdapat hubungan antara jarak tempat tinggal ke tiang provaider
terdekat dengan banyaknya keluhan atau H1 : r ≠ 0
Menentukan level of significansi (LOS)
Ø Level signifikansi 5% berarti alpha = α = 5% ; H1 : r ≠ 0 , berarti uji 2 arah
maka α = 5% dibagi 2 menjadi alpha 2,5%.
Ø Untuk menguji nilai r = 0,33 menggunakan distribusi t atau titik kritis
ditentukan berdasarkan Nilai ttable ( baca Tabel Distribusi Nilai t, dengan
df atau db = n-jumlah konstanta= 5-2= 3; dan α = 2,5% = 0,025)
Jumlah konstanta yaitu nilai a dan nilai koefisien regresi (b), dalam hal ini
ada 2 jenis nilai sehingga diperoleh angka 2
Ø Baca table untuk Nilai t0,025: 3 = 4,303. (silahkan browsing Tabel t)
Contoh salah satu tampilan Hasil Uji Hipotesis kasus korelasi menggunakan
aplikasi
Service yang diberikan

K
e
p
Cara menginterpretasikan: u
a
Ø 0,502 adalah nilai r positif yg dihitung dengan Rumus Koefisien Korelasi Pearson.
s
Karena r positif berarti jika service yang diberikan semakin meningkat maka a
n
kepuasan pelangga semakin meningkat pula.
Ø ** tanda ini menunjukan bahwa signifikansi level 1% dan bermaknap korelasi atau
hubungan antara service yang diberikan dan kepuasan pelanggan sangat e signifikan.
l
( NOTE Jika * disebut signifikan). a
Ø Sig. (1-tailed); bermakna diuji satu arah dan 0,00 bermakna lebih kecil n dari
g
signifikansi 1% ( p <0,01), maka hipotesis (Ho) diterima . g
Ø N = 75, bermakna jumlah sampel atau data yang diolah sebanyak 75 orang pelanggan.
a
n
B. Menguji Kasus Regresi
(perhatikan Contoh 1 sebelumnya dan hasil perhitungannya)
Pers. Regresi Y = 2,53 + 1,05 X.
Uji hipotesis dengan level signifikansi 5%

Merumuskan Hipotesis
H0 : Tidak terdapat pengaruh jarak tempat tinggal ke tiang provaider
terdekat dengan banyaknya keluhan atau H0 = b = 0
H1 : Terdapat hubungan antara jarak tempat tinggal ke tiang provaider
terdekat dengan banyaknya keluhan atau H1 : b ≠ 0
Menentukan level of significansi (LOS)
Ø Level signifikansi 5% berarti alpha = α = 5% ; H1 : b ≠ 0, berarti uji 2 arah
maka α = 5% dibagi 2 menjadi alpha 2,5%.
Ø Untuk menguji nilai b = 1,05 menggunakan distribusi t atau titik kritis
ditentukan berdasarkan Nilai ttable ( baca Tabel Distribusi Nilai t, dengan
df atau db = n-jumlah variabel = 5-2= 3; dan α = 2,5% = 0,025)
Ø Baca table untuk Nilai t0,025: 3 = 4,303
Salah satu contoh tampilan analisis regresi menggunakan
aplikasi:

Coefficientsa
Model Unstandardized Stand S
t
Coefficients ardize i
d g
Coeffi .
cients
B Std. Error Beta P < 0,01, bermakana konstanta dan
koefisien regresi
1 30.21 5.33
(Constant) 5.658 .000 Sangat signifikan.
0 9

thitung
Konstanta = a
Koefisien regersi = b

Berdasarkan table tersebut Model Pers. Regresi Y = a + bX adalah Y = 30,210 + 0,648 X


ABJAD YUNANI

Huruf Yunani Nama Yunani Aksara Latin ekivalen


Α α alpha A a
Β β beta B b
Γ γ gamma G g
∆ δ delta D d
Ε ε epsilon Ĕ ĕ
Ζ ζ zeta Z z
Η η eta Ē ē
Θ θ theta Th th
Ι ι iota I i
Κ κ kappa K k
Λ λ lambda L l
Μ µ mu M m
Ν ν nu N n
Ξ ξ xi X x
Ο ο omicron Ŏ ŏ
Π π pi P p
Ρ ρ rho R r
Σ σ sigma S s
Τ τ tau T t
Υ υ upsilon Y y
Φ φ phi Ph ph
Φ χ chi Ch ch
Ψ ψ psi Ps ps
Ω ω omega Ō ō
METODE STATISTIKA 2

Johan Harlan
Metode Statistika 2
Penulis : Johan Harlan
ISBN 979-1223-00-9

Cetakan Pertama, 2005

Diterbitkan pertama kali oleh Gunadarma


Jl. Margonda Raya No. 100, Pondokcina, Depok 16424
Telp. +62-21-78881112, 7863819 Faks. +62-21-7872829
e-mail : sektor@gunadarma.ac.id

Hak Cipta dilindungi undang-undang. Dilarang mengutip atau


memperbanyak dalam bentuk apapun sebagian atau seluruh isi
buku tanpa ijin tertulis dari penerbit.
KATA PENGANTAR

Pemberlakuan kurikulum berbasis kompetensi sedikit banyak


memerlukan penyesuaian cara penyampaian materi pengajaran Statistika di
tingkat Perguruan Tinggi. Isi buku-buku Metode Statistika ini sedapat
mungkin disesuaikan dengan silabus yang digunakan untuk perkuliahan
Statistika di jenjang S1, selain diupayakan untuk menggunakan cara
penyampaian yang diharapkan lebih memudahkan pembaca untuk mencerna
materi yang dipelajari.
Seri buku-buku Metode Statistika ini terdiri atas empat buku, yaitu
buku teks Metode Statistika 1, buku teks Metode Statistika 2, buku jawaban
soal-soal latihan Metode Statistika 1, dan buku jawaban soal-soal latihan
Metode Statistika 2. Materi yang diberikan terutama ditujukan untuk
perkuliahan Statistika selama dua semester di jenjang S1, tanpa memerlukan
penguasaan matematika lebih lanjut selain yang telah diperoleh di tingkat
SMU.
Buku teks Metode Statistika 1 memuat materi Statistika Deskriptif,
pengantar teori probabilitas, serta pengenalan terhadap beberapa distribusi
probabilitas yang penting dalam Statistika Terapan. Buku teks Metode
Statistika 2 berisi materi mengenai Inferensi Statistik, yaitu estimasi
parameter dan uji hipotesis, termasuk dengan menggunakan Statistika Non-
Parametrik.
Kepada semua pihak yang telah membantu terlaksananya penerbitan
buku-buku ini, penulis menyampaikan terima kasih yang sebesar-besarnya.
Penulis juga sangat mengharapkan saran, kritik, dan koreksi dari pembaca
demi perbaikan pada penerbitan selanjutnya.

Johan Harlan

Agustus 2018

v
DAFTAR ISI

Kata Pengantar v

Daftar Isi vii


Bab 1 Dasar-Dasar Inferensi Statistik 1
2.1 Estimasi Parameter 1
2.2 Uji Hipotesis 8
Lampiran 1A Interval Konfidensi Satu-Sisi dan Dua- 21
Sisi
Lampiran 1B Hipotesis Penelitian dan Hipotesis 23
Statistik
Latihan 1 25

Bab 2 Inferensi Statistik untuk Satu Populasi 32


2.1 Estimasi Interval untuk Rerata Populasi 32
2.2 Uji Hipotesis untuk Rerata Populasi 39
2.3 Estimasi Interval untuk Proporsi Populasi 48
2.4 Uji Hipotesis untuk Proporsi Populasi 52
Lampiran 2A Parameter Distribusi Parental dan 57
Distribusi Sampling serta Estimator-nya
Lampiran 2B Rangkuman Estimasi Interval untuk Nilai 59
Rerata dan Proporsi Satu Populasi
Lampiran 2C Hubungan antara Uji Hipotesis dan 61
Estimasi Interval
Lampiran 2D Teorema Chebyshev 63
Latihan 2 66

vii
Bab 3 Inferensi Statistik untuk Dua Populasi 73
3.1 Inferensi Statistik untuk Rerata Dua Populasi 73
Normal atau Sebarang – Sampel Besar
3.2 Inferensi Statistik untuk Rerata Dua Populasi 80
Normal – Sampel Kecil
3.3 Inferensi Statistik untuk Data Berpasangan 85
3.4 Inferensi Statistik untuk Proporsi Dua Populasi 89
Lampiran 3A Ikhtisar Uji Hipotesis untuk Rerata Dua 96
Populasi
Lampiran 3B Rangkuman Uji Z dan Uji t 99
Lampiran 3C Inferensi Statistik Data Proporsi 100
Lampiran 3D Randomisasi Lengkap dan Randomisasi 102
Blok
Latihan 3 107

Bab 4 Analisis Regresi Linear I 116


4.1 Data Bivariat 116
4.2 Analisis Korelasi 119
4.3 Analisis Regresi Linear Sederhana 124
4.4 Inferensi Statistik pada Model Regresi dan Model 132
Korelasi
Lampiran 4A Ukuran Sampel Minimum untuk Uji 138
Hipotesis pada Model Regresi dan Model
Korelasi
Lampiran 4B Contoh Analisis Regresi Linear 140
Sederhana dengan Program Komputer
Latihan 4 143

viii
Bab 5 Analisis Regresi Linear II 151
5.1 Analisis Regresi Linear Ganda 151
5.2 Variabel Indikator 160
5.3 Koefisien Korelasi Ganda dan Koefisien Korelasi 162
Parsial
Lampiran 5A Model Regresi Logistik 167
Latihan 5 170

Bab 6 Analisis Variansi 175


6.1 Analisis Variansi 1-Arah 175
6.2 Analisis Variansi 2-Arah dengan Interaksi 184
6.3 Analisis Variansi 2-Arah tanpa Interaksi 192
Lampiran 6A Ikhtisar Metode Statistika Parametrik 197
untuk Analisis Hubungan antara Dua
Variabel
Lampiran 6B Analisis Variansi Model Tetap dan 198
Model Acak
Lampiran 6C Interaksi pada ANOVA dan Model 200
Regresi
Lampiran 6D Ukuran Sampel Minimum untuk Uji 202
Hipotesis pada Analisis Variansi
Lampiran 6E Perbandingan Ganda 206
Latihan 6 209

Bab 7 Analisis Data Kategorik I 216


7.1 Penyajian Data Kategorik 216
7.2 Uji Homogenitas 223
7.3 Uji Independensi 231

ix
Lampiran 7A Ukuran Asosiasi pada Tabel Kontijensi 235
Lampiran 7B Ukuran Sampel Minimum untuk Uji 239
Kesamaan Beberapa Proporsi
Latihan 7 242

Bab 8 Analisis Data Kategorik II 249


8.1 Uji Eksak Fisher 249
8.2 Uji Kebaikan-Suai 253
8.3 Uji McNemar 260
Lampiran 8A Ukuran Kesepakatan 263
Lampiran 8B Koreksi Kontinuitas Yates untuk Uji Data 266
Kategorik
Latihan 8 267

Bab 9 Statistika Non-Parametrik I 272


9.1 Pengertian Statistika Non-Parametrik 272
9.2 Uji Tanda 275
9.3 Uji Rank Bertanda Wilcoxon 279
Lampiran 9.A Interval Konfidensi Bootstrap 284
Latihan 9 288

Bab 10 Statistika Non-Parametrik II 292


10.1 Uji Jumlah Rank Wilcoxon 292
10.2 Koefisien Korelasi Spearman 296
10.3 Uji Korelasi Rank Spearman 300
Lampiran 10A Statistik U Mann-Whitney 302
Latihan 10 305

Kepustakaan 311

x
Addenda 313
Addendum A Distribusi Z 313
Addendum B Nilai Kritis Distribusi t 314
Addendum C Nilai Kritis Distribusi F 315
Addendum D Nilai Kritis Distribusi χ 2 318
Addendum E Kuantil Statistik Penguji Rank Bertanda Wilcoxon 319
Addendum F Kuantil Statistik Penguji Jumlah Rank Wilcoxon 320
Addendum G Nilai Kritis Koefisien Korelasi Spearman 324

xi
BAB 1
DASAR-DASAR INFERENSI STATISTIK
Inferensi statistik adalah proses pengambilan kesimpulan mengenai
suatu populasi berdasarkan data sampel yang berasal dari populasi tersebut.
Inferensi statistik terdiri atas dua bagian utama, yaitu estimasi parameter dan
uji hipotesis. Dalam bab ini akan dibahas mengenai dasar-dasar kedua bagian
tersebut secara umum.

1.1. ESTIMASI PARAMETER


Estimasi parameter adalah penaksiran (pengestimasian) nilai
parameter populasi berdasarkan data sampel. Estimasi parameter dibedakan
atas estimasi titik dan estimasi interval.

 Estimasi titik

Pada proses estimasi titik, terlebih dahulu ditetapkan satu ukuran


statistik sampel bagi estimator untuk parameter tertentu populasi, lalu
nilainya dihitung berdasarkan data sampel. Contoh estimator titik antara lain
adalah :

a. Rerata sampel y sebagai estimator titik untuk rerata populasi µ :

µ̂ = y (1.1)

b. Variansi sampel s 2 sebagai estimator titik untuk variansi populasi σ 2 :

σˆ 2 = s 2 (1.2)

c. Proporsi sampel p sebagai estimator titik untuk proporsi populasi P:

P̂ = p (1.3)

Secara statistik matematik, estimator titik yang dipilih adalah


estimator yang memenuhi sifat-sifat antara lain :

1
a. Tak bias

Estimator θˆ bagi parameter θ dikatakan tak bias, jika nilai


harapannya sama dengan parameter populasi yang diestimasinya :

()
E θˆ = θ (1.4)

b. Efisien

Estimator θˆ bagi parameter θ dikatakan efisien, jika memiliki


variasi yang relatif kecil dibandingkan dengan estimator lainnya
bagi parameter θ .

c. Konsisten

Estimator θˆ bagi parameter θ dikatakan konsisten, jika


probabilitasnya untuk mendekati nilai parameter yang
diestimasinya membesar pada ukuran sampel yang semakin besar,
yaitu untuk setiap nilai ε > 0 berlaku :

( )
lim P θˆ − θ < ε = 1
n→∞
(1.5)

n : ukuran sampel

d. Cukup (sufisien).

Estimator θˆ bagi parameter θ dikatakan cukup, jika telah


meringkas seluruh informasi mengenai parameter θ yang
tercakup dalam data sampel.

Secara statistik matematik, standar deviasi sampel s bukan


merupakan estimator tak bias bagi standar deviasi populasi σ , namun demi
kemudahan praktis dalam Statistika Terapan standar deviasi sampel sampel s
selalu digunakan sebagai estimator titik bagi standar deviasi populasi σ :

σˆ = s (1.2.a)

2
Pada Metode Statistik II yang pembahasannya terutama menyangkut
Statistik Inferensi, dikenal variabel independen X dan variabel dependen Y.
Pembahasan sifat-sifat statistik selanjutnya terutama akan berkaitan dengan
variabel dependen Y.

 Estimasi Interval

Pengestimasian titik sangat tergantung pada keberuntungan peneliti


untuk memperoleh nilai estimasi titik yang benar-benar mendekati nilai
parameter yang diestimasi, yang dalam praktik sesungguhnya akan diperoleh
hanya dari satu kali pengambilan sampel. Selain itu peneliti lain dengan
menggunakan rancangan dan metode peneliti yang sama serta estimator yang
sama pula, hampir selalu akan memperoleh nilai estimasi titik yang berbeda
bagi parameter yang sama.

Karena itu, estimasi yang lebih baik untuk disajikan pada inferensi
statistik adalah estimasi interval, yaitu pernyataan estimasi dalam suatu
rentang interval dengan disertai pernyataan tingkat keyakinan akan
kebenaran pernyataan tersebut.

Estimasi interval yang ideal adalah estimasi dengan interval yang


sempit (presisi tinggi) dan tingkat keyakinan yang tinggi, namun dalam
kenyataannya kedua karakteristik ini saling bertentangan: Semakin tinggi
tingkat keyakinan pengestimasian, semakin lebar interval estimasinya.
Pengestimasian dengan tingkat keyakinan sama dengan satu (= 100%) akan
memiliki lebar interval tak berhingga.

Contoh 1.1 :
Misalkan sebagai hasil suatu penelitian disajikan pernyataan bahwa
interval konfidensi 95% (95% confidence interval; 95% CI) usia mahasiswa
Gunadarma adalah [20.3 ; 23.8].

Pengertiannya ialah bahwa pada pengambilan sampel mahasiswa


Gunadarma (dengan ukuran tertentu n sesuai rancangan penelitian),
diperoleh interval konfidensi di atas ( CI1 ) . Misalkan pula dilakukan lagi

3
penyampelan berulang dengan ukuran sampel n yang sama dan rumus
interval konfidensi yang sama, sehingga diperoleh interval konfidensi CI 2 ,
CI 3 , dan seterusnya. Setelah semua kemungkinan sampel terambil, maka
nilai µ sebenarnya akan tercakup dalam 95% di antara interval-interval
konfidensi tersebut (diagram 1.1). Angka 95% disebut sebagai ‘tingkat
keyakinan’ (confidence = keyakinan) pengestimasian tersebut.

Diagram 1.1. Interval konfidensi pada sampling berulang

Sebagai contoh, pada diagram 1.1 tampak bahwa interval konfidensi


yang diperoleh pada pengambilan sampel ke-7 tidak mencakup nilai µ
sebenarnya, sedangkan seluruh interval konfidensi lainnya mencakup nilai µ
tersebut.

Nilai-nilai rerata yang diperoleh pada penyampelan berulang


demikian akan membentuk suatu distribusi yang dinamakan ‘distribusi
sampling’ nilai rerata. Standar deviasi suatu distribusi sampling dinamakan
standard error (SE).

Y −µ Y −µ
Untuk data kontinu, transformasi , yaitu ataupun
SE (Y ) σ/ n
Y −µ
estimatornya dapat berdistribusi Z atau t ( lihat kembali Lampiran
s/ n
6a, buku teks Metode Statistika I).

4
Y −µ
Misalkan transformasi berdistribusi Z , maka :
SE (Y )

P [ − Z a /2 < Z < Z a /2 ] = 1 − a

Za : Nilai Z sedemikian hingga P [ − Z a /2 < Z < Z a /2 ] = 1 − a (Lihat


Addendum A)

 Y −µ 
P −Za/2 < < Za/2  = 1 − a
 SE (Y ) 

diperoleh :

Y −µ
> −Za/ 2
SE (Y )

Y − µ > − Z a / 2 .SE (Y )

µ < Y + Z a / 2 .SE (Y )

dan:

Y −µ
< Za/2
SE (Y )

Y − µ < Z a /2 .SE (Y )

µ > Y − Z a / 2 .SE (Y )

sehingga (batas-batas) interval konfidensi 100 (1 − a ) % untuk µ adalah:

Y ± Z a / 2 .SE (Y ) (1.6.a)

5
atau: [Y − Z a/2. SE (Y ) ; [Y − Z a/2. SE (Y ) ]
(1.6.b)

Y −µ
Jika transformasi berdistribusi t maka interval konfidensi
SE (Y )
100 (1 − a ) % untuk µ adalah :

Y ± ta /2 .SE (Y )
(1.7.a)

atau: Y − ta / 2 .SE (Y ) ; Y + ta / 2 .a SE (Y )  (1.7.b)


 

Bentuk umum estimasi interval untuk contoh-contoh diatas adalah :

Estimator titik ± nilai Z . SE (estimatornya titik) (1.8.a)

atau: Estimator titik ± nilai t . SE (estimator titik) (1.8.b)

Diagram 1.2. Contoh interval konfidensi 95% untuk nilai rerata


populasi µ [ Z 0.025 = 1.96]

6
Pada pengestimasian interval, dibutuhkan ukuran sampel minimum
untuk dapat menghasilkan lebar interval yang telah dispesifikasikan terlebih
dahulu sebelum pengumpulan data dilaksanakan. Untuk estimasi interval
nilai rerata populasi, ukuran sampel minimum tergantung pada:

a. Lebar interval (maksimum).

b. Tingkat keyakinan estimasi / nilai Za

c. Variabilitas populasi / σ

Contoh 1.2:

Misalkan hendak dilakukan pengambilan sampel terhadap data


populasi variabel random Y yang berdistribusi normal untuk mengestimasi
nilai reratanya dengan tingkat keyakinan 100(1-a)% dan lebar interval tidak
lebih daripada 2I (misalkan yB batas bawah interval; y A batas atas interval;
dan 2 I = y A − y B ; lihat diagram 1.2). Jika diketahui standar deviasi Y adalah
σ , maka :

I = Z a /2 .SE ( y )

σ
yaitu I = Z a /2 .
n

n=
( Za/2 ) σ 2
sehingga: (1.9)
I2

Jika standar deviasi populasi σ tak diketahui, dapat dilakukan studi


pendahuluan untuk menentukan nilai standar deviasi sampel sebagai
estimatornya:

2
(Z )
n = a/2
s2
(1.9.a)
I2

7
1.2 UJI HIPOTESIS
 Hipotesis Nol dan Hipotesis Alternatif

Uji hipotesis (uji signifikasi) adalah suatu prosedur Statistika untuk


menentukan apakah nilai suatu parameter populasi, θ , ‘lebih besar
daripada‘; ‘lebih kecil daripada’; ataupun ‘tidak sama dengan’ suatu nilai
tertentu berdasarkan dugaan peneliti, θ o. Ketiga pernyataan tentang
karakteristik populasi ini, salah satu di antaranya terpilih untuk dibuktikan
oleh peneliti, disebut sebagai ‘hipotesis alternatif’ (disimbolkan sebagai H1

atau H A ) dan dinyatakan secara matematis sebagai :

a. H1 : θ > θ 0 ;

b. H1 : θ < θ 0 ; atau

c. H1 : θ ≠ θ 0 .

Komplemen (negasi, penyangkalan) bagi ketiga pernyataan di atas,


yang masing-masing disebut sebagai ‘hipotesis nol’ (disimbolkan sebagai
H 0 ) dapat dinyatakan secara matematis sebagai:

a. H 0 : θ ≤ θ0 ;

b. H 0 : θ ≥ θ ; atau

c. H 0 : θ = θ0 ,

sehingga diperoleh bentuk-bentuk hipotesis statistik :

• H 0 : θ = θ 0 versus H1 : θ ≠ θ 0 (1.10.a)

• H 0 : θ ≤ θ 0 versus H1 : θ > θ 0 (1.10.b)

• H 0 : θ ≥ θ 0 versus H1 : θ < θ 0 (1.10.c)

8
Tujuan uji hipotesis adalah untuk menentukan apakah dugaan tentang
karakteristik suatu populasi memperoleh dukungan kuat oleh informasi yang
berasal dari sampel atau tidak. Jika dengan menggunakan prosedur uji
hipotesis, berdasarkan data yang dikumpulkan peneliti berhasil membuktikan
kebenaran hipotesis alternatif yang diajukannya, dikatakan bahwa hipotesis
nol (yang bersesuaian dengan hipotesis alternatif tersebut) ‘ditolak’ .

Sebaliknya, hipotesis nol tidak pernah dapat dibuktikan kebenarannya


dengan menggunakan prosedur uji hipotesis. Jika hipotesis alternatif tidak
berhasil dibuktikan kebenarannya, kesimpulan yang dianjurkan untuk
dikemukakan ialah bahwa hipotesis nol ‘tidak ditolak’, bukan pernyataan
bahwa hipotesis nol ‘diterima’.

Contoh 1.3:
Misalkan hendak dibuktikan rerata waktu tunggu konsumen yang
datang ke sebuah kantor pelayanan masyarakat kurang daripada 15 menit.
Rerata waktu tunggu yang lebih lama daripada 15 menit dianggap tidak
memuaskan dan akan mengakibatkan perlunya dilakukan perombakan dalam
tata kerja di kantor pelayanan tersebut. Hipotesis nol dan hipotesis alternatif
yang diajukan di sini adalah :

H 0 : µ ≤ 15 versus H1 : µ > 15

Jika data yang terkumpul mendukung secara kuat pernyataan


hipotesis alternatif H1 : µ > 15 , dinyatakan kesimpulan bahwa hipotesis nol
H 0 : µ ≤ 15 ditolak, sebaliknya jika data yang ada tidak mendukung
pernyataan hipotesis alternatif H1 : µ > 15 , dinyatakan kesimpulan bahwa
hipotesis nol H 0 : µ ≤ 15 tidak ditolak.

Secara umum, pernyataan yang hendak dibuktikan pada hipotesis


alternatif seandainya dianggap terbukti kebenarannya, adalah pernyataan
yang berimplikasikan keputusan untuk melakukan ‘perubahan‘ ataupun
sekurang-kurangnya berupa rekomendasi untuk melakukan ‘perubahan’.
Misalkan pada contoh di atas, pernyataan hipotesis alternatif H1 : µ > 15 yang

9
dianggap terbukti kebenarannya akan menghasilkan rekomendasi untuk
memperbaiki sistem pelayanan yang selama ini digunakan.

Karena ‘perubahan’ dalam bidang apapun akan terkait dengan


masalah biaya atau hal-hal lain yang umumnya membebani pelaksananya,
maka ‘penerimaan’ hipotesis alternatif akan menimbulkan implikasi yang
jauh lebih berat daripada ‘penerimaan’ hipotesis nol, sehingga pembuktian
hipotesis alternatif dengan sendirinya menjadi jauh lebih penting daripada
‘pembuktian’ hipotesis nol, yang dalam praktik umumnya tidak pernah
dilaksanakan (kecuali pada penelitian negatif).

Contoh 1.4 :
- Hendak dibuktikan bahwa rerata IQ populasi mahasiswa DKI Jakarta
lebih tinggi daripada 120 . Hipotesisnya adalah:
-
H 0 : µ ≤ 120
H1 : µ > 120
- Di antara baterai produksi pabrik XYZ, hanya 70% yang memenuhi
kualitas standar. Hendak diuji apakah cara produksi baru dapat
menghasilkan persentase yang lebih tinggi yang memenuhi kualitas
standar.
H 0 : P ≤ 70
H1 : P > 70

 Kesalahan Tipe I dan Kesalahan Tipe II

Jika nilai statistik sampel mendekati θ 0, nilai parameter menurut


hipotesis nol, maka hipotesis nol tidak ditolak, sebaliknya jika nilai statistik
sampel ‘cukup berbeda’ dengan θ 0, nilai parameter menurut hipotesis nol,
maka hipotesis nol akan ditolak. Untuk itu diperlukan suatu ‘nilai batas’
(nilai kritis), yang harus sudah ditentukan sebelum dilakukannya
pengumpulan data. Seandainya nilai statistik sampel yang merupakan
estimator bagi parameter populasi berada pada ‘daerah penolakan’, hipotesis

10
nol dinyatakan ‘ditolak’, sebaliknya jika nilai statistik tidak berada pada
daerah penolakan, maka hipotesis nol dinyatakan ‘ tidak ditolak’.

Penentuan nilai batas untuk pengambilan keputusan apakah hipotesis


nol ditolak atau tidak ditolak menimbulkan dampak kemungkinan adanya
kesalahan, yaitu jika variabilitas sampling menyebabkan diperolehnya nilai
statistik sampel yang ‘cukup berbeda’ dengan θ 0, nilai parameter menurut
hipotesis nol, sedangkan nilai parameter sebenarnya adalah θ 0. Di sini akan
terjadi kesalahan yaitu penolakan terhadap hipotesis nol yang sesungguhnya
benar. Kesalahan seperti ini dinamakan ‘kesalahan tipe I’ dan besarnya
dinyatakan dengan lambang a (lihat diagram 1.3):

α = P [ H 0 ditolak| H 0 benar] (1.11)

Diagram 1.3. kesalahan tipe I dan kesalahan tipe II

Kesalahan dapat pula terjadi dengan tidak menolak hipotesis nol yang
sebenarnya salah. Kesalahan seperti ini dinamakan ‘kesalahan tipe II’ dan
besarnya dinyatakan dengan lambang β (diagram 1.3), yang hanya dapat
dihitung besarnya jika nilai parameter menurut hipotesis alternatif
dinyatakan secara spesifik (tidak sekedar lebih besar atau lebih kecil
daripada, ataupun tidak sama dengan θ 0):
11
β = P [ H 0 tidak ditolak H A benar] (1.12)

Jika a diperkecil, maka β akan membesar, demikian pula


sebaliknya, walaupun demikian tidak ada hubungan eksak antara perubahan
kedua nilai tersebut.

Contoh 1.5:
Misalkan pada contoh 1.3 di atas, waktu tunggu berdistribusi normal
dengan nilai rerata menurut hipotesis nol yaitu µ0 = 15 menit dan nilai rerata
waktu tunggu menurut hipotesis alternatif yaitu µ 1 = 20 menit. Misalkan
pula nilai kritis pengambilan keputusan ditetapkan pada c = 18 menit, maka
jika dari data sampel diperoleh nilai statistik y > 18 menit, hipotesis nol
ditolak, sedangkan jika nilai statistik y ≤ 18 menit, hipotesis nol tidak
ditolak.

Diagram 1.4. Titik kritis dan daerah penolakan untuk wakru tunggu
pada contoh 1.5.

Contoh 1.6:
Lihat kembali contoh 1.3 dan 1.5. Pada diagram 1.4 dapat dilihat a ,
yaitu luas daerah penolakan pada kurva H 0 , serta β , yaitu luas daerah pada
kurva H 1. Tampak bahwa:

a = P  y > 18 µ = 15]

12
β = P  y ≤ 18 µ = 20]

Misalkan distribusi H 0 dan H 1 memiliki standar deviasi yang sama,


yaitu σ = 7.5 dan ukuran sampel adalah n = 25 . Maka transformasi normal
standar nilai y untuk titik kritis c = 18 pada distribusi H0 adalah:

c−µ
Zα =
σ/ n

18 − 15
= = 2.00
7.5 / 25

dan: a = 0.02

Transformasi standar nilai y untuk titik kritis c = 18 pada distribusi


H 1 adalah:

c − µ1
Z1− β = − Z β =
σ/ n

18 − 20
= = −1.33
7.5 / 25

dan: β = 0.09

Dalam praktik, yang terjadi adalah sebaliknya: nilai a dan β


merupakan besar kesalahan maksimum pada uji hipotesis yang dapat
ditoleransi oleh peneliti, karena itu harus ditentukan sendiri oleh peneliti
sebelum memulai pengumpulan data. Nilai kritis untuk pengambilan
keputusan dihitung berdasarkan besar nilai a yang ditentukan oleh peneliti
tersebut.

 Statistik Penguji

Untuk mempermudah dan menyederhanakan interpretasi terhadap


hasil suatu uji hipotesis, nilai statistik sampel biasanya ditransformasikan

13
menjadi nilai Z ataupun nilai t . Hasil transformasi ini disebut dengan
sebagai ‘statistik penguji’ ( test statistic ), yang diketahui bentuk distribusi
samplingnya dan digunakan sebagai dasar menolak atau tidak menolak
hipotesis nol setelah diperbandingkan dengan transformasi kritis c , yaitu
untuk penarikan kesimpulan uji hipotesis.

Untuk uji hipotesis terhadap nilai rerata, statistik pengujinya adalah:

y − µ0
Z uji = (1.13.a)
SE ( y )

y − µ0
t uji = (1.13.b)
SEˆ ( y )

Uji hipotesis dengan menggunakan statistik penguji yang


berdistribusi Z atau t di atas tergolong dalam Metode Statistik Parametrik.
Jika distribusi populasi tak diketahui dan sampel berukuran kecil ( n < 30 ) ,
digunakan Metode Statistik Non-Parametrik.

 Daerah Penolakan

Daerah penolakan (daerah kritis) adalah area pada distribusi sampling


yang lebih ekstrim daripada nilai batas (nilai kritis). Letak statistik penguji
pada distribusi samplingnya akan menentukan kesimpulan uji hipotesis:

- Jika nilai statistik penguji terletak pada daerah kritis distribusi


samplingnya, maka kesimpulannya hipotesis nol ditolak.
- Jika nilai statistik penguji terletak di luar daerah kritis, maka
kesimpulannya hipotesis nol tidak ditolak.

Untuk statistik penguji yang berdistribusi Z atau t , daerah


penolakan uji hipotesisnya diperlihatkan pada matriks 1.1 di bawah ini.

14
Matriks 1.1. Daerah penolakan pada uji hipotesis dengan Z atau t

Daerah penolakan
Hipotesis nol
Hipotesis alternatif
Uji Z Uji t

H 0 : θ ≤ θ0 H1 : θ > θ 0 Z uji > Z a tuji > ta

H 0 : θ ≥ θ0 H1 : θ < θ 0 Z uji < − Z a tuji < −ta

Zuji < − Z a /2 tuji < −ta /2


H 0 : θ = θ0 H1 : θ ≠ θ 0
Zuji > Z a /2 tuji > ta /2

Berdasarkan letak daerah kritisnya, uji hipotesis dibedakan atas:

• Uji satu-sisi: Daerah kritis ada di satu sisi distribusi sampling statistik
penguji ( H1 : θ > θ0 atau H1 : θ < θ0 ).

- Jika daerah kritis berada di sisi kanan distribusi sampling statistik


penguji ( H1 : θ > θ0 ), uji tersebut dinamakan uji sisi-kanan (right-
sided test).
- Jika daerah kritis berada di sisi kiri distribusi sampling statistik
penguji ( H1 : θ < θ0 ), uji tersebut dinamakan uji sisi-kiri (left-sided
test).
• Uji dua-sisi: Daerah kritis ada di kedua sisi distribusi sampling statistik
penguji (H1: θ ≠ θ 0).

 Kekuatan Uji

Kekuatan uji ( power of the test) suatu uji hipotesis adalah besarnya
probabilitas untuk menolak hipotesis nol dengan syarat hipotesis alternatif
benar, besarnya adalah (1 − β ) :

(1 − β ) = P [ H 0 ditolak H A benar ] (1.12.a)

15
Misalnya, pada contoh 1.5 untuk uji hipotesis terhadap nilai rerata
dengan hipotesis alternatif H A : µ1 = 20 (lihat diagram 1.4), kekuatan uji
adalah:

1 − β = P Y > 18 µ = 20 ]

Matriks 1.2. Probabilitas kesalahan tipe I dan tipe II pada uji hipotesis

H 0 benar H1 benar
H0 1− a β
H0 a 1− β

a : kesalahan tipe I

β : kesalhan tipe II

1− β : kekuatan (power) uji hipotesis

 Ukuran sampel minimum

Ukuran sampel minimum pada uji hipotesis adalah ukuran sampel


minimum yang dibutuhkan untuk mendeteksi selisih (minimum) nilai
parameter menurut hipotesis nol dan nilai parameter menurut hipotesis
alternatif pada uji hipotesis.

Pada uji hipotesis dua-sisi terhadap nilai rerata populasi dengan


hipotesis nol H 0 : µ = µ0 , besaran (minimum) yang diharapkan untuk
dideteksi adalah selisih nilai d = µ1 − µ0 (lihat diagram 1.5). Ukuran sampel
minimum yang diperlukan untuk mendeteksi perbedaan sebesar d antara
parameter distribusi hipotesis nol dengan parameter distribusi hipotesis
alternatif ditentukan oleh:

16
Diagram 1.5. Dasar perhitungan ukuran sampel minimum untuk uji
hipotesis

a. Besar kesalahan tipe 1 (nilai a ).

b. Kekuatan uji hipotesis [nilai (1 − β ) ]

c. Besar selisih minimum antara parameter kedua distribusi yang hemdak


dideteksi / nilai d = µ1 − µ0

d. Variabilitas kedua distribusi (nilai σ 0 dan σ 1 )

Contoh 1.7:
Lihat kembali contoh 1.3 dan 1.6. Misalkan pada uji hipotesis satu-
sisi terhadap waktu tunggu di atas dengan hipotesis nol H 0 : µ ≤ µ0 tetap
akan digunakan nilai a = 0.02 dan β = 0.09, sehingga Zα = 2.00 dan Z β =
1.33. Misalkan pula diketahui σ 0 = σ 1 = σ 2 , maka dari distribusi sampling
menurut H 0 untuk titik kritis (batas) c diperoleh:

(
c = µ0 + Z σ / n )
Dari distribusi sampling statistik penguji menurut H1, untuk titik kritis
c diperoleh:

17
(
c = µ1 − Z σ / n , )
Zaσ Z βσ
Sehingga µ0 + = µ1 −
n n

µ1 − µ0 =
( Za + Z β ) σ
n
2 2

dan n=
(Z a + Zβ ) σ 2
=
(Z a + Zβ ) σ2
(1.14)
2
( µ1 − µ0 ) d2

yaitu: n=
( 2.00 + 1.33) 7.52
= 25
52

 Nilai p

Nilai p satu-sisi (one-sided p-value) adalah probabilitas untuk


memperoleh nilai statistik penguji sebagaimana yang ada pada data sampel
atau lebih ekstrim, dengan syarat hipotesis nol benar. Untuk uji hipotesis
terhadap nilai hipotesis nol H 0 : µ ≤ µ0 , nilai p satu-sisi adalah:

p = P  Z > Z uji µ = µ0  (1.15)

• Uji 1-sisi: H 0 ditolak jika p < a


• Uji 2-sisi: H 0 ditolak jika p < a / 2

Nilai p dua-sisi (two-sided p value) biasanya adalah dua kali nilai p


satu-sisi, jika distribusi sampling statistik pengujinya simetris, misalnya
berupa distribusi Z atau t .

18
Diagram 1.6. Nilai p satu-sisi dan dua-sisi.

Contoh 1.8:
Lihat data pada contoh 1.3 dan 1.7. Misalkan pada (satu kali)
pengambilan sampel untuk uji hipotesis di atas dengan sampel berukuran
n = 25 diperoleh nilai rerata waktu tunggu y = 19 menit, maka :

y − µ0
Z uji =
σ/ n

19 − 15
= = 2.67
7.5 / 25

dan nilai p (satu-sisi) adalah:

p = 0.0038

Diagram 1.7. Nilai p pada contoh 1.8

19
 Langkah-langkah Umum pada Uji Hipotesis

1. Tentukan jenis uji/analisis statistik yang akan digunakan (sesuaikan


dengan jenis data skala pengukurannya).

2. Rumuskan hipotesis nol dan hipotesis alternatif.

3. Tentukan tingkat signifikansi a , kekuatan uji (1 − β ) , selisih


parameter minimum yang hendak dideteksi.

4. Hitung ukuran sampel minimum yang dibutuhkan. Jika perlu lakukan


studi pendahuluan untuk memperoleh data yang dibutuhkan namun
belum ada untuk perhitungan ukuran sampel.

5. Pilih statistik penguji yang akan digunakan (sesuai dengan uji /


analisis).

6. Rekrut sampel dan lakukan pengumpulan data.

7. Hitung nilai statistik penguji dari data sampel. Periksa apakah nilai
ini terletak pada daerah kritis atau tidak.

8. Hitung nilai p dan buat kesimpulan apakah H 0 ditolak atau tidak


ditolak.

9. Hitung dan sajikan interval konfidensi 100 (1 − a ) % untuk parameter


yang dikaji.

10. Jika H 0 tidak ditolak dan ukuran sampel yang diperoleh tidak
mencukupi ukuran minimum yang dibutuhkan, hitung kembali
kekuatan uji yang sesungguhnya.

Penentuan kekuatan uji (1 − β ) dan selisih parameter minimum yang


hendak dideteksi pada langkah ke-3 serta langkah-langkah ke-4, 6, 9, dan 10
tidak termasuk dalam uji hipotesis yang sebenarnya, namun dalam praktik
harus dikerjakan harus dikerjakan dalam urutan tersebut sebagai langkah-
langkah metode penelitian.

20
LAMPIRAN 1A: INTERVAL KONFIDENSI SATU-SISI
DAN DUA-SISI
Pengestimasian interval yang lazim dilakukan ialah penentuan
interval konfidensi dua-sisi, misalkan interval konfidensi 100 (1 − a ) % untuk
nilai rerata satu populasi adalah.

 y − Z a / 2 .SE ( y ) < µ < y + Z a / 2 .SE ( y ) 

yaitu: P  y − Z a /2 .SE ( y ) < µ < y + Z a / 2 .SE ( y )  = 1 − a

(lihat Diagram1.1)

Diagram 1.1. interval konfidensi dua-sisi untuk rerata satu populasi

Dalam keadaan tertentu kadang-kadang lebih penting untuk


menyajikan interval konfidensi satu-sisi, jika yang perlu ditentukan adalah
batas atas interval, sedangkan batas bawah interval adalah minus tak
berhingga, sehingga konfidensi interval 100 (1 − a ) % untuk nilai rerata satu
populasi adalah:

 −∞ < µ < y + Z a /2 .SE ( y ) 

yaitu P  −∞ < µ < y + Z a /2 .SE ( y )  = 1 − α

(lihat Diagram1.2)

21
Diagram 1.2. Interval konfidensi satu-sisi dengan batas bawah minus
tak terhingga untuk rerata satu populasi

Sebaliknya, jika yang perlu ditentukan adalah batas bawah interval,


sedangkan batas atas interval adalah tak berhingga, maka interval konfidensi
100 (1 − a ) % untuk nilai rerata satu populasi adalah:

 y − Z a / 2 .SE ( y ) < µ < ∞ 

yaitu P  y − Zα 2 .SE ( y ) < µ < ∞  = 1 – α

(lihat Diagram1.3)

Diagram 1.3. Interval konfidensi satu-sisi dengan batas atas tak


terhingga untuk rerata satu populasi

22
LAMPIRAN 1B: HIPOTESIS PENELITIAN DAN
HIPOTESIS STATISTIK
Hipotesis penelitian adalah pernyataan mengenai hal yang hendak
dibuktikan oleh peneliti dalam penelitiannya.

Hipotesis statistik dinyatakan dalam bentuk H 0 (hipotesis nol) dan


H 1 (hipotesis alternatif). Pernyataan yang hendak dibuktikan oleh peneliti,
yaitu hipotesis peneliti dikonversikan menjadi H 1. Hipotesis penelitian
dinyatakan (atau dianggap) terbukti jika uji hipotesis menghasilkan
penolakan H 0.

Contoh 1.1:
Misalkan bahwa hasil pengajaran matematika pada siswa SMU
dengan metode yang ada selama ini dianggap kurang memuaskan, sehingga
dirasa perlu untuk mengembangkan metode pengajaran matematika baru.
Sebelum dapat diterapkan, metode pengajaran baru tersebut harus terlebih
dahulu dinilai dalam suatu penelitian, apakah hasilnya benar lebih baik
daripada metode pengajaran lama.

Hipotesis penelitian: Hasil pengajaran matematika pada siswa SMU dengan


metode baru lebih baik daripada hasil pengajaran matematika pada siswa
SMU dengan metode lama.

Hipotesis statistik:

H 0 : µ1 ≤ µ 2

H1 : µ1 > µ2

µ1 : rerata nilai tes matematika siswa SMU yang memperoleh pengajaran


dengan metode baru

µ2 : rerata nilai tes matematika siswa SMU yang memperoleh pengajaran


dengan metode lama

23
Hipotesis penelitian dinyatakan (dianggap) terbukti benar, yaitu
pengajaran matematika pada siswa SMU dengan metode baru memberi hasil
yang lebih baik daripada dengan metode yang lama jika analisis statistik
terhadap data sampel menghasilkan penolakan hipotesis nol.

Dalam keadaan tertentu yang relatif lebih jarang ditemukan, yaitu


pada ‘penelitian negatif’ peneliti semata-mata bertujuan membuktikan bahwa
sesuatu yang baru adalah ‘sama baiknya’ ataupun ‘tidak lebih buruk’
daripada hal yang sama. Hipotesis statistiknya adalah:

H 0 : µ1 = µ 2 vs H1 : µ1 ≠ µ2

atau: H 0 : µ1 ≥ µ 2 vs H1 : µ1 < µ2

µ1 : rerata ‘sesuatu’ yang baru

µ2 : rerata ‘hal’ yang lama

Di sini tujuan peneliti dianggap tercapai jika hipotesisnya nol tidak


ditolak, dengan kata lain hipotesis nol ‘dianggap’ benar.

24
LATIHAN 1
Bagian Pertama

Pilihlah satu jawaban yang paling benar!

1. Secara statistik matematik, sifat yang harus dipenuhi oleh estimator


titik antara lain adalah:
A. Efisiein C. Suffisien
B. Konsisten D. Semuanya benar

2. Yang bukan merupakan estimator tak-bias di antara estimator titik di


bawah ini yaitu:
A. µ̂ = y C. σ̂ = s
B. σ̂ 2 = s 2 D. P̂ = p

3. Sampel kecil yang diambil secara acak dari populasi yang


berdistribusi normal, nilai rerata-nya:
A. Selalu berdistribusi normal
B. Berdistribusi normal jika variansi populasi diketahui
C. Transformasi standarnya selalu berdistribusi t.
D. Semuanya salah

4. Pernyataan bahwa interval konfidensi 95% nilai rerata adalah [ yB ;


y A ] berarti:
A. 95% nilai-nilai y terletak dalam interval [ yB ; y A ].
B. 95% nilai-nilai y berada dalam interval [ yB ; y A ]
C. Pada penarikan sampel berulang, 95% nilai-nilai y akan
terletak dalam interval [ yB ; y A ]
D. Yang benar lebih daripada satu.

25
5. Jika dari hasil suatu penelitian, dinyatakan bahwa interval konfidensi
95% nilai rerata tinggi badan penduduk Indonesia (dalam cm) adalah
[145 ; 165], pernyataan ini berarti:
A. 95% nilai-nilai y (tinggi badan penduduk Indonesia) terletak
dalam interval [145;165]
B. 95% nilai-nilai y terletak dalam interval [145 ; 165]
C. Nilai µ memiliki probabilitas 95% untuk berada dalam interval
[145 ; 165]
D. Semuanya salah

6. Pilihlah pertanyaan yang benar:


A. Estimator titik yang efisien adalah estimator yang mencakup
seluruh informasi mengenai parameter yang ada dalam sampel.
B. Estimator titik yang sufisien adalah estimator yang memiliki
variansi lebih kecil daripada variansi estimator lainnya bagi
parameter yang sama.
C. Semakin rendah tingkat keyakinan pada pengestimasian
interval, semakin sempit interval estimasinya.
D. Jika tingkat keyakinan adalah 100%, maka lebar interval
estimasi adalah nol.

7. Jika nilai IPK mahasiswa dianggap berdistribusi normal dan dari


hasil proses sampling diperoleh interval konfidensi 90% nilai IPK
lulusan Universitas Gunadarma adalah [2.2 ; 3.10], maka nilai rerata
sampelnya adalah:
A. 2.25
B. 2.65
C. 2.80
D. Tak dapat ditentukan

8. Ukuran sampel pada pengestimasian interval perlu dihitung untuk


menentukan:
A. Ukuran sampel minimum yang dibutuhkan untuk memperoleh
estimasi dengan lebar interval minimum yang dispesifikasikan.
B. Ukuran sampel minimum yang dibutuhkan untuk memperoleh
estimasi dengan lebar interval maksimum yang dispesifikasikan
C. Ukuran sampel maksimum yang dibutuhkan untuk memperoleh
estimasi dengan lebar interval minimum yang dispesifikasikan
D. Ukuran sampel maksimum yang dibutuhkan untuk memperoleh
estimasi dengan lebar interval maksimum yang
dispesifikasikan.

26
9. Upaya memperkecil biaya pada proses sampling untuk
pengestimasian interval dapat dilakukan antara lain dengan:
A. Memperkecil lebar interval yang diinginkan.
B. Menurunkan tingkat keyakinan estimasi.
C. Mencari populasi yang lebih heterogen
D. Semuanya salah

10. Pada interval konfidensi 1-sisi dengan batas atas berhingga, batas
bawahnya adalah:
A. − ∞ C. +1
B. 0 D. Semuanya salah

Bagian Kedua

Pilihlah satu jawaban yang paling benar!

1. Tingkat signifikasi α adalah:


A. Probabilitas untuk menolak H 0 yang benar.
B. Probabilitas untuk tidak menolak H 0 yang benar.
C. Probabilitas untuk menolak H 0 yang salah.
D. Probabilitas untuk tidak menolak H 0 yang salah.

2. Kesalahan tipe II adalah:


A. Probabilitas untuk menolak H 0 yang benar.
B. Probabilitas untuk tidak menolak H 0 yang benar.
C. Probabilitas untuk menolak H 0 yang salah.
D. Probabilitas untuk tidak menolak H 0 yang salah.

3. Kekuatan uji statistik (1 – β) adalah:


A. Probabilitas untuk menolak H 0 yang benar.
B. Probabilitas untuk tidak menolak H 0 yang benar.
C. Probabilitas untuk menolak H 0 yang salah.
D. Probabilitas untuk tidak menolak H 0 yang salah.

27
4. Pada pengujian untuk mendeteksi efek suatu perlakuan, tingkat
signifikansi α dapat pula dinyatakan sebagai:
A. Probabilitas untuk mendeteksi efek yang sesungguhnya ada.
B. Probabilitas untuk mendeteksi efek yang sebenarnya tidak ada.
C. Probabilitas untuk tidak mendeteksi efek yang sesungguhnya
ada.
D. Probabilitas untuk tidak mendeteksi efek yang sebenarnya tidak
ada.

5. Kekuatan (power) suatu iji hipotesis juga pula diartikan sebagai:


A. Probabilitas untuk menemukan efek yang sesungguhnya ada.
B. Probabilitas untuk menemukan efek yang sebenarnya tidak ada.
C. Probabilitas untuk tidak menemukan efek yang sesungguhnya
ada.
D. Probabilitas untuk tidak menemukan efek yang sebenarnya
tidak ada.

6. Pernyataan yang benar mengenai α (kesalahan tipe I), β (kesalahan


tipe II), dan kekuatan uji (power) pada ukuran sampel yang sama
adalah:
A. Semakin besar nilai α, semakin kecil nilai β.
B. Semakin besar nilai α, semakin besar nilai β.
C. Semakin kecil nilai α, semakin kecil nilai kekuatan uji.
D. Yang benar lebih dari satu.

7. Nilai p (p-value) satu-sisi adalah:


A. Probabilitas untuk mendapatkan nilai statistik sebagaimana
yang diperoleh dari data sampel dengan syarat H 0 benar.
B. Probabilitas untuk mendapatkan nilai statistik sebagaimana
yang diperoleh dari data sampel atau lebih ekstrim dengan
syarat H 0 benar.
C. Probabilitas untuk mendapatkan nilai statistik sebagaimana
yang diperoleh dari data sampel dengan syarat H 0 salah.
D. Probabilitas untuk mendapatkan nilai statistik sebagaimana
yang diperoleh dari data sampel atau lebih ekstrim dengan
syarat H 0 salah.

28
8. Dalam notasi probabilitas, nilai p pada uji Z terhadap hipotesis H 0 :
µ < µ0 adalah:
A. P  Z > Z uji H 0  B. P  Z > Zα H 0 
B. P  Z < Z uji H A  D. P  Z < Z β H A 

9. Keputusan pada uji hipotesis dengan uji Z 2-sisi jika didapatkan nilai
p 1-sisi yang lebih kecil daripada α, namun lebih besar daripada α/2
adalah:
A. H 0 ditolak
B. H 0 tidak ditolak
C. Keduanya mungkin benar
D. Keduanya salah

10. Uji Z terhadap hipotesis H 0 : µ1 = µ2 , menghasilkan penolakan


hipotesis nol pada tingkat signifikansi α = 0.05. Apabila digunakan
tingkat signifikasi α = 0.10, maka:
A. H 0 pasti ditolak.
B. H 0 mungkin tidak ditolak.
C. H 0 pasti tidak ditolak
D. Semuanya salah

11. Dalam pengujian statistik yang tidak mencakup penelitian negatif,


pernyataan verbal yang hendak dibuktikan diubah menjadi
pernyataan matematik dalam bentuk:
A. Hipotesis nol C. A) dan B) benar
B. Hipotesis alternatif D. A) dan B) salah

12. Misalkan A menyatakan perlakuan lama dan B menyatakan perlakuan


baru terhadap subjek penelitian, maka yang dimaksud dengan
penelitian negatif adalah:
A. Penelitian untuk membuktikan bahwa efek perlakuan A lebih
baik daripada efek perlakuan B.
B. Penelitian untuk membuktikan bahwa efek perlakuan B lebih
baik daripada efek perlakuan A.
C. Penelitian untuk membuktikan bahwa efek perlakuan A tidak
tidak sama dengan efek perlakuan B.
D. Penelitian untuk membuktikan bahwa efek perlakuan A tidak
berbeda dengan efek perlakuan B.

29
13. Di antara batu baterai produksi pabrik XYZ, hanya 70% yang
memenuhi standar. Konsultan pabrik mengajukan hipotesis (verbal)
bahwa cara produksi baru yang disarankannya dapat menghasilkan
persentase yang lebih tinggi yang memenuhi kualitas standar. Pada
pengujian statistik, hipotesis verbal yang hendak dibuktikan ini
ditransformasikan menjadi:
A. Hipotesis nol C. Keduanya benar
B. Hipotesis alternatif D. Keduanya salah

14. Untuk soal No. 13 di atas, pernyataan verbal yang hendak dikaji
tersebut dianggap terbukti kebenarannya jika pada akhir pengujian
statistik:
A. H 0 ditolak C. H 0 diterima
B. H 0 tidak ditolak D. B) dan C) benar.

15. Misalkan µ1 menyatakan nilai rerata lama waktu tidur sekelompok


pria dewasa pada malam hari, dan µ2 menyatakan nilai rerata bagi
sekelompok wanita dewasa dari populasi yang sama maka untuk
membuktikan bahwa lama waktu tidur malam hari pria tidak sama
dengan wanita, hipotesis nol yang perlu diuji adalah:
A. H 0 : µ1 < µ2
B. H 0 : µ1 = µ2
C. H 0 : µ1 > µ2
D. Yang benar lebih daripada satu.

16. Jika efek diuji dianggap memiliki nilai penting secara substantif,
namun hasil pengujian ternyata tidak menunjukkan kemaknaan
statistik, maka:
A. Efek tersebut disimpulkan tidak penting, uji statistik lebih lanjut
tidak diperlukan.
B. Efek tersebut disimpulkan penting, dan hasil uji statistik tidak
perlu diperhatikan.
C. Pengujian secara statistik perlu diulangi dengan ukuran sampel
yang lebih besar.
D. Semuanya salah

30
17. Jika efek yang diuji bermakna secara statistik, namun secara
substantif dianggap tidak penting maka:
A. Efek tersebut sebenarnya penting, dan penilaian terdahulu
secara substantif adalah salah.
B. Efek tersebut tidak penting, hasil uji statisik tidak perlu
diperhatikan.
C. Pengujian secara statistik perlu diulangi dengan ukuran sampel
yang lebih besar.
D. Semuanya salah.

31
BAB 2
INFERENSI STATISTIK UNTUK
SATU POPULASI

Pembahasan mengenai inferensi statistik (estimasi interval parameter


dan uji hipotesis) untuk satu populasi dalam bab ini mencakup:
a. Estimasi interval untuk rerata populasi.
b. Uji hipotesis untuk rerata populasi.
c. Estimasi interval untuk proporsi populasi.
d. Uji hipotesis untuk proporsi populasi.

2.1. ESTIMASI INTERVAL UNTUK RERATA POPULASI

 Interval Konfidensi untuk Rerata 1 Populasi

Misalkan dimiliki variabel random Y yang berasal dari populasi tak


berhingga dengan variansi populasi σ 2 , maka interval 100 (1 − a ) % untuk
nilai populasi µ adalah :
 σ 
y ± Za/2.  (2.1.a)
 n

Jika variansi populasi σ 2 tak diketahui dan sampel berukuran besar


dengan n > 30, maka variansi populasi σ 2 disubstitusikan dengan variansi
sampel s 2 ,, sehingga interval konfidensi 100 (1 − a ) % untuk nilai rerata
populasi µ adalah:
 s 
y + Za/2.  (2.1.b)
 n

32
Jika populasi berhingga dan ukuran sampel tak dapat diabaikan
terhadap ukuran populasi ( n / N ≥ 5%), interval konfidensi 100 (1 − a ) %
untuk nilai rerata populasi µ adalah:
 σ  N −n
y + Za/2.  (2.2.a)
 n N

Jika variansi populasi σ 2 tak diketahui dan sampel berukuran besar


dengan n ≥ 30 , interval konfidensi 100 (1 − a ) % untuk nilai rerata populasi
µ adalah :
 s  N −n
y + Za/2.  (2.2.b)
 n N

Untuk sampel kecil ( n < 30 ) yang berasal dari populasi normal tak
berhingga dan variansi populasi σ 2 tak diketahui, interval konfidensi
100 (1 − a ) % untuk nilai rerata populasi µ adalah:
 s 
y + t( n −1);a / 2 .   (2.3)
 n

Jika variansi berhingga dan ukuran sampel tak dapat diabaikan


terhadap ukuran populasi ( n / N ≥ 5% ) , interval konfidensi 100 (1 − a ) %
untuk nilai rerata populasi µ adalah:
 s  N −n
y + t( n −1);a / 2 .  
 n N (2.4)

Tampak bahwa bentuk umum interval konfidensi 100(1 – α)% untuk


nilai rerata satu populasi µ adalah:

Rerata sampel + Nilai Z.SE(rerata sampel) (2.5.a)

atau: Rerata sampel ± Nilai t.SE (rerata sampel) (2.5.b)

33
Dasar pemilihan rumus yang akan digunakan di sini yaitu:
1. Penggunaan nilai Z atau nilai t sebagai pengali untuk standard error
rerata sampel ( lihat matriks 2.1) : gunakan nilai t hanya jika populasi
normal, sampel kecil, dan standar deviasi populasi σ tak diketahui.
2. Penggunaan standar deviasi populasi σ atau standar deviasi sampel s :
gunakan s hanya jika standar deviasi populasi σ tak diketahui.

3. Pengguanaan fpc = 1 − ( n / N ) (finite population correction;


koreksi populasi berhingga): gunakan fpc hanya jika populasi
berhingga dan ukuran sampel terhadap ukuran populasi tak dapat
diabaikan ( n / N ≥ 5% ) .

y − µ0
Matriks 2.1. Distribusi transformasi pada populasi normal dan
SE ( y )
sebarang

a. Populasi normal
n ≥ 30 n < 30
σ y − µ0 y − µ0
~ Z (0 ; 1) ~ Z (0 ; 1)
diketahui σ/ n σ/ n
σ tak y − µ0 y − µ0
~ Z (0 ; 1) ~ t( n −1)
diketahui σ/ n σ/ n

b. Populasi sebarang
n ≥ 30 n < 30

σ y − µ0
~ Z (0 ; 1)
diketahui σ/ n
?
σ tak y − µ0
~ Z (0 ; 1)
diketahui σ/ n

34
N −n
Koreksi populasi berhingga sebenarnya adalah . Karena
N −1
N >> 1, maka N − 1 ≈ N , sehingga untuk penyederhanaan koreksi populasi
N −n n
berhingga biasanya dinyatakan sebagai = 1 − . Koreksi populasi
N N
n
berhingga dapat diabaikan jika kecil (misalnya kurang daripada 5%).
N

Rangkuman rumus-rumus estimasi interval untuk rerata satu populasi


dapat dilihat pada Lampiran 2B.

Tingkat keyakinan ( tingkat konfidensi ) yang biasa digunakan


besarnya adalah:
 (1 − a ) = 0.90 → Z a /2 = Z 0.05 = 1.64 )

 (1 − a ) = 0.95 → Z a /2 = Z 0.05 = 1.96 ) (2.6)

 (1 − a ) = 0.99 → Z a /2 = Z 0.05 = 2.58 )

Untuk distribusi t , nilai-nilai untuk ketiga tingkat keyakinan di atas


tergantung pada derajat bebasnya ( lihat Addendum B).

Contoh 2.1 (sampel besar; σ diketahui):


Sebuah perusahaan ingin mengestimasi rerata waktu yang dibutuhkan
sebuah mesin untuk memproduksi sejenis kartu. Diambil secara acak 36 rim
kertas, rerata waktu untuk memproduksi 1 rim adalah 1.5 menit. Jika
diasumsikan standar deviasi populasi 0.30 menit, tentukan estimasi interval
dengan tingkat konfidensi 95%.
y = 1.5 σ = 0.30 n = 36
Standard error rerata sampel adalah:
σ 0.30
SE ( y ) = = = 0.05
n 36

35
Untuk tingkat konfidensi 100 (1 − a ) % = 95% yaitu a = 0.05 ,
diperoleh Z a /2 = 1.96 , sehingga interval konfidensi 95% untuk nilai rerata
adalah:
y − Z a /2 .SE ( y ) < µ < y + Z a /2 .SE ( y )
yaitu: 1.5 − (1.96 )( 0.05 ) < µ < 1.5 + (1.96 )( 0.05 )
1.40 < µ < 1.60
atau: IK 95% adalah [1.40;1.60]

Contoh 2.2 (sampel besar; σ tak diketahui):


Seorang analis penelitian pemasaran mengumpulkan secara acak 100
dari 400 pelanggan yang menggunakan kupon khusus. Besarnya belanja rata-
rata 100 pelanggan tersebut adalah Rp 24,570 dengan standar deviasi Rp
6,600. Dengan tingkat konfidensi 95%, estimasilah:
a. Besar belanja rata-rata seorang di antara 400 pelanggan
b. Jumlah total uang yang dibelanjakan oleh 400 pelanggan.
a. n = 100 N = 400
y = 24, 570 s = 6, 600
Estimasi standard error rerata sampel adalah:
 s  N −n
SEˆ ( y ) =  
 n N
 6, 600  400 − 100
=  = 571.58
 100  400
Dengan tingkat konfidensi 100 (1 − a ) % = 95%, Z a /2 = 1.96 dan
interval konfidensi 95% belanja rata-rata seorang anggota
populasi pelanggan adalah:
y ± Z .SEˆ ( y ) = 24, 570 ± (1.96 )( 571.58 )
a /2

= 24,570 ± 1,120
atau: [ 23, 450; 25, 690]

36
b. Jumlah total uang yang dibelanjakan oleh 400 pelanggan adalah:
T = N .µ
dan estimasinya adalah:
Tˆ = N . y
Interval konfidensi 95% jumlah total uang yang dibelanjakan
adalah:
N  y ± Z a / 2 .SEˆ ( y ) 

atau: ( 400 )( 23, 450 ) ; ( 400 )( 25, 690 ) 

[9,380, 000 ; 10, 276,000]

Contoh 2.3 (sampel kecil):


Misalkan diketahui data waktu (dalam detik) yang dicatat dalam lari
100 m oleh sampel acak 10 orang atlet yang menjalani metode pelatihan baru
di Kodya Tangerang:
12.2;13.6;12.4;12.8;13.1;
13.5;12.5;12.7;12.5;12.8
Dengan tingkat keyakinan 90% hendak diketahui rerata waktu yang
diperlukan untuk lari 100 m pada populasi atlet yang menjalani metode
pelatihan baru di Kodya Tangerang:

y=
∑y 1
= 12.81
n

s=
∑y 2
i − ( ∑ yi )  2 n
= 0.463
n −1
s 0.463
SEˆ ( y ) = = = 0.146
n 10
t( n−1);a /2 = t(9;0.05) = 1.833

IK 90% untuk rerata waktu lari 100 m populasi atlet Kodya Tangerang yang
menjalani metode pelatihan baru adalah:

37
y ± t( n −1);a / 2 .SEˆ ( y )

12.81 ± (1.833)( 0.146 )


atau: [12.54;13.08]

 Ukuran Sampel Minimum untuk Estimasi Interval 1 Rerata

Misalkan hendak diestimasi interval konfidensi 100 (1 − a ) % untuk


rerata populasi µ . Interval konfidensi yang akan diperoleh dinyatakan
dengan lambang [ yB ; y A ] ; yB dan y A masing-masing menyatakan batas
bawah dan batas atas interval konfidensi tersebut. Misalkan pula
2 I = y A − y B menyatakan lebar interval maksimum yang diinginkan (=
presisi), maka:
σ
I = Z a /2 .
n
sehingga ukuran sampel minimum yang dibutuhkan adalah:
2

n=
( Z a /2 ) .σ 2
(2.7.a)
I2

Jika σ tak diketahui disubstitusikan dengan estimasinya s :


2
(Z )
n = a /2
.s 2
(2.7.b)
I2

Nilai s dapat diperoleh dari data penelitian sejenis terdahulu. Jika


penelitian sejenis terdahulu tidak ada, harus dilakukan studi pendahuluan
(pilot study), misalkan terhadap 30 anggota sampel untuk memperoleh nilai
standar deviasi s .

Contoh 2.4:
Lihat kembali data pada contoh 2.1. Dengan σ = 0.30 menit,
misalkan hendak diestimasi rerata waktu untuk memproduksi 1 rim kertas

38
dengan tingkat keyakinan 95% dan presisi (lebar interval konfidensi) tidak
lebih daripada 0.10 menit.
(1 − a ) = 0.95 → Z a / 2 = Z 0.025 = 1.96
σ = 0.30 2 I = 0.10 I = 0.10 / 2 = 0.05
Ukuran sampel minimum yang dibutuhkan adalah:
2

n=
( Z a /2 ) .σ 2
I2

=
(1.96 )( 0.30 )
2 2

0.052
= 138.30 ≈ 139 (dibulatkan keatas)

2.2 UJI HIPOTESIS UNTUK RERATA POPULASI


Jenis uji statistik yang digunakan untuk rerata satu populasi
tergantung pada bentuk distribusi populasi (normal atau sebarang), besar
sampel, dan diketahui tidaknya variansi populasi σ . Pada matriks 2.2 di
bawah tampak bahwa uji t hanya digunakan jika distribusi populasi normal ,
sampel kecil, dan variansi populasi σ tak diketahui.

Untuk populasi yang berdistribusi sebarang dan sampel berukuran


kecil, Metode Statistika Parametrik (uji Z dan uji t ) tak dapat dipakai, dan
sebagai gantinya harus digunakan Metode Statistika Non-parametrik.

Matriks 2.2. Uji hipotesis untuk rerata satu populasi pada populasi
normal dan sebarang

a. Populasi Normal b. Populasi Sebarang


n > 30 n < 30 n > 30 n < 30
σ σ
Uji Z Uji Z Uji Z
diketahui diketahui
?
σ tak σ tak
Uji Z Uji t Uji Z
diketahui diketahui

39
 Uji Hipotesis untuk 1 Rerata Populasi Sebarang (Sampel Besar)

Prosedur uji hipotesis:

1. Jenis uji statistik: uji Z


2. Hipotesis:
a. H 0 : µ = µ0 versus H1 : µ ≠ µ0 )
b. H 0 : µ ≤ µ0 versus H 1 : µ > µ0 ) (2.8)
c. H 0 : µ ≥ µ0 versus H1 : µ < µ0 )
3. Tingkat signifikansi: a. Tingkat signifikansi yang lazim digunakan
yaitu 0.01, 0.05, atau 0.10.
4. Statistik penguji:
y − µ0
Z uji = (2.9.a)
σ/ n
atau: y − µ0 (jika σ tidak diketahui)
Zuji =
s/ n (2.9.b)

yang berdistribusi normal standar jika n besar.


5. Daerah kritis: sesuai H1 (lihat diagram 2.1)
a. Z < Z a / 2 atau Z > Z a /2 untuk H1 : µ ≠ µ0 )
b. Z > Z a untuk H1 : µ > µ0 ) (2.10)
c. Z < −Za untuk H1 : µ < µ0 )

40
Diagram 2.1. Daerah kritis pada uji hipotesis untuk satu nilai rerata
populasi dengan sampel besar

Nilai-nilai
nilai titik kritis pada uji 11-sisi dan untuk tingkat signifikansi
0.01, 0.05, dan 0.10 dapat dilihat pada tab
tabel 2.1.

Tabel 2.1. Nilai-nilai


nilai titik kritis pada uji Z untuk berbagai tingkat
signifikansi

a. Nilai Z kritis untuk uji 1-arah:

a H1 : µ < µ 0 H1 : µ > µ0
0.01 Z < − Z0.01 (Z < −2.33) Z > Z 0.01 (Z > 2.33)
0.05 Z < − Z0.05 (Z < −1.64) Z > Z 0.05 (Z > 1.64)
0.10 Z < − Z0.10 (Z < −1.28) Z > Z 0.10 (Z > 1.28)

41
b. Nilai Z kritis untuk uji 2-arah:

a H1 : µ ≠ µ0
0.01 Z < − Z 0.005 (Z < −2.58) Z > Z 0.005 (Z > 2.58)
0.05 Z < − Z 0.025 (Z < −1.96) Z > Z 0.025 (Z > 1.96)
0.10 Z < − Z0.05 (Z < −1.64) Z > Z0.05 (Z > 1.64)

Contoh 2.5:
Lihat kembali data pada contoh 2.1 (estimasi interval 1 nilai rerata;
sampel besar; σ diketahui): Rerata waktu yang dibutuhkan mesin milik
sebuah perusahaan untuk memproduksi 1 rim kertas selama ini adalah 1.2
menit. Pada pengambilan sampel acak sebanyak 36 rim kertas, rerata waktu
untuk memproduksi 1 rim adalah 1.5 menit. Jika diasumsikan standar deviasi
populasi 0.30 menit dan digunakan a = 0.01 , kesimpulan apa yang diperoleh
pada uji hipotesis terhadap rerata waktu produksi untuk 1 rim kertas?

Yang perlu dibuktikan di sini ialah bahwa rerata waktu produksi


populasi lebih daripada 1.2 menit, dengan kata lain lebih lamanya rerata
waktu produksi sampel yaitu 1.5 menit tidak terjadi secara kebetulan. Jika
hal itu terbukti, diperlukan perubahan untuk memperbaiki waktu produksi
yang terlalu lama. Karena itu, yang diperlukan adalah uji satu-sisi dengan
hipotesis H 0 : µ ≤ 1.2 versus H1 : µ > 1.2.

Uji hipotesis (1-sisi):

1. Jenis uji statistik: uji Z.

2. Hipotesis: H 0 : µ ≤ 1.2 versus H1 : µ > 1.2

3. Tingkat signifikansi: a = 0.01

4. Daerah kritis: Z > Z , yaitu Z > 2.33


0.01

5. Statistik penguji:

42
y − µ0
Z uji =
σ/ n
yang berdistribusi normal standar.
y = 1.5 σ = 0.30 n = 36
σ 0.30
SE ( y ) = = = 0.05
n 36
1.5 − 1.2
Z uji = = 6.0,
0.05
yang terletak pada daerah kritis ( Z uji > 2.33 )

5. Kesimpulan: H 0 ditolak pada a = 0.01

Seandainya hendak dilakukan uji 2-sisi, perbedaannya adalah:

a. Hipotesis:
H 0 : µ = 1.2 vs H1 : µ ≠ 1.2

b. Daerah kritis: Z < − Z 0.025 , yaitu Z < −2.58


atau Z > Z 0.025 , yaitu Z > 2.58
Dengan statistik penguji yang sama:
Z uji = 6.0,
yang juga terletak pada daerah kritis Z > 2.58 , diperoleh kesimpulan
yang sama, yaitu H 0 ditolak pada a = 0.01 .

Contoh 2.6:
Lihat kembali data pada contoh 2.2 (estimasi interval 1 nilai rerata;
sampel besar; σ tak diketahui): Pemilik sebuah toko serba ada mentargetkan
setiap pelanggan untuk membelanjakan rata-rata Rp 30.000 per kali
kunjungan ke tokonya. Sampel acak yang terdiri dari 100 pelanggan
menunjukkan bahwa rerata belanja pelanggan adalah Rp 24.570 dengan
standar deviasi Rp 6.600. Dengan a = 0.05 , kesimpulan apa yang ditarik?

Pemilik toko perlu mengadakan perubahan jika tingkat penjualan


tokonya kurang memuaskan, yaitu rerata belanja populasi pelanggan per

43
kunjungan kurang daripada Rp 30.000, karena itu diperlukan uji satu-sisi
dengan hipotesis H 0 : µ ≥ 30, 000 versus H1 : µ < 30, 000 .

Uji hipotesis (1 sisi):

1. Jenis uji statistika: uji Z


2. Hipotesis: H 0 : µ ≥ 30, 000 versus H1 : µ < 30, 000

3. Tingkat signifikansi: a = 0.05


4. Daerah kritis: Z < − Z 0.05 , yaitu Z < −1.64

5. Statistik penguji:
y − µ0
Zuji =
s/ n
yang berdistribusi normal standar.
y = 24, 570 s = 6, 600 n = 100
s 6, 600
SEˆ ( y ) = = = 600
n 100
24,570 − 30, 000
Z uji = = −8.23
660
yang terletak pada daerah kritis ( Z uji < −1.64 )
5. Kesimpulan : H0 ditolak pada a = 0.05

Seandainya dilakukan uji 2-sisi, perbedaannya adalah:

a. Hipotesis:
H 0 : µ = 30, 000 vs H1 : µ ≠ 30, 000

b. Daerah kritis: Z < − Z 0.025 , yaitu Z < −1.96


atau Z > Z 0.025 , yaitu Z > 1.96

Dengan statistik penguji yang sama:


Z uji = −8.23,

44
yang juga terletak pada daerah kritis Z < −1.96, diperoleh kesimpulan yang
sama, yaitu H0 ditolak pada a = 0.05.

 Uji Hipotesis untuk 1 Rerata Populasi Normal (Sampel kecil)

Prosedur uji hipotesis:

1. Jenis uji statistik: uji t .


2. Hipotesis:
a. H 0 : µ = µ0 versus H1 : µ ≠ µ0 )
b. H 0 : µ ≤ µ0 versus H 1 : µ > µ0 ) (2.11)
c. H 0 : µ ≥ µ0 versus H1 : µ < µ0 )

3. Tingkat signifikansi: a.
4. Statistik penguji:
y − µ0
tuji = (2.12)
s/ n
yang berdistribusi t dengan db ( n − 1) .
5. Daerah kritis: sesuai H1
a. t < − t( n−1) ; α 2 atau t > − t( n−1) ; α 2 untuk H1 : µ ≠ µ0 )

b. t < − t( n−1) ; α untuk H1 : µ < µ0 ) (2.13)

c. t > t( n−1) ; α untuk H1 : µ > µ0 )

Contoh 2.7:
Lihat kembali data pada contoh 2.3 (estimasi interval; sampel kecil):
Data waktu (dalam detik)yang dicatat dalam lari 100 m oleh sampel acak 10
orang di antara atlet Kodya Tangerang yang menjalani metode pelatihan baru
adalah:
12.2;13.6;12.4;12.8;13.1;
13.5;12.5;12.7;12.5;12.8

45
Dengan a = 0.10 , ujilah hipotesis bahwa rerata waktu yang diperlukan untuk
lari 100 m pada populasi atlet Kodya Tannggerang yang menjalani metode
pelatihan baru kurang daripada 13.00 detik.

Metode pelatihan baru itu dianggap bermanfaat dan dapat diterima


jika metode tersebut dapat meningkatkan prestasi atlet, yaitu menghasilkan
rerata waktu lari 100 m kurang daripada 13.00 detik, maka diperlukan uji 1-
sisi dengan hipotesis H 0 : µ ≥ 13.00 versus H1 : µ < 13.00 .

Pada contoh 2.3 telah dihitung nilai-nilai rerata sampel dan standar
deviasi sampel:
y = 12.81 s = 0.463

Uji hipotesis (1-sisi):

1. Jenis uji statistik: uji t .


2. Hipotesis: H0 : µ ≥ 13.00

3. Tingkat signifikansi: a = 0.10.

4. Daerah kritis: t < − t( 9 ;10 ) ; yaitu t < −1.38

5. Statistik penguji:
y − µ0
tuji =
s/ n
yang berdistribusi t dengan db (n – 1).
y = 12.81 s = 0.463 n = 10
s
SEˆ ( y ) = = 0.146
n
12.81 − 13.0
tuji = = −1.30,
0.146
yang tidak terletak pada daerah kritis ( tuji > −1.38 ) .
6. Kesimpulan: H 0 tidak ditolak pada a = 0.10.

Seandainya dilakukan uji 2-sisi, perbedaannya adalah:

46
a. Hipotesis:
H 0 : µ = 13.00 vs H1 : µ ≠ 13.00

b. Daerah kritis: t < − t( 9 ; 0.05) , yaitu t < −1.83


atau: t > t( 9 ; 0.05) , yaitu t > 1.83

Dengan statistik penguji yang sama:


tuji = −1.30 ,
yang tidak terletak pada daerah kritis t < −1.83 , diperoleh kesimpulan yang
sama, yaitu H 0 tidak ditolak pada a = 0.10 .

 Ukuran Sampel Minimum untuk Uji Hipotesis 1 Rerata


Untuk keperluan praktis perhitungan ukuran sampel minimum yang
dibutuhkan pada uji hipotesis H 0 : µ ≤ µ0 vs H1 : µ > µ0 ,uji hipotesis tersebut
dapat dituliskan sebagai:
H 0 : µ = µ0 versus H A : µ = µ A
dengan µ0 menyatakan rerata menurut hipotesis nol; µ A menyatakan rerata
menurut hipotesis alternatif; sedemikian hingga d = ( µ A − µ0 ) adalah selisih
minimum µ0 dengan µ A yang diharapkan untuk dapat dideteksi.

Misalkan c menyatakan nilai titik batas (titik kritis) penerimaan dan


penolakan hipotesis nol, maka dengan merujuk pada distribusi sampling Y
menurut H 0 dan dengan asumsi σ 0 = σ 1 = σ :
c = µ 0 + Zα σ ( n )
Dengan merujuk pada distribusi sampling Y menurut H A diperoleh:
c = µA − Zβ σ ( n )
sehingga didapatkan:
µ 0 + Zα σ ( )
n = µA − Zβ σ ( n )

47
dan:
( Za + Z β )σ = µ A − µ0
n

Ukuran sampel minimum yang dibutuhkan untuk mendeteksi


perbedaan minimum sebesar d = µ A − µ0 pada uji hipotesis H 0 : µ ≤ µ0 vs
H1 : µ > µ0 adalah:
2

n=
( Za + Zβ ) σ 2

(2.14)
2
( µ A − µ0 )
Nilai σ 2 ataupun estimatornya s 2 diperoleh dari data terdahulu atau
studi pendahuluan. Untuk uji 2-sisi, nilai Zα diganti Zα 2 .

2.3. ESTIMASI INTERVAL UNTUK PROPORSI


POPULASI

 Interval Konfidensi untuk Proporsi 1 Populasi


Pada data proporsi dengan sampel berukuran besar, distribusi
sampling nilai reratanya (= proporsinya) dapat dianggap berdistribusi
normal. Misalkan dimiliki variabel random Y yang berskala dikotomi dari
populasi tak berhingga, dengan proporsi ‘sukses’ dalam populasi P , dan
misalkan dimiliki pula sampel acak berukuran n dari populasi tersebut
dengan proporsi ‘sukses’ dalam sampel p , maka interval konfidensi
100 (1 − a ) % untuk nilai proporsi populasi P adalah:

PQ
p ± Z a /2 (2.15.a)
n
dengan Q = 1 − P .

Jika proporsi populasi P dan komplemennya Q tak diketahui,


digunakan estimatornya yaitu proporsi sampel p dan komplemennya q :

48
pq
p ± Z a /2 (2.15.b)
n
dengan q = 1 − p.

Pada populasi berhingga berukuran N , jika ukuran sampel n tak


dapat diabaikan terhadap ukuran populasi ( n / N ≥ 5% ) , harus digunakan
‘koreksi populasi berhingga’ ( fpc ) , sehingga interval konfidensi
100 (1 − a ) % untuk nilai proporsi populasi P adalah:

PQ  N − n 
p ± Za/2   (2.16.a)
n  N 

Jika proporsi populasi P dan komplemennya Q tak diketahui,


digunakan estimatornya yaitu proporsi sampel p dan komplemennya q :
pq  N − n 
p ± Za/2   (2.16.b)
n  N 

Contoh 2.8:
Di antara 900 petani sebagai sampel acak petani di DIY, 610 orang
adalah buruh tani. Hitunglah interval konfidensi 90% proporsi buruh tani di
antara seluruh petani di DIY.
610 290
n = 900 p= = 0.678 q = 1− p = = 0.322
900 900
Estimasi standard error proporsi sampel p adalah:
pq
SEˆ ( p ) =
n

=
( 0.678)( 0.322 ) = 0.0156
900
(1 − a ) = 0.90 → Z a /2 = Z 0.05 = 1.64

Interval konfidensi 90% proporsi buruh tani adalah:

49
p ± Z a / 2 .SEˆ ( p )
0.678 ± (1.64 )( 0.0156 ) atau:
[ 0.652; 0.703]

Catatan:
a. Untuk data proporsi, nilai P (dan estiamatornya p ) adalah:
0 ≤ P ≤1 dan Q = 1− P
b. Jika digunakan untuk perhitungan persentase, maka:
0 ≤ P ≤ 100 dan Q = 100 − P

 Ukuran Sampel Minimum untuk Estimasi Interval 1 Proporsi

Misalkan hendak diestimasi interval konfidensi 100 (1 − a ) % untuk


proporsi populasi P . Interval konfidensi yang akan diperoleh dinyatakan
dengan lambang [ pB ; p A ] ; p B dan p A masing-masing menyatakan batas
bawah dan batas atas interval konfidensi tersebut. Misalkan pula 2I =
p A − pB menyatakan lebar interval maksimum yang diinginkan (= presisi),
maka:
I = Z a / 2 .SE ( p )

PQ
yaitu: I = Z a /2 .
n
dengan Q = 1 − P , sehingga ukuran sampel minimum yang dibutuhkan
adalah:
2
(Z )
n = a/2
PQ
2
(2.17.a)
I

Jika proporsi populasi P dan Q tak diketahui, disubstitusi dengan


estimasinya yaitu proporsi sampel p dan komplemennya q yang diperoleh
dari studi pendahuluan:

50
2
(Z )
n = a/2
PQ
2
(2.17.b)
I
dengan q = 1 − p.

Contoh 2.9:
Misalkan pada contoh 2.8 di atas, untuk estimasi interval proporsi
buruh tani di antara seluruh petani di DIY dengan tingkat keyakinan 90%,
lebar estimasi yang diinginkan cukup tidak melebihi 10%, maka ukuran
sampel minimum yang dibutuhkan adalah:
2
(Z )
n = a/2
pq
2
I
Z a /2 = Z 0.05 = 1.64 2 I = 10% I = 5% = 0.05

p = 0.678 q = 0.322
2

n=
(1.64 ) ( 0.678 )( 0.322 )
2
( 0.05)
= 236.36 ≈ 237

Jika nilai P dan Q tak diketahui, demikian pula estimasinya p dan


q (tidak dilakukan studi pendahuluan), dapat digunakan P̂Qˆ ( ) max yang akan
ˆˆ
menghasilkan nilai n terbesar, yaitu PQ ( ) max
= ( 0.5 )( 0.5 ) = 0.25, sehingga
diperoleh:
2
0.25 ( Z a /2 )
n= (2.17.c)
I2

Contoh 2.10:
Pada contoh 2.9, jika nilai proporsi populasi maupun estimasinya tak
diketahui, ukuran sampel minimum yang dibutuhkan adalah:
2
( ˆˆ
Z a / 2 ) PQ
n=
I2

51
dengan Pˆ = 0.5 dan Qˆ = 0.5, sehingga:

n=
(1.64 ) ( 0.5)( 0.5)
2

0.052
= 270.57 ≈ 271

2.4 UJI HIPOTESIS UNTUK PROPORSI POPULASI

 Uji Hipotesis untuk 1 Proporsi (Sampel Besar)

Prosedur uji hipotesis:

1. Jenis uji statistik: uji Z .


2. Hipotesis:
a. H 0 : P = P0 versus H1 : P ≠ P0 )
b. H 0 : P ≤ P0 versus H1 : P > P0 ) (2.18)
c. H 0 : P ≥ P0 versus H1 : P < P0 )

3. Tingkat signifikansi: α (0.01, 0.05. atau 0.10).


4. Statistik penguji:
p − P0
Z uji = (2.19)
P0Q0 / n
yang berdistribusi normal standar.
5. Daerah ktitis: sesuai H1
a. Z < − Z a / 2 atau Z > Z a /2 untuk H1 : P ≠ P0 )
b. Z < − Z a untuk H1 : P < P0 ) (2.20)
c. Z > Za untuk H1 : P > P0 )

Contoh 2.11
Lihat kembali data pada contoh 2.8 (estimasi interval 1 nilai
proporsi): Diantara 900 petani sebagai sampel acak petani di DIY, 610 orang

52
adalah buruh tani. Dengan a = 0.05 akan diuji apakah proporsi buruh tani di
DIY tidak kurang daripada 65%.

Seandainya proporsi buruh tani pada populasi petani DIY melebihi


65%, diperlukan perubahan untuk memperbaiki dan meningkatkan taraf
kehidupan populasi petani di DIY, maka uji hipotesis yang diperlukan adalah
uji 1-sisi dengan hipotesis H 0 : P ≤ 0.65 vs H1 : P > 0.65.
n = 900 p = 0.678
P0 = 0.65 Q0 = 1 − P0 = 1 = 0.65 = 0.35

Standard error proporsi sampel p adalah:


P0Q0
SE ( p ) =
n

=
( 0.65)( 0.35 ) = 0.016
900

Uji hipotesis (1-sisi):


1. Jenis uji statistik: uji Z .
2. Hipotesis: H 0 : P ≤ 0.65 vs H1 : P > 0.65

3. Tingkat signifikansi: a = 0.05


4. Daerah kritis: Z > Z 0.05 atau Z > 1.64
5. Statistik penguji:
p − P0
Z uji =
P0Q0 / n
yang berdistribusi normal standar.
0.678 − 0.65
Z uji = = 1.75,
0.016
yang terletak pada daerah kritis ( Z uji > 1.64 )
6. Kesimpulan: H 0 ditolak pada a = 0.05 , berarti dengan tingkat
signifikansi 5%, proporsi buruh tani di DIY secara bermakna lebih
besar daripada 65%.

53
 Ukuran Sampel Minimum untuk Uji Hipotesis 1 Proporsi

Untuk keperluan praktis perhitungan ukuran sampel, uji hipotesis


H 0 : P ≤ P0 vs H1 : P > P0 dituliskan sebagai:
H 0 : P = P0 versus H A : P = PA
P0 : proporsi menurut hipotesis nol;
PA : proporsi menurut hipotesis alternatif;
dan d = ( P A − P0 ) adalah selisih umum P0 dengan PA yang diharapkan dapat
dideteksi.

Jika c menyatakan nilai titik batas penerimaan dan penolakan


hipotesis nol, maka:
P0Q0
c = P0 + Z a ,
n
dengan Q0 = 1 − P0 dan:
PAQA
c = PA − Z β
n
sehingga didapatkan:
P0Q0 PQ
P0 + Z a= PA − Z β A A
n n
dan ukuran sampel minimum yang dibutuhkan untuk mendeteksi perbedaan
minimum sebesar d = ( PA − P0 ) pada uji hipotesis H 0 : P ≤ P0 vs H1 : P > P0
adalah:
2
 Z a P0 Q0 + Z β PAQA 
n=  2
 (2.21)
( PA − P0 )

Untuk uji 2-sisi, nilai Z a diganti dengan Z a/2.

54
Beberapa catatan mengenai estimasi interval dan uji hipotesis:
1. Pernyataan bahwa interval konfidensi 100 (1 − a ) % untuk µ adalah

Y ± Z a / 2 .SE (Y )  berarti pada pengambilan sampel berulang (misalnya


100 ×) dengan metode sampling dan ukuran sampel yang sama,
100 (1 − a ) % di antara interval-interval yang diperoleh akan mencakup
nilai µ yang sebenarnya (diagram 1.1).
2. Dari pernyataan di atas diperoleh (atau lebih tepat pernyataan di atas
sebenarnya berasal dari) pengertian:
P [ y B < µ < y A ] = 1 − a dengan:
yB = µ − Z a / 2 .SE ( y ) dan y A = µ + Z a / 2 .SE ( y )
atau: P [ y − Z a / 2 .SE ( y ) < µ < y + Z a /2 .SE ( y )  = 1 − a
(perhatikan distribusi sampling y ; diagram 1.2)
3. Jika pernyataan di atas telah dimuati dengan nilai-nilai tertentu,
misalnya: Interval konfidensi 95% nilai rerata IPK alumni Gunadarma
adalah [2.6;3.0], pernyataan ini hanya memiliki dua kemungkinan,
yaitu benar: P [ 2.6 < µ < 3.0] = 1 atau salah: P [ 2.6 < µ < 3.0] = 0
(interval ini telah menjadi salah satu di antara interval-interval yang
diperlihatkan pada diagram 1.1 dan 1.2).
4. Distribusi Z merupakan bentuk khusus distribusi t dengan derajat
bebas tak berhingga (dalam praktik sudah dapat dianggap sama dengan
distribusi t pada ukuran sampel n ≥ 30 ). Pada paket statistik dengan
program komputer tidak didapatkan uji Z . Uji statistik untuk satu
rerata, dua rerata, satu proporsi, dan dua proporsi seluruhnya dilakukan
dengan uji t .
5. Uji hipotesis diperlukan untuk mengambil keputusan dalam keadaan
ketidakpastian. Dalam keadaan yang pasti tidak diperlukan uji
hipotesis. Pada uji satu-sisi, jika nilai rerata sampel ( y) terletak
berseberangan dengan nilai µ menurut hipotesis alternatif, maka uji
hipotesis sebenarnya tidak diperlukan lagi. Misalnya pada pengujian

55
H 0 : µ ≤ 160 vs H1 : µ > 160 , jika diperoleh nilai y = 150 , maka uji
hipotesis tidak diperlukan lagi karena H 0 pasti tidak ditolak
(seandainya y > 160 masih perlu diuji apakah kelebihannya daripada
160 itu terjadi secara kebetulan atau tidak).

56
LAMPIRAN 2A: PARAMETER DISTRIBUSI PARENTAL DAN
DISTRIBUSI SAMPLING SERTA ESTIMATORNYA

Matriks II.1. Parameter distribusi parental Y (data kontinu) dan


estimatornya
PARAMETER ESTIMATOR

Rerata µ µˆ = y

Variansi Var (Y ) = σ 2 Var (Y ) = σˆ 2 = s 2

Standard error SD (Y ) = σ SDˆ (Y ) = σˆ = s ( ? )

N n N n

∑Y ∑y ∑ (Y − µ ) ∑( y − y)
2 2
i i i i
µ= i =1
y= i =1
σ2 = i =1
s2 = i =1

N n N n −1

Matriks II.2. Parameter distribusi sampling nilai y (data kontinu) dan


estimatornya
PARAMETER ESTIMATOR
Sampling dengan pengembalian:
Rerata µy µˆ y = y
Variansi Var ( y ) = σ y2 = σ 2 / n ˆ ( y ) = σˆ y2 = s 2 / n
Var

Standard error SE ( y ) = σ y = σ / n SEˆ ( y ) = σˆ y = s / n


Sampling tanpa pengembalian:
Rerata µy µˆ y = y

σ 2 N −n 2
s  N −n
Variansi Var ( y ) = σ y2 =   ˆ ( y ) = σˆ y2 =
Var  
n  N  n  N 
σ N −n s N −n
Standard error SE ( y ) = σ y = SEˆ ( y ) = σˆ y =
n N n N

N −n n
Finite population correction: fpc = = 1−
N N

57
Matriks II.3. Parameter distribusi parental Y (data binomial dengan
pendekatan normal) dan estimatornya

PARAMETER ESTIMATOR
Rerata µ = nP µˆ = np
Variansi Var (Y ) = nPQ ˆ (Y ) = npq
Var

Standard error SD (Y ) = nPQ SDˆ (Y ) = npq

Y berdistribusi binomial: Y ~ b (n ; P); Y menyatakan banyaknya ‘sukses’


dalam n percobaan dengan proporsi ‘sukses’ P .

Matriks II.4. Parameter distribusi parental p (data proporsi) dan


estimatornya

PARAMETER ESTIMATOR

Rerata P P̂ = p

Variansi Var ( p ) = PQ / n ˆ ( p ) = pq / n
Var

Standard error SE ( p ) = PQ / n SEˆ ( p ) = pq/ n

N n

∑ Yi ∑y i
P= i =1
(Yi = 0,1) p= i =1
( yi = 0,1)
N n

58
LAMPIRAN 2B: RANGKUMAN ESTIMASI INTERVAL UNTUK
NILAI RERATA DAN PROPORSI SATU POPULASI

Matriks II.5. Rangkuman rumus interval konfidensi rerata satu


populasi sebarang atau normal, sampel besar

n ≥ 30

Populasi tak berhingga Populasi berhingga, n / N < 5%

 σ   σ  N −n
σ diketahui y ± Za/2.  y ± Z a /2 .  
 n  n N

σ tak  s   s  N −n
y ± Za/2.  y ± Z a /2 .  
diketahui  n  n N

Matriks II.6. Rangkuman rumus interval konfidensi rerata satu


populasi normal, sampel kecil

n < 30 , populasi normal

Populasi tak berhingga Populasi berhingga, n / N < 5%

 σ   σ  N −n
σ diketahui y ± Za/2.  y ± Z a /2 .  
 n  n N
σ tak  s  s N −n
y ± t( n −1); a /2 .   y ± t( n −1);a /2 .
diketahui  n n N

59
Matriks II.7. Rangkuman rumus interval konfidensi proporsi satu
populasi sebarang dan normal, sampel besar

n ≥ 30

Populasi tak berhingga Populasi berhingga, n / N < 5%

PQ PQ  N − n 
P diketahui p ± Za/2 p ± Z a /2  
n n  N 

P tak pq pq  N − n 
p ± Z a /2 p ± Z a /2  
dietahui n n  N 

Jika populasi berhingga, tetapi n / N ≥ 5%, gunakan rumus untuk populasi


tak berhingga.

60
LAMPIRAN 2C: HUBUNGAN ANTARA UJI HIPOTESIS DAN
ESTIMASI INTERVAL

Misalkan dimiliki variabel random Y berasal dari populasi tak


berhingga, maka pengujian hipotesis terhadap rerata populasi dengan
hipotesis nol H 0 : µ = µ0 akan menghasilkan distribusi sampling Y (=
distribusi H 0 ) yang berpusat pada µ0 (lihat diagram II.I, gambar bawah).

Pengestimasian interval terhadap rerata populasi µ dengan tingkat


konfidensi 95% juga akan menghasilkan distribusi sampling Y , namun yang
berpusat pada y (gambar atas pada diagram II.1).

Kedua distribusi sampling Y ini hanya menunjukkan perbedaan


lokasi, namun memiliki ukuran penyebaran SE ( y ) yang sama besarnya,
sehingga d 1 yaitu lebar interval konfidensi 95% yang berpusat pada y
(gambar atas pada diagram) akan tepat sama besarnya dengan d 2 yaitu jarak
antar batas-batas 95% di sekitar µ0 (gambar bawah pada diagram).

Diagram II.1. Hubungan antara uji hipotesis dan estimasi interval

61
Misalnya, bagi uji hipotesis 2-arah dengan tingkat signifikansi a dan
estimasi interval dengan tingkat keyakinan (tingkat konfidensi) 100 (1 − a ) %
dapat disimpulkan bahwa:
• Jika H 0 ditolak, maka nilai θ0 pasti berada di luar rentang estimasi
interval, demikian pula sebaliknya.
• Jika H 0 ditolak, maka nilai θ0 pasti berada dalam rentang estimasi
interval, demikian pula sebaliknya.

Contoh II.1.
Lihat kembali contoh 2.3 pada teks (contoh estimasi interval untuk
sampel kecil). Pada contoh 2.3 tersebut, telah dihitung interval konfidensi
90% untuk nilai rerata:
[12.54;13.08]

Dalam contoh 2.7, yaitu pada uji hipotesis 2-sisi untuk data yang
sama dengan hipotesis H 0 : µ = 13.00, kesimpulan yang diperoleh adalah H 0
tidak ditolak pada uji 2-sisi dengan a = 10%.

Dapat dilihat bahwa nilai µ0 = 13.00 berada dalam interval


[12.54;13.08], sehingga tanpa melakukan uji hipotesis dapat disimpulkan
bahwa H 0 : µ = 13.00, tidak akan ditolak pada a = 10% , walaupun
demikian cara terakhir ini tidak dianjurkan untuk mengambil kesimpulan
mengenai suatu hipotesis.

62
LAMPIRAN 2D: TEOREMA CHEBYSHEV
Metode pengestimasian interval yang telah dibahas terdahulu
y −µ
mempersyaratkan diketahuinya distribusi transformasi , yaitu
SE ( y )
berdistribusi Z atau t . Jika populasi parental Y sebarang (tidak normal) dan
sampel berukuran kecil ( n < 30 ) , pengestimasian interval nilai rerata satu
populasi (ataupun parameter populasi lainnya) masih dapat dilakukan secara
kasar dengan menggunakan teorema Chebyshev.

Misalkan dimiliki variabel random Y , maka teorema Chebyshev


menyatakan bahwa:
1
PY − µ > kσ ]≤ 2 (2.22)
 k

Perhatikan bahwa:
a. Teorema ini dinyatakan dalam bentuk sebuah ‘pertidaksamaan’, sehingga
yang dapat dihitung dengan menggunakan teorema ini adalah nilai
maksimum probabilitas pada ruas kiri pertidaksamaan.
b. Bentuk distribusi variabel random Y tidak dinyatakan secara eksplisit,
sehingga teorema ini berlaku bagi setiap bentuk distribusi variabel
random Y .

Contoh II.2:
Misalkan diketahui rerata tinggi badan populasi mahasiswa
Gunadarma adalah µ = 164 cm dengan standar deviasi populasi σ = 8 cm,
maka:
1
P  Y − 164] > (1)( 8 )  ≤ atau: P  Y − 164] > 8 ≤ 1
12
1
P  Y − 164] > ( 2 )( 8 )  ≤ 2 atau: P  Y − 164] > 16  ≤ 0.25
2
1
P  Y − 164] > ( 3)( 8 )  ≤ 2 atau: P  Y − 164] > 24  ≤ 0.11
3

63
Jika pada teorema Chebyshev di atas Y disubstitusi dengan Y dan σ
disubstitusi dengan σ y , maka diperoleh:
1
P  Y − µ > kσ y  ≤ 2
k
sehingga teorema ini dapat digunakan untuk perhitungan interval konfidensi
1
dengan 2 menyatakan luas area di luar interval konfidensi, yaitu 100a% .
k

Contoh II.3
Misalkan dimiliki data tinggi badan untuk sampel 10 orang
mahasiswa Gunadarma (data pada contoh 3.1 dan 3.16, buku teks Metode
Statistika I). Pada contoh-contoh tersebut telah dihitung rerata dan standar
deviasi sampel:
y = 161.8 dan s = 4.32

Karena standar deviasi populasi distribusi sampling Y tak diketahui,


digunakan estimatornya, yaitu:
s
σˆ y = s y = SE (Y ) =
n
4.32
= = 1.37
10

Maka interval konfidensi 90% nilai rerata tinggi badan populasi dapat
dinyatakan sebagai:
 y − kσˆ y ; y + kσˆ y 
yang diperoleh dari persamaan dengan menggunakan titik-titik batas
maksimum probabilitas:
P  Y − µ > kσ y  = 1 – α = 0.10
1
sehingga: = 0.10 dan k = 10 = 3.16
k2
Interval konfidensi 95% nilai rerata tinggi badan populasi adalah:
y ± k .σˆ Y

64
yaitu: 161.8 + (3,16)(1.37)

atau: [157.5 ; 166.1]

65
LATIHAN 2
Bagian Pertama

Pilihlah satu jawaban yang paling benar!

1. Pada pengestimasian interval rerata populasi berukuran N dengan


menggunakan sampel berukuran n, ‘koreksi populasi berhingga’ (fpc;
finite population correction) perlu diperhitungkan jika:
A. n / N < 5% C. N / n < 5%
B. n / N ≥ 5% D. N / n ≥ 5%

2. Koreksi populasi berhingga tidak digunakan pada:


A. Sampling dengan pengembalian.
B. Sampling tanpa pengembalian.
C. A) dan B) benar.
D. A) dan B) salah.

3. Distribusi t (Student’s t) digunakan pada estimasi interval nilai rerata


populasi jika:
A. n besar dan populasi berdistribusi normal
B. n besar dan populasi berdistribusi sebarang.
C. n kecil, populasi berdistribusi normal, dan σ diketahui.
D. n kecil, populasi berdistribusi normal, dan σ tak diketahui.

4. Dari sampel yang berukuran n = 36 diperoleh interval konfidensi


95% untuk rerata populasinya adalah 80 < µ < 120, maka bagi nilai
rerata sampelnya disimpulkan:
A. y < 100 C. y > 100
B. y = 100 D. Semuanya salah.

5. Untuk soal No.4 juga dapat disimpulkan bagi standar deviasi


sampelnya:
A. s < 80 C. s > 80
B. s = 80 D. Semuanya salah.

66
6. Ukuran sampel minimum yang dibutuhkan untuk estimasi interval
rerata sebuah populasi dapat diperkecil dengan cara berikut:
A. Menurunkan tingkat keyakinan.
B. Menggunakan sampel yang lebih homogen.
C. Memperbesar lebar estimasi interval yang diinginkan.
D. Semuanya benar.

7. Misalkan hendak diestimasi rerata berat badan lahir bayi (gram) di


sebuah kabupaten. Jika diketahui standar deviasi populasinya adalah
680 g, dan lebar interval yang diinginkan tidak lebih daripada 200 g.
maka populasinya dengan tingkat keyakinan 90% adalah:
A. 31 C. 126
B. 76 D. 178

8. Pada uji Z terhadap rerata satu populasi dengan hipotesis nol


H 0 : µ1 ≥ µ2 , maka daerah kritisnya (daerah penolakan) terletak
pada:
A. Ekor kiri distribusi sampling statistik penguji.
B. Ekor kanan distribusi sampling statistik penguji.
C. Ekor kiri dan ekor kanan distribusi sampling statistik penguji.
D. Semuanya salah.

9. Pada uji Z terhadap H 0 : θ ≥ θ0 vs H1 : θ < θ0 dengan menggunakan


tingkat signifikansi α = 0.05, daerah kritis (daerah penolakan) uji
hipotesis ini adalah:
A. Z > Z 0.05 C. Z > Z 0.025
B. Z < − Z 0.05 D. Z > − Z 0.025

10. Pada pengujian hipotesis 1 rerata sampel dengan hipotesis


H 0 : µ = µ0 , syarat penggunaan uji t ialah:
A. Ukuran sampel kecil
B. Variansi populasi tak diketahui
C. Populasi berdistribusi normal
D. Semuanya benar

67
11. Pada sampel acak 100 orang usia kerja disebuah kecamatan
didapatkan 25 orang penganggur. Dengan tingkat keyakinan 99%,
hitunglah interval konfidensi tingkat pengangguran di kecamatan
tersebut:
A. 12.12% < P < 37.88%
B. 13.85% < P < 36.15%
C. 15.51% < P < 33.49%
D. 17.88% < P < 32.12%

12. Misalkan hendak diestimasi proporsi keluarga yang memiliki rumah


sendiri di kota Depok dengan tingkat keyakinan 95% dan lebar
estimasi tidak melebihi 10%, maka ukuran sampel minimum yang
dibutuhkan adalah:
A. 271 C. 1,083
B. 385 D. 1,537

13. Misalkan dimiliki data proporsi dengan proporsi sampel sebesar p


dan ukuran sampel n. Pada uji hipotesis H 0 : P = P0 , estimator
standar error p yang digunakan untuk menghitung statistik penguji
adalah:
A. SEˆ ( p ) = npq ; q = 1 − p
B. SEˆ ( p ) = nP Q ; Q = 1 − P
0 0 0 0

C. SEˆ ( p ) = ( pq ) n ; q = 1 − p
D. SEˆ ( p ) = ( P0Q0 ) n ; Q0 = 1 − P0
14. Pada data soal No. 13 diatas, jika n << N (N adalah ukuran populasi),
estimasi standard error p yang digunakan untuk menghitung
estimatornya interval proporsi populasi P adalah:
A. SEˆ ( p ) = npq ; q = 1 − p
B. SEˆ ( p ) = nP Q ; Q = 1 − P
0 0 0 0

C. SEˆ ( p ) = ( pq ) n ; q = 1 − p
D. SEˆ ( p ) = ( P0Q0 ) n ; Q0 = 1 − P0

68
15. Interval konfidensi 95% proporsi lulusan Universitas Gunadarma
yang berhasil memperoleh pekerjaan dalam tahun pertama setelah
lulus adalah [64% ; 78%]. Uji 2-sisi terhadap H 0 : P = 65% akan
menghasilkan kesimpulan:
A. H 0 ditolak pada α = 0.01
B. H 0 ditolak pada α = 0.05
C. H 0 tidak ditolak pada α = 0.05
D. H 0 tidak ditolak pada α = 0.10

Bagian Kedua
Pilihlah satu jawaban yang paling benar !

1. Misalkan dari sampel acak 36 orang mahasiswa Gunadarma


diperoleh data rerata pengeluaran sebesar Rp.800.000 per bulan
dengan standar deviasi Rp. 150.000. Dengan tingkat keyakinan
sebesar 90%, interval konfidensi rerata pengeluaran populasi
mahasiswa Gunadarma per bulan adalah:
A. Rp.794.660 < µ < Rp.805.340
B. Rp.793.145 < µ < Rp.806.854
C. Rp.767.960 < µ < Rp.832.040
D. Rp.758.875 < µ < Rp.841.125

2. Misalkan hendak diestimasi rerata tekanan darah atlet peserta Pelatda


dengan lebar interval tidak lebih daripada 20 mm Hg. Jika diketahui
standar deviasi populasinya adalah 40 mm Hg, maka ukuran sampel
minimum yang dibutuhkan untuk memperoleh estimasi interval rerata
populasinya dengan tingkat keyakinan 95% adalah:
A. 16 C. 62
B. 44. D. 157

Untuk soal No. 3 s.d. 7:


Ujian tingkat mahir bahasa Inggris yang telah distandardisasi
menghasilkan nilai rerata 62 dengan standar deviasi 12. Kelompok yang
terdiri 30 orang yang telah menyelesaikan kursus bahasa Inggris memperoleh
nilai rerata 65 untuk ujian tersebut.

69
3. Untuk menguji manfaat kursus bahasa Inggris tersebut, hipotesis nol
yang relavan adalah:
A. µ ≤ 62 C. µ ≥ 62
B. µ < 62 D. µ > 62

4. Uji statistik yang sesuai untuk menguji hipotesis tersebut adalah:


A. Uji Z C. Uji t berpasangan
B. Uji t independen D. Semuanya salah

5. Statistik pengujinya adalah:


A. tuji = 0.114 C. Z uji = 1.37
B. tuji = 0.625 D. Z uji = 7.50

6. Dengan tingkat signifikansi α = 0.05 dan uji satu sisi:


A. H 0 ditolak C. A) dan B) benar
B. H 0 tidak ditolak D. A) dan B) salah

7. Interval konfidensi 90% rerata nilai ujian bahasa Inggris untuk


peserta yang telah menyelesaikan kursus adalah:
A. 59.37 < µ < 70.63 C. 61.40 < µ < 68.60
B. 60.71 < µ < 69.29 D. 62.20 < µ < 67.80

8. Data lampau menunjukkan bahwa persentase rabun jauh di antara


pemuda seusia mahasiswa adalah 20%. Untuk membuktikan adanya
peningkatan persentase rabun jauh pada populasi mahasiswa,
hipotesis nol yang perlu diuji adalah:
A. H 0 : P ≤ 0.20
B. H 0 : P = 0.20
C. H 0 : P ≥ 0.20
D. Yang benar lebih daripada satu

9. Dengan tingkat signifikansi α = 0.05 daerah kritis untuk uji hipotesis


pada soal No. 8 tersebut adalah:
A. Z > 1.645 C. Z > 1.96
B. |Z| > 1.645 D. |Z| > 1.96

70
10. Jika di antara sampel acak berupa 100 orang mahasiswa didapatkan
25 penderita rabun jauh, kesimpulan yang diperoleh untuk uji
hipotesis pada soal No. 8 dan 9 yaitu:
A. H 0 ditolak
B. H 0 tidak ditolak
C. Keduanya mungkin benar.
D. Keduanya salah.

Untuk soal No. 11 s.d. 14:


Panitia penilai kualitas dosen Universitas Gunadarma menyatakan
bahwa 90% mahasiswa puas dengan pengajaran yang diperolehnya. Tuan
Hasan, seorang aktivis mahasiswa, merasa bahwa pernyataan ini terlalu
berlebihan. Dari sampel acak yang diambilnya yang terdiri atas 150
mahasiswa, 132 menyatakan rasa puasnya.

11. Untuk menguji proporsi kepuasan mahasiswa, hipotesis nol yang


relevan adalah:
A. P < 90% C. P > 90%
B. P < 90% D. P > 90%

12. Statistik pengujinya adalah:


A. Z uji = −0.179 C. Z uji = −1.66
B. Z uji = −0.83 D. Z uji = −2.11

13. Dengan tingkat signifikansi α = 0.05 dan uji satu sisi:


A. H 0 ditolak
B. H 0 tidak ditolak
C. A) dan B) mungkin benar.
D. A) dan B) salah.

14. Interval konfidensi 90% untuk persentase mahasiswa Gunadarma


yang merasa puas dengan pengajaran yang diperolehnya adalah:
A. 81.82% < P < 94.18%
B. 82.80% < P < 93.20%
C. 83.64% < P < 92.36%
D. 84.60% < P < 91.40%

71
15. Dari 150 orang mahasiswa yang dipilih secara acak, 44 orang berkaca
mata untuk melihat jauh. Interval konfidensi 95% proporsi
mahasiswa yang berkaca mata adalah:
A. 0.197 < P < 0.389
B. 0.220 < P < 0.366
C. 0.232 < P < 0.354
D. 0.246 < P < 0.341

16. Pada soal No. 15 di atas, jika dengan tingkat keyakinan yang sama
diinginkan lebar estimasi yang tidak lebih daripada 12%, ukuran
sampel minimum yang dibutuhkan adalah:
A. 95 C. 222
B. 155 D. 381

72
BAB 3
INFERENSI STATISTIK UNTUK
DUA POPULASI

Pembahasan mengenai inferensi statistik (uji hipotesis dan estimasi


interval parameter) untuk dua populasi dalam bab ini mencakup:
a. Inferensi statistik untuk rerata dua populasi, normal atau sebarang,
sampel besar.
b. Inferensi statistik untuk rerata dua populasi normal, sampel kecil.
c. Inferensi statistik untuk data berpasangan.
d. Inferensi statistik untuk proporsi dua populasi.

3.1. INFERENSI STATISTIK UNTUK RERATA DUA


POPULASI (NORMAL ATAU SEBARANG; SAMPEL
BESAR)

 Uji Hipotesis untuk Selisih 2 Rerata Populasi (Normal atau


sebarang; Sampel Besar)
Misalkan dimiliki variabel random Y1 dan Y2 yang keduanya berasal
dari populasi tak berhingga, masing-masing dengan variansi σ 12 dan σ 22 , dan
diketahui pula ukuran sampel masing-masing adalah n1 dan n2 ( n1 ≥ 30
dan n2 ≥ 30 ) , maka selisih kedua nilai rerata sampelnya ( y1 − y2 )
berdistribusi normal dengan rerata:
E ( y1 − y2 ) = ( µ1 − µ2 ) (3.1)

dan variansi: Var ( y1 − y2 ) = Var ( y1 ) + Var ( y2 )


σ1 2 σ22
Var ( y1 − y2 ) = + (3.2.a)
n1 n2
(dengan asumsi Y1 dan Y2 independen), sedangkan standard error-nya
adalah:

73
σ1 2 σ22
SE ( y1 − y2 ) = + (3.2.b)
n1 n2

Prosedur uji hipotesis:


1. Jenis uji statistik: uji Z.
2. Hipotesis:
a. H 0 : µ1 − µ 2 = 0 vs H1 : µ1 − µ 2 ≠ 0
atau: H 0 : µ1 = µ 2 vs H1 : µ1 ≠ µ 2 (3.3.a)
b. H 0 : µ1 − µ 2 ≤ 0 vs H1 : µ1 − µ 2 > 0
atau: H 0 : µ1 ≤ µ2 vs H1 : µ1 > µ2 (3.3.b)
c. H 0 : µ1 − µ 2 ≥ 0 vs H1 : µ1 − µ 2 < 0
atau: H 0 : µ1 ≥ µ2 vs H1 : µ1 < µ2 (3.3.c)
3. Tingkat signifikansi: a (0.01, 0.05, atau 0.10).
4. Statistik penguji:
y1 − y2
Z uji = (3.4.a)
σ1 2 σ22
+
n1 n2
y1 − y2
atau: Z uji = (3.4.b)
s1 2 s2 2
+
n1 n2
(jika σ 12 dan σ 22 tidak diketahui), yang berdistribusi normal standar
jika n1 dan n2 besar.
5. Daerah kritis: sesuai H1
a. Z < − Z a/ 2 atau Z > Z a /2 untuk H1 : µ1 − µ 2 ≠ 0 )
b. Z < −Za untuk H1 : µ1 − µ 2 < 0 ) (3.5)
c. Z > Za untuk H1 : µ1 − µ 2 > 0 )

Contoh 3.1:
Misalkan diketahui rerata usia pernikahan pertama bagi 100 orang
wanita suku A yang dipilih secara acak, yaitu 21.7 dengan standar deviasi 6.3

74
tahun, sedangkan untuk 100 orang wanita suku B adalah 19.5 tahun dengan
standar deviasi 5.8 tahun.
Karena tidak ada data terdahulu mengenai rerata usia pernikahan
pertama pada kedua suku, sebaiknya yang diuji hanyalah ada tidaknya
perbedaan rerata usia pernikahan antara kedua suku tersebut, sehingga yang
diperlukan adalah uji 2-sisi dengan hipotesis H 0 : µ1 = µ 2 vs H1 : µ1 ≠ µ2 .
y1 − y2 = 21.7 − 19.5 = 2.2
s1 2 s2 2
SEˆ ( y1 − y2 ) = +
n n2

6.32 5.82
= + = 0.856
100 100
Uji hipotesis (2-sisi):
1. Jenis uji statistik: uji Z.
2. Hipotesis:
H 0 : µ1 = µ 2 vs H1 : µ1 ≠ µ2
3. Tingkat signifikansi: a = 0.05
4. Daerah kritis: Z < − Z 0.025 , yaitu Z < −1.96
atau Z > − Z 0.025 . yaitu Z > 1.96
4. Statistik penguji:
y1 − y2
Z uji =
s1 2 s2 2
+
n1 n2
yang berdistribusi normal standar.
2.2
Z uji = = 2.57
0.856
terletak pada daerah kritis ( Z uji > 1.96 ) .
5. Kesimpulan: H 0 ditolak pada a = 0.05

Jika tetap hendak dilakukan uji 1-sisi, yang perlu dibuktikan adalah
hipotesis H1 : µ1 > µ2 ( µ1 tidak mungkin terbukti lebih kecil daripada µ2
dalam uji hipotesis, jika y1 > y2 ) .

75
Perbedaan uji 1-sisi dengan 2-sisi diatas adalah:
a. Hipotesis:
H 0 : µ1 ≤ µ 2 vs H1 : µ1 > µ 2
b. Daerah kritis: Z > Z 0.025 , yaitu Z > 1.64

Dengan statistik penguji yang sama:


Z uji = 2.57 ,
yang juga terletak pada daerah kritis Z > 1.64 , diperoleh kesimpulan yang
sama, yaitu H 0 ditolak pada a = 0.05.

 Ukuran Sampel Minimum untuk Uji Hipotesis Selisih 2


Rerata
Misalkan hendak dilakukan uji hipotesis H 0 : µ1 − µ2 ≤ 0 vs
H1 : µ1 − µ2 > 0 . Untuk perhitungan ukuran sampel, uji hipotesis tersebut
dapat dituliskan sebagai:
H 0 : µ1 − µ 2 = 0 versus H A : µ1 − µ 2 = d

Dengan µ1 menyatakan rerata populasi pertama (populasi Y1 ); µ2


menyatakan rerata populasi kedua (populasi Y2 ); dan d = ( µ1 − µ2 ) menurut
H A adalah selisih minimum µ1 dengan µ2 yang diharapkan untuk dapat
dideteksi.
Dengan asumsi-asumsi σ 1 = σ 2 = σ ; n1 = n2 = n ; serta Y1 dan Y2
independen, maka variansi distribusi sampling (Y1 − Y2 ) adalah:
Var (Y1 − Y2 ) = Var (Y1 ) + Var (Y2 )
σ2 σ2 2σ 2
= + =
n n n
dan standard error (Y1 − Y2 ) adalah:

SE (Y1 − Y2 ) = 2σ 2 / n

Misalkan c menyatakan nilai titik batas (titik kritis) daerah


penerimaan dan penolakan hipotesis nol pada distribusi sampling (Y1 − Y2 ) ,
maka dengan merujuk pada distribusi sampling menurut H 0 :
c = 0 + Z a 2σ 2 / n

76
Dengan merujuk pada distribusi sampling (Y
1 − Y2 ) menurut H A
diperoleh:
c = d − Z β 2σ 2 / n
sehingga didapatkan:
0 + Z a 2σ 2 / n = d − Z β 2σ 2 / n
2 2σ 2 2
dan: ( Z a + Zβ ) .
n
= d 2 = ( µ1 − µ 2 )

Ukuran sampel minimum yang dibutuhkan untuk mendeteksi


perbedaan minimum sebesar d = ( µ1 − µ2 ) pada uji hipotesis
H 0 : µ1 − µ 2 ≤ 0 vs H1 : µ1 − µ2 > 0 adalah:
2
2 ( Za + Zβ ) σ2
n= 2 (3.6)
( µ1 − µ2 )

Nilai σ 2 ataupun estimatornya s 2 diperoleh dari data terdahulu atau


studi pendahuluan. Untuk uji 2-sisi, nilai Z a diganti dengan Z a / 2 . Perhatikan
bahwa n adalah ukuran sampel 1 kelompok, sedangkan ukuran sampel 2
kelompok seluruhnya adalah 2n.

 Interval Konfidensi untuk Rerata Dua Populasi (Normal


atau Sebarang; Sampel Besar)
Misalkan dimiliki data rerata y1 dan variansinya σ 12 untuk sampel 1
berukuran n1 yang berasal dari populasi Y1 (sebarang atau normal) dengan
rerata populasi µ1 serta rerata y2 dan variansinya σ 22 untuk sampel 2
berukuran n2 yang berasal dari populasi Y2 (sebarang atau normal);
( n1 ≥ 30 dan n2 ≥ 30 ) .

Estimator titik untuk selisih 2 rerata populasi ( µ1 − µ2 ) adalah selisih


2 rerata sampel ( y1 − y2 ) dengan variansi:
Var ( y1 − y2 ) = Var ( y1 ) + Var ( y2 )
σ1 2 σ22
= +
n1 n2

77
dengan asumsi Y1 dan Y2 independen, serta standard error:
σ1 2 σ22
SE ( y1 − y2 ) = + (3.7)
n1 n2

sehingga interval konfidensi 100 (1 − a ) % untuk selisih 2 rerata populasi


adalah:
( y1 − y2 ) ± Z a / 2 .SE ( y1 − y2 )
σ1 2 σ22
atau: ( y1 − y2 ) ± Z a /2 . + (3.8)
n1 n2

Jika σ 1 2 dan σ 2 2 tak diketahui, keduanya diganti dengan


estimatornya s1 2 dan s2 2 :
s1 2 s2 2
( y1 − y2 ) ± Z a /2 . + (3.8.a)
n1 n2

Contoh 3.2:
Lihat kembali data pada contoh 3.1 untuk uji hipotesis selisih 2 nilai
rerata. Rerata usia wanita menikah untuk pertama kalinya bagi 100 orang
wanita suku A yang dipilih secara acak adalah 21.7 tahun dengan standar
deviasi 6.3 tahun, sedangkan untuk 100 orang wanita suku B adalah 19.5
tahun dengan standar deviasi 5.8 tahun. Hendak dihitung interval konfidensi
95% selisih rerata usia pernikahan pertama wanita antara kedua suku.
Pada contoh 3.1 telah dihitung:
s1 2 s2 2
SEˆ ( y1 − y2 ) = + = 0.856
n1 n2
( y1 − y2 ) = 21.7 − 19.5 = 2.2
Interval konfidensi 95% selisih rerata usia saat perkawinan pertama
wanita kedua suku adalah:
( y1 − y2 ) ± Z a / 2 .SEˆ ( y1 − y2 )
atau: 2.2 ± (1.96 )( 0.856 )
yaitu: [ 0.52;3.88]

78
 Ukuran Sampel Minimum untuk Estimasi Interval Selisih
2 Rerata:
Misalkan hendak diestimasi interval konfidensi 100 (1 − a ) % untuk
selisih 2 rerata populasi µ1 − µ2 . Interval konfidensi yang akan diperoleh
dinyatakan dengan lambang [ ∆yB ; ∆yA ] ; ∆yB dan ∆yA masing-masing
menyatakan batas bawah dan batas interval konfidensi tersebut. Misalkan
pula:
2I = ∆yA − ∆yB
menyatakan lebar interval maksimum yang diinginkan (= presisi), maka:
I = Z a/2 .SE ( y1 − y2 ) (3.9)
σ1 2 σ22
dengan: Var ( y1 − y2 ) = +
n1 n2
Jika diasumsikan σ 1 2 = σ 2 2 = σ 2 dan n1 = n2 = n, maka:
Var ( y1 − y2 ) = Var ( y1 ) + Var ( y2 )
σ2 σ2
2σ 2
= + =
n n n
2σ 2
SE ( y1 − y2 ) =
n
2σ 2
sehingga: I = Za/2 .
n
2
2 ( Za/2 ) σ 2
dan: n= (3.10)
I2

Untuk 2 kelompok, ukuran sampel seluruhnya adalah 2n . Nilai


estimasi σ 2 diperoleh dari studi pendahuluan:

2
σˆ = s 2
=
( n1 − 1) s1 2 + ( n2 − 1) s2 2
pooled
n1 + n2 − 2
(semua nilai-nilai n1 , n2 ,s1 , dan s2 2 pada rumus terakhir ini adalah nilai-
2

nilai pada studi pendahuluan).

79
Contoh 3.3:
Misalkan hendak diestimasi perbedaan jumlah asupan kalori (dalam
cal) makan siang anak sekolah peserta program gizi dengan anak sekolah
bukan peserta program tersebut, dengan tingkat keyakinan 95% dan lebar
estimasi interval tidak lebih daripada 40 cal. Dari studi pendahuluan
diketahui standar deviasi jumlah asupan kalori makan siang anak sekolah
adalah 75 cal.
(1 − a ) = 0.95 Z a / 2 = Z 0.025 = 1.96
2I = 40 I = 20
s = 75
Ukuran sampel minimum untuk 1 kelompok adalah:
2
2 ( Z a/2 ) s 2
n=
I2
( 2 ) (1.962 )
= = 108.045 ≈ 109
202
Ukuran sampel minimum untuk 2 kelompok perbandingan adalah:
2n = ( 2 )(109 ) = 218

3.2. INFERENSI STATISTIK UNTUK RERATA DUA


POPULASI NORMAL (SAMPEL KECIL)

 Uji hipotesis untuk Selisih 2 Rerata Populasi Normal


(Sampel Kecil)
Misalkan dimiliki variabel random Y1 dan Y2 yang keduanya berasal
dari populasi normal tak berhingga, masing-masing dengan variansi σ 1 2 dan
σ 2 2 , dan misalkan pula dimiliki 2 sampel acak dari kedua populasi tersebut
yang masing-masing berukuran n1 dan n2 ( n1 < 30 dan/atau n2 < 30 ) , maka
untuk uji hipotesis terhadap selisih kedua nilai rerata populasi dapat
digunakan uji Z dengan statistik penguji:

80
y1 − y2
Z uji =
SE ( y1 − y2 )
y1 − y2
Z uji =
σ1 2 σ22
+
n1 n2

Jika σ 1 2 dan σ 2 2 tak diketahui, digunakan uji t dengan statistik


penguji:
y1 − y2
tuji =
SEˆ ( y − y ) 1 2

Dengan asumsi:
σ1 2 = σ 2 2 = σ 2 (3.11)
(variansi populasi bersama; common population variance), maka variansi
( y1 − y2 ) adalah:
σ1 2 σ22 1 1 
Var ( y1 − y2 ) = + =σ2 + 
n1 n2  n1 n2 
Estimator σ 2 adalah rerata tertimbang s1 2 dan s2 2 dengan derajat
bebas masing-masing sebagai penimbangnya, dan dinamakan estimasi
gabungan (pooled estimate):
( n − 1) s1 2 + ( n2 − 1) s2 2
σˆ 2 = s 2 pooled = 1
( n1 − 1) + ( n2 − 1)
2
σˆ = s 2
=
( n1 − 1) s1 2 + ( n2 − 1) s2 2
pooled (3.12)
n1 + n2 − 2
dan estimasi variansi serta standard error ( y1 − y2 ) adalah:
1 1
ˆ ( y1 − y2 ) = s 2 pooled  + 
Var
 n1 n2 
1 1
SEˆ ( y1 − y2 ) = spooled + (3.13)
n1 n2

81
Prosedur uji hipotesis:
1. Jenis uji statistik: uji Z ( σ 1 2 dan σ 2 2 diketahui) atauuji t ( σ 1 2 dan σ 2 2 tak
diketahui).
2. Hipotesis:
a. H 0 : µ1 = µ 2 vs H1 : µ1 ≠ µ 2 )
b. H 0 : µ1 ≤ µ2 vs H1 : µ1 > µ2 ) (3.14)
c. H 0 : µ1 ≥ µ2 vs H1 : µ1 < µ 2 )
3. Tingkat signifikansi: a .
4. Statistik penguji:
Jika σ 1 2 dan σ 2 2 diketahui, statistik penguji adalah:
y1 − y2
Z uji = (3.15)
σ1 2 σ22
+
n1 n2
yang berdistribusi normal standar dengan daerah kritis:
a. Z < − Z a/ 2 atau Z > Z a /2 untuk H1 : µ1 − µ2 ≠ 0 )
b. Z < − Z a untuk H1 : µ1 − µ2 < 0 ) (3.16)

c. Z > Za untuk H1 : µ1 − µ2 > 0 )

Jika σ 1 2 dan σ 2 2 tak diketahui, dengan asumsi σ 1 2 = σ 2 2 maka statistik


penguji adalah:
y1 − y2
tuji = (3.17)
1 1 
s 2 pooled  + 
 n1 n2 

Contoh 3.4:
Misalkan hendak diteliti waktu belajar mingguan (jam) mahasiswa
putra dan putri di sebuah ibukota propinsi. Pada sampel acak 12 orang
mahasiswa pria, rerata waktu belajar adalah 27.8 jam dengan standar deviasi
7.2 jam, sedangkan untuk 10 orang mahasiswa wanita rerata waktu belajar
adalah 21.3 jam dengan standar deviasi 6.9 jam. Ingin diketahui apakah ada
perbedaan waktu belajar mingguan yang bermakna secara statistik antara
mahasiswa pria dan wanita di ibukota propinsi tersebut.

82
Karena tidak dinyatakan apakah menurut data terdahulu rerata waktu
belajar mahasiswa pria lebih lama daripada rerata waktu belajar mahasiswa
wanita, maka hipotesis yang layak diuji adalah H 0 : µ1 = µ 2 vs H1 : µ1 ≠ µ2 .
Dengan asumsi σ 1 2 = σ 2 2 = σ 2 , maka:
2
σˆ = s 2
=
( n1 − 1) s1 2 + ( n2 − 1) s2 2
pooled
n1 + n2 − 2
(11) ( 7.22 ) + ( 9 ) ( 6.92 )
= = 49.94
11 + 9
1 1
SEˆ ( y1 − y2 ) = spooled +
n1 n2
1 1
= 49.94  +  = 3.026
 12 10 
( y1 − y2 ) = 27.8 − 21.3 = 6.5
Uji hipotesis (2-sisi):
1. Jenis uji statistik:uji t .
2. Hipotesis: H 0 : µ1 = µ 2 vs H1 : µ1 ≠ µ2
3. Tingkat signifikansi: a = 0.05.
4. Daerah kritis: t < −t20 ;0.025 , yaitu t < −2.086
atau: t > t20 ;0.025 , yaitu t > 2.086
5. Dengan asumsi σ 1 2 = σ 2 2 = σ 2 , statistik penguji adalah:
y1 − y2
tuji =
1 1 
s 2 pooled  + 
 n1 n2 
yang berdistribusi t dengan db ( n1 + n2 − 2 ) .
6.5
tuji = = 2.15 ,
3.026
yang terletak pada daerah kritis ( tuji > 2.086 )
6. Kesimpulan: H 0 ditolak pada α = 0.05.

Jika hendak dilakukan uji 1-sisi, perbedaannya adalah:


a. Hipotesis: H 0 : µ1 = µ 2 vs H1 : µ1 ≠ µ2

83
b. Daerah kritis: t > t20 ;0.025 , yaitu t > 1.725
Dengan statistik penguji yang sama:
tuji = 2.15 ,
yang juga terletak pada daerah kritis t > 1.725 , diperoleh kesimpulan yang
sama, yaitu H 0 ditolak pada a = 0.05.

 Interval Konfidensi Selisih 2 Rerata Populasi Normal


(Sampel Kecil)
Misalkan dimiliki data rerata y1 dan variansinya σ 1 2 untuk sampel 1
yang berasal dari populasi normal Y1 dengan rerata populasi µ1 serta rerata
y2 dan variansinya σ 2 2 untuk sampel 2 yang berasal dari populasi normal
Y2 dengan rerata populasi µ2 ( n1 < 30 dan/atau n2 < 30), maka interval
konfidensi 100 (1 − a ) % untuk selisih 2 rerata populasi adalah:
σ1 2 σ22
( y 1 − y2 ) ± Z a/2 . + (3.19)
n1 n2

Jika variansi populasi σ 12 dan σ 2 2 tak diketahui, dengan asumsi


σ 12 = σ 2 2 = σ 2 , maka estimasi variansi serta standard error ( y1 − y2 )
adalah:
1 1 
ˆ ( y1 − y2 ) = s 2 pooled  + 
Var
 n1 n2 
1 1
SEˆ ( y1 − y2 ) = s pooled + (3.20)
n1 n2

Interval konfidensi 100 (1 − a ) % untuk selisih 2 rerata populasi


adalah:
1 1
( y 1 − y2 ) ± ta/ 2 .s pooled + (3.21)
n1 n2

Contoh 3.5:
Lihat kembali data pada contoh 3.4. Untuk mengestimasi selisih
waktu belajar mingguan (jam) mahasiswa pria dan wanita di sebuah propinsi,
diambil sampel acak 12 orang mahasiswa pria, rerata waktu belajar adalah

84
27.8 jam dengan standar deviasi 7.2 jam, serta 10 orang mahasiswa wanita,
rerata waktu belajar adalah 21.3 jam dengan standar deviasi 6.9 jam.
Dengan asumsi σ 1 2 = σ 2 2 = σ 2 , telah dihitung:

σˆ 2 = s 2 pooled =
( n1 − 1) s1 2 + ( n2 − 1) s2 2 = 49.94
n1 + n2 − 2
1 1
SEˆ ( y1 − y2 ) = spooled + = 3.026
n1 n2
( y1 − y2 ) = 6.5
Interval konfidensi 95% selisih rerata waktu belajar mingguan
mahasiswa putra dan putri adalah:
( y1 − y2 ) ± t( n1 +n2 −2);a/2 .SEˆ ( y1 − y2 )
atau: 6.5 ± ( 2.086 )( 3.026 )
yaitu: [0.19;12.81]

3.3. INFERENSI STATISTIK UNTUK DATA


BERPASANGAN
Data berpasangan adalah data untuk variabel yang sama, yang
diperoleh dari:
- Subjek yang sama pada bagian yang berbeda, misalkan bagian kiri dan
kanan tubuh.
- Subjek yang sama pada waktu yang berlainan, misalnya sebelum dan
sesudah ‘perlakuan’.
- Subjek berpasangan, misalkan pasangan anak kembar, pasangan subjek
yang ‘dipadankan’ (di-matched), dan sebagainya.

 Uji Hipotesis untuk Rerata Selisih Pasangan Data


Dependen
Uji hipotesis untuk rerata selisih data kelompok dependen
(berpasangan) dilaksanakan seperti pada uji hipotesis untuk nilai 1 rerata,
dengan data berupa selisih nilai untuk tiap pasangan. Umumnya data
diperoleh untuk sampel kecil.

85
Misalkan dimiliki pasangan variabel random ( X ; Y ) dengan nilai-
nilai ( X 1 ; Y1 ) , ( X 2 ; Y2 ) , . . . , ( X n ; Yn ) . Selisih nilai masing-masing
pasangan membentuk variabel random baru D dengan nilai-nilai:
d1 = x1 − y1 , d 2 = x2 − y2 , . . . , d n = xn − yn ;
dan rerata sampel:
n

d = ∑ di (3.22)
i =1

dan variansi sampel:


n

∑(d
2
1 −d )
sd 2 = i −1
(3.23)
n −1

Distribusi sampling d memiliki nilai harapan:

E (d ) = δ (3.24)
dan variansi:
σD2
Var ( d ) = (3.25)
n
dan estimatornya adalah:
sd 2
Var ( d ) = (3.25.a)
n
(variansi populasi σ D 2 umumnya tak diketahui besarnya)

Prosedur uji statistik:


1. Jenis uji statistik: uji t (untuk data berpasangan).
2. Hipotesis:
a. H 0 : δ = 0 versus H1 : δ ≠ 0 )
b. H 0 : δ ≤ 0 versus H1 : δ > 0 ) (3.26)
c. H0 :δ ≥ 0 versus H1 : δ < 0 )
3. Tingkat signifikansi: a.
4. Statistik penguji:

86
d
tuji = (3.27)
sd / n
yang berdistribusi t dengan db ( n − 1) , n menyatakan jumlah pasangan.
5. Daerah kritis: sesuai H1
a. t < −t( n −1);a/2 atau t > −t( n −1);a /2 untuk H1 : δ ≠ 0 )
b. t < −t( n −1);a untuk H1 : δ < 0 ) (3.28)
c. t > −t( n−1);a untuk H1 : δ > 0 )

Contoh 3.6:
Misalkan dimiliki data tekanan darah diastolik 10 orang akseptor KB
(dalam mm Hg) sebelum dan sesudah menggunakan pil KB (tabel 3.1).

Tabel 3.1. Data tekanan darah diastolik 10 akseptor KB sebelum dan


sesudah menggunakan pil KB
1 2 3 4 5 6 7 8 9 10
Sebelum (x) 68 72 62 70 58 66 68 52 64 72
Sesudah (y) 70 80 72 76 76 76 72 78 82 64
d = (y – x) 2 8 10 6 18 10 4 26 18 −8
n

∑d
i −1
1
d =
n
94
= = 9.4
10
n

∑(d
2
1 −d)
sd 2 = i −1
= 91.6
n −1
s
SEˆ ( d ) = d
n
91.6
= = 3.03
10
Uji hipotesis (1-sisi):
1. Jenis uji statistik: uji t berpasangan.

87
2. Hipotesis: H 0 : δ < 0 versus H1 : δ > 0
3. Tingkat signifikansi: a = 0.05.
4. Daerah kritis: t > t( 9;0.05) , yaitu t > 1.833
5. Statistik penguji:
d
tuji =
sd / n
yang berdistribusi t dengan db ( n − 1) .
9.4
tuji = = 3.11, sehingga tuji > 1.833
3.03
6. Kesimpulan: H 0 ditolak pada a = 0.05.

Untuk uji 2-sisi, perbedaannya adalah:


a. Hipotesis: H 0 : δ = 0 versus H1 : δ ≠ 0
b. Daerah kritis: t < −t 9;0.025 ' yaitu
( )
t > −2.262
atau: t > t( 9;0.025)' yaitu t > 2.262

Dengan statistik penguji yang sama:


tuji = 3.11,
yang juga terletak pada daerah kritis t > 2.262 , diperoleh kesimpulan yang
sama, yaitu H 0 ditolak pada a = 0.05.

 Interval Konfidensi untuk Rerata Selisih Pasangan Data


Independen
Misalkan dimiliki pasangan data sampel:
( X 1 ; Y1 ) , ( X 2 ; Y2 ) , . . . , ( X n ;Yn )
yang berasal dari populasi pasangan variabel random ( X ; Y ) dan:
d1 = x1 − y1 , d 2 = x2 − y2 , . . . , d n = xn − yn ;
n n 2
∑ di
i =1

i =1
( di − d )
sehingga d = dan sd2 = , maka interval konfidensi
n n −1
100 (1 − a ) % untuk rerata populasi selisih kedua variabel yaitu δ adalah:
d ±t .SEˆ ( d )
( n −1);a /2

88
sd
atau: d ± t( n −1);a /2 . (3.29)
n

Contoh 3.7:
Lihat kembali data pada contoh 3.6. Data tekanan darah diastolik 10
orang akseptor KB (dalam mm Hg) sebelum dan sesudah menggunakan pil
KB dapat dilihat pada tabel 3.1.
Pada contoh 3.6 tersebut telah dihitung:
n

∑d
i −1
1
d = = 9.4
n
n

∑(d
2
1 −d)
sd 2 = i −1
= 91.6
n −1
s
SEˆ ( d ) = d = 3.03
n
Interval konfidensi 95% untuk δ adalah:
d ±t .SEˆ ( d )
( 9;0.025)
9.4 ± ( 2.26 )( 3.03)
atau: [ 2.55;16.25]

3.4. INFERENSI STATISTIK UNTUK PROPORSI DUA


POPULASI

 Uji Hipotesis untuk Selisih 2 Proporsi (Sampel Besar)


Misalkan dimiliki variasi random Y1 dan Y2 yang masing-masing
berskala dikotomi, keduanya berasal dari populasi tak berhingga, masing-
masing dengan proporsi ‘sukses’ dalam populasi P1 dan P2 , dan misalkan
pula pada kedua sampel dari kedua populasi tersebut yang masing-masing
berukuran n1 dan n2 ( n1 ≥ 30 dan n2 ≥ 30 ) proporsi sampelnya adalah P1
dan P2 , maka nilai harapan selisih kedua proporsi sampel adalah:
E ( P1 − P2 ) = ( P1 − P2 )
dan variansinya adalah:

89
Var ( P1 − P2 ) = Var ( P1 ) + Var ( P2 )
PQ
1 1 PQ
=+ 2 2
n1 n2
dengan asumsi Y1 dan Y2 indenpenden; Q1 = 1 − P1 ; Q2 = 1 − P2 .

Jika proporsi populasi P1 dan P2 tak diketahui, digunakan


estimatornya proporsi sampel p1 dan p2 :
pq p q
Var ( p1 − p2 ) = 1 1 + 2 2
n1 n2
dengan q1 = 1 − p1 ; q2 = 1 − p2 .

Prosedur uji hipotesis:


1. Jenis uji statistik:uji Z
2. Hipotesis:
a. H 0 : P1 − P2 = 0 vs H1 : P1 − P2 ≠ 0
atau: H 0 : P1 = P2 vs H1 : P1 ≠ P2 (3.30.a)
b. H 0 : P1 − P2 ≤ 0 vs H1 : P1 − P2 > 0
atau: H 0 : P1 ≤ P2 vs H1 : P1 > P2 (3.30.b)
c. H 0 : P1 − P2 ≥ 0 vs H1 : P1 − P2 < 0
atau: H 0 : P1 ≥ P2 vs H1 : P1 < P2 (3.30.c)
3. Tingkat signifikansi: a ( 0.01, 0.05, atau 0.10 )
4. Statistik penguji:
p1 − p1
Z uji = (3.31)
PQ
1 1 PQ
+ 2 2
n1 n2

p1 − p1
atau: Z uji = (3.31.a)
p1q1 p2 q2
+
n1 n2

(jika P1 dan P2 tak diketahui), yang berdistribusi normal standar jika


n1 dan n2 besar.
5. Daerah kritis: sesuai H1

90
a. Z < − Z a / 2 atau Z > Z a /2 untuk H1 : P1 ≠ P2 )
b. Z < −Za untuk H1 : P1 < P2 ) (3.32)
c. Z > Za untuk H1 : P1 > P2 )

Contoh 3.8:
Misalkan dimiliki 2 sampel acak berupa 100 keluarga dari DKI
Jakarta, 23 di antaranya tergolong ‘mampu’ dan 200 keluarga dari Kodya
Bogor dengan yang tergolong ‘mampu’ berjumlah 12 keluarga dan hendak
diuji apakah ada perbedaan yang bermakna secara statistik antara proporsi
keluarga ‘mampu’ di DKI Jakarta Kodya Bogor. Digunakan a = 0.05.
23 12
p1 − p2 = − = 0.17
100 200
p1q1 p2 q2
SEˆ ( p1 − p2 ) = +
n1 n2
( 0.23)( 0.77 ) + ( 0.06 )( 0.94 ) = 0.045
100 200

Uji hipotesis (1-sisi):


1. Jenis uji hipotesis: uji Z .
2. Hipotesis: H 0 : P1 = P2 vs H1 : P1 ≠ P2
3. Tingkat signifikansi: a = 0.05.
4. Daerah kritis: Z < − Z a /2 atau Z > Z a /2
yaitu: Z < − Z 0.025 atau Z > Z 0.025'
atau: Z < −1.96 atau Z > 1.96
5. Statistik penguji:
p1 − p1
Z uji =
p1q1 p2 q2
+
n1 n2
0.17
= = 3.75
0.045
Z uji terletak pada daerah kritis ( Z uji > 1.96 ) .

91
6. H 0 ditolak, berarti ada perbedaan yang bermakna secara statistik antara
proporsi keluarga ‘mampu’ di DKI Jakarta dan Kodya Bogor pada
tingkat signifikansi a = 0.05.

 Ukuran Sampel Minimum untuk Uji Hipotesis Selisih 2


Proporsi:
Misalkan hendak dilakukan uji hipotesis H 0 : P1 − P2 ≤ 0
vs
H1 : P1 − P2 > 0. Untuk perhitungan ukuran sampel, uji hipotesis tersebut
dapat dituliskan sebagai:
H 0 : P1 − P2 = 0 versus H A : P1 − P2 = d
dengan menyatakan proporsi ‘sukses’ pada populasi pertama (populasi Y1 );
P2 menyatakan proporsi ‘sukses’ pada populasi kedua (populasi Y2 ); dan d =
( P1 − P2 )
menurut H A adalah selisih minimum P1 dengan P2 yang
diharapkan untuk dapat dideteksi.
Dengan asumsi n1 = n2 = n serta asumsi Y1 dan Y2 independen, maka
variansi distribusi sampling ( p1 − p2 ) adalah:
Var ( p1 − p2 ) = Var ( p1 ) + Var ( p2 )
PQ
1 1 PQ PQ + P Q
= + 2 2 == 1 1 2 2
n1 n2 n
dengan Q1 = 1 − P1 ; Q2 = 1 − P2 ; dan standard error ( P1 − P2 ) adalah:
:
1 1 + P2Q2
PQ
SE ( P1 − P2 ) =
n

Menurut H 0 : P1 = P2 , sehingga keduanya dapat disubstitusikan oleh


P , nilai rata-rata keduanya:
P1 + P2
P1 = P2 = P dan P =
2
sehingga standard error ( p1 − p2 ) menurut H 0 adalah:
2 PQ
SE ( P1 − P2 ) =
n

92
Misalkan c menyatakan nilai titik batas (titik kritis) penerimaan dan
penolakan hipotesis nol pada distribusi sampling ( p1 − p2 ) . maka dengan
merujuk pada distribusi sampling menurut H 0 :
2 PQ
c = 0 + Zα
n
Dengan merujuk pada distribusi sampling ( p1 − p2 ) menurut H A
diperoleh:
PQ + P Q
c = d − Zβ 1 1 2 2
n
sehingga didapatkan:
2 PQ PQ + P Q
0 + Za = d − Zβ 1 1 2 2
n n
2
 Z 2 PQ + Z PQ + P Q 
 a β 1 1 2 2
 = d2 = P − P 2
dan ( 1 2)
n
Ukuran sampel minimum yang dibutuhkan untuk mendeteksi H A
perbedaan minimum sebesar d = ( p1 − p2 ) pada uji hipotesis H 0 : P1 − P2 ≤ 0
vs H1 : P1 − P2 > 0 adalah:
2
 Z 2 PQ + Z PQ + P Q 
n=  
a β 1 1 2 2
2 (3.33)
( p1 − p2 )
Untuk 2 kelompok, ukuran sampel seluruhnya adalah 2n . Dalam
praktik, nilai-nilai P1 dan P2 yang tidak diketahui disubstitusikan dengan p1
dan p2 sebagai estimatornya, yang diperoleh dari data terdahulu atau studi
pendahuluan. Untuk uji 2-sisi, nilai Z a diganti dengan Z a / 2 .

 Interval Konfidensi untuk Selisih Proporsi Dua Populasi


Misalkan dimiliki data proporsi p1 untuk sampel 1 yang berasal dari
populasi Y1 serta proporsi p2 untuk sampel 2 yang berasal dari populasi Y2 .

Estimator titik untuk selisih 2 proporsi populasi ( P1 − P2 ) adalah


selisih 2 proporsi sampel ( p1 − p2 ) dengan variansi:

93
Var ( p1 − p2 ) = Var ( p1 ) + Var ( p2 )
PQ PQ
SE ( p1 − p2 ) = 1 1
+ 2 2
n1 n2
dengan Q1 = 1 − P1 ; Q2 = 1 − P2 , sehingga interval konfidensi 100 (1 − a ) %
untuk selisih 2 proporsi populasi ( P1 − P2 ) adalah:

( p1 − p2 ) ± Z a /2 .SE ( p1 − p2 )
PQ PQ
yaitu: ( p1 − p2 ) ± Z a /2 . 1 1
+ 2 2 (3.34)
n1 n2

Jika P1 , P2 , Q1 , dan Q2 tak diketahui, nilai-nilainya diganti dengan


estimatornya p1 , p2 , q1 , dan ; q1 = 1 − p1 ; q2 = 1 − p2 :

p1q1 p2 q2
( p1 − p2 ) ± Z a /2 . + (3.34a)
n1 n2

Contoh 3.9:
Lihat kembali data pada contoh 3.8. Misalkan dimiliki 2 sampel acak
berupa 100 keluarga dari DKI Jakarta, 23 di antaranya tergolong ‘mampu’
dan 200 keluarga dari Kodya Bogor dengan yang tergolong ‘mampu’
berjumlah 12 keluarga dan hendak dihitung estimasi interval selisih
proporsinya dengan tingkat keyakinan 99%, maka:

23 12
( p1 − p2 ) = − = 0.17
100 200
p1q1 p2 q2
SEˆ ( p1 − p2 ) = +
n1 n2

=
( 0.23 ( 0.77 ) + ( 0.06 )( 0.94 ) = 0.045
100 200

94
Interval konfidensi 99% selisih proporsi keluarga ‘mampu’ antara
DKI Jakarta dan Kodya Bogor adalah:
( p1 − p2 ) ± Z a / 2 .SEˆ ( p1 − p2 )
yaitu: 0.17 ± ( 2.58)( 0.045 )
atau: [0.053;0.287]

 Ukuran Sampel Minimum untukl Estimasi Interval selisih


2 Proporsi:
Misalkan hendak diestimasi interval konfidensi 100 (1 − a ) % untuk
selisih 2 proporsi populasi ( P1− P2 ) . Interval konfidensi yang akan diperoleh
dinyatakan dengan lambang [ ∆pB ; ∆p A ] ; ∆pB dan ∆p A masing-masing
menyatakan batas bawah dan batas atas interval konfidensi tersebut.
Misalkan pula:
2 I = ∆p A − ∆pB
menyatakan lebar interval yang diinginkan (= presisi), maka:
I = Z a /2 .SE ( p1 − p2 )

1 1 + P2 Q2
PQ
yaitu: I = Z a /2 .
n
dengan asumsi n1 = n2 = n ; Q1 = 1 − P1 ; Q2 = 1 − P2 ; sehingga:

2
( Z ) [ P1 Q1 + P2 Q2 ]
n = a/2 (3.36)
I2

Ukuran sampel 2 kelompok seluruhnya adalah 2n.

95
LAMPIRAN 3A: IKHTISAR UJI HIPOTESIS UNTUK RERATA DUA POPULASI

Diagram III.1 Ikhtisar uji hipotesis untuk rerata 2 populasi

96
Matriks III.1. Uji hipotesis untuk rerata dua populasi pada populasi
normal dan sebarang

a. Populasi normal b. Populasi sebarang


n1 > 30 n1 < 30 n1 > 30 n1 < 30
dan dan/atau dan dan/atau
n2 > 30 n2 < 30 n2 > 30 n2 < 30
σ 1 dan σ 2 σ 1 dan σ 2
Uji Z
diketahui
diketahui /
Uji Z Uji Z ?
σ 1 dan σ 2 Uji t tak
tak diketahui (σ1 = σ 2 ) *) diketahui

*) Jika :
- Populasi Y1 dan Y2 berdistribusi normal,
- Ukuran sampel kecil ( n1 < 30 dan / atau n2 < 30 ) ,
- Variansi kedua populasi tak diketahui dan tidak sama (σ 1 2 ≠ σ 2 2 ) , maka
digunakan uji t dengan SEˆ ( y1 − y2 ) :
s1 2 s2 2
σˆ = +
( y1 − y2 ) n1 n2
dengan derajat bebas efektif menurut Satterthwaite:
2
 s1 2 s2 2 
n + n 
db efektif =  1 2 
(dibulatkan atau diinterpolasikan)
2
( 1 1)+( 2 2)
s 2
/ n s 2
/ n
n1 − 1 n2 − 1

97
Matriks III.2 SE ( y1 - y2 ) atau estimatornya pada uji hipotesis untuk
rerata dua populasi
a. Populasi normal
n1 ≥ 30 dan n2 ≥ 30 n2 < 30 dan/atau n2 < 30
σ 1 dan σ1 σ 2 2 σ 12 σ22
σ = + σ = +
σ2 ( y1− y2 ) n1 n2 ( y1 − y2 ) n1 n2
diketahui
σ 1 dan s12 s2 2 Asumsi: σ 1 2 = σ 2 2 = σ 2
σˆ = +
σ 2 tak ( y1− y2 ) n1 n2 1 1
diketahui σˆ = σˆ2  + 
( y1 − y2 )  n 1 n2 

σˆ 2 = s 2 pooled =
( n1 − 1) s12 + ( n1 − 1) s1 2
( n1 − 1) + ( n1 − 1)

b. Populasi sebarang
n1 ≥ 30 dan n2 ≥ 30 n1 < 30 dan/atau
n2 < 30
σ 1 dan σ 2 σ1 σ 2 2
σ = +
diketahui ( y1− y2 ) n1 n2
σ 1 dan σ 2 tak s12 s2 2 ?
σˆ = +
diketahui ( y1− y2 ) n1 n2

98
LAMPIRAN 3B: RANGKUMAN UJI Z DAN UJI t

Matriks III.3. Uji Z untuk 1 rerata dan 2 rerata

Uji Z untuk 1 rerata Uji Z untuk 2 rerata


Hipotesis H 0 : µ = µ0 H 0 : µ1 − µ 2 = 0
y1 − y2
y − µ0 Z uji =
Statistik penguji Z uji = σ 12 σ 22
σ/ n +
n1 n2

Matriks III.4. Uji t untuk 1 rerata dan 2 rerata

Uji t, 1 rerata Uji t, equal Uji t, unequal Uji t, berpasangan


Hipotesis H 0 : µ = µ0 H 0 : µ1 − µ 2 = 0 H 0 : µ1 − µ 2 = 0 H0 : δ = 0
y1 − y2 y1 − y2
y − µ0 tuji = tuji = d
Statistik penguji tuji = 2 1 1  s12 s2 2 tuji =
s/ n s pooled = +  + sd / n
 n1 n2  n1 n2

99
LAMPIRAN 3C: INFERENSI STATISTIK DATA PROPORSI
Matriks III.5 Estimasi Interval 1 Proporsi: p ± Z a /2 .SE ( p )

SE (p) SEˆ ( p )
Data [P dan Q diketahui] [P dan Q diketahui]

PQ P (1 − P ) PQ P (1 − P )
Proporsi: 0 < P < 1 = =
n n n n
PQ P (100 − P ) pq p (100 − p )
Persentase: 0 < P < 100 = =
n n n n
Matriks III.6 Estimasi Interval 2 Proporsi: ( p1 - p2 ) ± Z a / 2 .SE ( p1 - p2 )
SE ( p1 - p2 ) SEˆ ( p1 - p2 )
Data
[ P1 dan P2 diketahui] [ P1 dan P2 tak diketahui]

P1 (1 − P1 ) P2 (1 − P2 ) p1 (1 − p1 ) p2 (1 − p2 )
Proporsi: 0 < P < 1 + +
n n n n
P1 (100 − P1 ) P2 (100 − P2 ) p1 (100 − p1 ) p2 (100 − p2 )
Persentase: 0 < P < 100 + +
n n n n
Perhatikan:
1. Nilai persentase 100× lebih besar daripada nilai proporsi, misalnya proporsi 0.25 sama dengan persentase 25%.
2. Angka 1 pada rumus proporsi diganti dengan angka 100 pada rumus persentase.

100
p - P0
Matriks III.7 Uji hipotesis 1 proporsi ( H 0 : P = P0 ) : Zuji =
SE ( p )
SE (p)
Data SEˆ ( p )
[ P0 dan Q0 selalu diketahui dari H 0 ]
P0 Q0 P0 (1 − P0 )
Proporsi: 0 < P < 1 = −
n n
P0 Q0 P0 (100 − P0 )
Persentase: 0 < P < 100 = −
n n

p1 - p2
Matriks III.8 Uji hipotesis 2 proporsi ( H 0 : P1 = P2 ) : Zuji =
SE ( p1 - p2 )
SE ( p1 - p2 ) SEˆ ( p1 - p2 )
Data
[ P1 dan P2 diketahui] [ P1 dan P2 tak diketahui]

P1 (1 − P1 ) P2 (1 − P2 ) p1 (1 − p1 ) p2 (1 − p2 )
Proporsi: 0 < P < 1 + +
n n n n
P1 (100 − P1 ) P2 (100 − P2 ) p1 (100 − p1 ) p2 (100 − p2 )
Persentase: 0 < P < 100 + +
n n n n

101
LAMPIRAN 3D: RANDOMISASI LENGKAP DAN RANDOMISASI
BLOK

Randomisasi lengkap

Pada studi eksperimental dengan dua (atau lebih) kelompok


perlakuan, setiap anggota sampel yang baru direkrut harus memiliki
probabilitas yang sama untuk masuk ke dalam salah satu di antara kelompok-
kelompok perlakuan tersebut.

Misalkan dimiliki 2 kelompok perlakuan, yaitu kelompok A dan


kelompok B. Maka anggota sampel yang baru terpilih akan memiliki
probabilitas sebesar 50% untuk dimasukkan ke dalam kelompok A dan
probabilitas sebesar 50% untuk dimasukkan kedalam kelompok B.

Contoh III.1:

Misalkan akan diambil sampel berukuran 64, dengan 32 subjek di


antaranya dimasukkan ke dalam kelompok perlakuan A dan 32 lainnya ke
dalam kelompok perlakuan B. Anggota sampel yang direkrut diberi nomer 1
s.d. 64 (nomor basis data).

Untuk menentukan 32 subjek yang akan dimasukkan ke dalam


kelompok A, dipilih 32 nomor pertama dari tabel bilangan acak yang bernilai
di antara 01 s.d. 64. Pembacaan dilakukan dari tabel bilangan acak pada buku
teks Metode Statistika I, Addendum F halaman pertama (halaman 191),
dimulai dari baris ke-25 kolom ke-5 ke arah kanan, dan seterusnya . Nomor-
nomor yang diperoleh yaitu 31, 64, 03, . . . , 57 (lihat tabel III.1). Nomor lain
(nomor sisa) yang tidak terpilih di antara nomor 01 s.d. 64 dimasukkan
kedalam kelompok B.

102
nomor terpilih untuk kelompok A dari tabel
Tabel III.1 Nomor-nomor
bilangan acak dengan randomisasi lengkap

Alokasi nomer-nomorr yang terpilih uuntuk masuk ke dalam kelompok


A dan sisanya yang dimasukkan ke dalam kelompok B setelah diurutkan
diperlihatkan pada tabel III.2.

Tabel III.2. Alokasi akhir 64 anggota sampel dengan randomisasi


lengkap untuk 2 kelompok perlakuan A dan B

No Klp: Nomorr kelompok (1 s.d.32 untuk tiap kelompok)


No BD: Nomorr basis data (gabungan; 1 s.d. 664)

103
Randomisasi Blok
Pada studi eksperimental dengan 2 kelompok perlakuan, umumnya
digunakan ukuran sampel yang sama pada kedua kelompok, yaitu n A = nB = n.
Ukuran kelompok yang sama (balans; seimbang) ini akan menghasilkan
kekuatan uji (power) maksimum sebagaimana yang dispesifikasikan pada
perhitungan ukuran sampel minimum yang dibutuhkan untuk uji hipotesis.
Dalam keadaan tertentu, walaupun ukuran sampel kelompok menurut
rancangan studi adalah balans, ketidakseimbangan ukuran yang akan
menurunkan kekuatan uji dapat terjadi misalnya karena:
- Perekrutan subjek berakhir sebelum ukuran sampel yang direncanakan
tercapai (waktu penelitian berakhir, keterbatasan sumber daya, dan
sebagainya). Pada contoh 1 di atas, seandainya anggota sampel yang
diperoleh hanya 60, kelompok A akan terdiri atas 28 subjek dan
kelompok B terdiri atas 32 subjek.

− Ukuran sampel awal tercapai, namun pada pengumpulan data terjadi


atrisi/withdrawal/drop-out (subjek mengundurkan diri, hewan percobaan
mati, dan sebagainya).

Untuk mengurangi ketidakseimbangan karena tidak tercapainya


ukuran sampel yang direncanakan, dianjurkan untuk menggunakan
randomisasi blok.

Contoh III.2:

Lihat kembali data pada contoh III.1. Telah disebutkan bahwa


seandainya ukuran sampel yang diperoleh hanya 60, kelompok A akan terdiri
atas 28 subjek dan kelompok B terdiri atas 32 subjek. Dalam keadaan
tertentu, dengan menggunakan tabel bilangan acak lain ataupun tabel yang
sama dengan titik awal yang berbeda, mungkin saja diperoleh
ketidakseimbangan yang lebih besar, misalkan sampel yang diperoleh
berukuran 54, 22 di antaranya teralokasi pada kelompok A dan 32 pada
kelompok B.

104
Penggunaan randomisasi blok, misalnya dengan blok berukuran 8
menjamin agar perbedaan ukuran antar kelompok tidak lebih daripdaripada 4
(setengah ukuran blok). Untuk pelaksanaan
pelaksanaan, 64 anggota sampel yang akan
direkrut
rekrut dibagi atas 8 blok berukuran 8.
Dengan titik awal yang sama pada tabel bilangan acak seperti pada
contoh 1 (lihat tabel III.3).

- Blok I: Pilih 4 di antara 8 nom


nomor (ukuran blok), 1 s.d.8. Nomor yang
terpilih, yaitu 8, 3, 1, dan 6 dimasukkan dalam kelompok A. Nomor
sisanya dimasukkan dalam kelompok B.

- Blok II: Pilih 4 di antara nom


nomor 8, 1 s.d. 8. Nomor yang terpilih ,
yaitu 4, 3, 8, dan 6 dimasukkan dalam kelompok A. Nomor sisanya
dimasukkan dalam kelompok B.

- Dan seterusnya sampai dengan blok VIII: Nom


Nomor terpilih untuk
kelompok A yaitu 7, 6, 1, dan 88, sisanya untuk kelompok B.

Tabel III.3 Nomor-nomorr terpilih untuk kelompok A dari tabel


bilangan acak dengan randomisasi blok berukuran 8

Alokasi akhir diperlihatkan pada tabel III.4.

105
Tabel III.4. Alokasi akhir 64 anggota sampel dengan randomisasi blok
berukuran 8 untuk kelompok perlakuan A dan B

No Kelompok: No. 1 s.d. 32 untuk tiap kelompok


Nomor blok: No 1. s.d.
.d. 8, teralokasi merata pada kedua kelompok

106
LATIHAN 3
Bagian Pertama

Pilihlah satu jawaban yang paling benar !

1. Pada penggunaan uji Z bagi kesamaan 2 rerata sampel berukuran


besar n1 dan n2, yang dimaksud dengan pernyataan ‘sampel berukuran
besar’ ialah:
A. n1 + n2 ≥ 30 C. n1 ≥ 30 dan n2 ≥ 30
B. n1 ≥ 30 atau n2 ≥ 30 D. Semuanya salah

2. Pada uji kesamaan rerata 2 sampel yang berasal dari populasi normal,
masing-masing dengan berukuran sampel n1 < 30 dan n2 < 30, serta
diasumsikan memiliki variansi yang sama, estimator bagi variansi
populasi bersama (common population variance) adalah variansi
sampel gabungan ( s 2 pooled ) , yang dihitung sebagai:
A. Rerata hitung (arithmetic mean) kedua variansi sampel.
B. Rerata geometrik (geometric mean) kedua variansi sampel
C. Rerata tertimbang (weighted mean) kedua variansi sampel
dengan ukuran sampel masing-masing sebagai penimbang.
D. Rerata tertimbang (weighted mean) kedua variansi sampel
dengan derajat bebas masing-masing sampel sebagai
penimbang.

3. Pernyataan yang benar mengenai variansi dan SE selisih rerata 2


populasi independen adalah:
A. Var ( y1 − y2 ) = Var ( y1 ) − Var ( y2 )
B. Var ( y1 − y2 ) = Var ( y1 ) + Var ( y2 )
C. SE ( y1 − y2 ) = SE ( y1 ) − SE ( y2 )
D. SE ( y1 − y2 ) = SE ( y1 ) + SE ( y2 )

107
4. Untuk mempelajari pengaruh lingkungan terhadap perilaku
dikumpulkan anggota sampel berupa 10 pasangan anak kembar
homozigot yang anggota pasangannya masing-masing dibesarkan
secara terpisah dalam lingkungan perkotaan dan pedesaan. Untuk
membandingkan hasil tes perilaku anggota pasangan kembar yang
dibesarkan lingkungan perkotaan dan pedesaan digunakan analisis
statistik:
A. Uji t independen dengan variansi sama
B. Uji t independen dengan variansi tidak sama
C. Uji t berpasangan
D. Uji Z

5. Data yang seharusnya dianalisis dengan uji t berpasangan


menghasilkan statistik penguji dengan derajat bebas db1. Seandainya
data tersebut (secara salah) dianalisis dengan uji t independen,
diperoleh statistik penguji dengan derajat bebas db2 maka:
A.. db1 = db2 C. db2 = 2db1
B. db1 = 2db2 D. Semuanya salah

6. Uji t berpasangan dapat digunakan untuk membandingkan:


A. Data yang diperoleh dari anggota sampel sebelum dan sesudah
menjalani perlakuan tertentu.
B. Data yang diperoleh dari anggota pertam dan kedua dari sejumlah
pasangan anak kembar homozigot
C. Data dari bagian kiri dan bagian kana tubuh individu yang sama
pada sekumpulan anggota sampel yang menjalani perlakuan
tertentu.
D. Semuanya benar

Untuk soal No. 7 s.d. 10:


Misalkan dimiliki data sampel acak nilai IQ mahasiswa Fakultas Ilmu
Komputer dan Fakultas Ekonomi Universitas Gunadarma (diasumsikan
σ 12 ≠ σ 22 )
Filkom: n1 = 40 y1 = 131 s1 = 15
FE: n2 = 36 y2 = 126 s2 = 17

108
7. Uji statistik yang relevan untuk menilai ada tidaknya perbedaan
rerata nilai IQ mahasiswa Fakultas Ekonomi Universitas Gunadarma
adalah:
A. Uji Z C. Uji t berpasangan
B. Uji t independen D. Semuanya salah

8. Dengan asumsi σ 12 ≠ σ 2 2 tersebut, statistik pengujinya adalah:


A. Z uji = 0.692 C. Z uji = 3.84
B. Z uji = 1.35 D. Semuanya salah
9. Dengan tingkat signifikansi α = 0.05, daerah kritis (daerah penolakan
hipotesis nol) untuk H 0 : µ1 − µ 2 = 0 adalah:
A. Z > 1.28 C. Z > 1.96
B. Z > 1.64 D. Z > 2.57
10. Dengan tingkat signifikansi α = 0.05, kesimpulan yang diperoleh
yaitu:
A. H 0 ditolak C. A) dan B) mungkin benar
B. H 0 tidak ditolak D. A) dan B) salah

Untuk soal No. 11 s.d. 13:


Dua metode A dan B menghafalkan materi yang sulit akan dinilai
efektivitasnya . Sembilan pasangan siswa yang dipadankan menurut IQ dan
prestasi akademiknya dialokasikan secara acak untuk menggunakan metode
A dan B dalam tiap pasangan. Tes hafakan diberikan kepada seluruh siswa
dengan hasil:
Pasangan 1 2 3 4 5 6 7 8 9
Metode A 90 86 72 65 44 52 46 38 43
Metode B 85 87 70 62 44 53 42 35 46

11. Estimasi titik rerata selisih nilai tes:


A. 0.05 C. 1.33
B. 1.20 D. 1.50

12. SEˆ ( d ) adalah:


A. 0.81 C. 2.69
B. 0.90 D. 7.25

109
13. Interval konfidensi 95% untuk rerata selisih nilai tes adalah:
A. [ −0.14; 2.81] C. [ −0.43;3.09]
B. [ −0.34;3.00] D. [ −0.74;3.40]
14. Diperoleh sampel acak terdiri dari 500 orang pria dan 500 orang
wanita. Pada kelompok pria didapatkan 12 orang buta warna,
sedangkan pada kelompok wanita hanya 5 orang yang buta warna.
Hitunglah interval konfidensi 90% selisih proporsi penderita buta
warna pria dan wanita ( P1 menyatakan persentase buta pada pria dan
P2 pada wanita).
A. −0.70% < P1 − P2 < 3.50% C. −0.19% < P1 − P2 < 2.99%
B. −0.20% < P1 − P2 < 3.00% D. −0.06% < P1 − P2 < 2.74%

Bagian Kedua

Pilihlah satu jawaban yang paling benar !


Untuk soal No. 1 s.d. 7:
Misalkan dimiliki data sampel acak gaji guru pria dan wanita disuatu
2 2
daerah ( diasumsikan σ 1 ≠ σ 2 ):

Pria: n1 = 100 y1 = Rp. 478.928 s1 = Rp. 24.620


Wanita: n2 = 150 y2 = Rp. 466.150 s2 = Rp. 20.420

1. Uji statistik yang relevan untuk menilai ada tidak perbedaan antara
gaji guru pria dan wanita adalah:
A. Uji Z C. Uji t berpasangan
B. Uji t independen D. Semuanya salah

2. Hipotesis nol yang sesuai untuk uji diatas adalah:


A. µ1 − µ2 < 0 C. µ1 − µ2 > 0
B. µ1 − µ2 = 0 D. µ1 > µ 2

3. Statistik pengujinya adalah:


A. Z uji = 0.58 C. Z uji = 4.30
B. Z uji = 1.56 D. Semuanya salah

110
4. Dengan tingkat signifikansi α = 0.05, daerah kritis (daerah
penolakan hipotesis nol ) untuk uji 2-sisi adalah:
A. Z > 1.28 C. Z > 1.96
B. Z > 1.64 D. Z > 2.57

5. Dengan tingkat signifikansi α = 0.05, kesimpulan yang diperoleh


yaitu:
A. H 0 ditolak C. A) dan B) benar
B. H 0 tidak ditolak D. A) dan B) salah

2 2
6. Dengan asumsi σ 1 ≠ σ 2 , interval konfidensi 95% selisih rerata gaji
guru pria dan wanita adalah:
A Rp. 5.136 < µ < Rp. 20.420 C. Rp. 7.902 < µ < Rp. 17.654
B. Rp. 6.950 < µ < Rp. 18.606 D. Rp. 8.972 < µ < Rp. 16.484

7. Misalkan sebelum survei di atas dijalankan, ditetapkan bahwa lebar


estimasi interval yang diinginkan dengan tingkat keyakinan 95%
tidak lebih daripada Rp. 8.000. Survei pendahuluan terhadap 30
orang guru pria dan wanita menghasilkan data standar deviasi gaji
guru pria sebesar Rp. 24.750 dam guru wanita Rp. 20.600. Ukuran
sampel minimum keseluruhan yang dibutuhkan adalah:
A. 176 C. 352
B. 249 D. 498

Untuk soal No. 8 s.d. 11:


Misalkan dimiliki data pertambahan berat badan tikus-tikus
percobaan per minggu (dalam gram) yang memperoleh dua macam diet A
dan B:
Diet A: 44, 44, 56, 46, 47, 38, 58, 53, 49, 35, 46, 30, 41
Diet B: 35, 47, 55, 29, 40, 39, 32, 41, 42, 57, 51, 39

8. Estimasi titik untuk ( µ1 − µ2 ) adalah:


A. 2.90 C. 3.59
B. 3.12 D. 4.20

111
9. s 2 pooled adalah:
A. 8.36 C. 69.91
B. 63.97 D. 76.39

10. SEˆ ( y1 − y2 ) adalah:


A. 3.35 C. 8.73
B. 8.36 D. 11.20

11. Interval konfidensi 95% selisih rerata pertambahan berat badan tikus
antara yang diberikan diet A dengan yang diberikan diet B (dalam
gram) adalah:
A. [ −2.61;8.41] C. [ −3.66;9.46]
B. [ −2.84;8.64] D. [ −4.02;9.82]
Untuk soal No. 12 s.d. 17:
Untuk membandingkan efektivitas 2 metode pengajaran Statistika,
100 orang diajar dengan cara lama dan 150 orang dengan cara baru. Di
antara peserta cara lama, yang lulus adalah 63 orang, sedangkan peserta cara
baru yang lulus berjumlah 107 orang.

12. Hipotesis nol yang perlu diuji untuk membuktikan efektivitas metode
pengajaran dengan cara baru itu ialah ( P1 menyatakan proporsi yang
lulus dengan cara baru dan P2 dengan cara lama):
A. H 0 : P1 > P2 C. H 0 : P1 = P2
B. H 0 : P1 ≥ P2 D. H 0 : P1 ≤ P2

13. Daerah kritis untuk uji hipotesis tersebut adalah:


A. Z > 1.28 untuk α = 0.05 C. Z > 1.64 untuk α = 0.05
B. Z < −1.28 untuk α = 0.10 D. Z < −1.64 untuk α = 0.10

14. Nilai estimasi standard error untuk ( P1 − P2 ) sesuai dengan hipotesis


pada soal No. 12 adalah:
A. 0.03 C. 0.09
B. 0.06 D. 0.12

112
15. Statistik penguji untuk uji hipotesis tersebut adalah:
A. Z uji = 1.37 C. Z uji = 2.24
B. Z uji = 1.58 D. Z uji = 4.33

16. Kesimpulan yang diperoleh pada uji hipotesis tersebut adalah:


A. Ditemukan peningkatan efektivitas pada metode pengajaran
dengan cara baru yang bermakna secara statistik pada tingkat
signifikansi α = 0.05
B. Ditemukan peningkatan efektivitas pada metode pengajaran
dengan cara baru yang bermakna secara statistik pada tingkat
signifikansi α = 0.10
C. Tidak ditemukan peningkatan efektivitas pada metode pengajaran
dengan cara baru yang bermakna secara statistik pada tingkat
signifikansi α = 0.10
D. Semuanya salah

17. Interval konfidensi 95% selisih proporsi yang lulus di antara kedua
metode adalah:
A. −0.073 < P1 − P2 < 0.240 C. −0.017 < P1 − P2 < 0.183
B. −0.036 < P1 − P2 < 0.202 D. −0.005 < P1 − P2 < 0.161

Bagian Ketiga

Pilihlah satu jawaban yang paling benar !


Untuk soal No. 1 s.d. 5:
Sebuah penelitian dilakukan untuk membandingkan keterampilan
bermain musik siswa perkotaan dan pedesaan. Dua sampel acak diambil
masing-masing dari populasi siswa SLTP perkotaan dan pedesaan. Hasil tes
2 2
mereka adalah sebagai berikut ( diasumsikan σ 1 ≠ σ 2 ).

Perkotaan Pedesaan
Ukuran sampel 100 90
Rerata 81.2 76.4
SD 7.6 8.2

113
1. Uji statistik yang relevan untuk menilai ada tidaknya perbedaan
keterampilan bermain musik siswa perkotaan dan pedesaan adalah:
A. Uji Z C. Uji t berpasangan
B. Uji t independen D. Semuanya salah

2. Besar statistik pengujinya adalah:


A. 0.58 C. 4.17
B. 1.56 D. Semuanya salah

3. Dengan tingkat signifikansi α = 0.05, daerah kritis ( daerah penolakan


hipotesis nol ) untuk uji 2-sisi adalah:
A. Z < −1.28 atau Z > 1.28 C. Z < −1.96 atau Z >1.96
B. Z < −1.64 atau Z > 1.64 D. Z < −2.58 atau Z > 2.58

4. Dengan tingkat signifikansi α = 0.05, kesimpulan yang diperoleh


pada uji 2-sisi yaitu:
A. H 0 ditolak C. A) dan B) benar
B. H 0 tidak ditolak D. A) dan B) salah

5. Interval konfidensi 90% selisih rerata nilai tes keterampilan bermain


musik siswa SLTP perkotaan dan pedesaan adalah:
A. [ 2.91;6.69] C. [1.83;7.77 ]
B. [ 2.55;7.05] D. Semuanya salah

Untuk soal No. 6 s.d. 10:


Dimiliki dara berikut mengenai kadar Hb (g%) 6 orang penderita
anemia yang dipilih secara acak, sebelum (Y1i ) dan sesudah (Y2i ) mendapat
pengobatan dengan preparat Fe:

i 1 2 3 4 5 6
Y1i 12.2 11.3 14.7 11.4 11.5 12.7
Y2i 13.0 13.4 16.0 13.6 14.0 13.8

6. Uji statistik yang relevan untuk menilai manfaat data pengobatan


dengan preparat Fe di atas adalah:
A. Uji Z C. Uji t berpasangan
B. Uji t independen D. Semuanya salah

114
7. Hipotesis nol yang sesuai untuk uji di atas adalah:
A. µ 2 ≤ µ1
B. µ2 − µ1 ≤ 0
C. δ ≤ 0; dengan δˆ = d dan d i = Y2i − Y1i
D. A) dan B) benar.

8. Statistik pengujinya adalah:


A. Z uji = 2.45 ; berdistribusi normal standar
B. tuji = 2, 45 ; berdistribusi t dengan db 10
C. tuji = 5.93 ; berdistribusi t dengan db 5
D. Semuanya salah

9. Dengan tingkat signifikansi α = 0.05, daerah kritis (daerah penolakan


hipotesis nol) untuk uji 1-sisi adalah:
A. Z > 1.64 C. t > 1.81
B. Z > 1.96 D. t > 2.015

10. Dengan tingkat signifikansi α = 0.05, kesimpulan yang diperoleh


yaitu:
A. H 0 ditolak C. A) dan B) benar.
B. H 0 tidak ditolak D. A) dan B) salah.

115
BAB 4
ANALISIS REGRESI LINEAR 1
4.1 DATA BIVARIAT

 Paparan Data Bivariat


Data bivariat adalah data dengan pasangan (dua) variabel berbeda,
yang berasal dari subjek yang sama. Data bivariat yang akan dibahas dalam
bab ini adalah data berskala kontinu, atau sekurang-kurangnya numerik.
Paparan (layout) data bivariat tersebut secara umum diperlihatkan pada
matriks 4.1.

Matriks 4.1. Paparan data bivariat


Subjek Variabel 1 Variabel 2
1 X11 X 21
2 X12 X 22
... ... ...
i X 1i X 2i
... ... ...
n X1n X 2n

Contoh 4.1:
Pada pengambilan sampel acak 48 orang mahasiswa Fakultas Ilmu
Komputer Universitas Gunadarma, 2002, diperoleh data tinggi dan berat
badan mereka, yang disajikan dalam bentuk dataset (database; basis data)
seperti terlihat pada tabel 4.1 di bawah ini.

116
Tabel 4.1. Tinggi dan berat badan 48 orang mahasiswa Fakultas Ilmu
Komputer Universitas Gunadarma, 2002
No TB BB No TB BB No TB BB No TB BB
1 174 84 13 171 65 25 176 70 37 160 52
2 159 55 14 177 95 26 158 60 38 155 48
3 156 72 15 168 50 27 157 55 39 172 49
4 154 44 16 151 44 28 158 50 40 167 59
5 159 64 17 154 47 29 175 89 41 163 47
6 155 53 18 160 49 30 173 70 42 176 54
7 160 45 19 164 42 31 155 50 43 156 53
8 160 61 20 171 55 32 161 51 44 160 50
9 155 64 21 171 54 33 169 80 45 168 71
10 158 62 22 173 80 34 145 43 46 159 46
11 174 53 23 171 68 35 154 45 47 171 54
12 162 54 24 170 64 36 158 51 48 170 55
TB: tinggi badan (dalam cm); BB: berat badan (dalam kg)

 Distribusi Frekuensi Bivariat


Data bivariat jika dikelompokkan (dikategorikan) akan menghasilkan
distribusi frekuensi bivariat, suatu bentuk penyajian distribusi frekuensi dua
variabel sekaligus. Tabel yang diperoleh disebut juga tabel silang atau tabel r
× c (terdiri atas r baris dan c kolom).

Contoh 4.2:
Lihat kembali data tinggi dan berat badan 48 orang mahasiswa
Gunadarma pada contoh 4.1. Kategorisasi data bivariat tersebut
menghasilkan distribusi frekuensi bivariat dalam bentuk tabel silang 3×3
seperti terlihat pada tabel 4.2 di bawah ini.

117
Tabel 4.2. Distribusi mahasiswa menurut tinggi dan berat badan ,
Fakultas Ilmu Komputer, Universitas Gunadarma , 2002 (N = 48)

Tinggi Berat badan (kg)


Jumlah
badan (cm) < 50 50-59 > 60
< 160 7 7 5 19
160-169 4 6 3 13
> 170 1 6 9 16
Jumlah 12 19 17 48

Nilai-nilai pada kolom terkanan dan baris terbawah yang dinamakan


‘distribusi marginal’ merupakan distribusi frekuensi (univariat) untuk
masing-masing variabel.

Contoh 4.3:
Contoh lain untuk distribusi frekuensi bivariat tampak pada tabel 4.3,
yang menunjukkan distribusi hipotetis karyawan sebuah perusahaan menurut
lama masa kerja dan besar gaji bulanannya.

Tabel 4.3. Distribusi karyawan perusahaan ABC menurut masa kerja


dan gaji bulanan
Masa kerja Gaji (dalam ratusan ribu rupiah)
Jumlah
(tahun) < 1000 1000-1999 > 2000
<5 30 4 0 34
5-9 23 17 2 42
> 10 2 6 4 12
Jumlah 55 27 6 88

Dari tabel silang dapat diperkirakan secara kasar kemungkinan


adanya hubungan anatara kedua variabel, serta arah hubungan tersebut.
Hubungan antara dua variabel numerik yang terikat dalam struktur data
bivariat demikian seandainya ada dinamakan ‘asosiasi statistik’. Secara
statistik, hubungan antara dua variabel tersebut dianalisis dengan:
1. Analisis kolerasi: untuk hubungan tanpa arah (variabel baris ↔
variabel kolom).
2. Analisis regresi sederhana: untuk hubungan yang memiliki arah
(variabel independen →variabel dependen) .

118
4.2. ANALISIS KORELASI

 Diagram Tebar
Analisis korelasi adalah analisis statistik yang ditujukan untuk
mengukur keeratan hubungan antara dua variabel yang terikat dalam
struktur data bivariat. Dua variabel demikian dapat disajikan secara grafik
dengan ‘diagram tebar’ (scatter diagram), dengan tiap titik menyatakan satu
pasangan nilai, yaitu nilai pada sumbu X (merepresentasikan variabel
pertama) dan nilai pada sumbu Y (merepresentasikan variabel kedua).
Manfaat diagram tebar adalah untuk memperkirakan besar (tingkat
keeratan) dan arah hubungan antar dua variabel tersebut. Besar dan dua arah
hubungan itu dinyatakan secara kuantitatif dengan koefisien korelasi
(sampel) r:
1) Arah hubungan:
 Hubungan positif ( r > 0 ) : jika X membesar, maka Y juga
membesar.
 Hubungan negatif ( r < 0 ) : jika X membesar, maka Y mengecil,
dan sebaliknya.
2) Besar hubungan:
−1 ≤ r ≤ 1 (4.1)
 Hubungan kuat: r mendekati 1
 Hubungan lemah: r mendekati 0

Perhatikan bahwa:
- Perhitungan korelasi dapat dilakukan dengan dan tanpa melalui analisis
regresi
- Tingkat korelasi yang kuat (‘bermakna’ secara statistik) belum tentu
menunjukkan hubungan kausal (sebab-akibat)

119
Diagram 4.1. Diagram tebar beberapa contoh data bivariat dengan
berbagai niali korelasi

 Koefisien Korelasi Pearson


Korelasi antara dua variabel yang berskala kontinu dinamakan
koefisiensi korelasi Pearson atau koefisien korelasi produk-momen:
- Koefisien korelasi untuk populasi: ρ
- Koefisien korelasi untuk sampel: r = ρˆ

120
Koefisien korelasi r bernilai + 1 jika:
a. Setiap titik pada diagram tebar, yaitu tiap pasangan nilai ( X i ; Yi )
terletak pada satu garis lurus, yaitu garis regresi Yˆ = b0 + b1 X dengan
b1 > 0.
b. Garis lurus tersebut membentuk sudut lancip dengan sumbu horizontal
X : 00 < ϕ < 900 dengan b1 = tg ϕ

Koefisien korelasi r bernilai − 1 jika:


a. Setiap titik pada diagram tebar, yaitu tiap pasangan nilai ( X i ; Yi )
terletak pada satu garis lurus, yaitu garis regresi Yˆ = b0 + b1 X dengan
b1 < 0.
b. Garis lurus tersebut membentuk sudut tumpul dengan sumbu horizontal
X : 900 < ϕ < 1800 dengan b1 = tg ϕ

Rumus definisi:

r=
∑( X i − X )(Yi − Y )
(4.2)
 ∑ ( X i − X )2   ∑ (Yi − Y ) 
2

 

Rumus operasional:

∑X Y − ∑ n∑
( X )( Y ) i i
i i
r= (4.3)
(∑ X )   (∑Y ) 
2
 2

∑  ∑ Y − 
2 i 2 i
X − 1 1
 n  n  

Dengan lambang-lambang S xx , S yy , dan S xy :


2
 
 ∑ Xi 
S xx = ∑ ( X i − X ) = ∑ X i2 −  i 
2
(4.4.a)
i i n
2
 
 ∑ Yi 
S yy = ∑ (Yi − Y ) = ∑ Yi 2 −  i 
2
(4.4.b)
i i n

121
  
 ∑ X i  ∑ Yi 
S xy = ∑ ( X i − X )(Yi − Y ) = ∑ X i Yi −  i  i 
(4.4.c)
i i n

serta S x dan S y :

∑i ( X i − X )
2
S x = S xx = (4.5.a)

∑i (Yi − Y )
2
S y = S yy = (4.5.b)

maka rumus operasional untuk r dapat dituliskan sebagai:


S xy S xy
r= = (4.6)
S xx S yy Sx S y

Contoh 4.4 (korelasi dengan rumus definisi):


Misalkan dimiliki data hipotesis variabel X yang menyatakan nilai
tes 1 (Matematika) dan variabel Y yang menyatakan nilai tes 2 (Bahasa
Inggris) 7 orang calon mahasiswa. Untuk menghitung koefisien korelasi
antara variabel X dan Y dengan menggunakan rumus definisi, terlebih
dahulu disusun tabel perhitungan seperti pada tabel 4.4 berikut.

Tabel 4.4. Contoh perhitungan koefisien korelasi dengan menggunakan


rumus definisi

2 2
Siswa Xi Yi ( Xi − X ) ( Xi − X ) (Yi − Y ) (Yi − Y ) ( X i − X )(Yi − Y )
A 90 94 10 100 17 289 170
B 82 66 2 4 −11 121 −22
C 66 69 −14 196 −8 64 112
D 70 86 −10 100 9 81 −90
E 95 72 15 225 −5 25 −75
F 97 88 17 289 11 121 187
G 60 64 −20 400 −13 169 260
Jumlah 560 539 1,314 870 542

X i : nilai tes 1; Yi : Nilai tes 2

122
560 539
X= = 80 Y= = 77
7 7

r=
∑ ( X i − X )(Yi − Y )
 ( X − X )2   (Y − Y )2 
∑ i  ∑ i 
542
= = 0.51
(1,314 )(870 )

Contoh 4.5 (korelasi dengan rumus operasional):


Lihat kembali data nilai tes Matematika dan bahasa Inggris pada
contoh 4.4. Untuk menghitung koefisien korelasi dengan menggunakan
rumus operasional, disusun tabel perhitungan seperti terlihat pada tabel 4.5.

Tabel 4.5. Contoh perhitungan koefisien korelasi dengan menggunakan


rumus operasional

Siswa Xi Yi X i2 Yi 2 X i Yi
A 90 94 8,100 8,836 8,460
B 82 66 6,724 4,356 5,412
C 66 69 4,356 4,761 4,554
D 70 86 4,900 7,396 6,020
E 95 72 9,025 5,184 6,840
F 97 88 9,409 7,744 8,536
G 60 64 3,600 4,096 3,840
Jumlah 560 539 46,114 42,373 43,662
X i : Nilai tes 1; Yi : Nilai tes 2
( ∑ X )( ∑ Y )
∑X Y −
i i
i i
r= n
 Xi )   Yi ) 
∑ ∑
2 2

∑ X i −
2 (   ∑ Yi −2 ( 
 n  n 
  

43, 662 −
( 560 )( 539 )
= 7 = 0.51
 560  
2
5392 
 46,114 − 7   42,373 − 7 
  
atau:

123
2
 
 ∑ Xi  2
S xx = ∑ X i 2 −  i  = 46,114 − 560 = 1,314
i n 7
2
 2
 ∑ Yi  2
S yy = ∑ Yi 2 −  i  = 42,373 − 539 = 870
i n 7
  
 ∑ X 1   ∑ Yi 
S xy = ∑ X i Yi −  i   i  = 43, 662 − ( 560 )( 539 ) = 542
i n 7
S xy 542
r= = = 0.51
Sx Sy (1,314 )( 870 )

4.3. ANALISIS REGRESI LINEAR SEDERHANA

 Garis Regresi dan Model Regresi Linear


Analisis regresi adalah analisis statistik yang ditujukan untuk
memperoleh persamaan garis yang menunjukkan hubungan antara dua
variabel yang terikat dalam struktur data bivariat, dalam bentuk persamaan
garis regresi (diagram 4.2).

Persamaan garis regresi:


Yˆ = β 0 + β1 X (populasi) (4.7.a)
Yˆ = b0 + b1 X (sampel) (4.7.b)

124
Diagram 4.2. Contoh diagram tebar data bivariat dan garis regresinya

1) Nilai Y -prediksi ( = Yˆ ) : adalah nilai prediksi variabel Y untuk setiap


nilai X tertentu.
 Dalam populasi: Yˆi = β 0 + β1 X i
 Dalam sampel: Yˆi = β 0 + β1 X i
2) Nilai Y -sesungguhnya (= Yi ) : adalah nilai variabel Y sesungguhnya
untuk setiap nilai X tertentu. Pasangan nilai-nilai X dan Y
sesungguhnya menyatakan titik-titik yang ada pada diagram tebar.
Hubungan tiap nilai X tertentu dengan pasangan nilai Y
sesungguhnya, dinyatakan dalam suatu model, yang dinamakan model
regresi linear.
 Dalam populasi: Yi = β0 + β1 X i + ε i (4.8.a)

dengan ε i = Yi − Yˆi

 Dalam sampel: Yi = b0 + b1 X i + ei (4.8.b)

dengan ei = Yi − Yˆi

β0 : intersep (intercept); estimatornya adalah: βˆ0 = b0


β1 : kemiringan (slope;koefisien regresi); estimatornya adalah: βˆ1 = b1
εi : galat acak (random error): εˆ = ei

125
Persamaan garis regresi juga berlaku bagi pasangan nilai rerata X
dan rerata Y :
Y = b0 + b1 X (4.9)
Asumsi yang harus dipenuhi pada model regresi linear ini antara lain
yaitu:
 Nilai-nilai Yi independen satu sama lain (asumsi independensi).
 Himpunan nilai-nilai Yi untuk tiap nilai X i tertentu [distribusi (Y | X)]
berdistribusi normal dengan variansi yang sama (asumsi
homoskedastitas; lihat diagram 4.3).

Diagram 4.3. Asumsi homoskedastitas pada model regresi linear

 Koefisien Regresi b0 dan b1


Koefisiensi regresi b0 dan b1 pada analisis regresi linear diestimasi
dengan menggunakan metode kuadrat terkecil (ordinary least square; OLS),
yaitu penentuan nilai b0 dan b1 sedemikian hingga menghasilkan nilai
∑e
2
minimum untuk i
. Dengan metode ini diperoleh rumus definisi untuk
koefisien regresi b1 , yaitu:

b1 =
S xy
=
∑ ( X − X )(Y − Y )
i i
(4.10)
∑( X − X )
2
S xx i

Dalam praktik, yang digunakan untuk perhitungan adalah rumus


operasional:

126
b1 = ∑ X iYi −
( ∑ X )( ∑ Y )
i i

n (4.11)
(∑ X )
2

∑X 2 i
1 −
n
dengan:
b0 = Y − b1 X (4.9.a)

Contoh 4.6:
Misalkan dimiliki data hipotetis bagi 8 orang tenaga penjual
(salesman), yang menyatakan lama bekerja sebagai tenaga penjual dalam
tahun dan jumlah penjualan mingguannya dalam ribuan rupiah. Misalkan
hubungan antara lama bekerja (variabel X ) dan jumlah penjualan (variabel
Y ) dinyatakan dalam model regresi linear:
Yi = β0 + β1 X i + ε i
Estimator β0 dan β1 adalah b0 dan b1 , yang perhitungannya
disajikan dengan menggunakan tabel 4.6 di bawah ini.

Tabel 4.6. Contoh perhitungan koefisien regresi untuk data 8 orang


tenaga penjual

Penjual Xi Yi X i Yi X i2 Yi 2
A 6 90 540 36 8,100
B 5 60 300 25 3,600
C 3 40 120 9 1,600
D 1 30 30 1 900
E 4 30 120 16 900
F 3 50 150 9 2,500
G 6 80 480 36 6,400
H 2 20 40 4 400
Jumlah 30 400 1,780 136 24,400
Xi : Lama berjualan (dalam tahun)
Yi : Jumlah penjualan (dalam ribuan rupiah)

30 400
X= = 3.75 Y= = 50
8 8

127
2
 
 ∑ Xi  2
S XX = ∑ Xi2 −  i  = 136 − 30 = 23.5
i n 8
  
 ∑ X i   ∑ Yi 
S xy = ∑ X iYi −  i  i  = 1, 780 − ( 30 )( 400 ) = 280
i n 8
S xy 280
b1 = = = 11.91
S xx 23.5
b0 = Y − b1 X = 50 − (11.91)( 3.75 ) = 5.32

Estimasi persamaan regresi: Yˆ = 5.32 +11.91X


Misalkan seorang penjual memiliki lama penjualan 4 tahun, maka
taksiran (estimasi) jumlah penjualannya adalah:
Xi = 4
Yˆi = 5.32 + 11.91 X i = 5.32 + (11.91)( 4 ) = 52.98

Hubungan antara b1 dengan r :

∑ (Y − Y )
2
b1 i Sy
= = (4.12)
∑( X − X )
2
r i
Sx

 Variansi pada Model Regresi


Pada diagram 4.4, tampak bahwa:

(Y − Y ) = (Yˆ − Y ) + (Y
i i i
2
− Yˆi )

128
Diagram 4.4. Dasar Penguraian variansi pada model regresi linear

Secara matematis, dapat dibuktikan bahwa:

∑ (Y − Y )
2 2 2
i = ∑ (Yˆ − Y )
i + ∑ (Y − Yˆ )
i i

atau: JKT = JKR + JKG (4.13)

JKT : Jumlah Kuadrat Total (SSTo, Total Sum of Squares) = S yy


JKR : Jumlah Kuadrat Regresi (SSR, Regression Sum of Squares)
JKG : Jumlah Kuadrat Galat (Error Sum of Squares) = ∑ ei 2

Rumus definisi:

∑ (Y − Y )
2
JKT = S yy = i (4.14)
2
 ∑ ( X i − X )(Yi − Y ) 
2

JKR = b1 . S yy =
( S xy ) =   (4.15)
∑( Xi − X )
2
S xx

Rumus operasional:

2
 
 ∑ Yi 
= ∑Yi −  
2 i
JKT = S yy ; db = n – 1 (4.16)
i n

129
2

2

 ∑ X iYi −
∑ X i ∑ Yi 
JKR =
( S xy ) = 
n  ; db = 1 (4.17)
(∑ Xi )
2
S xx
∑ X i2 − n
JKG = JKT – JKR ; db = n – 2 (4.13.a)

 Kuadrat Rerata
Jumlah Kuadrat
Kuadrat Rerata ( mean square) =
derajat bebas

 Kuadrat Rerata Regresi (KRR; regression mean square; MSR)

JKR
KRR = (4.18)
1

 Kuadrat Rerata Galat (KRG; error mean square; MSE)


JKG
KRG = (4.19)
n−2

Contoh 4.7:
Lihat kembali data pada contoh 4.6:
S xx = 23.5 S xy = 280
2
 
 ∑ Yi  400 2
S yy = ∑ Yi −
2  i  = 24, 400 − = 4, 400
i n 8
JKT = S yy = 4, 400
2

JKR =
(S ) xy280 2
=
= 3, 336.17
S xx 2 23.5
280
atau JKR = b1 .S xy = ( 280 ) = 3,336.17
23.5

130
JKG = JKT − JKR = 4, 400 − 3,336.17 = 1.063.83

 Koefisien Determinasi
Koefisien determinasi adalah proporsi variansi yang dapat dijelaskan
oleh model regresi.
JKR JKT − JKG JKG
R2 = = = 1− (4.20)
JKT JKT JKT
2 2

R2 =
∑ (Yˆ − Y ) =1−
∑ (Yi − Yˆi ) (4.20.a)
∑ (Yi − Y ) ∑ (Yi − Y )
2 2

Akar koefisiensi determinasi sama dengan koefisien korelasi:


R=r (4.21)
sehingga:
2

∑ X iYi −
( ∑ X i )( ∑ Yi ) 
2

R 2
=
(S )
xy
=
 n 
(4.22)
 X i )  Yi ) 
∑ ∑
2 2
Sxx S yy
 ∑ Xi −2 (  ∑ Yi −
2 ( 
 n  n 
  

Contoh 4.8:
Lihat kembali data pada contoh 4.6 dan 4.7.
JKR = 3, 336.17 JKT = 4, 400
Koefisien determinasi adalah:
JKR 3,336.17
R2 = = = 0.76
JKT 4, 400

R= R2 = 0.76 = 0.87

S xx = 23.5 S yy = 4, 400 S xy = 280


S xy
Koefisien korelasi: r=
S xx S yy

131
280
= = 0.87
( 23.5 )( 4, 400 )
Tampak bahwa: R=r
Koefisien korelasi r juga dapat dihitung sebagai berikut:
b1 = 11.91 (contoh 4.6)
S xx = 23.5 (contoh 4.6)
S yy = JKT = 4, 400 (contoh 4.7)
Dengan menggunakan rumus:

∑ (Y − Y )
2
b1 i Sy
= =
∑( X − X )
2
r i
Sx

11.91 4, 400
diperoleh: =
r 23.5
r = 0.87

4.4. INFERENSI STATISTIK PADA MODEL REGRESI


DAN MODEL KORELASI

 Uji ANOVA (Uji F) untuk H0 : β 1 = 0


- Hipotesis: H 0 : β1 = 0 (4.23.a)
H1 : β1 ≠ 0 (4.23.b)

- Statistik pengujinya adalah:


KRR JKR /1
Fuji = = (4.24)
KRG JKG / ( n − 2 )
yang berdistribusi F dengan derajat bebas pembilang 1 dan derajat bebas
penyebut ( n − 2 ) .
- Daerah kritis: F > F1;( n−2);α (4.25)

(tabel nilai kritis distribusi F dapat dilihat pada Addendum C)

132
Hasil perhitungan disajikan dalam bentuk tabel ANOVA (analisis
variansi) seperti terlihat pada tabel 4.7 di bawah ini.

Tabel 4.7. Tabel ANOVA untuk persamaan garis regresi Yˆi = b0 + b1 Xi

Sumber Fuji
JK db KR Ftabel
variansi
JKR
Regresi JKR 1 KRR =
1 KRR F1;
Fuji = ( n−2 );α
JKG KRG
Galat JKG n–2 KRG =
n−2
Total JKT n–1

Contoh 4.9:
Lihat kembali data penjualan pada contoh 4.6. Pada contoh 4.7 telah
dihitung nilai-nilai JKT, JKR, dan JKG-nya ( n = 8 ) :
JKT = 4, 400 JKR = 3, 336.17 JKG = 1, 063.83
Diperoleh:
JKR 3,336.17
KRR = = = 3,336.17
1 1
JKG 1,063.83
KRG = = = 177.30
n−2 6
Untuk uji hipotesis H 0 : β1 = 0 dengan uji F dan tingkat signifikansi
a = 0.05, disusun tabel analisis variansi berikut:

Tabel 4.8. Tabel ANOVA untuk persamaan regresi Yˆ = 5.32 +11.91X

Sumber Fuji
JK db KR Ftabel
variansi
Regresi 3,336.17 1 3,336.17 3,336.17
Fuji = F1; 6; 0.05
Galat 1,063.83 6 177.30 177.30
= 5.99
= 18.82
Total 4,400 7

133
Nilai Fuji = 18.82 lebih besar daripada nilai titik kritis F(1;6;0.05) = 5.99,
sehingga H 0 : β1 = 0 ditolak pada tingkat signifikansi a = 0.05.

 Distribusi F
Statistik penguji pada uji ANOVA untuk model regresi linear
berdistribusi F, yang cuplikan nilai-nilainya diperlihatkan pada tabel 4.9 di
bawah ini (tabel lengkap nilai kritis distribusi F terdapat pada Addendum C).
Distribusi F memiliki derajat bebas pembilang (numerator; baris teratas pada
tabel) dan derajat bebas penyebut (denominator; kolom terkiri pada tabel).
Bentuk distribusinya dapat berbeda-beda, tergantung pada derajat bebas
pembilang dan derajat bebas penyebut., tetapi nilai-nilai F seluruhnya adalah
positif (di sisi kanan sumbu vertikal), sehingga uji hipotesis dengan statistik
penguji yang berdistribusi F selalu adalah uji 1-ekor, namun merupakan uji
2-sisi.

Diagram 4.5. Distribusi F dengan berbagai derajat bebas pembilang dan


derajat bebas penyebut.

Tabel distribusi F biasanya dibuat terpisah untuk berbagai nilai a,


dan yang disajikan pada tabel 4.9 adalah nilai-nilai distribusi F untuk
a = 0.05. Nilai-nilai distribusi F selengkapnya dapat dilihat pada Addendum
C.

134
Tabel 4.9. Cuplikan tabel F untuk α = 0.05 [α = P (F > F( n; d ; α ) ]

 Uji t (2-sisi) untuk H0 : β 1 = 0 dan Interval Konfidensi β 1

- Hipotesis: H 0 : β1 = 0 (4.26.a)
H1 : β1 ≠ 0 (4.26.b)
- Statistik pengujinya adalah:
b1 b
tuji = = 1 (4.27)
SEˆ ( b1 ) s S x
yang berdistribusi t dengan db ( n − 2 ) .
2

s2 =
JKG
=
∑ (Yi − Yˆi ) = KRG (4.28)
( n − 2) (n − 2)
- Daerah kritis (daerah penolakan) adalah:
t > t( n−2);α 2 (4.29)

135
Interval konfidensi (1 − a ) untuk β1 adalah:
b1 + t( n−2);α 2 . SEˆ ( b1 )
s
yaitu: b1 + t( n−2);α 2 . (4.30)
Sx

Contoh 4.10:
Lihat kembali data penjualan pada contoh 4.6. Dalam contoh tersebut
telah diperoleh estimasi persamaan regresi:
Yˆ = 5.32 +11.91X
Untuk menguji hipotesis H 0 : β1 = 0, statistik pengujinya adalah:
b1 b
tuji = = 1
SEˆ ( b1 ) s / Sx
yang berdistribusi t dengan db ( n − 2 ) .
JKG
s2 = = KRG = 177.30 S xx = 23.5
( n − 2)
s 177.30
SEˆ ( b1 ) = = = 2.747
Sx 23.5
b1 1191
tuji = = = 4.34
SEˆ ( b ) 2.747
1

Dengan a = 0.05, daerah kritis untuk hipotesis H 0 : β1 = 0 adalah


| t |> t( 6;0.025 ) atau | t |> 2.447, sehingga H 0 ditolak.

Interval konfidensi 95% untuk β1 adalah:


b ±t
1 .SEˆ ( b )
( 6;0.025) 1

atau: 11.91 ± ( 2.447 )( 2.747 )


[5.19;18.64]

136
Uji Hipotesis untuk Koefisien Korelasi r
- Hipotesis: H 0 : ρ = 0 (4.31.a)

H1 : ρ ≠ 0 (4.31.b)
- Statistik pengujinya adalah:
r
tuji = (4.32)
(1 − r ) ( n − 2 )
2

yang berdistribusi t dengan db ( n − 2 ) .


- Daerah kritis (daerah penolakan) adalah:
t > t( n−2);α 2 (4.33)

Contoh 4.11:
Lihat kembali data penjualan pada contoh 4.6. Pada contoh 4.8 telah
dihitung:
r = 0.87
Untuk menilai apakah koefisien korelasi ini berbeda secara bermakna
dengan nol (tidak ada korelasi), maka dilakukan uji hipotesis H 0 : ρ = 0 .
Statistik pengujinya adalah:
r 0.87
tuji = = = 4.34
( ) ( )
1 − r 2
/ n − 2 1 − ( )
0.87 2
/ 6
yang berdistribusi t dengan db ( n − 2 ) .

Dengan a = 0.05, daerah kritis adalah |t|> t( n − 2 );a/ 2 , yaitu |t|> t( 6;0.025) atau
|t|>2.447, sehingga H 0 ditolak.

137
LAMPIRAN 4A: UKURAN SAMPEL MINIMUM UNTUK
UJI HIPOTESIS PADA MODEL REGRESI DAN MODEL
KORELASI

Ukuran Sampel untuk Model Regresi Linear


Rumus perhitungan ukuran sampel minimum yang dibutuhkan untuk
uji hipotesis pada model regresi linear tidak dapat disajikan dalam bentuk
sederhana, karena menggunakan distribusi F-sentral serta distribusi F-non-
sentral yang memerlukan pemahaman teoretis di luar ruang lingkup
pembahasan pada buku teks ini. Jika diperlukan, ukuran sampel minimum
yang dibutuhkan untuk uji hipotesis pada model regresi linear dapat
ditentukan dengan menggunakan salah satu program komputer yang ada
untuk perhitungan ukuran sampel dan kekuatan uji hipotesis, misalnya PASS
2000.

Contoh IV.1:
Misalkan akan ditentukan ukuran sampel minimum yang dibutuhkan
untuk melakukan uji hipotesis terhadap model regresi linear
Yi = β0 + β1 X i + ε i . Misalkan pula dipilih tingkat signifikansi a = 0.05,
kekuatan uji (1 − β ) = 0.80, dan diketahui dari penelitian terdahulu bahwa
SD ( X ) = 1. Dengan memasukkan nilai-nilai spesifikasi ini pada progam
komputer PASS 2000, diperoleh ukuran sampel minimum yang dibutuhkan
pada berbagai nilai minimum koefisien regresi β1 yang diharapkan untuk
dideteksi serta berbagai tingkat korelasi antara variabel X dan Y (tabel IV.1).

Tabel IV.1. Ukuran sampel minimum untuk uji F terhadap hipotesis


H0 : β 1 = 0 pada model regresi linear Yi = β 0 + β 1 X i + ε i *)

β1
ρ
1 3 5 7 9
0.2 191 191 191 191 191
0.4 44 44 44 44 44
0.6 17 17 17 17 17
0.8 7 7 7 7 7
*) α = 0.05, (1 – β) = 0.80, dan SD (X) = 1

138
Ukuran Sampel untuk Model Korelasi
Pada uji hipotesis H 0 : ρ = 0 vs H1 : ρ > 0 , misalkan besar korelasi
minimum yang diharapkan untuk dideteksi adalah R, sehingga untuk
perhitungan ukuran sampel minimum yang dibutuhkan, hipotesisnya dapat
dituliskan sebagai H 0 : ρ = ρ0 = 0 dan H A : ρ = ρ1 = R .
Transformasi koefisien korelasi sampel r berdistribusi normal
standar:
1+ r
z = 0.5 In
1− r
dengan standard error:
1
SE ( z ) =
n −3
Misalkan c menyatakan titik kritis pada uji hipotesisis, dan
diasumsikan bahwa standard error kedua distribusi sampling menurut H 0
dan H A adalah sama, maka dengan merujuk pada distribusi sampling H 0
diperoleh:
1
c = 0 + Zα
n−3
sedangkan dengam merujuk pada distribusi H A diperoleh:
1+ R 1
c = 0.5 ln − Zβ
1− R n−3
1 1+ R 1
Selanjutnya: 0 + Z α = 0.5 ln − Zβ
n−3 1− R n−3
1+ R
0.5ln
1 1− R
=
n−3 Zα + Z β

dan diperoleh ukuran sampel minimum yang dibutuhkan untuk mendeteksi


korelasi minimum sebesar R:
2
 Zα + Z β 
n=  2
+3
 1+ R 
 0.5 ln 1 − R 

139
LAMPIRAN 4B: CONTOH ANALISIS REGRESI LINEAR
SEDERHANA DENGAN PROGAM KOMPUTER

Sebagai contoh, di bawah ini diperlihatkan keluaran tiga program


komputer, SPSS 12.0 for Windows, Minitab Realease 14, dan Stata/SE 8.0
for Windows untuk analisis data pada Latihan 4 Bagian Kedua (usia dan
tekanan darah sistolik), dengan analisis regresi linear sederhana.

SPSS 12.0 FOR WINDOWS

Regression

Variables Entered/Removed(b)

Variables Variables
Model Entered Removed Method
1 USIA(a) . Enter
a All requested variables entered
b Dependent Variable: TENSI

Model Summary

Adjusted R Std. Error of


Model R R Square Square the Estimate
1 .349(a) .122 -.097 25.749
a Predictors: (Constant), USIA

ANOVA(b)

Sum of
Model Squares df Mean Square F Sig.
1 Regression 368.825 1 368.825 .556 .497(a)
Residual 2652.009 4 663.002
Total 3020.833 5
a Predictors: (Constant), USIA
b Dependent Variable: TENSI

Coefficient(a)

Unstandardized Standardized
Model Coefficients Coefficients t Sig.
B Std. Error Beta
1 (Constant) 92.897 62.920 1.476 .214
USIA .887 1.189 .349 .746 .497
a Dependent Variable: TENSI

140
MINITAB RELEASE 14

-------------- 1/27/2005 6:11:45 PM -----------------------------------------


Welcome to Minitab, press F1 for help.

Regression Analysis: TENSI versus USIA

The regession equation is


TENSI = 92.9 + 0.89 USIA

Predictor Coef SE Coef T P


Constant 92.90 62.92 1.48 0.214
USIA 0.887 1.189 0.75 0.497

S = 25.7488 R-Sq = 12.2% R-Sq (adj) = 0.0%

Analysis of Variance

Source DF SS MS F P
Regression 1 368.8 368.8 0.56 0.497
Residual Error 4 2652.0 663.0
Total 5 3020.8

STATA/SE 8.0 FOR WINDOWS

. regress TENSI USIA

Source | SS df MS Number of obs = 6


---------|------------------------- F(1, 4) = 0.56
Model | 368.824802 1 368.824802 Prob>F = 0.4972
Residual | 2652.00852 4 663.002133 R-squared = 0.1221
---------|------------------------- Adj R-squared = -0.0974
Total | 3020.83333 5 604.166667 Root MSE = 25.749

141
------+-----------------------------------------------------
TENSI | Coef. Std.Err. t P>|t| [95%Conf.Interval]
------|-----------------------------------------------------
USIA | .8869534 1.189182 0.75 0.497 -2.414744 4.188651
_cons | 92.89726 62.91996 1.48 0.214 -81.79656 267.5911
------+-----------------------------------------------------

142
LATIHAN 4
Bagian Pertama

Pilihlah satu jawaban yang paling benar!

Untuk soal No. 1 s.d. 6:


Diketahui: X =7 Y = 34 n =8
∑ X = 400 ∑ XY = 1, 931 ∑Y
2 2
= 9,576

∑( X
2
1. i −X) =
A. 8 C. 136
B. 27 D. 328

∑ (Y − Y )
2
2. i =
A. 8 C. 136
B. 27 D. 328

∑( X ∑ (Y − Y )
2 2
3. i −X) i =
A. 8 C. 136
B. 27 D. 328

4. Dengan pembagi ( n − 1) , Var ( X ) adalah:


A. 1.14 C. 19.43
B. 3.86 D. 46.26

5. Dengan pembagi ( n − 1) , Var (Y ) adalah:


A. 1.14 C. 19.43
B. 3.86 D. 46.26

6. Koefisien korelasi r adalah:


A. 0.45 C. 0.61
B. 0.53 D. 0.72

143
7. Jika r menyatakan koefisien Pearson antara variabel X dan Y dan
diketahui r < 0, maka:
A. Untuk nilai X yang besar, nilai Y juga cenderung besar.
B. Untuk nilai X yang besar, nilai Y cenderung kecil.
C. Untuk nilai X yang kecil, nilai Y cenderung besar
D. B) dan C) benar.

8. Misalkan dimiliki himpunan data bivariat ( X 2 − Y2 ) , . . . , ( X 8 − Y8 )


dan r menyatakan koefisien korelasi X dengan Y. Jika gambaran
titik-titik data tersebut pada diagram tebar (scatter diagram)
membentuk titik-titik sudut segi delapan beraturan, maka:
A. r > 0 C. r < 0
B. r = 0 D. Semuanya salah.

9. Proporsi variansi yang dapat dijelaskan oleh suatun model regresi


dinamakan:
A. Koefisien korelasi C. Koefisien regresi
B. Koefisien determinasi D. Koefisien konkordansi

10. Misalkan dimiliki garis regresi Yˆi = b0 + b1 X i , dan r menyatakan


koefisien korelasi X dengan Y:
A. Jika r = 0, maka b1 = 0
B. Jika r = −1, maka b1 = −1
C. Jika r = + 1 , maka b1 = +1
D. Yang benar lebih daripada satu.

11.

144
Kedua gambar di atas menunjukkan diagram tebar dan garis regresi 2
sampel data bivariat, masing-masing dengan estimasi garis regresi
Yˆ = a1 + b1 X dan koefisien korelasi r1 serta garis regresi Yˆ = a2 + b2 X
dan koefisien korelasi r2 . Jika kedua diagram dibuat dengan skala
pengukuran yang sama, maka:
A. b1 > b2 dan r1 > r2 C. b1 < b2 dan r1 > r2
B. b1 > b2 dan r1 < r2 D. b1 < b2 dan r1 < r2

12. Misalkan dimiliki 2 himpunan data bivariat, masing-masing dengan


estimasi garis regresi Yˆ = a1 + b1 X dan koefisien korelasi r1 serta
garis regresi Yˆ = a2 + b2 X dan koefisien korelasi r2 . Jika diketahui
b1 > b2 > 0 , maka:
A. r1 > 0 dan r2 > 0 C. r1 > r2 > 0
B. r1 < 0 dan r2 < 0 D. r2 > r1 > 0

13. Dimiliki data bivariat dengan variabel independen X dan variabel


dependen Y serta estimasi garis regresi Yˆ = b0 + b1 X . Jika pada
diagram tebar ( X ; Y ) seluruh titik-titik ( X i ; Yi ) terletak pada garis
regresi Yˆ = b0 + b1 X , maka:
A. JKR = 0 C. JKR = JKG
B. JKR =1 D. JKR = JKT

14. Dari himpunan data bivariat (X ; Y) diketahui koefisien korelasinya


r = 0 , maka bagi model regresi Yi = b0 + b1 X i + ei berlaku:
A. JKR = 0 C. JKR = JKG
B. JKR =1 D. JKR = JKT

15. Data bivariat dengan variabel independen X dan variabel dependen


Y menghasilkan estimasi garis regresi Yˆ = b0 + b1 X dan koefisien
korelasi r. Jika diketahui bahwa uji hipotesis H 0 : β1 = 0
menghasilkan statistik penguji t1 dan uji hipotesis H 0 : ρ = 0
menghasilkan statistik penguji t 2 , maka:
A. t1 < t2 C. t1 > t2
B. t1 = t2 D. Semuanya salah

145
16. Koefisien determinasi pada analisis regresi linear menyatakan:
A. Proporsi variansi variabel dependen yang dapat ‘dijelaskan’
oleh model regresi.
B. Proporsi variansi variabel dependen yang tidak dapat
‘dijelaskan’ oleh model regresi.
C. Proporsi variansi variabel independen yang dapat ‘dijelaskan’
oleh model regresi.
D. Proporsi variansi variabel independen yang tidak dapat
‘dijelaskan’ oleh model regresi.

17. Secara kuantitatif, besar koefisien determinasi adalah sama dengan:


A. Koefisien korelasi.
B. Kuadrat korefisien korelasi.
C. Akar (positif) koefisien korelasi.
D. Semuanya salah

18. Pada model regresi linear sederhana, nilai kuadrat rerata regresinya
(regression mean square):
A. Lebih besar daripada nilai jumlah kuadrat regresi (regression
sum of squares)
B. Sama dengan nilai jumlah kuadrat regresi.
C. Lebih kecil daripada nilai jumlah kuadrat regresi.
D. Semuanya mungkin benar.

Bagian Kedua
Pilihlah satu jawaban yang paling benar!

Dimiliki data usia (dalam tahun) dan tekanan darah sistolik (dalam
mm Hg) kelompok subjek yang terdiri dari enam orang dewasa sebagai
berikut:
Subjek (i) 1 2 3 4 5 6
Usia ( X i ) 47 52 37 53 65 59
Tekanan darah (Yi ) 135 110 140 120 150 180

1. Nilai harapan usia kelompok tersebut (dalam tahun) adalah:


A. 50.33 C. 55.28
B. 52.17 D. 57.12

146
2. Nilai harapan tekanan darah sistolik mereka (dalam mm Hg) adalah:
A. 122 C. 139
B. 128 D. 145

3. Jika garis regresi tekanan darah sistolik terhadap usia dinyatakan


sebagai Yˆ = β 0 + β1 X dengan variabel Y menyatakan tekanan darah
sistolik dan variabel X menyatakan usia subjek, maka estimasi β 0
adalah:
A. 0.887 C. 36.453
B. 12.757 D. 92.897

4. Estimasi β1 adalah:
A. 0.887 C. 36.453
B. 12.757 D. 92.897

5. Koefisien korelasi antara usia dengan tekanan darah sistolik subjek


adalah:
A. 0.122 C. 0.910
B. 0.349 D. 0.954

6. Jumlah kuadrat regresi adalah:


A. 368.82 C. 2,652.01
B. 663.00 D. 3,020.83

7. Jumlah kuadrat galat adalah:


A. 368.82 C. 2,652.01
B. 663.00 D. 3,020.83

8. Kuadrat rerata galat adalah:


A. 368.82 C. 2,652.01
B. 663.00 D. 3,020.83

9. Koefisien determinasi model regresi di atas adalah:


A. 0.122 C. 0.910
B. 0.349 D. 0.954

10. Untuk subjek berusia 50 tahun, nilai prediksi tekanan darah


sistoliknya (dalam mm Hg) adalah:
A. 112 C. 137
B. 125 D. 150

147
11. ( )
Estimasi standard error β1 [ SEˆ βˆ1 ] adalah:
A. KRG / S x = 30.62 C. KRG / S x = 1.19
B. KRG / S xx = 1.41 D. KRG / S xx = 0.05

12. Pada uji statistik terhadap hipotesis H 0 : β1 = 0 , diperoleh statistik


penguji sebesar:
A. tuji = 0.746 C. Keduanya benar
B. Fuji = 0.556 D. Keduanya salah

13. Dengan tingkat signifikansi α = 0.05, nilai kritis bagi uji hipotesis
pada soal No. 12 di atas adalah:
A. t = 2.776 C. Keduanya benar.
B. F = 7.709 D. Keduanya salah.

14. Pada uji hipotesis H 0 : ρ = 0 , kesimpulan yang diperoleh ialah:


A. Pada tingkat signifikansi α = 0.05 , H 0 tidak ditolak
B. Pada tingkat signifikansi α = 0.05 , H 0 ditolak
C. Keduanya benar
D. Keduanya salah

Bagian Ketiga
Pilihlah satu jawaban yang paling benar!
Data berikut menyatakan nilai tes keterampilan (X) dan produktivitas
kerja per minggu (Y) 8 orang karyawan.

Siswa (i) 1 2 3 4 5 6 7 8
Tes keterampilan ( X i ) 6 9 3 8 7 5 8 10
Produktivitas kerja (Yi ) 30 49 18 42 39 25 41 52

148
1. Jika garis regresi produktivitas kerja terhadap nilai tes keterampilan
dinyatakan sebagai Yˆ = β 0 + β1 X dengan variabel Y menyatakan
produktivitas kerja dan variabel X menyatakan nilai tes keterampilan,
maka estimasi β 0 adalah:
A. 0.982 C. 1.028
B. 0.991 D. 5.139

2. Estimasi β1 adalah:
A. 0.982 C. 1.028
B. 0.991 D. 5.139

3. Koefisien korelasi antara nilai tes masuk dengan nilai ujian akhir
siswa adalah:
A. 0.982 C. 1.028
B. 0.991 D. 5.139

4. Koefisien determinasi model regresi di atas adalah:


A. 0.982 C. 1.028
B. 0.991 D. 5.139

5. Nilai harapan produktivitas kerja jika nilai tes keterampilan = 8


adalah:
A. 41.00 C. 42.14
B. 41.50 D. 42.28

6. Jumlah kuadrat regresi (regression sum of squares) adalah:


A. 2.88 C. 950.69
B. 17.31 D. 968.00

7. Jumlah kuadrat galat (error sum of squares) adalah:


A. 2.88 C. 950.69
B. 17.31 D. 968.00

8. Kuadrat rerata galat (error mean squares) adalah:


A. 2.88 C. 950.69
B. 17.31 D. 968.00

149
9. ( )
Estimasi standard error β1 [ SEˆ βˆ1 ] adalah:
A. KRG / S x = 0.48 C. KRG / S x = 0.28
B. KRG / S xx = 0.08 D. KRG / S xx = 0.05

10. Pada uji statistik terhadap hipotesis H 0 : β1 = 0 , diperoleh statistik


penguji sebesar:
A. tuji = 18.16 C. Keduanya benar
B. Fuji = 329.61 D. Keduanya salah

11. Pada uji F, daerah kritis uji hipotesis H 0 : β1 = 0 adalah:


A. F > 5.99 untuk α = 0.05; F > 12.25 untuk α = 0.01
B. F > 5.99 untuk α = 0.05; F > 13.74 untuk α = 0.01
C. ` F > 234 untuk α = 0.05; F > 5,859 untuk α = 0.01
D. F > 237 untuk α = 0.05; F > 5,928 untuk α = 0.01

12. Berdasarkan nilai statistik penguji, tersebut maka pada uji F terhadap
H 0 : β1 = 0 disimpulkan bahwa H 0 :
A. Ditolak pada α = 0.01 dan pada α = 0.05
B. Ditolak pada α = 0.01; tidak ditolak pada α = 0.05
C. Tidak ditolak pada α = 0.01; ditolak pada α = 0.05
D. Tidak ditolak pada α = 0.01 dan pada α = 0.05

150
BAB 5
ANALISIS REGRESI LINEAR II

5.1. ANALISIS REGRESI LINEAR GANDA

 Model dan Estimasi Parameter


Bentuk umum dengan (p – 1) variabel independen (p menyatakan
jumlah koefisien regresi ) adalah:
Yi = β 0 + β1 X1i + . . . + β p −1 X + εi (5.1)
( p −1);i

Contoh 5.1:
Contoh model dengan 2 variabel independen yaitu:
Yi = β 0 + β1 X1i + β 2 X 2i + ε i
Persamaan garis regresi-nya adalah:
Yˆi = β 0 + β1 X1i + β 2 X 2i

Yi : Tinggi badan anak


X1i : Tinggi badan ayah
X 2i : Tinggi badan ibu
Estimasi koefisien regresi diperoleh dengan metode kuadrat kecil
(least square method; ordinary least square; OLS) dan perhitungannya
secara operasional dapat dilakukan dengan menggunakan:
1. Metode eliminasi
2. Aljabar matriks
3. Program statistika komputer

Catatan:
Dalam aljabar matriks diperhitungkan adanya p variabel independen,
yaitu dengan menggunakan variabel X 0 yang nilainya selalu sama dengan 1,
sehingga model yang digunakan dapat dituliskan sebagai:

151
Yi = β 0 X 0 + β1 X1i + . . . + β p −1 X + εi
( p −1);i

 Metode Kuadrat Terkecil (Least Square Method; Ordinary


Least Square / OLS)

a. Regresi linear sederhana


Misalkan dimiliki estimasi model dan garis regresi-nya:
Yi = b0 + b1 X i + ei (5.2.a)
Yˆi = b0 + b1 X i (5.2.b)

Maka residual ei adalah:


ei = Yi − Yˆi (5.3)
= Yi − b0 − b1 X i
2
Misalkan: Q = ∑ ei2 = ∑ (Yi − b0 − b1 X i ) (5.4)
∂Q ∂Q
Qmin jika: =0 dan =0 (5.4.a)
∂b0 ∂b1
∂Q
= 2 ∑ (Yi − b0 − b1 X i ) ( −1)
∂b0
= −2 ∑ (Yi − b0 − b1 X i ) = 0
n b0 + b1 ∑ X i − ∑ Yi = 0 (I)
∂Q
= 2 ∑ (Yi − b0 − b1 X i ) ( −1X i )
∂b1
= −2 ∑ ( X i ) (Yi − b0 − b1 X i ) = 0
b0 ∑ X i + b1 ∑ X i2 − ∑ X iYi = 0 (II)

Persamaan I dan II disebut sebagai ‘persamaan normal’. Dengan


menyelesaikan persamaan normal I dan II:
n b0 + b1 ∑ X i − ∑ Yi = 0 (I)
b0 ∑ X i + b1 ∑ X i2 − ∑ X iYi = 0 (II)
diperoleh rumus b1 (dan b0 ).

152
b. Regresi linear ganda dengan 2 variabel independen (p = 3)
Misalkan dimiliki estimasi model dan garis regresi:
Yi = b0 + b1 X1i + b2 X 2i + ei (5.5.a)

Yˆi = b0 + b1 X1i + b2 X 2i (5.5.b)


maka residual ei adalah:
ei = Yi − Yˆi
= Yi − b0 − b1 X1i − b2 X 2i
2
Misalkan: Q = ∑ ei2 = ∑ (Yi − b0 − b1 X1i − b2 X 2i ) (5.6)
∂Q ∂Q ∂Q
Qmin jika: =0, = 0 , dan =0 (5.6.a)
∂b0 ∂b1 ∂b2
∂Q
= 2 ∑ (Yi − b0 − b1 X1i − b2 X 2i ) ( −1)
∂b0
= −2 ∑ (Yi − b0 − b1 X1i − b2 X 2i ) = 0

n b0 + b1 ∑ X1i + b2 ∑ X 2i − ∑ Yi = 0 (I)
∂Q
= 2 ∑ (Yi − b0 − b1 X1i − b2 X 2i )( − X1i )
∂b1
= −2 ∑ ( X1i )(Yi − b0 − b1 X1i − b2 X 2i ) = 0

b0 ∑ X1i + b1 ∑ X 1i2 + b2 ∑ X1i X 2i − ∑ X1iYi = 0 (II)


∂Q
= 2 ∑ (Yi − b0 − b1 X1i − b2 X 2i )( − X 2i )
∂b2
= −2 ∑ ( X 2i )(Yi − b0 − b1 X1i − b2 X 2i ) = 0

b0 ∑ X 2i + b1 ∑ X1i X 2i + b2 ∑ X 2i2 − ∑ X 2iYi = 0 (III)

Dengan menyelesaikan persamaan normal I, II, dan III (metode eliminasi):


n b0 + b1 ∑ X1i + b2 ∑ X 2i − ∑Y = 0 i (I)
b0 ∑ X1i + b1 ∑ X1i2 + b2 ∑ X1i X 2i − ∑ X1iYi = 0 (II)
b0 ∑ X 2i + b1 ∑ X1i X 2i + b2 ∑ X 2i2 − ∑ X 2iYi = 0 (III)
diperoleh nilai-nilai b0 , b1 , dan b2 .

153
c. Regresi linear ganda dengan 3 variabel independen (p = 4)
Misalkan dimiliki estimasi model dan garis regresi:
Yi = b0 + b1 X1i + b2 X 2i + b3 X 3i + ei (5.7.a)

Yˆi = b0 + b1 X1i + b2 X 2i + b3 X 3i (5.7.b)

Seperti cara di atas, dengan memisalkan Q = ∑ ei2 dan menyamakan


derivat parsial-nya terhadap b0 , b1 , b2 dan b3 masing-masing sama dengan
nol, diperoleh empat persamaan normal I, II, III, dan IV:
n b0 + b1 ∑ X1i + b2 ∑ X 2i + b3 ∑ X 3i − ∑Y = 0 i (I)

b0 ∑ X1i + b1 ∑ X 1i2 + b2 ∑ X1i X 2i + b3 ∑ X1i X 3i − ∑ X1iYi = 0 (II)

b0 ∑ X 2i + b1 ∑ X1i X 2i + b2 ∑ X 2i2 + b3 ∑ X 2i X 3i − ∑ X 2iYi = 0 (III)

b0 ∑ X 3i + b1 ∑ X1i X 3i + b2 ∑ X 2i X 3i + b3 ∑ X 3i2 − ∑ X 3iYi = 0 (IV)

yang selanjutnya diselesaikan dengan metode eliminasi, sehingga


menghasilkan nilai-nilai b0 , b1 , b2 , dan b3 .

 Metode Eliminasi

Contoh 5.2:
Misalkan dimiliki data seperti pada tabel 5.1 berikut:

Tabel 5.1. Contoh data untuk peragaan metode eliminasi pada analisis
regresi linear ganda

i 1 2 3 4 5 6
Yi 26 31 26 38 18 27
X1i 2 6 6 11 1 1
X 2i 5 5 8 5 12 6

154
i 7 8 9 10 11 12
Yi 26 26 32 25 40 26
X1i 4 6 4 4 10 2
X 2i 7 9 4 8 5 3

n = 12 ∑ X1i = 57 ∑ X 2i = 77
∑ Yi = 341 2
∑ X 1i = 387
2
∑ X 2i = 563
∑ X1i X 2i = 347 ∑ X1iYi = 1,797 ∑ X 2iYi = 2,083
Dengan menyelesaikan:
n b0 + b1 ∑ X1i + b2 ∑ X 2i − ∑Y = 0 i (I)
b0 ∑ X1i + b1 ∑ X 1i2 + b2 ∑ X1i X 2i − ∑ X1iYi = 0 (II)
b0 ∑ X 2i + b1 ∑ X1i X 2i + b2 ∑ X 2i2 − ∑ X 2iYi = 0 (III)

yaitu:
12 b0 + 57 b1 + 77 b2 − 341 = 0 (I)
57 b0 + 387 b1 + 347 b2 − 1,797 = 0 (II)
77 b0 + 947 b1 + 563 b2 − 2,083 = 0 (III)
Diperoleh penyelesaian:
(I) ×19 ⇒ 228 b0 + 1,083 b1 + 1,463 b2 − 6,479 = 0
(II) × 4 ⇒ 228 b0 + 1,548 b1 + 1,388 b2 − 7,188 = 0
−465 b1 + 75 b2 + 709 = 0 (IV)
(I) ×77 ⇒ 924 b0 + 4,389 b1 + 5,929 b2 − 26,257 = 0
(III) × 12 ⇒ 924 b0 + 4,164 b1 + 6,756 b2 − 24,996 = 0
225 b1 − 827 b2 − 1,261 = 0 (V)
(IV) × −15 ⇒ 6,975 b1 − 1,125 b2 − 10,635 = 0
(V) × 31 ⇒ 6,975 b1 −25,637 b2 −39,091 = 0
24,512 b2 +28,456 = 0
b2 = −1.161
(V) ⇒ 225 b1 − (827)(−1.161) – 1.261 = 0
225 b1 + 960.065 – 1.261 = 0
b1 = 1.337

155
(I) ⇒ 12 b0 + (57)(1.337) + (77)(−1.161) − 341 = 0
12 b0 + 76.237 – 89.389 − 341 = 0
b0 = 29.513
Estimasi persamaan garis regresi adalah:
Yˆi = 29.513 + 1.337 X1i − 1.161 X 2i

Sebagai bahan perbandingan, pada bagan 5.1 diperlihatkan hasil


pengolahan data yang sama dengan progam komputer Minitab Release 14.

Bagan 5.1. Contoh keluaran program komputer untuk analisis regresi


linear ganda: estimasi koefisien regresi

Regression Analysis: Y versus X1, X2

The regression equation is

Y = 29.5 + 1.34 X1 - 1.16 X2


Predictor Coef SE Coef T P
Constant 29.513 2.112 13.97 0.000
X1 1.3375 0.1945 6.88 0.000
X2 -1.1609 0.2527 -4.59 0.001

S = 2.05089 R-Sq = 90.5% R-Sq (adj) = 88.3%

 Penguraian Jumlah Kuadrat dan Uji Hipotesis


A. Jumlah Kuadrat

1. Jumlah Kuadrat Total:


2
JKT = ∑ (Yi − Y )
2
2 ( ∑ Yi )
JKT = ∑ Yi − ; db = n – 1 (5.8)
n
2. Jumlah Kuadrat Galat
2
(
JKG = ∑ ei2 = ∑ Yi − Yˆi )
JKG = ∑ Yi 2 − b0 ∑ Yi − b1 ∑ X1iYi − . . . − b p −1 ∑ X ( p −1),iYi (5.9)

156
db = n – p
3. Jumlah Kuadrat Regresi:
JKR = JKT − JKG ; db = p – 1 (5.10)

B. Uji hipotesis
Untuk menguji hipotesis H 0 : β1 = β 2 = . . . = β p −1 = 0 digunakan
uji F dengan statistik penguji:
JKR ( p − 1)
Fuji = (5.11)
JKG ( n − p )

yang berdistribusi F dengan db pembilang (p – 1) dan db penyebut (n – p).

Tabel 5.2 Tabel ANOVA untuk uji H 0 : β 1 = β 2 = . . . = β p-1 = 0


Sumber Fuji
JK db KR Ftabel
variasi
JKR KRR
Regresi JKR p−1 Fuji = F( p−1),( n− p );α
KRR = p − 1 KRG
JKG
Galat JKG n–p
KRG = n − p
Total JKT n−1

Pengujian terhadap masing-masing koefisien regresi ( H 0 : βi = 0)


dapat dilakukan dengan uji Wald dengan statistik penguji:

βˆ j
tuji = (5.12)
( )
SEˆ βˆ j

yang berdistribusi t dengan derajat bebas 1. Nilai-nilai SEˆ βˆ j ( ) umumnya


diperoleh dari keluaran program komputer (lihat contoh pada bagan 5.1).

Contoh 5.3:
Lihat kembali data pada contoh 5.2. Perhitungan jumlah kuadrat dan
kuadrat rerata-nya adalah:

157
2
2 ( ∑ Yi )
JKT = ∑ Yi −
n
3412
= 10,087 − = 396.917
12
JKG = ∑ Yi 2 − b0 ∑ Yi − b1 ∑ X1iYi − b2 ∑ X 2iYi
= 10,087 – (29.513)(341) – (1.337)(1,797) – (−1.161)(2,083)
= 37.885
JKR = JKT – JKG
= 396.917 – 37.885 = 359.061
JKR
dan: KRR =
p −1
359.061
= = 179.531
2
JKG
KRG =
n− p
37.855
= = 4.206
9
Tabel ANOVA-nya dan uji F untuk hipotesis H 0 : β1 = β 2 = 0
dengan tingkat signifikansi α = 0.05 diperlihatkan pada tabel 5.3.

Tabel 5.3 Tabel ANOVA untuk model regresi


Yi = 29.513 + 1.337 X 1i − 1.161 X 2i + ei

Sumber Fuji
JK db KR Ftabel
variasi
179.531 F( 2,9;0.05) =
Regresi 359.061 2 179.531 Fuji =
4.206
Galat 37.855 9 4.206 = 42.68 4.26
Total 396.917 11

Sebagai perbandingan, pada bagan 5.2 diperlihatkan hasil pengolahan


data yang sama dengan progam komputer Minitab Release 14.

158
Bagan 5.2. Contoh keluaran program komputer untuk analisis regresi
linear ganda: tabel ANOVA

Regression Analysis: Y versus X1, X2

Anal ysis of Variance

Source DF SS MS F P
Regression 2 359.06 179.53 42.68 0.000
Residual Error 9 37.86 4.21
Total 11 396.92

Source DF Seq SS
X1 1 270.26
X2 1 88.80

 Koefisien Determinasi Ganda


Koefisien determinasi ganda menyatakan proporsi variansi Y yang
dapat dijelaskan oleh (p − 1) variabel independen secara bersama.
JKR JKT − JKG JKG
R2 = = =1− (5.13)
JKT JKT JKT

Contoh 5.4:
Lihat kembali data pada contoh 5.2. Pada contoh 5.3 telah dihitung
nilai-nilai jumlah kuadrat-nya:
JKR = 359.061 JKT =396.917
JKR
R2 =
JKT
359.061
= = 0.905
396.917
(pada keluaran program komputer di bagian akhir contoh 5.2, nilai koefisien
determinasi R 2 adalah 90.5%)

159
5.2 VARIABEL INDIKATOR

 Pengertian Variabel Indikator


Variabel-variabel pada model regresi linear dalam pembahasan
terdahulu, baik variabel independen maupun dependen selalu berskala
kontinu ataupun sekurang-kurangnya numerik. Adakalanya harus digunakan
variabel independen ataupun dependen yang berskala kategorik, baik
dikotomi ataupun politomi. Inklusi variabel independen yang berskala
kategorik dalam model regresi linear harus dilakukan dalam bentuk variabel
indikator (variabel dummy), sedangkan jika variabel dependen yang berskala
kategorik dianjurkan untuk menggunakan model regresi logistik.
Nilai-nilai bagi variabel indikator hanya dinyatakan sebagai 0 atau 1,
walaupun kadang-kadang yang digunakan adalah nilai +1 dan −1.

 Variabel Indikator bagi Variabel Berskala Dikotomi


Misalkan jenis kelamin yang berskala dikotomi (pria dan wanita)
akan digunakan sebagai variabel independen dalam model regresi linear,
maka digunakan variabel indikator X dengan kriteria nilai:
X = 1 jika subjek berjenis kelamin pria,
X = 0 jika subjek berjenis kelamin wanita

 Variabel Indikator bagi Variabel Berskala Politomi


Variabel kategorik dengan r kategori direpresentasikan sebagai (r –
1) variabel indikator. Representasi variabel indikator untuk variabel
kategorik dengan tiga dan empat kategori diperlihatkan pada tabel 5.4.a dan
5.4.b.

Tabel 5.4. Variabel indikator untuk variabel kategorik


a. Dengan tiga kategori
Variabel indikator
Kategori
X1 X2
I 0 0
II 1 0
III 1 1

160
b. Dengan empat kategori
Variabel indikator
Kategori X1 X2 X3
I 0 0 0
II 1 0 0
III 1 1 0
IV 1 1 1

Contoh 5.5:
Dimiliki data skala L (Lie; Kebohongan) MMPI-2, usia, jenis
kelamin, dan fakultas 8 orang mahasiswa Gunadarma seperti terlihat pada
tabel 5.5. Dari data tersebut hendak diestimasi model regresi linear dengan
skala L sebagai variabel dependen; serta usia, jenis kelamin, dan fakultas
sebagai variabel independen.

Tabel 5.5. Skala L MMPI-2 pada 8 orang mahasiswa Gunadarma, 2002


No. subjek Skala L Usia (th) Jenis kelamin Fakultas
1 6 19 Wanita Psikologi
2 2 18 Pria Teknik Industri
3 8 18 Wanita Ilmu Komputer
4 4 19 Pria Ilmu Komputer
5 3 21 Pria Ekonomi
6 5 21 Pria Ilmu Komputer
7 6 20 Pria Ilmu Komputer
8 6 19 Wanita Ilmu Komputer

Skala L dinyatakan sebagai variabel dependen Y; usia yang berskala


kontinu (dalam tahun) dinyatakan sebagai variabel independen pertama X1 ;
jenis kelamin yang berskala dikotomi dinyatakan sebagai variabel
independen kedua X 2 dengan kriteria:
X2 = 1 untuk mahasiswa pria
X 2 = 0 untuk mahasiswa wanita.
Fakultas yang terdiri atas 4 kategori dinyatakan dengan 3 varibel
indikator X 3 , X 4 , dan X 5 dengan kriteria seperti terlihat pada tabel 5.6.

161
Tabel 5.6. Representasi fakultas mahasiswa Gunadarma dalam bentuk
variabel indikator
Variabel indikator
Fakultas X3 X4 X5
Ilmu Komputer 0 0 0
Ekonomi 1 0 0
Teknik Industri 1 1 0
Psikologi 1 1 1

Model regresi yang digunakan ialah:


Yi = β 0 + β1 X1i + β 2 X 2i + β3 X 3i + β 4 X 4i + β5 X 5i + ε i
Model diestimasi dari basis pada tabel 5.7 yang disusun sebagai representasi
untuk data pada tabel 5.5.

Tabel 5.7. Basis data skala L MMPI-2 8 orang mahasiswa Gunadarma,


2002
No. Y X1 X2 X3 X4 X5
1 6 19 0 1 1 1
2 2 18 1 1 1 0
3 8 18 0 0 0 0
4 4 19 1 0 0 0
5 3 21 1 1 0 0
6 5 21 1 0 0 0
7 6 20 1 0 0 0
8 6 19 0 0 0 0

5.3 KOEFISIEN KORELASI GANDA DAN KOEFISIEN


KORELASI PARSIAL

 Koefisien Korelasi Ganda


Koefisien korelasi ganda menyatakan:
- Korelasi antara variabel dependen Y dengan himpunan (p – 1) variabel
independen secara bersama, yaitu Y dengan { X1 , X 2 , . . . , X p −1 };
atau:

162
- Korelasi antara variabel independen Y dengan prediksi Y yang
dihasilkan oleh model regresi ganda dengan (p – 1) variabel
independen, yaitu Y dengan Yˆ .

rYYˆ = ry 1, 2, . . . ,( p −1) =
(
∑ (Yi − Y ) Yˆi − Yˆ ) (5.14.a)
 2 2

 ∑ (Yi − Y )   ∑ Yi − Y

ˆ ˆ
( ) 
∑ YiYˆi −
∑ Yi ∑ Yˆi ( )
atau: rYYˆ = n (5.14.b)
 2  ∑ Yˆi ( ) 2 
2 ( ∑ Yi )
 ∑ Yi −   ∑ Yˆi 2 − 
 n  n 
  

Nilai kuadratnya sama dengan koefisien determinasi ganda:


2
(r ) = (r )
2
YYˆ y 1, 2, . . . ,( p −1)
= R2 (5.15)

Contoh 5.6:
Lihat kembali data pada contoh 5.2 dan estimasi persamaan garis
regresinya Yˆi = 29.513 + 1.337 X1i − 1.161 X 2i . Untuk menghitung koefisien
korelasi gandanya terlebih dahulu dihitung nilai-nilai prediksi Yˆ dengan i
menggunakan persamaan garis regresi estimasi tersebut dan hasilnya
diperlihatkan pada tabel 5.8. serta diagram 5.1.

Tabel 5.8. Daftar nilai variabel dependen Yi dan prediksinya untuk


contoh perhitungan koefisien korelasi ganda
i 1 2 3 4 5 6
Yi 26 31 26 38 18 27

i 26.38 31.73 28.25 38.42 16.92 23.88

i 7 8 9 10 11 12
Yi 26 26 32 25 40 26

i 26.74 27.09 30.22 25.58 37.08 28.70

163
Diagram 5.1. Diagram tebar variabel dependen Y dan nilai-nilai
prediksinya Yˆ

Korelasi antara Y dan Yˆi dapat dihitung dengan menggunakan rumus


korelasi ataupun dengan regresi linear:
rYYˆ = 0.9511
Koefisien determinasi ganda adalah:
2
( )
R 2 = rYYˆ

= 0.95112 = 0.905
Atau sebaliknya, koefisien korelasi ganda dapat dihitung sebagai akar positif
koefisien determinasi ganda. Pada contoh 5.4 telah dihitung nilai koefisien
determinasi ganda:
R 2 = 0.905
rYYˆ = R2

164
= 0.905 = 0.9511

 Koefisien Korelasi Parsial


Koefisien korelasi parsial menyatakan korelasi antara variabel
dependen Y dengan salah satu variabel independen X j yang disesuaikan
dengan (memperhitungkan keberadaan satu atau lebih) variabel independen
lainnya:
Misalnya pada persamaan garis regresi:
Yˆi = β0 + β1 X1i + β2 X 2i + β3 X 3i
1. Korelasi antara variabel dependen Y dan variabel independen X1
dengan memperhitungkan pengaruh variabel independen X 2 adalah:
ry1 − ry 2 . r12
ry1 2 = (5.16.a)
(1 − ry22 )( 1 − r122 )
ry1 : Koefisien korelasi antara Y dan X1
ry 2 : Koefisien korelasi antara Y dan X 2
r12 : Koefisien korelasi antara X1 dan X 2
2. Korelasi antara variabel dependen Y dan variabel independen X1
dengan memperhitungkan pengaruh variabel independen X 3 adalah:
ry1 − ry 3 . r13
ry13 = (5.16.b)
( )(
1 − ry23 1 − r132 )
3. Korelasi antara variabel dependen Y dan variabel independen X1
dengan memperhitungkan pengaruh variabel independen X 2 dan X 3
secara bersama adalah:
ry12 − ry 3 2 . r13 2 ry13 − ry 2 3 . r12 3
ry1 23 = = (5.16.c)
( )(
1 − ry23 2 1 − r132 2 ) ( )(
1 − ry22 3 1 − r122 3 )
ry1 : Koefisien korelasi antara Y dan X1
ry 2 : Koefisien korelasi antara Y dan X 2
r12 : Koefisien korelasi antara X1 dan X 2

165
Contoh 5.7:
Misalkan dari persamaan regresi Yˆi = b0 + b1 X1i + b2 X 2i + b3 X 3i
diketahui matriks korelasi Y, X1 , X 2 , dan X 3 :

Tabel 5.9. Contoh penyajian matriks korelasi Y, X 1 , X 2 , dan X 3 untuk


perhitungan koefisien korelasi parsial

Y X1 X2 X3
Y 1.00
X1 0.64 1.00
X2 0.51 0.27 1.00
X3 0.74 0.56 0.28 1.00

Maka:
ry1 − ry 2 . r12 r13 − r12 . r23
ry1 2 = r13 2 =
(1 − r ) (1 − r )
2
y2
2
12 (1 − r122 )(1 − r232 )
0.64 − ( 0.51)( 0.27 ) 0.56 − ( 0.27 )( 0.28 )
=
(1 − 0.51 )(1 − 0.27 )
2 2 =
(1 − 0.27 )(1 − 0.28 )
2 2

= 0.61 = 0.52
ry1 − ry 3 . r13 ry 3 − ry 2 . r23
ry13 = ry 3 2 =
(1 − r 23 ) (1 − r132 )
y (1 − r 22 ) (1 − r232 )
y

0.64 − ( 0.74 )( 0.56 ) 0.74 − ( 0.51)( 0.28 )


=
(1 − 0.74 )(1 − 0.56 )
2 2 =
(1 − 0.51 )(1 − 0.28 )
2 2

= 0.40 = 0.72
ry12 − ry 3 2 . r13 2
ry1 23 =
(1 − r )(1 − r )
2
y3 2
2
13 2

0.61 − ( 0.72 )( 0.52 )


= 0.39
=
(1 − 0.72 )(1 − 0.52 )
2 2

166
LAMPIRAN 5A: MODEL REGRESI LOGISTIK

Dalam bab 5, subbab 5.2 telah dibahas mengenai penggunaan


variabel indikator untuk merepresentasikan variabel independen kategorik
dalam model regresi linear. Adakalanya dalam model regresi didapatkan juga
variabel dependen kategorik, baik yang berskala dikotomi ataupun politomi.
Dalam keadaan demikian, model regresi yang digunakan bukan lagi model
regresi linear sebagaimana yang telah dibahas dalam bab 4 dan 5, melainkan
model regresi logistik (model logit).

Model regresi logistik sederhana (simple logistic regression), dengan


satu variabel independen X dan variabel dependen Y berskala dikotomi
adalah:

 P (Y ) 
logit P (Y ) = ln   = β 0 + β1 X (5.17)
 1 − P ( Y ) 

1
atau: P (Y ) = (5.17.a)
1 + exp − ( β 0 + β1 X )

dengan P (Y ) menyatakan probabilitas bahwa variabel dependen Y bernilai


sama dengan satu.

Apabila variabel independen X lebih daripada satu, digunakan model


regresi logistik ganda (multiple logistic regression):

 P (Y ) 
logit P (Y ) = ln   = β 0 + β1 X1 + . . . + β p −1 X p −1
 1 − P ( Y ) 

1
atau: P (Y ) = (5.18.a)
(
1 + exp − β0 + β1 X1 + ... + β p −1 X p −1 )

167
Jika variabel dependen Y berskala politomi, digunakan model regresi
politomi yang dibedakan atas:
- Model regresi logistik multinomial: digunakan jika variabel dependen Y
berskala politomi nominal.
- Model regresi logistik ordinal: digunakan jika variabel dependen Y
berskala politomi ordinal.

Untuk estimasi koefisien regresi pada model regresi logistik, yang


digunakan bukan metode kuadrat terkecil, melainkan metode likelihood
maksimum (maximum likelihood method), yaitu pencarian nilai parameter
yang jika dimasukkan dalam model akan memaksimumkan probabilitas
untuk memperoleh distribusi nilai sebagaimana yang ada dalam sampel.

Estimasi koefisien regresi dengan metode likelihood maksimum tak


dapat dilakukan dengan menggunakan rumus-rumus yang relatif sederhana
seperti pada estimasi koefisien model regresi linear dengan metode kuadrat
kecil. Di sini diperlukan proses iterasi yang cukup panjang menggunakan
program komputer.

Contoh V.I:
Dimiliki data nyeri kepala pada 218 orang mahasiswa Gunadarma
dengan variabel dependen NKTT (nyeri kepala ada / NKTT = 1; nyeri kepala
tidak ada / NKTT = 0). Sebagai variabel independen digunakan variabel
Usia (dalam tahun), Sex (jenis kelamin pria / Sex = 1; jenis kelamin wanita
/ Sex = 0), dan BMI (indeks massa tubuh; dalam kg/m2). Hasil pengolahan
data yang menggunakan model regresi logistik ganda dengan program Stata
8.0 diperlihatkan pada bagan V.1 di bawah ini.

168
Bagan V.I Contoh keluaran progam komputer untuk analisis regresi
logistik ganda dengan program komputer Stata 8.0

. logit NKTT Usia Sex BMI

Iteration 0: log likelihood = -151.09691


Iteration 1: log likelihood = -148.66589
Iteration 2: log likelihood = -148.66472

Logit estimates Number of obs = 218


LR chi2(3) = 4.86
Prob>chi2 = 0.1820
Log likelihood = -148.66472 Pseudo R2 = 0.0161

NKTT Coef. Std. Err. z P>|z| [95%Conf.Interval]


Usia 0.1399613 0.1132984 1.24 0.217 -0.0820994 0.3620219
Sex -0.3150595 0.3001361 -1.05 0.294 -0.9033155 0.2731965
BMI 0.0521261 0.0371095 1.40 0.160 -0.0206072 0.1248594
_cons -3.658059 2.386413 -1.53 0.125 -8.335342 1.019224

169
LATIHAN 5
Bagian Pertama
Pilihlah satu jawaban yang paling benar !
1. Estimasi koefisien regresi pada model regresi linear dilakukan
dengan:
A. Meminimumkan kuadrat jumlah residual
B. Meminimumkan jumlah kuadrat residual
C. Memaksimumkann kuadrat jumlah residual
D. Memaksimumkan jumlah kuadrat residual

2. Residual dalam diagram tebar menyatakan jarak dari titik tebar ke


garis regresinya, yang diukur sebagai:
A. Jarak dari titik tebar tegak lurus ke garis regresi.
B. Jarak dari titik tebar dalam arah vertikal ke garis regresi.
C. Jarak dari titik tebar dalam arah horizontal ke garis regresi.
D. Semuanya salah

3. Aplikasi metode kuadrat terkecil terhadap persamaan garis regresi


Yˆi = β 0 + β1 X 1i + β 2 X 2i akan menghasilkan:
A. Dua persamaan normal
B. Tiga persamaan normal
C. Empat persamaan normal
D. Semuanya salah

4. Jumlah kuadrat total pada model regresi linear ganda adalah:


A. Kuadrat jumlah deviasi variabel dependen terhadap reratanya
B. Kuadrat jumlah deviasi variabel independen terhadap reratanya
C. Jumlah kuadrat deviasi variabel dependen terhadap reratanya
D. Jumlah kuadrat deviasi variabel independen terhadap reratanya

5. Jumlah kuadrat galat pada model regresi linear ganda adalah:


A. Kuadrat jumlah residual variabel dependen
B. Kuadrat jumlah residual variabel independen
C. Jumlah kuadrat residual variabel dependen
D. Jumlah kuadrat residual variabel independen

170
6. Untuk menguji hipotesis H 0 : β1 = β 2 = ... = β p −1 = 0 pada model
regresi linear ganda digunakan:
A. Uji t C. Uji F
B. Uji Wald D. Semuanya benar

7. Pada model regresi Yi = β 0 + β1 X 1i + β 2 X 2i + β 3 X 3i + ei dengan ukuran


sampel n = 25, derajat bebas untuk jumlah galat-nya adalah:
A. 3 C. 22
B. 21 D. 24

8. Proporsi variansi dependen pada model regresi linear ganda yang


dapat dijelaskan oleh seluruh variabel independen yang ada dalam
model secara bersama dinamakan:
A. Koefisien korelasi biserial C. Koefisien korelasi ganda
B. Koefisien korelasi parsial D. Korelasi determinasi ganda

9. Variabel kategorik yang direpresentasikan oleh empat variabel


indikator dalam suatu model regresi linear memiliki:
A. Tiga kategori C. Lima kategori
B. Empat kategori D. Semuanya salah

10. Korelasi antara variabel dependen pada model regresi linear ganda
dengan himpunan keseluruhan variabel independen yang ada dalam
model secara bersama dinamakan :
A. Koefisien korelasi biserial C. Koefisien korelasi ganda
B. Koefisien korelasi parsial D. Korelasi determinasi ganda

11. Nilai koefisien korelasi ganda sama dengan:


A. Akar positif koefisien determinasi ganda
B. Akar negatif koefisien determinasi ganda
C. Koefisien determinasi ganda
D. Kuadrat koefisien determinas ganda

12. Korelasi antara variabel dependen pada model regresi linear ganda
dengan salah satu variabel independen dengan memperhitungkan
keberadaan variabel independen lain dalam model dinamakan:
A. Koefisien korelasi biserial C. Koefisien korelasi ganda
B. Koefisien korelasi parsial D. Korelasi determinasi ganda

171
Bagian Kedua

Pilihlah satu jawaban yang paling benar !


Dimiliki data tentang kepuasan kerja pada sekelompok karyawan
universitas swasta di Jakarta yang akan diolah dengan model regresi linear
ganda. Variabel dependen yaitu kepuasan kerja (KEPUASAN) akan
diregresikan terhadap variabel independen pusat pengendalian (locus of
control; LOCUS), pola perilaku (pattern of behavior; POLA), dan
pemenuhan harapan penggajian (PHP). Data diolah dengan program SPSS
12.0, dan keluarannya diperlihatkan pada bagan-bagan di bawah ini.

Model Summary

Adjusted R Std. Error of


Model R R Square Square the Estimate
1 .834(a) .696 .684 9.725

ANOVA(b)

Sum of
Model Squares df Mean Square F Sig.
1 Regression 17298.096 3 5766.032 60.963 .000(a)
Residual 7566.607 80 94.583
Total 24864.702 83
a Predictors: (Constant), PHP, POLA, LOCUS
b Dependent Variable: KEPUASAN

Coefficients(a)

Unstandardized Standardized
Model Coefficients Coefficients t Sig.
B Std. Error Beta
1 (Constant) -21.340 14.297 -1.493 .139
LOCUS 1.052 .278 .284 3.780 .000
POLA 1.909 .416 .298 4.588 .000
PHP 1.430 .219 .493 6.534 .000
a Dependent Variable: KEPUASAN

172
1. Jumlah karyawan yang menjadi anggota sampel adalah:
A. 60 orang C. 84 orang
B. 80 orang D. 85 orang

2. Jika LOCUS = 0, POLA = 0, dan PHP = 0, maka nilai KEPUASAN


adalah:
A. -21.340 C. 1.909
B. 1.052 D. 1.430

3. Estimasi persamaan garis regresi adalah:


A. KEPUASAN = -21.340 + 1.052 LOCUS + 1.909 POLA + 1.430
PHP
B. KEPUASAN = 14.297 + 0.278 LOCUS + 0.416 POLA + 0.219
PHP
C. KEPUASAN = -1.439 + 3.780 LOCUS + 4.588 POLA + 6.534
PHP
D. Semuanya salah

4. Kuadrat rerata galat adalah:


A. 94.583 C. 7,566.607
B. 5,766.032 D. 17,298.096

5. Derajat bebas jumlah kuadrat regresi adalah:


A. 3 C. 83
B. 80 D. Semuanya salah

6. Koefisien korelasi ganda adalah:


A. 0.684 C. 0.834
B. 0.696 D. Semuanya salah

7. Koefisien determinasi ganda adalah:


A. 0.684 C. 0.834
B. 0.696 D. Semuanya salah

8. Statistik penguji untuk uji hipotesis H 0 : β1 = β 2 = β3 = 0 adalah:


A. 3.780 C. 6.534
B. 4.588 D. 60.963

9. Statistik penguji untuk uji hipotesis H 0 : β 2 = 0 adalah:


A. 3.780 C. 6.534
B. 4.588 D. 60.963

173
10. Dengan tingkat signifikansi α = 0.01, maka kesimpulan bagi uji
hipotesis H 0 : β1 = β 2 = β3 = 0 adalah:
A. H 0 ditolak
B. H 0 tidak ditolak
C. A) dan B) keduanya mungkin benar
D. Tak dapat dibuat kesimpulan

174
BAB 6
ANALISIS VARIANSI

Analisis variansi (analysis of variance; ANOVA) adalah metode


statistika untuk menganalisis hubungan antara:
 Variabel independen kategorik yang jumlah kategorinya lebih daripada
dua dengan:
 Variabel dependen numerik.
Ikhtisar analisis yang digunakan dalam Metode Statistika Parametrik
untuk mengkaji hubungan antara dua variabel dapat dilihat pada lampiran
6A.
Variabel independen kategorik pada ANOVA dinamakan ‘perlakuan’
(treatment; tritmen) dan masing-masing kategorinya disebut ‘taraf’
perlakuan. Berdasarkan jumlah variabel independennya (jumlah perlakuan),
dikenal analisis variansi 1-arah (one-way ANOVA), analisis variansi 2-arah
(two-way ANOVA), dan seterusnya.

6.1. ANALISIS VARIANSI 1-ARAH

Contoh 6.1:
Beberapa contoh analisis variansi 1-arah yaitu:
a. Misalkan dimiliki lima (k = 5) metode pengajaran dan sejumlah siswa,
maka terdapat lima populasi hipotetis, masing-masing terdiri atas siswa
yang diajar dengan satu metode pengajaran tertentu. Dengan ANOVA
hendak dibandingkan rerata nilai ujian kelima kelompok siswa.
b. Misalkan terdapat tiga (k = 3) kota, hendak dibandingkan rerata
penghasilan bulanan keluarga di tiga kota tersebut.
c. Misalkan dimiliki empat (k = 4) varietas padi, hendak dibandingkan
rerata produksi per ha sawah yang ditanami dengan empat varietas padi
tersebut.

175
 Variansi Dalam-Kelompok dan Variansi Antar-Kelompok
Misalkan dimiliki tiga kelompok data Y1 , Y2 , dan Y3 , ketiganya
berasal dari populasi normal dengan rerata µ1 , µ2 , dan µ3 dan variansi yang
sama σ 2 (diasumsikan σ 12 = σ 22 = σ 32 = σ 2 ). Misalkan pula hendak diuji
apakah ketiga kelompok data Y1 , Y2 , dan Y3 ‘dapat dianggap’ berasal dari
satu populasi yang sama atau berasal dari dua atau lebih populasi yang
berbeda.

Dalam konteks analisis variansi, variansi untuk masing-masing


kelompok data Y1 , Y2 , dan Y3 , yaitu σ 2 disebut sebagai variansi ‘dalam
kelompok’ (within group), sedangkan variansi antar nilai-nilai rerata µ1 , µ2 ,
dan µ3 disebut sebagai variansi ‘antar kelompok’ (between groups).

Semakin ‘terpisah’ ketiga kelompok data Y1 , Y2 , dan Y3 , semakin


besar pula probabilitas bahwa ketiganya berasal dari populasi berbeda ( H0 :
µ1 = µ2 = µ3 ditolak). Pada diagram 6.1 tampak bahwa ketiganya akan
‘terpisah’ jika:
- Variansi antar-kelompok lebih besar,
- Variansi dalam-kelompok lebih kecil;
atau dengan kata lain:
va riansi antar-kelompok
lebih besar
variansi dalam-kelompok

176
Diagram 6.1. Tiga kelompok data yang dapat berasal dari satu populasi
yang sama atau dua/lebih populasi yang berbeda.
Atas: ketiganya berasal dari populasi yang sama, variansi dalam-kelompok
yang besar dan atau variansi antar-kelompok yang kecil.
Bawah: ketiganya berasal dari populasi berbeda, variansi dalam kelompok
kecil dan /atau variansi antar kelompok besar.
Jika yang hendak diuji adalah hipotesis H0 : µ1 = µ2 = µ3 maka H0
akan ditolak ( Y1 , Y2 , dan Y3 dianggap berasal dari populasi berbeda) jika
va riansi antar-kelompok
nilai -nya melebihi nilai tertentu yang ada pada
variansi dalam-kelompok
tabel nilai distribusi sampling.
Pada pembahasan selanjutnya dalam analisis variansi, Y merupakan
satu variabel (variabel dependen) dengan subskrip 1, 2, dan 3 menyatakan
kelompok-kelompok (taraf-taraf perlakuan).

 Model dan Struktur Data


Struktur data pada analisis variansi 1-arah diperlihatkan pada matriks
6.1, yaitu struktur data yang digunakan untuk rancangan randomisasi lengkap
(completely randomized design).

177
Matriks 6.1. Struktur data pada analisis variansi 1-arah
Kategori Kategori (taraf) perlakuan
(taraf) Total
1 2 ... k
perlakuan
y11 y21 yk1
y12 y22 yk 2
Data
... ... ... ...
y1n y2 n yk n
1 2 k

Jumlah
y1 . y2 . yk . y. .
kolom
Ukuran n1 n2 nk
... n
sampel
Rerata y1 y2 yk y
...
sampel
Rerata µ
µ1 µ2 ... µk
populasi
Variansi
s12 s22 ... sk2 s2
sampel

Model pada analisis variansi 1-arah (model dalam populasi) adalah:


Yij = µ + τ 1 + ε ij (6.1)

µ : rerata populasi
τ1 : efek perlakuan ke-i
ε ij : galat pada subjek ke-j dalam kelompok perlakuan ke-i

Estimasi diperoleh dari penguraian nilai observasi yang ada dalam


sampel:
yij = y + ( yi − y ) + ( yij − yi ) (6.2)
atau:
Nilai observasi = rerata utama + deviasi oleh perlakuan + galat
yij : nilai observasi (pada subjek) ke-j dalam kelompok perlakuan ke-i
yi : nilai rerata observasi pada kelompok perlakuan ke-i
y : nilai rerata utama (grand mean)

178
 Penguraian dan Perhitungan Jumlah Kuadrat
Estimasi untuk model pada analisis variansi 1-arah dapat dituliskan
sebagai:
yij − y = ( yi − y ) + ( yij − yi )

Secara matematis dapat dibuktikan bahwa:


k ni k k ni 2
∑∑
i =1 j =1
( yij − y ) 2
= ∑ ( yi − y ) +
i =1
2
∑∑
i =1 j =1
( yij − yi )
JKT = JKP + JKG (6.3)

 Jumlah Kuadrat Total (JKT; total sum of squares; SSTo):


2
 k ni 
k ni k n  ∑∑ yij 
= ∑∑ yij2 −  
i

∑∑
2 i =1 j =1
JKT =
i =1 j =1
( yij − y ) i =1 j =1 n
ni 2
k
( y. . )
JKT = ∑∑
i =1 j =1
yij2 −
n
; db = n – 1 (6.4)

 Jumlah Kuadrat Perlakuan (JKP; treatment sum of squares; SSTr):


2 2
 ni   k ni 
k k
 ∑ y ij   ∑∑ yij 
JKP = ∑ ( yi − y )2 = ∑   −  i =1 j =1 
j =1

i =1 i= j n n
2
k
( yi . )2 ( y. . )
JKP = ∑
i =1 ni

n
; db = k – 1 (6.5)

 Jumlah Kuadrat Galat (JKG, residual sum of squares; error sum of


squares; SSE):
k ni 2
JKG = ∑∑
i =1 j =1
( yij − yi ) = JKT – JKP

JKG = JKT – JKP ; db = (n – 1) – (k – 1) (6.3.a)


db = n − k

179
 Kuadrat Rerata
Kuadrat rerata adalah jumlah kuadrat dibagi derajat bebasnya:
jumlah kuadrat
Kuadrat rerata (mean square) =
derajat bebas
Kuadrat rerata pada analisis variansi merupakan estimator untuk
variansi:
- Kuadrat rerata perlakuan merupakan estimator bagi variansi antar-
kelompok (between-groups variance).
- Kuadrat rerata galat merupakan estimator bagi variansi dalam
kelompok (within-group variance).

 Kuadrat rerata perlakuan (KRP; treatment mean square; MSTr):


JKP
KRP = (6.6)
k -1

 Kuadrat rerata galat (KRG; error mean square; MSE):


JKG
KRG = (6.7)
n-k

Dengan asumsi σ 12 = σ 22 = σ 32 = σ 2 , maka KRG (MSE) merupakan


estimator bagi σ 2 (seperti s 2pooled yang juga menjadi estimator bagi σ 2 pada

uji t dengan variansi sama σ 12 = σ 22 = σ 2 ).

 Tabel ANOVA untuk Analisis Variansi 1-Arah


Hasil perhitungan nilai-nilai jumlah kuadrat, kuadrat rerata, dan
statistik penguji (beserta nilai titik kritis) biasanya disajikan dalam sebuah
tabel ANOVA, yang bentuk umumnya diperlihatkan pada tabel 6.1 di bawah
ini.

180
Tabel 6.1. Tabel ANOVA 1-arah
Sumber Fuji
JK db KR Ftabel
variasi
KRP Fuji
Perlakuan JKP k−1 JKP KRP F( k −1);( n −k );α
= =
k -1 KRG
KRG
Galat JKG n–k JKG
=
n-k
Total JKT n−1

JK: jumlah kuadrat; KR: kuadrat rerata

 Langkah-langkah Uji Hipotesis


Langkah-langkah uji hipotesis pada ANOVA adalah sebagai berikut:
1. Jenis uji statistik: analisis variansi 1-arah.
2. Hipotesis: H 0 : µ1 = µ2 = . . . = µk (6.8.a)
H1 : Tidak semua nilai rerata sama (6.8.b)
atau: µi ≠ µ j untuk paling sedikit satu pasangan nilai (i; j)
3. Tingkat signifikansi: α = 0.01, 0.05, atau 0.10.
4. Daerah kritis: F > F( k −1);( n −k );α (6.9)
5. Statistik penguji:
KRP JKP ( k − 1)
Fuji = = (6.10)
KRG JKG ( n − k )
yang berdistribusi F dengan derajat bebas pembilang (k – 1) dan derajat
bebas penyebut (n – k).
5. Kesimpulan: H 0 ditolak jika statistik uji terletak pada daerah kritis dan
H 0 tidak ditolak jika statistik uji tidak terletak pada daerah kritis.

 Hubungan Antara Analisis Regresi dan Analisis Variansi


Analisis regresi dan analisis variansi sesungguhnya merupakan dua
teknik analisis data yang identik, yang tergolong dalam ‘model linear’.
181
Perbedaannya terletak pada model yang digunakan untuk menjelaskan data.
Analisis regresi menekankan penyajian koefisien regresi serta hubungan
antara variabel independen dan variabel dependen, sedangkan analisis
variansi menekankan penyajian fa faktor-faktor eksperimental, penguraian
jumlah kuadrat-jumlah kuadratt rerata, serta uji hipotesis (lihat diagram 6.2).

Diagram 6.2. Analisis regresi dan analisis variansi.


(a) Analisis regresi:
µ1 = E (Y | X1 = 50), µ2 = E (Y | X 2 = 60), µ3 = E (Y | X 3 = 70).
(b) Analisis variansi: Taraf perlakuan hanya dinyatakan sebagai kelompok
I, II, dan III.
Data yang sama akan memberikan hasil uji hipotesis (nilai (nilai-p) yang
sama pula jikaa diolah baik dengan analisis regresi maupun analisis variansi.

Contoh 6.2:
Untuk membandingkan penghasilan tahunan keluarga (dalam jutaan
rupiah) di tiga kota A, B, dan C, diambil sampel acak masing
masing-masing empat
keluarga dari kota A, kota B, dan kota
ota C. Hasil pengamatan adalah sebagai
berikut:

182
Tabel 6.2. Data penghasilan tahunan keluarga di kota A, B, dan C
Perlakuan Total
1 2 3
19 16 13
18 11 16
21 13 18
18 14 11
yi . 76 54 58 188
∑j yij2 1,450 742 870 3,062

ni 2
k
( y. . )
JKT = ∑∑
i =1 j =1
yij2 −
n

192 182 162 112 1882


= + +...+ +...+ −
1 1 1 1 12
1882
= 3,062 − = 116.67
12
2
k
( yi . )2 ( y. . )
JKP = ∑
i =1 ni

n
762 542 582 1882
= + + − = 68.67
4 4 4 12
JKG = JKT – JKP = 116.67 – 68.67 = 48

Uji hipotesis:
1. Jenis uji statistik: analisis variansi 1-arah
2. Hipotesis: H 0 : µ1 = µ2 = µ3
H1 : Tidak semua nilai rerata sama
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis: F > F2; 9; 0.05 yaitu F > 4.26
5. Statistik penguji:
KRP JKP ( k − 1)
Fuji = =
KRG JKG ( n − k )

183
yang berdistribusi F dengan derajat bebas pembilang (k – 1) = 3 – 1 = 2
dan derajat bebas penyebut (n – k) = 12 – 3 = 9.
Perhitungan: lihat tabel

Tabel 6.3. Tabel ANOVA untuk perbandingan penghasilan tahunan


keluarga di kota A, B, dan C

Sumber variasi JK db KR Fuji Ftabel


Perlakuan 68.67 2 34.33 6.44 4.26
Galat 48 9 5.33
Total 116.67 11

6. Kesimpulan: H 0 ditolak karena Fuji = 6.44 > Ftabel = 4.26, sehingga


dapat disimpulkan bahwa pada tingkat signifikansi 0.05 terdapat
perbedaan yang bermakna secara statistik antara penghasilan tahunan
keluarga di tiga kota A, B dan C.

Catatan:
Pada keputusan untuk menolak H 0 dengan ANOVA hanya dapat
disimpulkan bahwa tidak semua nilai rerata sama, namun untuk mengetahui
nilai rerata mana saja yang berbeda dengan yang lainnya, ataupun nilai rerata
mana yang lebih besar / lebih kecil, harus dilakukan analisis lebih lanjut,
yaitu dengan perbandingan ganda (multiple comparisons; lihat lampiran 6E).

6.2. ANALISIS VARIANSI 2-ARAH DENGAN


INTERAKSI

Contoh 6.3:
Beberapa contoh analisis variansi 2-arah yaitu:
a. Misalkan dimiliki siswa pada tiga sekolah (r = 3) dan empat metode
pengajaran (c = 4) untuk diteliti. Hendak dibandingkan ketiga sekolah,
keempat metode pengajaran, dan dapat pula diteliti kemungkinan efek
interaksi antara sekolah dengan metode pengajaran.
b. Misalkan terdapat tiga kota (r = 3). Pekerja di ketiga kota tersebut
dibedakan menurut jenis kelaminnya (c = 2). Hendak dibandingkan
penghasilan rata-rata pekerja pria dan wanita, penghasilan rata-rata
pekerja di ketiga kota, dan kemungkinan efek interaksi antara kota
dengan jenis kelamin.

184
c. Misalkan dimiliki empat varietas padi (r = 4) dan tiga jenis pupuk (c =
3). Hendak dibandingkan produksi rata-rata per ha sawah yang
ditanami keempat varietas padi, menggunakan ketiga jenis pupuk, serta
kemungkinan interaksi varietas padi dengan jenis pupuk.
Nilai-nilai populasi untuk tiap sel (tiap subkelompok) menurut taraf-
taraf kedua perlakuan secara skematis diperlihatkan pada matriks 6.2 di
bawah ini.
Matriks 6.2. Nilai populasi untuk tiap sel menurut taraf-taraf perlakuan
pada analisis variansi 2-arah
Variabel Variabel kedua
pertama 1 2 ... c
1 µ 11 µ 12 ... µ 1c µ1 .
2 µ 21 µ 22 . µ 2c µ2.
... . . . ... .
r µ r1 µr2 ... µ rc µr .
µ .1 µ .2 ... µ .c µ

µ ij : Rerata bagi anggota populasi yang tergolong dalam taraf ke-i variabel
pertama dan taraf ke-j variabel kedua; i = 1, 2, . . . , r ; j = 1, 2, . . . , c

 Model dan Struktur Data:


 Pada model ini,didapatkan observasi lebih daripada satu per sel: k >1; k
= 1, 2, . . . , h
 Ada estimasi interaksi
 Umumnya digunakan untuk rancangan faktorial r × c (factorial design,
factorial experiment), yaitu dengan melakukan randomisasi terhadap
keseluruhan r × c sel sekaligus.

185
Matriks 6.3. Struktur data pada analisis variansi 2-arah dengan
rancangan faktorial
Variabel Variabel kedua
pertama 1 2 ... c
y111 , y112 , . . y121 , y122 , . . y1c1 , y1c 2 , . .
1 ...
. , y11h . , y12h . , y1ch
y211 , y212 , . . y221 , y222 , . . y2c1 , y2c 2 , . .
2 .
. , y21h . , y22h . , y2ch
... ... . . ...
yr11 , yr12 , . . yr 21 , yr 22 , . . yrc1 , yrc 2 , . .
r ...
. , yr1h . , yr 2h . , yrch

yijk : Nilai observasi ke-k pada sel (i; j); i = 1, 2, . . . , r ; j = 1, 2, . . . , c;


k = 1, 2, . . . , h
• Model (dalam populasi):
Yijk = µ + α i + β j + (αβ )ij + ε ijk (6.11)

• Estimasinya (penguraian nilai observasi dalam sampel):


yijk = y + ( yi − y ) + ( y j − y ) + ( yij − yi − y j + y ) + ( yijk − yij )
(6.12)
atau: Nilai observasi = Rerata utama + Efek faktor A
+ Efek faktor B + Efek interaksi + Galat

 Penguraian dan Perhitungan Jumlah Kuadrat:


yijk − y = ( yi − y ) + ( y j − y ) + ( yij − yi − y j + y )
+ ( yijk − yij )

Secara matematis dapat dibuktikan bahwa:


2 2
∑∑∑ ( yijk − y ) ∑i ( yi − y ) ∑j ( y j − y )
2
= +
i j k

2 2
+ ∑∑
i j
( yij − yi − y j + y ) + ∑∑∑
i j k
( yijk − yij )

186
atau:
Jumlah Kuadrat Total = Jumlah Kuadrat A + Jumlah Kuadrat B
+ Jumlah Kuadrat Interaksi + Jumlah Kuadrat Galat
(6.13)

Didefinisikan:
1) Tij = ∑k yijk : Jumlah observasi pada sel (i; j) (6.14.a)

c
2) yi . = ∑
j =1
Tij : Jumlah observasi baris ke-i variabel A (6.14.b)

r
3) y. j = ∑
i =1
Tij : Jumlah observasi kolom ke-j variabel B (6.14.c)

r c
4) y. . = ∑∑
i =1 j =1
Tij : Jumlah semua observasi (6.14.d)

2
( y.. )
5) C = (6.14.e)
rch

Matriks 6.4. Data jumlah nilai observasi pada tiap sel


B
A
1 2 ... c yi .
1 T11 T12 ... T1c y1 .
2 T21 T22 ... T2c y2 .
... ... ... ... ... .
r Tr1 Tr 2 ... Trc yr .
y. j y .1 y .2 . y .c y. .

Tij : Jumlah (total) nilai observasi pada sel ke-(i; j); i = 1, 2, . . . , r ; j =


1, 2, . . . , c.
yi . : Jumlah nilai observasi taraf (baris) ke-i variabel A; i = 1, 2, . . . , r.
y. j : Jumlah nilai observasi taraf (kolom) ke-j variabel B; j = 1, 2, . . . , c.

187
Selanjutnya dapat dihitung:
1) Jumlah Kuadrat Total:
JKT = ∑∑∑
i j k
2
yijk −C ; db = rch − 1 (6.15)

2) Jumlah Kuadrat A:
2
( yi . )
JKA = ∑i ch
−C ; db = r – 1 (6.16)

3) Jumlah Kuadrat B:
2
( y.j )
JKB = ∑j rh
−C; db = c – 1 (6.17)

4) Jumlah Kuadrat Sel:


Tij2
JKA + JKB + JKAB = ∑∑
i j h
−C ; db = rc – 1 (6.18)

5) Jumlah Kuadrat Interaksi:


JKAB = JK Sel – JKA – JKB ; db = (r – 1)(c – 1) (6.19)
6) Jumlah Kuadrat Galat:
JKG = JKT – (JKA + JKB + JKAB)
JKG = JKT – JK Sel ; db = rc(h – 1) (6.13.a)

188
 Tabel ANOVA untuk Analisis Variansi 2-Arah Dengan Interaksi

Tabel 6.4. Tabel ANOVA 2-arah untuk model dengan interaksi

Sumber variasi JK db KR Fuji Ftabel


JKA KRA F r −1 ; rc
A JKA r–1 KRA = FA = ( ) ( h −1); α
r −1 KRG
JKB KRB F c −1 ; rc
B JKB c–1 KRB = FB = ( ) ( h −1); α
c −1 KRG
JKAB KRAB
Interaksi JKAB (r – 1)(c – 1) KRAB = FAB = F r −1
( r − 1)( c − 1) KRG
( )( c −1); r c( h −1); α
JKG
Galat JKG rc(h – 1) KRG =
rc ( h − 1)
Total JKT rch – 1

189
Contoh 6.4:
Misalkan terhadap 12 ekor tikus percobaan diberikan dua macam diet
(A1 dan A2) serta tiga macam stressor (B1, B2, dan B3), lalu diukur
pertambahan berat badannya (dalam gram) setelah lama periode tertentu.
Diperoleh data sebagai berikut:

Tabel 6.5. Data kenaikan berat badan tikus percobaan untuk variabel A
dan variabel B
Variabel B
Variabel A
1 2 3
1 11, 19, 16 38, 12, 21 37, 53, 53
2 20, 11, 2 27, 20, 26 62, 59, 48

Hasil perhitungan awal untuk melakukan analisis variansi


diperlihatkan pada tabel 6.6.

Tabel 6.6 Tabel nilai Tij dan ∑k yijk2 untuk variabel A dan variabel B

Variabel A
Variabel B
yi . ∑∑ 2
yijk ∑j Tij2
1 2 3 j k

46; 71; 143;


1 260 9,754 27,606
738 2,029 6,987

33; 73; 169;


2 275 11,959 34,979
525 1,805 9,629
y. j 79 144 312 535
∑∑
i k
2
yijk 1,263 3,834 16,616 21,713

∑i Tij2 3,205 10,370 49,010 62,585

Hipotesis nol: H A : α 1 = α 2 = 0
HB : β 1 = β 2 = β 3 = 0
H AB : (αβ )11 = (αβ )12 = (αβ )13 = (αβ )21 = (αβ )22 =
(αβ )23 = 0

190
Perhitungan:
112 192 482 5352
JKT = + +...+ −
1 1 1 18
5352
= 21,713 − = 5,811.61 (db = 17)
18
260 2 2752 5352
JKA = + − = 12.50 (db = 1)
9 9 18
192 1442 312 2 5352
JKB = + + −
6 6 6 18
= 4,818.78 (db = 2)
JK Sel = JKA + JKB + JKAB
46 2 332 1692 5352
= + + . . . + −
3 3 3 18
= 4,960.28 (db = 5)
JKAB = 4,960.28 – (12.50 +4,818.78)
= 129 (db = 2)
JKG = JKT – JK Sel
= JKT – (JKA + JKB + JKAB)
= 5,811.61 – 4,960.28 = 851.33 (db = 12)

Tabel 6.7. Tabel ANOVA untuk variabel A dan variabel B


Ftabel
Sumber variasi JK db KR Fuji
(α = 0.05)
Baris (A) 12.50 1 12.50 0.18 4.75
Kolom (B) 4,818.78 2 2,409.39 33.96 3.89
Interaksi (AB) 129 2 64.50 0.91 3.89
Galat 851.33 12 70.94
Total 5,811.61 17

Sebagai kesimpulan, pada tingkat signifikansi α = 0.05:


- H A tidak ditolak
- H B ditolak
- H AB tidak ditolak

191
6.3. ANALISIS VARIANSI 2-ARAH TANPA INTERAKSI

 Model dan Struktur Data


 Pada model ini, hanya ada satu observasi untuk tiap sel: k = 1
 Tidak ada (tidak dapat dilakukan) estimasi interaksi.
 Umumnya digunakan untuk rancangan blok randomisasi lengkap
(completely randomized block design), yaitu dengan melakukan
randomisasi dalam tiap blok (intra-blok). Perhatikan bahwa dengan tidak
dilakukannya randomisasi antar-blok, penilaian terhadap efek blok tidak
memiliki validasi yang sama dengan penilaian terhadap efek perlakuan.

Matriks 6.5. Struktur data pada analisis variansi 2-arah dengan


rancangan blok randomisasi lengkap
Variabel pertama Variabel kedua (blok)
(perlakuan) 1 2 ... c
1 y11 y12 ... y1c
2 y21 y22 . y2c
... ... . . ...
r yr 1 yr 2 ... yrc

Model:
Yij = µ + α i + β j + ε ij (6.20)

Estimasinya (penguraian nilai observasi) adalah:


yij = y + ( yi − y ) + ( y j − y ) + ( yij − yi − y j + y )
atau:
Nilai observasi = Rerata utama + Efek perlakuan + Efek blok + Galat

 Penguraian dan Perhitungan Jumlah Kuadrat

yij − y = ( yi − y ) + ( y j − y ) + ( yij − yi − y j + y )

Secara sistematis, dapat dibuktikan bahwa:

192
2 2
∑∑ ( yij − y ) ∑∑ ( yi − y ) ∑∑ ( yj − y)
2
= +
i j i j i j

2
+ ∑∑
i j
( yij − yi − y j + y )
atau:
Jumlah Kuadrat Total = Jumlah Kuadrat A + Jumlah Kuadrat B
+ Jumlah Kuadrat Galat (6.22)
Didefinisikan:
c
1) yi . = ∑
j =1
yij : Jumlah observasi baris ke-i variabel A (6.23.a)

r
2) y. j = ∑
i =1
yij : Jumlah observasi kolom ke-j variabel B (6.23.b)

r c
3) y. . = ∑∑
i =1 j =1
yij : Jumlah semua observasi (6.23.c)

2
( y. . )
4) C= (6.23.d)
rc

Diperoleh:
 Jumlah Kuadrat Total:
JKT = ∑∑
i j
yij2 −C ; db = rc – 1 (6.24)

 Jumlah Kuadrat A:
2
( yi )
JKA = ∑i c
−C ; db = r – 1 (6.25)

 Jumlah Kuadrat B:
2
( yj )
JKB = ∑j r
−C ; db = c – 1 (6.26)

 Jumlah Kuadrat Galat:


JKG = JKAB = JKT – JKA – JKB ; db = (r – 1)(c – 1) (6.22.a)

193
 Tabel ANOVA untuk Analisis Variansi 2-Arah Tanpa Interaksi

Tabel 6.8. Tabel ANOVA 2-arah untuk model tanpa interaksi

Sumber Fuji
JK db KR Ftabel
variasi
JKA KRA F r −1 ;
A JKA r–1 KRA = FA = ( ) ( r −1)( c −1); α
r −1 KRAB
JKB KRB F c −1 ;
B JKB c–1 KRB = FB = ( ) ( r −1)( c −1); α
c −1 KRAB
JKAB
Galat JKAB (r – 1)(c – 1) KRAB =
( r − 1)( c − 1)
Total JKT rc – 1

194
Contoh 6.5:
Misalkan terhadap residivis pengguna narkotika mantan penghuni
empat rumah tahanan (blok B1, B2, B3, dan B4) yang telah menjalani salah
satu di antara tiga program rehabilitasi (perlakuan A1, A2, atau A3),
dilakukan pengamatan untuk menentukan lamanya periode remisi (jumlah
hari mereka terbebas dari penggunaan ulang narkotika). Data hasil
pengamatan disajikan pada tabel 6.9 berikut.

Tabel 6.9. Data periode remisi pengguna narkotika untuk variabel A


(perlakuan) dan variabel B (blok)
Perlakuan Blok (B)
yi . ∑j yij2
(A) 1 2 3 4
1 35 24 28 21 108 3,026
2 19 14 14 13 60 922
3 21 16 21 14 72 1,334
y. j 75 54 63 48 240
∑i yij2 2,027 1,028 1,421 806 5,282

Hipotesis nol: H A : α 1 = α 2 = α 3 = 0
HB : β 1 = β 2 = β 3 = β 4 = 0

Perhitungan:
352 24 2 142 240 2
JKT = + +...+ −
1 1 1 12
240 2
= 5,282 − = 482 (db = 11)
12

1082 60 2 72 2 240 2
JKA = + + −
4 4 4 12
= 312 (db = 2)

752 542 632 482 240 2


JKB = + + + −
3 3 3 3 12
= 138 (db = 3)
JKG = 482 – (312 + 138) = 32 (db = 6)

195
Tabel 6.10. Tabel ANOVA untuk data hipotetis variabel A dan variabel
B

Sumber variasi JK db KR Fuji Ftabel (α = 0.05)


Perlakuan (A) 312 2 156 29.25 5.14
Blok (B) 138 3 46 8.625 4.76
Galat 32 6 5.33
Total 482 11

Kesimpulan yang diperoleh, yaitu pada tingkat signifikansi 5%


terdapat efek perlakuan maupun blok yang bermakna secara statistik
terhadap variabel dependen.

196
LAMPIRAN 6A: IKHTISAR METODE STATISTIKA PARAMETRIK UNTUK
ANALISIS HUBUNGAN ANTAR DUA VARIABEL
Analisis statistik yang lazim digunakan dalam Metode Statistika Parametrik untuk menguji hubungan antar dua
variabel (satu variabel independen dan satu variabel dependen ialah uji t / uji Z, analisis variansi, analisis regresi linear,
analisis regresi logistik, dan uji khi-kuadrat . Ikhtisar penggunaannya diperlihatkan pada matrik VI.1 di bawah ini.
Matriks VI.1. Ikhtisar metode statistika parametrik untuk analisis hubungan antar 1 variabel independen dengan
1 variabel dependen

Variabel dependen
Variabel independen Numerik Kategorik
Dikotomi Politomi
Analisis Regresi Analisis Regresi Analisis Regresi
Numerik
Linear Logistik Logistik Politomi
Dikotomi Uji t / uji Z
Kategorik Uji khi-kuadrat
Politomi Analisis Variansi

Selain itu masih didapatkan berbagai analisis statistik lain yang relatif lebih jarang digunakan untuk menguji
hubungan antar 1 variabel independen dengan satu 1 variabel dependen, namun dalam keadaan tertentu mungkin saja
dijadikan pilihan utama untuk menganalisis data yang tersedia

197
LAMPIRAN 6B: ANALISIS VARIANSI MODEL
TETAP DAN MODEL ACAK

Dalam analisis variansi dikenal dua model, yaitu model tetap (fixed
model; model I) dan model acak (random model; model II). Pada model
tetap, taraf-taraf perlakuan yang diuji dalam analisis variansi mencakup
seluruh taraf yang mungkin ada, sedangkan pada model acak, taraf-taraf
yang diuji hanya merupakan sampel dari keseluruhan taraf yang ada dalam
populasi.

Contoh VI.1:
a. Sebuah pabrik memproduksi dan menjual makanan kaleng berisi
kaleng ikan tuna dalam bentuk empat kemasan, yang masing-masing
dinamakan kemasan I, II, III, dan IV. Untuk dapat meningkatkan
pemasaran, manajer peruasahaan melakukan riset pasar dengan
mengumpulkan data penjualan keempat bentuk kemasan dan
melakukan analisis variansi dengan hipotesis H 0 : µ 1 = µ 2 = µ 3 =
µ 4 ; µ i menyatakan rerata penjualan dengan kemasan ke-i per bulan di
masing-masing toko.
Analisis variansi di sini termasuk dalam model tetap (model I), karena
hanya ada empat kemasan di pabrik tersebut dan keempatnya diuji
dalam analisis.
b. Sebuah perusahaan hipermarket yang memiliki ratusan karyawan di
bagian pelayanan konsumen memilih lima orang di antaranya secara
acak, masing-masing untuk dinilai oleh sekelompok konsumen.
Hipotesis yang hendak diuji ialah H 0 : µ 1 = µ 2 = µ 3 = µ 4 = µ 5 ; µ j
menyatakan rerata penilaian konsumen bagi karyawan ke-j.
Analisis variansi di sini termasuk dalam model acak (model II), karena
jumlah karyawan tidak hanya lima, melainkan ratusan dan kelima
orang tersebut dipilih secara acak dari populasi karyawan. Tujuan
penelitian sebenarnya adalah untuk menilai seberapa besar variasi
pelayanan yang diberikan oleh karyawan terhadap konsumen, karena

198
itu hasil yang diperoleh akan digeneralisasikan terhadap seluruh
populasi karyawan.
Pada ANOVA 2-arah, salah satu variabel independennya
(perlakuannya) mungkin tergolong dalam model I, dan variabel independen
lainnya tergolong dalam model II. Model ANOVA demikian dinamakan
model campuran (mixed model; model III).
Pada ANOVA 2-arah dengan interaksi, terdapat perbedaan statistik
penguji untuk ketiga model tersebut (lihat matriks VI.2). Seluruh
pembahasan mengenai ANOVA 2-arah dan contoh-contohnya pada bab 8
menggunakan model tetap.

Matriks IV.2. Statistik penguji untuk model tetap, model acak, dan
model campuran pada ANOVA 2-arah dengan interaksi

Model tetap Model acak Model campuran


Faktor
(A dan B tetap) (A dan B acak) (A tetap, B acak)
KRA KRA KRA
A FA = FA = FA =
KRG KRAB KRAB
KRB KRB KRB
B FB = FB = FB =
KRG KRAB KRAB
KRAB KRAB KRAB
AB FAB = FAB = FAB =
KRG KRG KRG

199
LAMPIRAN 6C: INTERAKSI PADA ANOVA DAN
MODEL REGRESI

Dalam bab 6, subbab 6.2 serta lampiran 6B telah dibahas beberapa


contoh serta uji hipotesis untuk interaksi pada ANOVA. Misalkan dimiliki 2
perlakuan A dan B, masing-masing dengan dua taraf perlakuan, A1 dan A 2
serta B1 dan B 2 . Rerata variabel dependen Y untuk kombinasi taraf-taraf
perlakuan ini masing-masing adalah µ 11 , µ 12 , µ 21 dan µ 22 (lihat tabel
VI.1).

Tabel VI.1 Rerata variabel dependen Y pada rancangan percobaan 2×2

B1 B2
A1 µ 11 µ 12
A2 µ 21 µ 22

Dengan model:

Yijk = µ + α i + β j + (αβ ) ij + ε ijk (6.27)

maka: µ 11 = µ + α 1 + β 1 + (αβ ) 11 (6.28.a)


µ 12 = µ + α 1 + β 2 + (αβ ) 12 (6.28.b)
µ 21 = µ + α 2 + β 1 + (αβ ) 21 (6.28.c)
µ 22 = µ + α 2 + β 2 + (αβ ) 22 (6.28.d)

Diagram VI.1 Rancangan percobaan 2×2


Kiri: Tanpa interaksi, µ 12 − µ 11 = µ 22 − µ 21 .
Kanan: Dengan interaksi, µ 12 − µ 11 ≠ µ 22 − µ 21 .

200
Dalam keadaan tanpa interaksi (diagram VI.1 kiri), maka:
µ 12 − µ 11 = µ 22 − µ 21 (6.29)

Jika interaksi ada (diagram VI.1 kanan), maka:


µ 12 − µ 11 ≠ µ 22 − µ 21 (6.30)

Interaksi juga dapat ditemukan pada model regresi, misalnya pada


model regresi linear dengan 2 variabel independen:
Yi = β 0 + β 1 X 1i + β 2 X 2i + ε i (6.31.a)

jika terdapat interaksi antara variabel independen X 1 dan X 2 , model yang


digunakan adalah:
Yi = β 0 + β 1 X 1i + β 2 X 2i + β 3 X 1i X 2i + ε i (6.31.b)

Uji hipotesis untuk suku interaksi β 3 X 1 X 2 , yaitu uji terhadap


hipotesis H 0 : β 3 = 0 dapat dilakukan dengan uji Wald.

Contoh VI.2:
Misalkan dimiliki data hipotetis untuk penjualan biskuit merek
tertentu. Biskuit ini dibuat dalam 2 bentuk, bundar dan persegi, serta 2
warna, coklat dan kuning. Contoh data penjualan hipotetis untuk kombinasi
masing-masing bentuk dan warna, dengan dan tanpa interaksi diperlihatkan
pada tabel VI.2.

Tabel VI.2. Contoh data penjualan biskuit dengan 2 bentuk dan 2


warna*)
a. Tanpa interaksi b. Dengan interaksi
Coklat Kuning Coklat Kuning
Bundar 30 28 Bundar 32 22
Persegi 26 24 Persegi 24 30

*) dalam ribuan kotak

201
LAMPIRAN 6D: UKURAN SAMPEL MINIMUM
UNTUK UJI HIPOTESIS PADA ANALISIS
VARIANSI

Untuk menentukan ukuran sampel minimum yang dibutuhkan pada


uji hipotesis H 0 : µ 1 = µ 2 = . . . = µ k vs H 1 : µ i ≠ µ j untuk paling sedikit
satu pasangan nilai (i ; j) dengan uji F pada analisis variansi, dapat
digunakan pendekatan kekuatan uji minimum (minimum power for a given
decision rule), namun pendekatan ini memerlukan pembahasan mengenai
distribusi F non-sentral sebagai distribusi sampling menurut hipotesis
alternatif beserta tabelnya yang berada di luar ruang lingkup pembahasan
buku teks ini. Di sini hanya akan dibahas perhitungan ukuran sampel
minimum untuk analisis variansi dengan penggunaan kelompok kontrol
sebagai salah satu kelompok perbandingan.

Misalkan hendak dilakukan analisis variansi untuk membandingkan


rerata k kelompok perbandingan. Sampel berukuran minimum yang
dibutuhkan terdiri atas:

a. Satu kelompok kontrol (control group), dengan ukuran kelompok nc .

b. (k – 1) kelompok uji (test groups), masing-masing dengan ukuran


kelompok nt .

Ukuran sampel seluruhnya adalah:

n = (k – 1) nt + nc (6.32)

Pada perbandingan rerata (ataupun proporsi) beberapa kelompok,


acapkali ada salah satu kelompok yang dijadikan sebagai kelompok kontrol
(kelompok pembanding), yang biasanya tidak diberi perlakuan apapun atau
diberi perlakuan dengan intensitas terendah. Kelompok-kelompok uji
berukuran sama besar, yaitu masing-masing berukuran nt , sedangkan ukuran
kelompok kontrol dapat sama besar ataupun lebih besar daripada ukuran satu
kelompok uji.

202
Perbandingan ukuran satu kelompok uji nt dengan ukuran kelompok
kontrol nc dinamakan ‘rasio alokasi uji-kontrol’ (test-control allocation
ratio):

nt
λ = (6.33)
nc

Pada bab 3, subbab 3.1 telah dibahas mengenai ukuran sampel


minimum yang dibutuhkan untuk mendeteksi perbedaan minimum sebesar d
= ( µ 1 − µ 2 ) pada uji hipotesis dua kelompok perbandingan H 0 : µ 1 − µ 2
µ 1 − µ 2 < 0 vs H 1 : µ 1 − µ 2 > 0, yaitu:

n=
(
2 Zα + Z β )2 σ 2
( µ1 − µ2 )2
Untuk k kelompok perbandingan dengan uji 2-sisi, ukuran kelompok
kontrol adalah:

 λ +1 
 (
 Zα + Z β )σ
2 2

nc =  λ  (6.34)
(
µ c − µt
2
)
µc : rerata populasi kontrol

µt : rerata populasi uji

d= ( µc − µt ) : perbedaan minimum yang hendak dideteksi antara rerata


populasi kontrol dan populasi uji

Ukuran satu kelompok uji adalah:

nt = λ nc (6.33.a)

Untuk λ = 1 (alokasi uniform), maka:

203
nc =
(
2 Zα + Z β )σ
2 2

(6.35)
( µ c − µt ) 2

dan: nt = nc (6.36)

Tampak bahwa rumus yang diperoleh serupa dengan rumus bab 3,


subbab 3.1 untuk dua kelompok perbandingan dengan kelompok kontrol
sebagai kelompok 1 dan kelompok uji sebagai kelompok 2.

Contoh VI.3:

Lihat kembali contoh 6.2 tentang perbandingan rerata penghasilan


tahunan keluarga di tiga kota A, B, dan C. Misalkan sebelum penelitian
dilaksanakan terlebih dahulu dilakukan perhitungan ukuran sampel minimum
untuk mendeteksi adanya perbedaan rerata penghasilan sekurang-kurangnya
6 juta rupiah dibandingkan dengan kota A sebagai kelompok kontrol dengan
tingkat signifikansi 5% dan kekuatan uji 80%. Dengan perhitungan dalam
jutaan rupiah, maka:

d= ( µc − µt ) = 6
α = 0.05 Zα 2
= 1.96

1 – β = 0.80 Z β = 0.84

Jika pada penelitian pendahuluan didapatkan estimasi standar deviasi


adalah 5 juta rupiah:

σ̂ = 5

maka dengan rasio alokasi uji-kontrol λ = 1:

 λ +1
( )σ
2 2
  Zα 2 + Z β
nc =  λ 
(
µ c − µt
2
)
204
 1+1 2 2
  (1.96 + 0.84 ) 5
=  
1
= 10.90 ≈ 11
62

nt = λ nc = (1)(11) = 11

Ukuran sampel seluruhnya adalah:

n = (k – 1) nt + nc

= (2)(11) + 11 = 33

205
LAMPIRAN 6E: PERBANDINGAN GANDA
(MULTIPLE COMPARISONS)

Jika pada analisis variansi hipotesis H 0 : µ 1 = µ 2 = . . . = µ k


ditolak, maka langkah berikutnya ialah mencari kelompok mana saja di
antara k kelompok yang diperbandingkan yang berbeda dengan kelompok
lainnya. Metode pencarian kelompok-kelompok yang berbeda demikian
dinamakan ‘perbandingan ganda’ (multiple comparisons).
Dikenal berbagai metode dalam perbandingan ganda, antara lain
metode Tukey, metode Scheffé, metode Bonferroni, dan sebagainya. Di
sini hanya akan dibahas salah satu yang termudah di antara berbagai metode
tersebut, yaitu metode Bonferroni.
Misalkan Lh menyatakan selisih 2 nilai rerata yang diperbandingkan:
Lh = µ i − µ j (6.37)
maka interval konfidensi perbandingan ganda 100(1 – α)% untuk Lh ; h = 1,
2, . . . , m; dengan m menyatakan jumlah perbandingan, adalah:

( ) ( )
Lˆ h − B . s Lˆ h < Lh < Lˆ h + B . s Lˆ h (6.38)

dengan: B = t n−k ; α 2m (6.39)


( ) ( )
k menyatakan jumlah taraf perlakuan (jumlah populasi yang
diperbandingkan).

Contoh VI.4:
Lihat data pada contoh 6.2. Akan dihitung interval konfidensi
perbandingan ganda (interval konfidensi simultan) 100(1 – α)% untuk
( µ1 − µ2 ) , ( µ1 − µ3 ) , dan ( µ3 − µ2 ) sekaligus.
Pada contoh 6.2, m = 3, h = 1, 2, 3; dan dengan memisalkan:
L1 = ( µ1 − µ2 )
L 2 = ( µ1 − µ3 )
L 3 = ( µ3 − µ2 )
maka interval konfidensi perbandingan ganda 95% untuk L1 , L 2 , dan L 3
adalah:

206
( )
L̂1 − B . s Lˆ1 < L1 < L̂1 + B . s Lˆ1 ( )
L̂ 2 − B . s ( Lˆ 2 ) < L 2 < L̂ 2 + B . s ( Lˆ 2 )

L̂ 3 − B . s ( Lˆ 3 ) < L 3 < L̂ 3 + B . s ( Lˆ 3 )
k=3 (k menyatakan jumlah taraf perlakuan / jumlah populasi yang
diperbandingkan)
n = 12
B = t n −k ; α 2 m = t 12−3 ; 0.05 2 3 = t 9; 0.0083 = 2.93
( ) ( ) ( ) ( )( ) ( )

L̂1 = ( y1 − y2 )
L̂ 2 = ( y1 − y3 )
L̂ 3 = ( y3 − y2 )
76 54 58
y1 = = 19 y2 = = 13.5 y3 = = 14.5
4 4 4
L̂1 = 19 – 13.5 = 5.5
L̂ 2 = 19 – 14.5 = 4.5
L̂ 3 = 14.5 – 13.5 = 1

1 1 1 1 
( )
s Lˆ h = s +
ni n j
= KRG  + 
 ni n j 
 
JKG
karena: s 2 = KRG =
n−k
ni = n j = 4 dan KRG = 5.33, sehingga:

1 1
( )
s Lˆ h = 5.33  +  = 1.63
4 4
5.5 – (2.93) . (1.63) < L1 < 5.5 + (2.93) . (1.63)
4.5 – (2.93) . (1.63) < L 2 < 4.5 + (2.93) . (1.63)
1 – (2.93) . (1.63) < L 3 < 1 + (2.93) . (1.63)
yaitu: 0.71 < L1 < 10.29
−0.29 < L 2 < 9.29

207
−3.79 < L 3 < 5.79

Gambaran akhir di sini biasanya diberikan sebagai berikut:


µ2 µ3 µ1

Gambaran ini menyatakan bahwa:


a. Urutan nilai dari yang terkecil sampai dengan yang terbesar adalah: µ2
− µ3 − µ1 .
b. µ2 tidak berbeda dengan µ3 , µ3 tidak berbeda dengan µ1 , tetapi µ2
berbeda dengan µ1 .

208
LATIHAN 6
Bagian Pertama

Pilihlah satu jawaban yang paling benar!

1. Misalkan dimiliki data nilai ujian statistika tiga kelas A, B, dan C.


Apabila dilakukan 3 kali uji kesamaan 2 rerata dengan uji t (multiple
t-test;; A vs B, A vs C, dan B vs C), masing-masing dengan tingkat
signifikansi α = 0.05, maka probabilitas untuk sekurang-kurangnya
mendapatkan satu kali kesalahan tipe I adalah:
3
A. 0.05 C. 0.05
3
B. 3 × 0.05 D. 1 – 0.95

2. Untuk menguji hubungan antara variabel independen kategorik


dengan variabel dependen kontinu / numerik, metode statistika yang
dianjurkan penggunaannya adalah:
A. Analisis variansi C. Analisis regresi logistik.
B. Analisis regresi linear D. Uji khi-kuadrat Pearson.

3. Pada analisis variansi terhadap suatu himpunan data, akan diperoleh


kesimpulan yang mengarah pada adanya perbedaan nilai rerata
(mean) antar kelompok perlakuan, jika :
A. Variansi antar-kelompok dan variansi dalam-kelompok besar.
B. Variansi antar-kelompok dan variansi dalam-kelompok kecil.
C. Variansi antar-kelompok besar dan variansi dalam-kelompok
kecil.
D. Variansi antar-kelompok kecil dan variansi dalam-kelompok
besar.

4. Pada uji ANOVA, variansi dalam-kelompok (within-group)


diestimasi oleh:
A. Jumlah kuadrat perlakuan (treatment sum of squares).
B. Kuadrat rerata perlakuan (treatment mean square).
C. Jumlah kuadrat galat (error sum of squares).
D. Kuadrat rerata galat (error mean square).

Untuk soal No. 5 s.d. 10:


Sebuah pabrik benang mempunyai lima mesin pintal A, B, C, D, dan
E yang diharapkan dapat menghasilkan benang yang memiliki kekuatan

209
sama. Untuk memeriksanya, diambil sampel acak masing-masing 6 potong
benang dari hasil produksi tiap mesin. Pemeriksaan kekuatannya
menghasilkan data sebagai berikut:

Mesin
A B C D E
4.2 3.9 4.1 3.6 3.8
4.1 3.8 4.0 3.9 3.6
4.2 3.7 4.2 3.5 3.9
4.3 3.8 4.0 4.0 3.5
4.4 3.6 4.1 4.1 3.7
4.0 3.5 3.8 3.8 3.6

5. Hipotesis nol dan hipotesi alternatif analisis variansi ini dirumuskan


sebagai:
A. H 0 : µ1 = µ2 = µ3 = µ 4 = µ5
H 0 : µ1 ≠ µ2 ≠ µ3 ≠ µ 4 ≠ µ5
B. H 0 : µ1 = µ2 = µ3 = µ 4 = µ5
H1 : semua µ1 , i = 1, 2, 3, 4, 5, tidak sama
C. H 0 : µ1 = µ2 = µ3 = µ 4 = µ5
H1 : tidak semua µ1 , i = 1, 2, 3, 4, 5, sama
D. H 0 : µ1 = µ2 = µ3 = µ4 = µ5 = 0
H1 : tidak semua µ1 = 0, i = 1, 2, 3, 4, 5

6. JKT sama dengan:


A. 1.2444 C. 4.2144
B. 1.8470 D. 4.4124

7. JKG sama dengan:


A. 6.8 C. 0.68
B. 9.5 D. 0.95

8. Dengan α = 0.05, daerah kritis hipotesis ini adalah:


A. F > 4.34 C. F > 2.78
B. F > 4.22 D. F > 2.76

210
9. Nilai statistik penguji Fuji sama dengan:
A. 10.768 C. 18.213
B. 13.182 D. 31.281

10. Berdasarkan nilai statistik penguji, tersebut maka terhadap


H 0 : µ1 = µ2 = µ3 = µ 4 = µ5 disimpulkan bahwa:
A. H 0 tidak ditolak pada α = 0.01
B. H 0 tidak ditolak pada α = 0.05
C. H 0 ditolak pada α = 0.10
D. Semuanya salah.

Untuk soal No. 11 s.d. 15:


Ibu Leoni menyatakan pendapatnya bahwa siswa pada berbagai
tingkatan sekolah dan mahasiswa menghabiskan waktu sama banyaknya
untuk menonton acara TV. Untuk membuktikan pendapatnya ia mengambil
sampel acak beberapa siswa SMP, SMU, dan mahasiswa, serta menanyakan
berapa menit mereka menonton TV sejak pulang sekolah / kuliah sampai
dengan waktu tidur setiap hari. Diperoleh data berikut:

Siswa SMP Siswa SMU Mahasiswa


459 115 272
311 153 88
152 201 374
293 30 178

11. JKT (Jumlah Kuadrat Total; Total Sum of Squares) adalah:


A. 12,037.28 C. 108,335.5
B. 64,586.17 D. 172, 921.67

12. JKP (Jumlah Kuadrat Perlakuan; Treatment Sum of Squares) adalah:


A. 12,037.28 C. 108,335.5
B. 64,586.17 D. 172, 921.67

13. KRG ( Jumlah Kuadrat Galat; Error Mean Squares) adalah:


A. 12,037.28 C. 108,335.5
B. 64,586.17 D. 172, 921.67

211
14. Untuk uji hipotesis H 0 : µ1 = µ2 = µ3 , statistik pengujinya adalah:
A. 0.37 C. 1.68
B. 0.60 D. 2.69

15. Dengan tingkat signifikansi α = 0.05, diperoleh kesimpulan:


A. Terdapat perbedaan lama menonton TV antar siswa SMP,
SMU, dan mahasiswa yang bermakna.
B. Ditemukan perbedaan lama menonton TV antar siswa SMP,
SMU, dan mahasiswa yang bermakna secara statistik.
C. Tidak ditemukan perbedaan lama menonton TV antar siswa
SMP, SMU, dan mahasiswa yang bermakna secara statistik.
D. Semuanya salah.

Bagian Kedua

Pilihlah satu jawaban yang paling benar !

Dua macam pupuk ( P dan Q ) digunakan dalam kuantitas 1 kg dan 2


kg per petak. Dilakukan eksperimen faktorial 2×2 dengan empat observasi
replikasi dengan hasil sebagai berikut:

B: Dosis pemupukan
1 kg 2 kg
P 17, 16, 15, 18 13, 13, 14, 12
A: Jenis pupuk
Q 21, 20, 19, 18 14, 16, 16, 14

Selanjutnya dilakukan analisis variansi dengan hipotesis:


H A : α1 = α 2 = 0
H B : β1 = β 2 = 0
H AB : (αβ )11 = (αβ )12 = (αβ )21 = (αβ ) 22 = 0

1. JKA sama dengan:


A. 2.5 C. 25
B. 6.4 D. 64

2. JKB sama dengan:


A. 2.5 C. 25
B. 6.4 D. 64

212
3. JKAB sama dengan:
A. 1 C. 3
B. 2.5 D. 6.4

4. JKG sama dengan:


A. 16 C. 25
B. 20 D. 64

5. KRA sama dengan:


A. 6.4 C. 20
B. 16 D. 25

6. KRB sama dengan:


A. 16 C. 25
B. 20 D. 64

7. KRAB sama dengan:


A. 0.3 C. 1.6
B. 1 D. 3

8. KRG sama dengan:


A. 1.333 C. 3.625
B. 2.673 D. 13.331

9. FA sama dengan:
A. 1.875 C. 18.750
B. 7.815 D. 48.000

10. FB sama dengan:


A. 4.800 C. 18.750
B. 7.815 D. 48.000

11. FAB sama dengan:


A. 0.750 C. 2.673
B. 1.875 D. 7.815

213
12. Dengan tingkat signifikansi α = 5% disimpulkan:
A. H A tidak ditolak
B. H B ditolak
C. H AB ditolak
D. Ketiga hipotesis semuanya ditolak

Bagian Ketiga

Pilihlah satu jawaban yang paling benar !

B: Pekerja
B1 B2 B3 B4
A1 44 46 34 43
A: Tipe mesin A2 38 40 36 38
A3 47 52 44 46

Selanjutnya dilakukan analisis variansi dengan hipotesis:


H A : α1 = α 2 = α 3 = 0
H B : β1 = β 2 = β3 = β 4 = 0

1. Pada uji analisis variansi 2-arah (two-way ANOVA) terhadap data


dengan 1 pengamatan / observasi per sel, model statistik yang dapat
digunakan ialah:
A. yij = µ + α i + β j + ε ij
B. yij = µ + α i + β j + (αβ )ij + ε ijk
C. Keduanya dapat digunakan.
D. Keduanya tidak dapat digunakan.

2. JKA ( jumlah kuadrat A ) sama dengan:


A. 29.5 C. 173.17
B. 98 D. 300.67

3. JKB ( jumlah kuadrat B ) sama dengan:


A. 29.5 C. 173.17
B. 98 D. 300.67

214
4. JKG ( jumlah kuadrat galat)
A. 29.5 C. 173.17
B. 98 D. 300.67

5. KRA (kuadrat rerata A) sama dengan:


A. 4.92 C. 86.58
B. 32.67 D. 119.25

6. KRB (kuadrat rerata B) sama dengan:


A. 4.92 C. 86.58
B. 32.67 D. 119.25

7. KRG (kuadrat rerata galat) sama dengan:


A. 4.92 C. 86.58
B. 32.67 D. 119.25

8. FA sama dengan:
A. 3.58 C. 17.61
B. 6.64 D. 32.29

9. FB sama dengan:
A. 3.58 C. 17.61
B. 6.64 D. 32.29

10. Dengan tingkat signifikansi α = 5% disimpulkan:


A. H A tidak ditolak C. Keduanya benar
B. H B ditolak D. Keduanya salah

215
BAB 7
ANALISIS DATA KATEGORIK
7.1. PENYAJIAN DATA KATEGORIK

 Bentuk Umum Tabulasi Silang


Data kategorik disajikan dalam bentuk tabel r × c (tabulasi silang,
tabel kontijensi), dengan menyatakan jumlah baris (row) dan c menyatakan
jumlah kolom (column). Bentuk-bentuk umum penyajian data kategorik
diperlihatkan pada tabel 7.1 berikut:

Tabel 7.1. Beberapa bentuk umum tabulasi silang r x c

a. Tabel 1 × c (c > 2)

O1 O2 ... Oc

Oi : Observasi (frekuensi pengamatan) pada kategorik (kolom) ke-i;


i = 1, 2, . . . , c

b. Tabel 2 × 2

O11 O12
O21 O22

c. Tabel 2 × c (c > 2)

O11 O12 ... O1c


O21 O22 ... O2c

Oij : Observasi (frekuensi pengamatan) pada kategori (baris) ke-


i, kolom ke-j; i = 1, 2; j = 1, 2, . . . , c

216
d. Tabel r × c (r > 2 dan c > 2)

O11 O12 ... O1c


O21 O22 ... O2c
... ... ... ...
Or1 Or 2 ... Orc

Oij : Observasi (frekuensi pengamatan) pada baris ke-i, kolom


ke-j; i = 1, 2, . . . , r; j = 1, 2, . . . , c

Contoh 7.1:
- Misalkan diambil sampel acak 350 orang lulusan SMU (1 sampel),
dicatat jenis kelaminnya dan ditanyai keinginannya untuk melanjutkan
sekolah. Hasil yang diperoleh diperlihatkan pada tabel 2×2 di bawah
ini:

Tabel 7.2. Jenis kelamin dan keinginan melanjutkan pendidikan


Melanjutkan sekolah
Jenis kelamin
Ingin Tidak Jumlah
Pria 163 80 243
Wanita 46 61 107
Jumlah 209 141 350
- Misalkan dimiliki data tentang kerutan wajah 2 kelompok subjek (2
sampel), perokok berat dan perokok ringan / bukan perokok, yang
disajikan dalam bentuk tabel 2×2:
Tabel 7.3. Intensitas merokok dan kerutan wajah (2 proporsi binomial)
a. Tabel frekuensi
Kerutan wajah
Perokok
Nyata Tidak Jumlah
Berat 127 73 200
Ringan/tidak 59 141 200

217
b. Tabel proporsi
Kerutan wajah
Perokok
Nyata Tidak Jumlah
Berat 0.635 0.365 1.000
Ringan/tidak 0.295 0.705 1.000

Keterangan: p1 = 0.635 ; q1 = 0.365 ;


p2 = 0.295 ; q2 = 0.705 ;

- Misalkan dimiliki data tentang insomnia pada 3 kelompok usia wanita


(3 sampel; muda, dewasa, dan tua), yang disajikan dalam bentuk tabel
3×2:
Tabel 7.4. Insomnia pada berbagai kelompok usia wanita (3 proporsi
binomial)
Insomnia
Kelompok usia
Ada Tidak ada Jumlah
18-34 th 19 41 60
35-54 th 23 37 60
55-74 th 33 27 60
Keterangan: p1 = 0.317 ; q1 = 0.683 ;
p2 = 0.383 ; q2 = 0.617 ;
p3 = 0.550 ; q3 = 0.450 ;

 Frekuensi Observasi dan Frekuensi Harapan


Frekuensi dalam sel-sel pada tabel 7.1 serta tabel-tabel frekuensi pada
contoh 7.1 di atas merupakan frekuensi pengamatan / observasi (observed),
yang dinyatakan dengan lambang O, dengan Oij menyatakan frekuensi
pengamatan pada baris ke-i dan kolom ke-j (sel ke-ij). Untuk tabel 2×2,
bentuk umumnya diperlihatkan pada tabel 7.5 berikut.

218
Tabel 7.5. Bentuk umum tabel 2×2 dengan frekuensi observasi (‘tabel
observasi’)
Variabel B
Variabel A
B1 B2 Jumlah
A1 a = O11 b = O12 n1 = a + b
A2 c = O21 d = O22 n2 = c + d
Jumlah m1 = a + c m2 = b + d n

Jumlah baris ( n1 dan n 2 ) serta jumlah kolom ( m1 dan m 2 ) disebut


sebagai frekuensi ‘marginal’ (tepi). Untuk perhitungan statistik, masing-
masing jumlah baris dan kolom ini diasumsikan memiliki nilai tetap (fixed
margin).

Frekuensi harapan (expected) untuk tiap sel dinyatakan dengan E,


dengan Eij menyatakan frekuensi harapan pada baris ke-i dan kolom ke-j
(sel ke-ij), dihitung berdasarkan asumsi fixed margin dengan rumus:
ni m j
Eij = (7.1)
n
Secara stokastik, frekuensi harapan pada tabel r×c menyatakan frekuensi
yang diharapkan akan terjadi jika variabel baris (variabel A ) tidak memiliki
asosiasi statistik dengan variabel kolom (variabel B). Untuk tabel 2×2 seperti
pada tabel 7.5, penyajiannya dalam bentuk frekuensi harapan serta rumus-
rumus perhitungannya adalah:

Tabel 7.6. Bentuk umum tabel 2×2 dengan frekuensi harapan (‘tabel
harapan’)

Variabel B
Variabel A
B1 B2 Jumlah
A1 E11 E12 n1 = E11 + E12
A2 E21 E22 n2 = E21 + E22
Jumlah m1 = E11 + E21 m2 = E12 + E22 n

219
n1 m1 n1 m 2
E11 = E12 = )
n n
n 2 m1 n2 m 2
E21 = E22 = ) (7.1.a)
n n
Perhatikan bahwa frekuensi marginal (jumlah baris dan jumlah
kolom) pada tabel harapan selalu bernilai sama dengan frekuensi marginal
pada tabel observasi.

Contoh 7.2:
Lihat kembali data tentang jenis kelamin dan keinginan melanjutkan
pendidikan pada contoh 7.1. Data pada tabel 7.2 adalah tabel observasi, dan
frekuensi harapan masing-masing sel adalah (lihat tabel 7.7):

E11 =
n1 m1
=
( 243)( 209 ) = 145.1
n 350

E12 =
n1 m 2
=
( 243)(141) = 97.91
n 350

E21 =
n 2 m1
=
(107 )( 209 ) = 63.9
n 350

E22 =
n2 m 2
=
(107 )(141) = 43.1
n 350

Tabel 7.7. Tabel harapan untuk data jenis kelamin dan keinginan
melanjutkan pendidikan

Melanjutkan sekolah
Jenis kelamin
Ingin Tidak Jumlah
Pria 145.1 97.9 243
Wanita 63.9 43.1 107
Jumlah 209 141 350

220
 Uji Hipotesis untuk Tabulasi Silang dengan Data
Kategorik
Uji statistik untuk data kategorik yang disajikan dalam bentuk
tabulasi silang umumnya dilakukan dengan membandingkan data frekuensi
pengamatan (observed; Oij ) dengan data frekuensi harapan (expected; Eij ).
Beberapa uji statistik untuk data kategorik tersebut yaitu:

1. Uji khi-kuadrat (chi-square) Pearson, digunakan untuk tabel r×c (r >


2; c > 2) dengan syarat tidak ada sel dengan frekuensi harapan Eij
bernilai kurang daripada 5. Uji khi-kuadrat Pearson dibedakan atas :
a. Uji homogenitas (uji perbandingan proporsi): digunakan bagi
data yang berasal dari 2 sampel atau lebih, untuk menguji
kesamaan (homogenitas) proporsi antar sampel.
b. Uji independensi: digunakan bagi data yang berasal 1 sampel,
untuk menguji ada tidaknya asosiasi statistik antar variabel baris
dengan variabel kolom.
2. Uji eksak Fisher: digunakan untuk tabel 2×2 jika ada sel dengan
frekuensi harapan Eij yang bernilai kurang daripada 5.

3. Uji kebaikan-suai (goodness of fit): digunakan untuk tabel 1×c, yaitu


untuk menguji apakah data sampel berasal dari (berdistribusi sesuai
dengan) suatu populasi tertentu, misalnya populasi normal
4. Uji McNemar: digunakan untuk data kategorik berpasangan yang
disajikan dalam bentuk tabel 2×2.

 Distribusi Khi-kuadrat
Kecuali uji eksak Fisher , seluruh uji hipotesis untuk data kategorik
yang disebutkan di atas menggunakan statistik penguji yang ber-distribusi
khi-kuadrat, yang cuplikan distribusinya diperlihatkan pada tabel 7.8 di
bawah ini (tabel lengkap nilai kritis distribusi khi-kuadrat dapat dilihat pada
Addendum D).
Bentuk distribusi khi-kuadrat berbeda-beda, tergantung pada derajat
bebasnya, namun seluruhnya bernilai positif (terletak di kanan sumbu
vertikal), sehingga seperti pada uji F, uji hipotesis dengan statistik penguji
yang berdistribusi khi-kuadrat selalu adalah uji 2-sisi, walaupun dengan
memperhatikan gambaran distribusinya, uji tersebut adalah uji 1-ekor (one-
tail test).
221
Tabel 7.8. Cuplikan tabel distribusi khi-kuadrat [P ( χ 2 > χ α2 )]

α
db
0.100 0.050 0.025 0.010
1 2.71 3.84 5.02 6.63
2 4.61 5.99 7.38 0.21
. . . . .
. . . . .
. . . . .
9 14.7 16.9 19.0 21.7
10 16.0 18.3 20.5 23.2
. . . . .
. . . . .
. . . . .
19 27.2 30.1 32.9 36.2
20 28.4 31.4 34.2 37.6
. . . . .
. . . . .
. . . . .
29 39.1 42.6 45.7 49.6
30 40.3 43.8 47.0 50.9
40 51.8 55.8 59.3 63.7
50 63.2 67.5 71.4 76.2
60 74.4 79.1 83.3 88.4

222
7.2. UJI HOMOGENITAS

 Tabel 2×2
Misalkan dimiliki data kategorik yang paparannya disajikan dalam
bentuk umum tabel 2×2 berikut:
Tabel 7.9. Bentuk umum paparan data pada tabel 2×2
Variabel B
Variabel A
B BC Jumlah
A a b n1 = a + b
AC c d n2 = c + d
Jumlah m1 = a + c m2 = b + d n

Uji homogenitas khi-kuadrat untuk tabel 2×2 memberikan hasil yang


sama dengan uji kesamaan 2 proporsi dengan pendekatan normal (uji Z),
masing-masing hipotesis:
H 0 : P1 = P2 vs H1 : P1 ≠ P2 (7.2)
a a c c
dan: P̂1 = p1 = = ; P̂2 = p2 = =
a + b n1 c+d n2

Perhatikan bahwa uji kesamaan 2 proporsi dengan uji Z hanya boleh


dilakukan untuk sampel berukuran besar ( n1 > 30 dan n2 > 30), sedangkan
uji homogenitas khi-kuadrat sendiri hanya boleh dilakukan jika tidak ada sel
dengan frekuensi harapan yang lebih kecil daripada 5.
Statistik penguji pada uji khi-kuadrat homogenitas adalah:
2
( Oij − Eij )
2
Wuji = χ uji = ∑∑
i j Eij
(7.3)

yang berdistribusi khi-kuadrat dengan derajat bebas (r – 1)(c – 1). Untuk


tabel 2×2, derajat bebasnya adalah satu. Daerah kritis adalah:
W > χ 21;α (7.4)
( )
2
2
Wuji = χ uji bernilai sama dengan ( Zuji ) ; Z uji adalah statistik
penguji pada uji kesamaan 2 proporsi dengan uji Z. Khusus untuk tabel 2×2,
rumus 7.3 untuk statistik penguji di atas dapat dijabarkan menjadi:

223
n ( ad − bc )2
Wuji = (7.5)
n1n2 m1m2

Jika H 0 ditolak, disimpulkan bahwa ada perbedaan yang bermakna


secara statistik antara proporsi peristiwa B dalam kelompok A dengan
proporsi peristiwa B dalam kelompok AC; sedangkan jika H 0 tidak ditolak,
disimpulkan bahwa tidak ada perbedaan yang bermakna secara statistik
antara proporsi peristiwa B dalam kelompok A dengan proporsi peristiwa B
dalam kelompok AC.

Contoh 7.3:
Anggota 2 sampel acak yang masing-masing terdiri atas 100 orang
pria dan 100 orang wanita ditanyai pendapatnya terhadap pernyataan:
‘Wanita mempunyai hak dan kewajiban yang sama dengan pria’. Diperoleh
jawaban sebagai berikut:
Tabel 7.10. Pendapat tentang hak dan kewajiban menurut reponden
wanita pria dan wanita
Sikap
Jenis kelamin
Setuju Tidak setuju Jumlah
Pria 30 70 100
Wanita 45 55 100
Jumlah 75 125 200

Uji hipotesis:
1. Jenis uji statistik: uji khi-kuadrat (uji homogenitas).
2. Hipotesis: H 0 : P1 = P2
H1 : P1 ≠ P2
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis: W > χ1;2 05 atau W > 3.84.

5. Statistik penguji:

2 n ( ad − bc )2
Wuji = χ uji =
n1n2 m1m2

224
( 200 ) ( 30 )( 55) − ( 70 )( 45) 2
= = 4.80
(100 )(100 )( 75)(125)
yang berdistribusi χ 2 dengan derajat bebas 1.

6. Kesimpulan: karena W > 3.84, H 0 ditolak, sehingga pada tingkat


signifikansi 0.05 terdapat perbedaan yang bermakna secara statistik
antara pria dan wanita mengenai sikapnya terhadap hak dan kewajiban
pria dan wanita.

 Tabel r×2
Bentuk umum paparan data untuk tabel r×2 dapat disajikan
sebagaimana terlihat pada tabel 7.11 di bawah ini.

Tabel 7.11. Bentuk umum paparan data untuk tabel r×2


a. Tabel observasi
Variabel B
Variabel A
B BC Jumlah
A1 a1 = O11 b1 = O12 n1
A2 a 2 = O21 b 2 = O22 n2
... ... ... ...
Ar a r = Or1 br = Or 2 nr
Jumlah m1 m2 n

b. Tabel proporsi
Variabel B
Variabel A
B BC Jumlah
A1 p1 q1 1
A2 p2 q2 1
... ... ... ...
Ar pr qr 1
Jumlah m1 m2 1

225
Hipotesis yang diuji adalah:
H 0 : P1 = P2 = . . . = Pr (7.6)

a1 a a
dengan: P̂1 = p1 = , P̂2 = p2 = 2 , . . . , Pˆr = pr = r .
n1 n2 nr
Frekuensi di atas merupakan frekuensi pengamatan (observed), sedangkan
untuk uji statistik harus dihitung pula frekuensi harapannya (expected)
dengan rumus:
ni m j
Eij =
n
Statistik pengujinya adalah:
2

Wuji = 2
χuji = ∑∑
( Oij − Eij ) (7.7)
i j Eij

yang berdistribusi khi- kuadrat dengan derajat bebas (r – 1)(c – 1) dan daerah
kritis:
W > χ 2r −1 (7.8)
( )( c −1); α
Untuk tabel kontijensi dengan r > 2 dan/atau c > 2, rumus statistik
penguji ini tidak dapat dijabarkan lebih lanjut seperti pada rumus 7.5 untuk
tabel 2×2.

Contoh 7.4:
Untuk membandingkan proporsi perokok di antara berbagai tingkatan
jabatan akademik dosen di DKI Jakarta, dilakukan wawancara terhadap
sampel acak 50 orang guru besar, 70 lektor kepala, 100 lektor, dan 100
asisten ahli dengan hasil sebagai berikut ( Oij ):

226
Tabel 7.12. Kebiasaan merokok pada beberapa tingkatan jabatan
akademik
a. Tabel observasi
Kebiasaan merokok
Jabatan akademik
Ya Tidak Jumlah
Guru besar 6 44 50
Lektor kepala 18 52 70
Lektor 26 74 100
Asisten ahli 35 65 100
Jumlah 85 235 320

b. Tabel harapan
Jabatan Kebiasaan merokok
akademik Ya Tidak Jumlah

Guru besar
( 50 )( 85 ) = 13.28 ( 50 )( 235 ) = 36.72 50
320 320
Lektor ( 70 )(85) = 18.59 ( 70 )( 235 ) = 51.41 70
kepala 320 320
Lektor
(100 )( 85 ) = 26.56 (100 )( 235 ) = 73.44 100
320 320
Asisten ahli
(100 )( 85 ) = 26.56 (100 )( 235 ) = 73.44 100
320 320
Jumlah 85 235 320

Uji hipotesis:
1. Jenis uji statistik: uji khi-kuadrat (uji homogenitas).
2. Hipotesis: H 0 : P1 = P2 = P3 = P4
H1 : Pi ≠ Pj untuk paling sedikit salah satu pasangan nilai
i, j.
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis: W > χ 3;2 05 , yaitu W > 7.815

5. Statistik penguji:

227
2
2
Wuji = χ uji = ∑∑
r 2 ( Oij − Eij ) =
i =1 j =1 Eij

=
( 6 − 13.28 )2 +
( 44 − 36.72 )2 +
(18 − 18.59 )2 +
13.28 36.72 18.59
( 52 − 51.41)2 +
( 26 − 26.56 )2 +
( 74 − 73.44 ) 2 +
51.41 26.56 73.44
( 35 − 26.56 )2 +
( 65 − 73.44 )2 = 9.127
26.56 73.44
yang berdistribusi χ 2 dengan derajat bebas (r − 1)(c – 1) = (3)(1) = 3.

6. Kesimpulan: Karena W > 7.815, H 0 ditolak, sehingga pada tingkat


signifikansi 0.05 terdapat perbedaan yang bermakna secara statistik
antara proporsi perokok pada keempat tingkatan jabatan akademik
dosen di DKI Jakarta.

 Tabel r×c
Bentuk umum paparan data untuk tabel r×c dapat diperlihatkan pada
tabel 7.13 di bawah ini.

Tabel 7.13. Bentuk umum paparan data untuk tabel r×c

Variabel B
Variabel A Jumlah
B1 B2 ... Bc
A1 O11 O12 ... O1c n1
A2 O21 O22 ... O2c n2
... ... ... ... ... ...
Ar Or1 Or 2 ... Orc nr
Jumlah m1 m2 ... mc n

Contoh 7.5:
Dari empat jurusan pada Akademi KLM diambil sampel acak yang
terdiri atas 100 orang mahasiswa untuk tiap jurusan. Tiap mahasiswa
ditanyai pendapatnya terhadap pernyataan “Aplikasi komputer sangat perlu

228
dipelajari oleh semua mahasiswa akademi ini”. Pendapat mahasiswa
diklasifikasikan berupa: Setuju, netral, dan tidak setuju.
Hasil pengumpulan pendapat mahasiswa tersebut disajikan pada tabel
7.14.a, sedangkan frekuensi harapannya pada tabel 7.14.b dihitung dengan
ni m j
menggunakan rumus Eij = .
n
Tabel 7.14. Pendapat mahasiswa mengenai keperluan untuk
mempelajari aplikasi komputer
a. Tabel observasi
Pendapat
Jurusan Jumlah
Setuju Netral Tidak setuju
A 47 18 35 100
B 60 12 28 100
C 68 11 21 100
D 73 7 20 100
Jumlah 248 48 104 100

b. Tabel harapan
Pendapat
Jurusan Jumlah
Setuju Netral Tidak setuju
A 62 12 26 100
B 62 12 26 100
C 62 12 26 100
D 62 12 26 100
Jumlah 248 48 104 100

Uji hipotesis:
1. Jenis uji statistik: Uji khi-kuadrat (uji homogenitas).
2. Hipotesis: H 0 : Pi1 = P1 ; Pi 2 = P2 ; . . . ; i = 1, 2, . . . , r
H1 : H 0 tidak benar
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis: W > χ (26; 0.05) , yaitu W > 12.592.

5. Statistik penguji:

229
2
2
Wuji = χ uji = ∑∑
r c ( Oij − Eij ) =
i =1 j =1 Eij

=
( 47 − 62 )2 +
(18 − 12 )2 +
( 35 − 26 )2 +...+
62 12 26
( 7 − 12 )2 +
( 20 − 26 )2 = 17.01
12 26
yang berdistribusi χ 2 dengan derajat bebas (r – 1)(c – 1) = (3)(2) = 6.

6. Kesimpulan: Karena W > 12.592, H 0 ditolak, sehingga pada tingkat


signifikansi 0.05 terdapat perbedaan yang bermakna secara statistik
antara distribusi pendapat terhadap pernyataan “Aplikasi komputer
sangat perlu dipelajari oleh semua mahasiswa akademi ini” di keempat
jurusan akademi KLM.

230
7.3. UJI INDEPENDENSI

 Tabel 2×2
Pada uji indepedensi yang hendak diuji ialah apakah peristiwa A dan
B merupakan kejadian yang saling berkaitan (dependen) / memiliki asosiasi
dengan hipotesis:

( )
H 0 : P ( A B ) = P A BC = P ( A) ) (7.9.a)

atau: H : P ( B A) = P ( B A ) = P ( B )
0
C
) (7.9.b)

atau: H 0 : P ( A ∩ B ) = P ( A) P ( B ) ) (7.9.c)

Jika H 0 ditolak, disimpulkan bahwa ada asosiasi yang bermakna


secara statistik antara peristiwa A dengan peristiwa B, sedangkan jika H 0
tidak ditolak, disimpulkan bahwa tidak ada asosiasi yang bermakna secara
statistik antara peristiwa A dengan peristiwa B.
.
Statistik penguji dan daerah kritis untuk uji indepedensi sama seperti
pada uji homogenitas.

Contoh 7.6:
Pemeriksaan untuk penyakit gula (diabetes mellitus; DM) dan
jantung koroner (PJK) terhadap sampel acak 200 orang pria berusia 50-65
tahun memberikan hasil sebagai berikut:
Tabel 7.15. Diabetes mellitus dan penyakit jantung koroner pada pria
usia lanjut

PJK
DM
Ada: B Tidak ada: BC Jumlah
Ada: A 16 20 36
Tidak ada: AC 32 132 164
Jumlah 48 152 200

231
Uji hipotesis:
1. Jenis uji statistik: uji khi-kuadrat (uji independensi).

2. Hipotesis: H 0 : A dan B independen, yaitu:

( )
H 0 : P ( A B ) = P A BC = P ( A)

atau: H : P ( B A) = P ( B A ) = P ( B )
0
C

atau: H 0 : P ( A ∩ B ) = P ( A) P ( B )
H1 : H 0 tidak benar, atau A dan B tidak independen.
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis: W > χ (21; 0.05) atau W > 3.84.

5. Statistik penguji:

2 n ( ad − bc )2
Wuji = χ uji =
n1n2 m1m2

( 200 ) (16 )(132 ) − ( 20 )( 32 )  2


= = 10.06
( 36 )(164 )( 48)(152 )
yang berdistribusi χ 2 dengan derajat bebas 1.

5. Kesimpulan: Karena W > 3.84, H 0 ditolak, sehingga pada tingkat


signifikansi 0.05 terdapat asosiasi yang bermakna secara statistik antara
kejadian DM dan PJK pada kelompok pria berusia 50-65 tahun.

 Tabel r×c
Bentuk hipotesis yang diuji di sini sama seperti untuk tabel 2×2,
yaitu:

( )
H 0 : P ( A B ) = P A BC = P ( A) ) (7.10.a)

atau: H : P ( B A) = P ( B A ) = P ( B )
0
C
) (7.10.b)

atau: H 0 : P ( A ∩ B ) = P ( A) P ( B ) ) (7.10.c)

232
sedangkan statistik penguji dan daerah kritisnya sama seperti pada uji
homogenetis untuk tabel r×c.

Contoh 7.7:
Sampel acak yang terdiri atas 1,000 orang responden diklasifikasi-
silangkan menurut kebiasaan merokok (berat, sedang, tidak merokok) dan
tinggi badan (tinggi, sedang, pendek). Frekuensi pengamatan beserta
frekuensi harapannya (dalam kurung) adalah sebagai berikut:

Tabel 7.16. Tinggi badan dan kebiasaan merokok

Kebiasaan Tinggi badan


Jumlah
merokok Tinggi Sedang Pendek
Berat 102 (127) 290 (282) 132 (114) 524
Sedang 102 (85) 182 (188) 64 (76) 348
Tidak merokok 39 (31) 67 (69) 22 (28) 128
Jumlah 243 539 218 1000

Keterangan: Angka-angka dalam kurung menyatakan frekuensi


harapan.

Uji hipotesis:
1. Jenis uji statistik: uji khi-kuadrat (uji indepedensi).

2. Hipotesis: H 0 : Kebiasaan merokok dan tinggi badan independen.


H1 : H 0 tidak benar.

3. Tingkat signifikansi: α = 0.01.

4. Daerah kritis: W > χ (24; 0.01) yaitu W > 13.277.

5. Statistik penguji:
2
3 3 ( Oij − Eij )
2
Wuji = χ uji = ∑∑
i =1 j =1 Eij

=
(102 − 127 )2 +
( 290 − 282 )2 +
(132 − 114 )2 +...+
127 282 114

233
( 67 − 69 )2 +
( 22 − 28 )2 = 16.93
69 28

yang berdistribusi χ 2 dengan derajat bebas (r – 1)(c – 1) = (2)(2) = 4.

6. Kesimpulan: Karena W > 13.277, H 0 ditolak, sehingga pada tingkat


signifikansi 0.01 terdapat asosiasi yang bermakna secara statistik antara
kebiasaan merokok dan tinggi badan.

234
LAMPIRAN 7A: UKURAN ASOSIASI PADA
TABEL KONTIJENSI
Dalam pembahasan terdahulu telah ditunjukkan bahwa keeratan
hubungan antara dua variabel yang berskala kontinu / numerik dapat diukur
dengan koefisien korelasi Pearson. Untuk dua variabel berskala kategorik
yang datanya disajikan dalam bentuk tabel kontijensi, terdapat berbagai
ukuran untuk menyatakan keeratan hubungan antara kedua variabel tersebut,
namun tidak ada satupun di antaranya yang diterima sebagai ukuran tunggal
asosiasi terbaik, walaupun ada satu atau beberapa di antaranya yang lebih
banyak digunakan daripada yang lain. Di sini hanya akan dibahas beberapa
ukuran asosiasi (measures of association; ukuran ketergantungan; measures
of dependence), terutama untuk kontijensi 2×2.

Tabel VII.1. Bentuk umum tabel 2×2 untuk pembahasan ukuran


asosiasi
Variabel B
Variabel A
B1 B2 Jumlah
A1 a b n1
A2 c d n2
Jumlah m1 m2 n

 Koefisien phi:
2
χuji
φ= (7.11)
n

 Koefisien kontijensi Pearson:


2
χuji
P= 2 (7.12)
n + χuji

 Koefisien kontijensi Cramer (dapat digunakan untuk tabel r×c):

2
χuji
C= (7.13)
n ( q − 1)

235
dengan: q = min (r ; c)

 Ukuran Q Yule (Yule’s Q):


ad − bc
Q̂ = (7.14)
ad + bc
Untuk n besar, Q berdistribusi normal dengan variansi:

( )  1a + b1 + 1c + d1 
1 2
Var ( )
ˆ Qˆ =
4
1 − Qˆ 2 (7.15)

sehingga dapat dihitung interval konfidensi 100(1 − α)%-nya.

 Rasio imbangan (rasio odds; odds ratio):

ad
ORˆ = (7.16)
bc

Untuk n besar, transformasi logaritma rasio imbangan ln ORˆ


berdistribusi normal dengan variansi:

1 1 1 1
ˆ (ln ORˆ ) =  + + + 
Var (7.17)
a b c d
sehingga dapat dihitung interval konfidensi 100(1 − α)%-nya.
Nilai rasio imbangan berkisar antara nol sampai dengan tak berhingga.
Tidak adanya asosiasi antara variabel baris dengan variabel kolom
dinyatakan dengan nilai rasio imbangan sama dengan satu.

Contoh VII.1:
Lihat kembali data pria berpenyakit DM dan PJK pada contoh 7.6,
yang disajikan kembali di bawah ini:

Tabel 7.15. Diabetes melitus dan penyakit jantung koroner pada pria
usia lanjut
PJK
DM
Ada: B Tidak ada: BC Jumlah
Ada: A a = 16 b = 20 36
Tidak ada: AC c = 32 d = 132 164
Jumlah 48 152 n = 200

236
2
Pada contoh 7.6 telah dihitung nilai statistik penguji χ uji = 10.06.

a. Koefisien phi adalah:


2
χuji
φ=
n
10.06
= = 0.224
200
b. Koefisien kontijensi Pearson adalah:
2
χuji
P= 2
n + χuji
10.06
= = 0.219
200 + 10.06
c. Koefisien kontijensi Cramer adalah:
2
χuji
C=
n ( q − 1)

Untuk tabel 2×2, q = min (r ; c) = 2 sehingga koefisien kontijensi


Cramer bernilai sama dengan koefisien phi:
C = 0.224
d. Ukuran Q Yule adalah:
ad − bc
Q̂ =
ad + bc

=
(16 )(132 ) − ( 20 )( 32 ) = 0.535
(16 )(132 ) + ( 20 )( 32 )
Standard error Q̂ adalah:

( )  a1 + b1 + 1c + d1 
1 2
( )
SEˆ Qˆ =
4
1 − Qˆ 2

(4 1 − 0.535 )  161 + 201 + 321 + 1321  = 0.139


1 2
2
=

Interval konfidensi 95% ukuran Q adalah:


Q̂ + Z0.025 . SEˆ Qˆ ( )
237
atau: 0.535 + (1.96)(0.139)
yaitu: [0.263 ; 0.807]
e. Rasio imbangan adalah:
ad
ORˆ =
bc

=
(16 )(132 ) = 3.3
( 20 )( 32 )
Transformasi logaritma ORˆ adalah:
ln ORˆ = ln 3.3 = 1.194

Standard error ln ORˆ adalah:


1 1 1 1
SEˆ (ln ORˆ ) =  + + + 
a b c d 
1 1 1 1 
=  + + +  = 0.389
 16 20 32 132 
Interval konfidensi 95% ln OR adalah:
ln ORˆ ± Z0.025 . SEˆ (ln ORˆ )
atau: 1.194 + (1.96)(0.389)
yaitu: [0.431 ; 1.956]
Interval konfidensi 95% OR adalah:
[exp 0.431 ; exp 1.956]
yaitu: [1.540 ; 7.074]

238
LAMPIRAN 7B: UKURAN SAMPEL MINIMUM
UNTUK UJI KESAMAAN BEBERAPA PROPORSI
Pada bab 3, subbab 3.4 telah dibahas cara penentuan ukuran sampel
minimum untuk uji kesamaan 2 proporsi, sedangkan dalam lampiran 6D
pada pembahasan mengenai ukuran sampel minimum untuk uji kesamaan
beberapa nilai rerata telah dijelaskan mengenai kelompok kontrol serta
alokasi rasio uji-kontrol. Konsep-konsep dalam pembahasan terdahulu
tersebut akan digunakan kembali pada penentuan ukuran sampel minimum
untuk uji kesamaan beberapa proporsi pada tabel kontijensi r×2 di sini.
Misalkan hendak dilakukan uji homogenitas khi-kuadrat untuk
mengkaji kesamaan proporsi pada k kelompok perbandingan dengan sampel
berukuran minimum yang dibutuhkan, yang terdiri atas:
a. Satu kelompok kontrol (control group), dengan ukuran kelompok nc .
b. (k – 1) kelompok uji (test groups), masing-masing dengan ukuran
kelompok nt .
Ukuran sampel seluruhnya adalah:
n = (k – 1) nt + nc (7.18)

Perbandingan ukuran satu kelompok uji nt dengan ukuran kelompok


kontrol nc dinamakan ‘rasio alokasi uji-kontrol’ (test-control allocation
ratio):
nt
λ= (7.19)
nc

Ukuran kelompok kontrol minimum adalah:


2
  λ +1  
 Zα 2   PQ + Z β P Q
c c + PQ
t t λ 
  λ  
nc = (7.20)
( Pc − Pt )2
Pc : proporsi pada populasi kontrol
Pt : proporsi pada populasi uji

239
Qc = 1 − Pc Qt = 1 − Pt (7.21)

Pc + λ Pt
P = Q =1− P (7.22)
1+ λ
d = ( Pc − Pt ) : perbedaan minimum yang hendak dideteksi antara
proporsi pada populasi kontrol dan populasi uji.
Ukuran satu kelompok uji adalah:
nt = λ nc (7.19.a)

Untuk λ = 1 (alokasi uniform), maka:


2
Z ( 2PQ ) + Z β PcQc + PQ 
nc =  α 2 t t
 (7.23)
( Pc − Pt )2
dan: nt = nc (7.24)

Contoh VII.2:
Lihat kembali data tentang insomnia pada 3 kelompok usia pada
contoh 7.1, tabel 7.4. Misalkan sebelum penelitian terlebih dahulu dilakukan
perhitungan ukuran sampel minimum untuk mendeteksi adanya perbedaan
proporsi penderita insomnia sebesar 0.10 pada 2 kelompok usia 18-34 tahun
dan 35-54 tahun, dibandingkan dengan proporsi penderita insomnia pada
kelompok usia 55-74 tahun sebagai kelompok kontrol. Hasil penelitian
pendahuluan menunjukkan estimasi proporsi penderita insomnia pada
kelompok kontrol sebesar 50%. Dengan tingkat signifikansi 5% dan
kekuatan uji 80%, maka:
k=3 d = 0.10
Pˆc = pc = 0.50
Pˆ = p = p − d = 0.50 – 0.10 = 0.40
t t c
qc = 1 − pc = 1 – 0.50 = 0.50
qt = 1 − pt = 1 – 0.40 = 0.60
α = 0.05 Zα 2 = 1.96
1 – β = 0.80 Z β = 0.84

Dengan alokasi uniform, maka λ = 1, sehingga:

240
pc + pt s 0.50 + 0.40
p = = = 0.45
2 2
q = 1 − p = 1 – 0.45 = 0.55
Ukuran minimum kelompok kontrol adalah:
2
Z ( 2PQ ) + Z β PcQc + PQ 
 α t t
nc =  
2

( Pc − Pt )2
2
1.96 ( 2 )( 0.45 )( 0.55) + 0.84 ( 0.50 )( 0.50 ) + ( 0.40 )( 0.60 ) 
= 
0.102
= 387.35 ≈ 388
Ukuran minimum satu kelompok uji adalah:
nt = nc = 388
Ukuran sampel seluruhnya adalah:
n = (k – 1) nt + nc
= (2)(388) + 388 = 1,164

241
LATIHAN 7
Bagian Pertama
Pilihlah satu jawaban yang paling benar !

1. Uji 2-sisi (two-sided test) adalah pengujian terhadap hipotesis


H 0 : θ = θο , sedangkan uji 2-ekor (two-tail test) yaitu uji dengan
daerah kritis (daerah penolakan) berada di kedua ekor distribusi
sampling. Kedua istilah ini memiliki pengertian yang serupa pada:
A. Uji t C. Keduanya benar
B. Uji khi-Kuadrat D. Keduanya salah

2. Untuk menguji hubungan antara variabel independen kategorik


dengan variabel dependen kategorik, metode statistik yang digunakan
adalah:
A. Uji Z . C. Analisis regresi linear.
B. Analisis variansi D. Uji khi-kuadrat Pearson

3. Penggunaan uji khi-kuadrat bagi data kategorik antara lain adalah


untuk:
A. Uji homogenitas
B. Uji independensi
C. Uji kebaikan-suai (goodness-of-fit)
D. Semuanya benar

4. Pada uji khi-kuadrat terhadap tabel kontijensi r×c (r baris dan c


kolom), statistik penguji yang dihasilkan memiliki derajat bebas
sebesar:
A. r×c C. (r – 1) × (c – 1)
B. (r×c) − 1 D. Semuanya salah.

5. Data yang dianalisis dengan uji independensi berasal dari:


A. Satu sampel C. Tiga sampel
B. Dua sampel D. Semuanya salah.

242
6. Pada sampel 100 orang mahasiswa wanita teradapat 25 orang
penderita nyeri kepala kronis, sedangkan pada sampel 100 orang
mahasiswa pria hanya pada 14 penderita kelainan yang sama. Untuk
mengkaji ada tidaknya perbedaan proporsi penderita nyeri kepala
diantara mahasiswa pria dan wanita secara statistik digunakan:
A. Uji Z untuk kesamaan proporsi
B. Uji khi-kuadrat
C. Keduanya dapat digunakan
D. Keduanya tidak dapat digunakan

7. Frekuensi harapan pada tabel r×c menyatakan:


A. Frekuensi yang diharapkan akan terjadi jika variabel baris
memiliki asosiasi dengan variabel kolom.
B. Frekuensi yang diharapkan akan terjadi jika variabel baris tidak
memiliki asosiasi dengan variabel kolom.
C. Frekuensi yang diharapkan akan terjadi jika variabel baris dan
variabel kolom tidak independen.
D. Semuanya salah.

8. Frekuensi marginal pada tabel harapan:


A. Lebih kecil daripada frekuensi marginal pada tabel observasi.
B. Sama besar dengan frekuensi marginal pada tabel observasi.
C. Lebih besar daripada frekuensi marginal pada tabel observasi.
D. Semuanya salah.

9. Hipotesis H 0 : A dan B independen dapat juga dinyatakan sebagai:


A. P ( A B ) = P ( B A ) C. P ( A ∪ B ) = P ( A ) P ( B )
B. P ( A B ) = P ( A B C ) D. Semuanya benar

10. Data untuk mengkaji hubungan usia(muda, dewasa, tua) dengan


kebiasaan merokok (bukan perokok, perokok ringan, perokok berat)
yang disajikan dalam bentuk tabulasi silang memiliki derajat bebas:
A. 1 C. 6
B. 4 D. 9

243
Bagian Kedua
Pilihlah satu jawaban yang paling benar !

Untuk soal No. 1 s.d. 6:


Untuk menguji kebenaran dugaan bahwa kelompok orang usia lanjut
lebih sedikit tidurnya dibandingkan kelompok orang usia muda, diambil
sampel acak 250 orang berusia 30-40 tahun dan 250 orang berusia 60-70
tahun, lalu ditanyakan kebiasaan tidurnya. Hasilnya adalah sebagai berikut:

Jam tidur Umur (tahun)


(jam/hari) 30-40 60-70
<8 172 120
>8 78 130

1. Uji statistik untuk data di atas tergolong dalam:


A. Uji indepedensi C. Keduanya benar
B. Uji homogenitas D. Keduanya salah

2. Jika P1 menyatakan proporsi orang usia muda yang tidurnya kurang


daripada 8 jam/hari, dan P2 menyatakan proporsi hal yang sama pada
orang usia lanjut, maka dengan menggunakan uji khi-kuadrat untuk
data di atas, hipotesis yang diujiialah:
A. H 0 : P1 ≤ P2 C. H 0 : P1 ≥ P2
B. H 0 : P1 = P2 D. Semuanya salah

3. Statistik penguji untuk data di atas besarnya adalah:


A. 1.712 C. 4.452
B. 3.425 D. 22.26

4. Statistik penguji tersebut berdistribusi khi-kuadrat dengan derajat


bebas:
A. 1 C. 3
B. 2 d. 4

5. Dengan tingkat signifikansi α = 5% , nilai kritis untuk statistik


penguji ialah:
A. 3.84 C. 9.49
B. 5.02 D. 11.14

244
6. Kesimpulan yang diperoleh:
A. Pada tingkat signifikansi 5%, terdapat perbedaan proporsi
individu yang tidur lebih sedikit yang bermakna secara statistik di
antara kelompok usia muda dan kelompok usia lanjut.
B. Pada tingkat signifikansi 5%, tidak terdapat perbedaan proporsi
individu yang tidur lebih sedikit yang bermakna secara statistik di
antara kelompok usia muda dan kelompok usia lanjut.
C. Pada tingkat signifikansi 10%, tidak terdapat perbedaan proporsi
individu yang tidur lebih sedikit yang bermakna secara statistik di
antara kelompok usia muda dan kelompok usia lanjut.
D. Semuanya salah.

Untuk soal No. 7 s.d. 12:


Polusi sulfur dioksida di udara dapat menyebabkan kerusakan
tanaman. Untuk mempelajari pengaruhnya terhadap berbagai jenis sayuran
kebun, 40 tanaman masing-masing jenis sayuran ditanam dalam rumah hijau
yang terpolusi sulfur dioksida dengan hasil sebagai berikut:

Jenis sayuran
Kerusakan daun
Kubis Bayam Tomat
Parah 32 28 19
Sedikit/tidak rusak 8 12 21

7. Frekuensi observasi tanaman bayam yang rusak parah adalah:


A. 12 C. 28
B. 19 D. 32

8. Frekuensi harapan tanaman kubis yang rusak parah adalah:


A. 13.67 C. 28.00
B. 26.33 D. 32.00

9. Nilai ( Oij − Eij ) untuk tanaman tomat yang sedikit / tidak rusak
adalah:
A. −5.33 C. 5.33
B. −7.33 D. 7.33

2
10. Nilai ( Oij − Eij ) untuk tanaman kubis yang sedikit / tidak rusak
adalah:
A. 2.78 C. 205.44
B. 32.11 D. 336.11
245
2
11. Nilai ( Oij − Eij ) / Eij untuk tanaman tomat yang rusak parah adalah:
A. 1.08 C. 2.08
B. 2.04 D. 3.39

12. Statistik penguji besarnya adalah:


A. 3.67 C. 5.92
B. 3.88 D. 9.85

Bagian Ketiga

Untuk soal No. 1 s.d. 4:


Tabel di bawah ini menunjukkan hasil uji coba sebuah vaksin baru
terhadap hewan ternak, yaitu jumlah ternak yang hidup dan mati pada saat
wabah.
Fatal Non-fatal
Vaksinasi 6 114
Tanpa vaksinasi 18 162

1. Uji statistik yang relevan untuk menganalisis data di atas ialah:


A. Uji khi-kuadrat Pearson C. Uji eksak Fisher
B. Uji McNemar D. Semuanya benar

2. Dengan menggunakan uji khi-kuadrat, statistik penguji untuk data di


atas besarnya adalah:
A. 1.355 C. 4.765
B. 2.446 D. 12.36

3. Dengan tingkat signifikansi α = 5%, nilai kritis untuk statistik


penguji ialah:
A. 3.84 C. 9.49
B. 5.02 D. 11.14

246
4. Kesimpulan yang diperoleh yaitu:
A. Pada tingkat signifikansi 5%, terdapat perbedaan proporsi
kematian ternak yang bermakna secara signifikansi di antara
kelompok dengan vaksinasi dan kelompok tanpa vaksinasi.
B. Pada tingkat signifikansi 5%, tidak terdapat perbedaan proporsi
kematian ternak yang bermakna secara statistik di antara
kelompok dengan vaksinasi dan kelompok tanpa vaksinasi.
C. Pada tingkat signifikansi 10%, terdapat perbedaan proporsi
kematian ternak yang bermakna secara statistik di antara
kelompok dengan vaksinasi dan kelompok tanpa vaksinasi.
D. Semuanya salah.

Untuk soal No. 5 s.d. 7:


Seorang pekerja sosial berdasarkan hasil wawancaranya terhadap
pasangan-pasangan suami istri yang mengurus perceraian, hendak meneliti
apakah ada kaitan masa penjajakan pra-nikah (lama hubungan sebelum
menikah) dengan usia perkawinan (lama perkawainan dapat dipertahankan).
Data yang ada yaitu:
Usia perkawinan
Masa penjajagan pra-nikah
< 4 tahun > 4 tahun
Kurang daripada ½ tahun 11 8
½ - 1 ½ tahun 28 24
Lebih daripada 1 ½ tahun 21 19

5. Untuk menguji H 0 : tidak ada asosiasi antara masa penjajagan pra-


nikah dengan usia perkawinan, statistik pengujinya besarnya adalah:
A. 0.15 C. 3.84
C. 1.33 D. 4.11

6. Dengan tingkat signifikansi α = 5% , nilai kritis untuk statistik


penguji adalah:
A. 3.841 C. 5.991
B. 5.024 D. 7.378

247
7. Kesimpulan yang diperoleh yaitu:
A. Pada tingkat signifikansi 1%, terdapat asosiasi yang bermakna
secara statistik antara masa penjajagan pra-nikah dengan usia
perkawainan.
B. Pada tingkat signifikansi 5%, terdapat asosiasi yang bermakna
secara statistik antara masa penjajagan pra-nikah dengan usia
perkawinan.
C. Pada tingkat signifikansi 10%, terdapat asosiasi yang bermakna
secara statistik penjajagan pra-nikah dengan usia perkawinan.
D. Semuanya salah.

248
BAB 8
ANALISIS DATA KATEGORIK II
8.1. UJI EKSAK FISHER
Dalam pengambilan sampel di lapangan yang umumnya selalu
dilakukan dalam bentuk tanpa pengembalian, penggunaan distribusi binomial
sebagai dasar perhitungan probabilitas dianggap valid apabila sampel
berukuran cukup besar. Pada uji khi-kuadrat Pearson yang didasarkan atas
selisih 2 proporsi binomial, dibutuhkan ukuran sampel yang cukup besar
yang dinyatakan dalam bentuk persyaratan bahwa tidak ada sel dengan
frekuensi harapan lebih kecil daripada lima.
Adanya frekuensi harapan yang lebih kecil daripada lima pada salah
satu sel dalam tabel 2×2 mengindikasikan ukuran sampel yang terlalu kecil
untuk dianalisis dengan menggunakan distribusi binomial dan uji khi-kuadrat
Pearson, dan dalam keadaan tersebut perhitungan probabilitas didasarkan
atas distribusi hipergeometrik, yaitu dengan uji eksak Fisher.
Pada uji eksak Fisher tidak ada statistik penguji, dan uji hipotesis
dilakukan dengan menghitung secara langsung nilai p-nya.

Contoh 8.1:
Misalkan dimiliki data keinginan bunuh diri pada 20 penderita
psikokis dan 20 penderita neurosis sebagai berikut:

Tabel 8.1. Keinginan bunuh diri pada pasien psikokis dan neurosis
Keinginan bunuh diri
Tipe pasien
Ada Tidak ada Jumlah
Psikosis a = 2 (4) b = 18 (16) n1 = 20
Neurosis c = 6 (4) d = 14 (16) n2 = 20
Jumlah m1 = 8 m2 = 32 n = 40
Keterangan: Angka dalam kurung menyatakan frekuensi harapan
Nilai p mencakup probabilitas komposisi data yang sama dengan dan
lebih ekstrim daripada data sampel. Data sampel menunjukkan nilai O11 = a
= 2.

249
Misalkan P1 menyatakan proporsi yang berkeinginan bunuh diri dari
pada populasi penderita psikosis dan P2 menyatakan proporsi serupa pada
populasi penderita neurosis. Pada pengujian hipotesis H 0 : P1 > P2
,
komposisi data yang lebih ekstrim daripada a = 2 mencakup nilai-nilai a = 1
dan a = 0 (lihat tabel 8.2.a dan 8.2.b).

Tabel 8.2. Tabel dengan frekuensi sel yang lebih ekstrim daripada
pengamatan
(a) (b)
1 19 20 0 20 20
7 13 20 8 12 20
8 32 40 8 32 40

Atas dasar distribusi hipergeometrik, probabilitas untuk mendapatkan


nilai a sebagai frekuensi pengamatan untuk sel kiri atas (dan komposisi
keseluruhan tabel) adalah:
 n !  n !
n1 n2  1  2 
 a !b !  c ! d !
P (a) = a n c = 
C C
Cm1 n!
m1 ! m2 !
n !n !m!m !
P (a) = 1 2 1 2 (8.1)
a ! b! c! d ! n!
Nilai p 1-sisi adalah (lihat perhitungan pada tabel 8.3):
p = P (a = 2) + P (a = 1) + P (a = 0)

Tabel 8.3. Perhitungan nilai p satu-sisi


a P (a)
20! 20! 8! 32!
2 = 0.0958
2! 18! 6! 14! 40!
20! 20! 8! 32!
1 = 0.0202
1! 19! 7! 13! 40!
20! 20! 8! 32!
0 = 0.0016
0! 20! 8! 12! 40!
p P (2) + P (1) + P (0) = 0.1176

250
Dengan tingkat signifikansi α = 0.05, nilai p yang diperoleh lebih
besar daripada α, sehingga hipotesis nol yang menyatakan tidak ada
hubungan antara tipe kelainan jiwa pasien dengan keinginan bunuh diri tidak
ditolak.
Dikenal tiga versi uji eksak Fisher:
1. Uji eksak Fisher 1-sisi: Merupakan bentuk yang lazim digunakan,
seperti pada contoh 8.1 diatas.
2. Uji eksak Fisher-Irwin 2-sisi: Nilai p 2-sisi diperoleh sebagai hasil
penjumlahan nilai p 1-sisi pada uji eksak Fisher 1-sisi ditambah dengan
probabilitas di pihak yang berseberangan pada distribusi probabilitas a
(lihat contoh 8.2).
3. Uji eksak Fisher 2-sisi: Nilai p diperoleh dengan mengali-duakan nilai
p 1-sisi pada uji eksak Fisher 1-sisi. Pada contoh 8.1 , nilai p 1-sisi
adalah 0.1176, sehingga p 2-sisi adalah (2)(0.1176) = 0.2352.

Contoh 8.2:
Lihat kembali data pada soal 8.1 (tabel 8.1). Secara teoretis, rentang
nilai a berkisar antara 0 s.d. 2. Pada uji eksak Fisher 1-sisi (soal 8.1) telah
dihitung nilai p 1-sisi sebagai penjumlahan probabilitas P (a = 2) + P (a = 1)
+ P (a = 0) = 0.1176.
Pada pihak yang ‘berseberangan’ akan dihitung nilai p sebagai
penjumlahan probabilitas P (a = 6) + P (a = 7) + P (a = 8). Penyajian
datanya diperlihatkan pada tabel 8.4, sedangkan perhitungan pada tabel 8.5.

Tabel 8.4. Tabel dengan frekuensi sel yang lebih ekstrim daripada
pengamatan
(a) (b)
6 14 20 7 13 20
2 18 20 1 19 20
8 32 40 8 32 40

(c)
8 12 20
0 20 20
8 32 40

251
Tabel 8.5. Perhitungan nilai p 1-sisi
a P (a )
20! 20! 8! 32!
6 = 0.0958
6! 14! 2! 18! 40!
20! 20! 8! 32!
7 = 0.0202
7! 13! 1! 19! 40!
20! 20! 8! 32!
8 = 0.0016
8! 12! 0! 20! 40!
p P (6) + P (7) + P (8) = 0.1176

Diperoleh nilai p 2-sisi uji Fisher-Irwin:


p = [P (2) + P (1) + P (0)] + [P (6) + P (7) + P (8)]
= 0.1176 + 0.1176 = 0.2352

Tampak di sini bahwa distribusi probabilitas a kurang lebih simetris:


P (a = 2) ≈ P (a = 6); P (a = 1) ≈ P (a = 7); dan P (a = 0) ≈ P (a = 8);
sehingga hasil uji eksak Fisher-Irwin 2-sisi (nilai p-nya) di sini tepat sama
dengan hasil uji eksak Fisher 2-sisi, walaupun begitu hal ini tidak selalu
terjadi demikian.

252
8.2. UJI KEBAIKAN-SUAI (UJI GOODNESS-OF-FIT)
Uji kebaikan-suai (goodness-of-fit) adalah uji statistik untuk menilai
sejauh mana kesesuaian data sampel yang ada dengan bentuk distribusi yang
dispesifikasikan dalam hipotesis nol. Bentuk distribusi menurut hipotesis nol
tersebut dapat berupa:
a. Distribusi data lampau (tanpa disertai spesifikasi bentuk
distribusinya).
b. Distribusi tertentu, misalnya distribusi normal, distribusi Poisson, dan
sebagainya.

 Uji Normalitas
Yang akan dibahas di sini hanya uji kebaikan-suai yang terbanyak
digunakan dalam praktik, yaitu uji normalitas (uji goodness-of-fit distribusi
normal). Uji ini digunakan untuk menilai apakah data sampel yang diperoleh
dapat dianggap berasal dari populasi normal. Selain uji normalitas khi-
kuadrat yang dibahas di sini masih ada beberapa uji normalitas lain, misalnya
uji Kolmogorov-Smirnov (uji Lilliefors), uji Shapiro-Wilk, dan sebagainya.
Uji normalitas khi-kuadrat sebenarnya bukanlah diperuntukkan bagi
analisis data kategorik murni, karena data sampel akan diuji berskala kontinu
atau sekurang-kurangnya numerik, yang untuk pengujiannya terlebih dahulu
harus dikategorisasikan. Distribusi frekuensi yang diperoleh sebagai hasil
kategorisasi ini disajikan sebagai tabel observasi dalam bentuk tabel 1×c
(lihat tabel 7.1.a) atau dapat pula dalam bentuk tabel r×1.
Uji khi-kuadrat untuk normalitas data terdiri atas 2 tahap, yaitu
perhitungan frekuensi harapan dan uji hipotesis.

 Perhitungan Frekuensi Harapan


Frekuensi harapan diperoleh dengan mengkategorisasikan distribusi
normal tertentu yang memiliki rerata dan standar deviasi yang
dispesifikasikan dalam hipotesis. Jika rerata dan standar deviasi ini tidak
dispesifikasikan, harus digunakan nilai-nilai estimasinya yang diperoleh dari
sampel.

Contoh 8.3:
Misalkan dimiliki data usia hidup 40 aki merek PQR dengan
distribusi frekuensi seperti terlihat tabel 8.6 (jika data yang ada berskala

253
kontinu harus terlebih dahulu dikategorisasikan, lihat buku teks Metode
Statistika I, bab 2: Peringkasan Data). Tabel distribusi frekuensi ini
merupakan tabel observasi untuk uji normalitas khi-kuadrat.

Tabel 8.6. Distribusi frekuensi usia hidup 40 aki merek PQR

Usia hidup (tahun) fj


1.45−1.95 2
1.95−2.45 1
2.45−2.95 4
2.95−3.45 15
3.45−3.95 10
3.95−4.45 5
4.45−4.95 3
n = ∑ fj 40
j

Langkah-langkah perhitungan frekuensi harapan:


1. Cari parameter populasi normal (µ dan σ):
Untuk menghitung frekuensi harapan seandainya sampel di atas berasal
dari populasi normal, perlu diketahui parameter populasinya, yaitu
rerata dan standar deviasi populasi. Karena nilai-nilai ini tak diketahui,
harus dihitung estimasinya, yaitu rerata dan standar deviasi sampel
(untuk perhitungan rerata dan standar deviasi data tak berkelompok,
lihat kembali buku teks Metode Statistika I, bab 3: Ukuran Statistik).

Tabel 8.7. Perhitungan rerata dan standar deviasi distribusi usia hidup
40 aki merek PQR

Interval kelas fj Xj fj X j f j X 2j
1.45-1.95 2 1.7 3.4 5.78
1.95-2.45 1 2.2 2.2 4.84
2.45-2.95 4 2.7 10.8 29.16
2.95-3.45 15 3.2 48.0 153.60
3.45-3.95 10 3.7 37.0 136.90
3.95-4.45 5 4.2 21.0 88.20
4.45-4.95 3 4.7 14.1 66.27
∑ fj
j
∑ fjX j
j
∑ f j X 2j
j

254
∑j f j X j
x = (8.2)
∑j f j
136.5
= = 3.4125
40
 
2 
 fj
∑j f j X j −  ∑ f j X j 
2
 j ∑j 
  
s= (8.3)
 
 ∑ f j  − 1
 j 

484.75 − 136.52 40 
 
= = 0.6969
40 − 1
2. Transformasi batas kelas menjadi nilai Z:
Dengan menggunakan transformasi:
Xj −µ
Zj =
σ
batas-batas kelas ditransformasikan ke dalam distribusi normal standar
(distribusi Z), nilai µ dan σ yang tidak diketahui disubstitusikan dengan
estimatornya x dan s:

Xj −x
Zj = (8.4)
s

255
Tabel 8.8. Transformasi batas kelas distribusi normal menjadi batas
kelas distribusi Z
Batas kelas Xj −x
distribusi normal: X j Batas kelas distribusi Z: Z j =
s
1.95 − 3.4125
1.95 = −2.10
0.6969
2.45 − 3.4125
2.45 = −1.38
0.6969
2.95 − 3.4125
2.95 = −0.66
0.6969
3.45 − 3.4125
3.45 = 0.05
0.6969
3.95 − 3.4125
3.95 = 0.77
0.6969
4.45 − 3.4125
4.45 = 1.49
0.6969

3. Tentukan luas area masing-masing kelas:


Dengan menggunakan tabel Z, tentukan luas area masing-masing kelas
dalam distribusi Z:

Tabel 8.9. Penentuan luas area masing-masing dalam distribusi Z


Interval kelas Luas area
Z < −2.10 0.0179
−2.10 < Z < −1.38 0.0659
−1.38 < Z < −0.66 0.1708
−0.66 < Z < 0.05 0.2653
0.05 < Z < 0.77 0.2595
0.77 < Z < 1.49 0.1525
Z > 1.49 0.0681
Jumlah luas area 1.0000

4. Hitung frekuensi harapan:


Frekuensi harapan untuk tiap kelas sesuai dengan luas areanya masing-
masing.

256
Tabel 8.10. Perhitungan frekuensi harapan untuk tiap kelas pada
distribusi Z

Interval kelas Frekuensi harapan ( E j )


1.45−1.95 0.0179 × 40 = 0.72
1.95−2.45 0.0659 × 40 = 2.64
2.45−2.95 0.1708 × 40 = 6.83
2.95−3.45 0.2653 × 40 = 10.61
3.45−3.95 0.2595 × 40 = 10.38
3.95−4.45 0.1525 × 40 = 6.10
4.45−4.95 0.0681 × 40 = 2.72
Jumlah 40
5. Penggabungan kelas:
Untuk digunakan dalam uji khi-kuadrat kebaikan-suai, tidak boleh ada
sel dengan frekuensi harapan lebih kecil daripada 5, sehingga jika perlu
harus dilakukan penggabungan kelas interval:

Tabel 8.11. Tabel harapan untuk distribusi frekuensi 40 aki merek PQR
No Kelas interval Frekuensi harapan
1 < 2.95 10.19
2 2.95 − 3.45 10.61
3 3.45 − 3.95 10.38
4 > 3.95 8.82
Jumlah 40

 Uji Hipotesis
Setelah tabel observasi diperoleh dan tabel harapannya disusun, dapat
dilakukan uji normalitas khi-kuadrat dengan langkah-langkah sebagai
berikut:
1. Jenis uji statistik: uji kebaikan-suai (uji khi-kuadrat).
2. Hipotesis:
H 0 : Sampel acak berasal dari populasi normal ) (8.5.a)
H1 : Distribusi populasi tidak normal ) (8.5.b)

3. Tingkat signifikansi: α = 0.01, 0.05, atau 0.10.

257
4. Daerah kritis: W > χ k2; α (8.6)

5. Statistik penguji:
2
c (O j − E j )
2
Wuji = χ uji = ∑
j =1 Ej
(8.7)

yang berdistribusi χ 2 dengan derajat bebas k, yaitu c dikurangi jumlah


kuantitas data observasi (data sampel) yang digunakan untuk
menghitung frekuensi harapan. Kuantitas yang diperlukan seluruhnya
ada 3, yaitu n (jumlah pengamatan), x (rerata sampel), dan s (standar
deviasi sampel).
6. Kesimpulan:
H 0 ditolak : Sampel dianggap tidak berasal dari populasi
normal.
H 0 tidak ditolak : Sampel dianggap berasal dari populasi normal.

Contoh 8.4:
Lihat data pada contoh 8.3. Hendak diuji apakah data sampel tersebut
berasal dari populasi normal.

Tabel 8.12. Distribusi frekuensi observasi dan harapan usia hidup 40 aki
merek PQR
No kelas 1 2 3 4
Oj 7 15 10 8
Ej 10.19 10.61 10.38 8.82

Uji hipotesis:
1. Jenis uji statistik: uji kebaikan-suai (uji khi-kuadrat).
2. Hipotesis:
H 0 : Sampel acak berasal dari populasi normal
H1 : Sampel acak berasal dari populasi tidak normal
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis: W > χ1;2 0.05 , yaitu W > 3.84.

258
5. Statistik penguji:
2
4 (O j − E j )
2
Wuji = χ uji = ∑
j =1 Ej

=
( 7 − 10.19 )2 +
(15 − 10.61)2 +
(10 − 10.38)2 +
10.19 10.61 10.38
(8 − 8.82 )2 = 2.91
8.82
yang berdistribusi χ 2 dengan derajat bebas k.
Digunakan 3 kuantitas sampel pada perhitungan frekuensi harapan,
yaitu ukuran sampel n, rerata sampel x , dan standar deviasi s, sehingga
k = c – 3 = 4 – 3 = 1.
6. Kesimpulan: Karena W > 3.84, Wuji tidak terletak pada daerah kritis
dan H 0 tidak ditolak, sehingga data sampel dapat dianggap berasal dari
populasi normal.

259
8.3. UJI MCNEMAR
Uji McNemar digunakan untuk data kategorik dikotomi berpasangan.
Pengertian data ‘berpasangan’ di sini adalah sama seperti pada uji t
berpasangan, yaitu data untuk dua variabel yang sama, yang berasal dari:
- Subjek yang sama pada bagian yang berbeda, misalnya bagian kiri dan
kanan tubuh.
- Subjek yang sama pada waktu yang berlainan, misalnya sebelum dan
sesudah ‘perlakuan’.
- Subjek berpasangan, misalnya pasangan anak kembar, pasangan subjek
yang ‘dipadankan’ (di-matched), dan sebagainya.
Bentuk umum paparan data kategorik berpasangan ‘sebelum’ dan
‘sesudah’ perlakuan diperlihatkan pada tabel 8.13. Pada uji McNemar yang
dipentingkan hanyalah frekuensi f dan g, yaitu jumlah subjek yang
mengalami perubahan ‘sebelum’ dan ‘sesudah’ perlakuan.

Tabel 8.13. Bentuk umum paparan data pada uji McNemar


Yi = Sesudah perlakuan
X i = Sebelum perlakuan
Yi = 1 Yi = 0
Xi = 1 e f
Xi = 0 g h

Langkah-langkah uji hipotesis:


1. Jenis uji statistik: Uji McNemar
2. Hipotesis: H 0 : P (f) = P (g) = 0.5 ) (8.8.a)
H1 : P (f) ≠ P (g) ) (8.8.b)
(hanya untuk responden yang menjalani perubahan)
3. Tingkat signifikansi: α
4. Daerah kritis: W > χ (21; α ) (8.9)

5. Statistik penguji:

(f − g )2
Wuji = (8.10)
f +g

260
yang berdistribusi khi-kuadrat dengan derajat bebas 1.
Jika hipotesis nol ditolak, disimpulkan bahwa ada perubahan yang
terkait dengan perlakuan yang telah diberikan, dengan kata lain perlakuan
dianggap efektif untuk menghasilkan perubahan.

Contoh 8.5:
Misalkan dilakukan pengumpulan pendapat dari 100 responden yang
dipilih secara acak, apakah akan memilih calon presiden dari Partai
Demokrat atau Partai Republik. Pengumpulan pendapat dilakukan sebelum
dan sesudah debat calon.

Tabel 8.14. Pilihan responden sebelum dan sesudah debat calon


presiden

Yi = Sesudah
X i = Sebelum
Demokrat Republik
Demokrat e = 63 f = 21
Republik g=4 h = 12

Uji hipotesis:
1. Jenis uji statistik: Uji McNemar
2. Hipotesis: H 0 : P (f) = P (g) = 0.5
H1 : P (f) ≠ P (g)
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis: W > χ (21; 0.05) , yaitu W > 3.84.

5. Statistik penguji:

(f − g )2
Wuji =
f +g
( 21 − 4 )2
= = 11.56
21 + 4
yang berdistribusi khi-kuadrat dengan derajat bebas 1.
6. Kesimpulan: Karena W > 3.84, H 0 ditolak, sehingga disimpulkan
bahwa pada tingkat signifikansi 0.05 ada perubahan pilihan responden
yang bermakna secara statistik sebagai hasil menyaksikan debat.

261
Uji McNemar digunakan untuk sampel berukuran besar. Untuk data
berpasangan kategorik yang berskala dikotomi, jika sampel berukuran kecil
digunakan uji tanda, yang akan diuraikan dalam pembahasan Metode
Statistika Non-Parametrik.

262
LAMPIRAN 8A: UKURAN KESEPAKATAN

Data berpasangan dapat diperoleh untuk variabel yang sama, namun


dikumpulkan oleh dua pengamat yang berbeda. Data demikian apabila
berskala kategorik dikotomi, termasuk dalam jenis data yang dapat dianalisis
dengan uji McNemar. Paparan data berpasangan tersebut diperlihatkan pada
tabel VIII.1.

Tabel VIII.1. Tabel observasi untuk paparan data berpasangan dari dua
pengamat berbeda pada tabel 2×2
Pengamat B
Pengamat A Jumlah
YB = 1 YB = 0
YA = 1 e f n11
YA = 0 g h n10
Jumlah n21 n20 n

Hipotesis yang perlu dibuktikan ialah bahwa pengamat A


memperoleh hasil observasi yang berbeda daripada pengamat B, yang jika
dikonversikan menjadi hipotesis alternatif yaitu H1 : P (f) ≠ P (g), dengan
komplemen hipotesis nol-nya H 0 : P (f) = P (g) = 0.5.

Jika hipotesis nol tidak ditolak, langkah selanjutnya yang perlu


dilakukan adalah menilai besar kesesuaian yang ada antara hasil observasi
pengamat A dengan pengamat B, yang dinyatakan dalam bentuk ‘ukuran
kesepakatan’ (measure of agreement). Walaupun ukuran kesepakatan yang
dibahas di sini adalah untuk data berpasangan yang diperoleh dari 2
pengamat dalam bentuk tabel 2×2, ukuran tersebut dapat pula digunakan
untuk setiap jenis data berpasangan yang disajikan dalam bentuk tabel 2×2.
Untuk pembahasan selanjutnya, paparan data pada tabel VIII.1
disajikan kembali dalam bentuk tabel proporsi seperti terlihat pada tabel
VIII.2.

263
Tabel VIII.2. Tabel proporsi untuk paparan data berpasangan dari dua
pengamat berbeda pada tabel 2×2
Pengamat B
Pengamat A Jumlah
YB = 1 YB = 0
YA = 1 pe pf p1
YA = 0 pg ph q1
Jumlah p2 q2 1

e f
pe = pf =
n n
g h
pg = ph =
n n
n11
p1 = pe + p f = q1 = pg + ph = 1 − p1
n
n
p2 = pe + pg = 21 q2 = p f + ph = 1 − p2
n
Estimasi ukuran kesepakatan berdasarkan data sampel adalah:

κ̂ =
(
2 pe ph − p f pg ) (8.11)
p1q2 + p2 q1

Contoh VIII.1:
Dua orang dokter spesialis paru, A dan B, secara terpisah memeriksa
100 foto Röntgen paru pengunjung rumah sakit untuk menilai ada tidaknya
gambaran tuberkulosis paru. Hasil pemeriksaan adalah sebagai berikut:

Tabel VIII.3. Contoh data berpasangan untuk pembacaan foto Rontgen


paru
a. Tabel observasi
Dokter B
Dokter A Jumlah
Tb paru (+) Tb paru (−)
Tb paru (+) e = 20 f=4 n11 = 24
Tb paru (−) g = 10 h = 66 n10 = 76
Jumlah n21 = 30 n20 = 70 n = 100

264
b. Tabel proporsi
Dokter B
Dokter A Jumlah
Tb paru (+) Tb paru (−)
Tb paru (+) pe = 0.20 p f = 0.04 p1 = 0.24
Tb paru (−) pg = 0.10 ph = 0.66 q1 = 0.76
Jumlah p2 = 0.30 q2 = 0.70 1

Estimasi ukuran kesepakatan antara hasil pembacaan foto Röntgen


dokter A dengan dokter B adalah:

κ̂ =
(
2 pe ph − p f pg )
p1q2 + p2 q1
2 ( 0.20 )( 0.66 ) − ( 0.04 )( 0.10 ) 
= = 0.646
( 0.24 )( 0.70 ) + ( 0.30 )( 0.76 )

265
LAMPIRAN 8B: KOREKSI KONTINUITAS YATES
UNTUK UJI DATA KATEGORIK

Statistik penguji pada uji kuadrat untuk tabel kontijensi 2×2,


 n ( ad − bc )2  n n m m
 [ 1 2 1 2 ]
sebenarnya berdistribusi diskret, namun di-

aproksimasi dengan distribusi khi-kuadrat yang merupakan distribusi
kontinu. Karena itu, Yates (dibaca: yeits) pada tahun 1934 menganjurkan
penggunaan ‘koreksi kontinuitas’ untuk statistik penguji tersebut (matrik
VIII.1). Pengunaan koreksi kontinuitas juga dianjurkan bagi statistik penguji
pada uji khi-kuadrat untuk tabel kontijensi r×c serta uji McNemar.

Matriks VIII.1. Statistik penguji pada uji khi-kuadrat Pearson dan uji
Mc Nemar dengan dan tanpa koreksi kontinuitas
Statistik penguji
Uji Statistik
Tanpa koreksi Dengan koreksi
2
n ( ad − bc )2 n ( ad − bc − 0.5n )
Tabel 2×2
Uji khi- n1n2 m1m2 n1n2 m1m2
kuadrat 2 2
Pearson
∑∑
( Oij − Eij ) (Oij − Eij − 0.5 )
Tabel r×c
i j Eij ∑∑
i j Eij

Uji McNemar (f − g )2 ( f − g − 1)2


f +g f +g

Sebagian ahli statistika menolak penggunaan koreksi kontinuitas


Yates dengan alasan bahwa penggunaan koreksi cenderung menyebabkan uji
bersifat ‘over-konservatif’ (tingkat signifikansi aktual jauh lebih kecil
daripada tingkat signifikansi yang dinyatakan). Kecuali dalam lampiran ini,
pada seluruh pembahasan mengenai uji khi-kuadrat dalam buku teks Metode
Statistika II ini digunakan statistika penguji tanpa koreksi kontinuitas.

266
LATIHAN 8

Bagian Pertama
Pilihlah satu jawaban yang paling benar !

1. Uji eksak Fisher digunakan untuk:


A. Tabel 2x2 C. Tabel r x 2; r > 2
B. Tabel 2 x c; c > 2 D. Semuanya benar

2. Perhitungan probabilitas pada uji eksak Fisher didasarkan atas:


A. Distribusi normal C. Distribusi Poisson
B. Distribusi hipergeometrik D. Semuanya salah

3. Perhitungan nilai p pada uji eksak Fisher mencakup:


A. Probabilitas komposisi data yang sama dengan data sampel.
B. Probabilitas komposisi data yang lebih ekstrim daripada data
sampel.
C. Keduanya benar.
D. Keduanya salah.

Untuk soal No. 4 s.d. 8:


Dimiliki struktur tabel berikut:

B1 B2
A1 a b n1
A2 c d n2
m1 m2 n

4. Probabilitas untuk mendapatkan struktur tabel tersebut adalah:

A.
( a )( b )( c )( d ) C.
a !b !c ! d !
n1n2 m2 m2 n n1 ! n2 ! m2 ! m2 ! n !
n1n2 m2 m2 n !n !m !m !
B. D. 1 2 2 2
( a )( b )( c )( d )( n ) a !b !c ! d ! n !

267
5. Jika diketahui untuk tabel di atas: n = 30; n 1 = 15; m1 = 10; dan c =
3; maka probabilitas untuk mendapatkan komposisi data tersebut
adalah:
A. 0.0001 C. 0.0225
B. 0.0025 D. 0.0975

6. Untuk data pada soal No. 5, nilai P ( c = 1) adalah:


A. 0.0001 C. 0.0225
B. 0.0025 D. 0.0975

7. Pada uji eksak Fisher 1-sisi untuk data soal No. 5, nilai p adalah:
A. 0.0001 C. 0.0251
B. 0.0026 D. 0.1225

8. Kesimpulan yang diperoleh untuk uji H 0 : variabel baris dan


variabel kolom independen terhadap data soal No. 5 adalah:
A. H 0 tidak ditolak pada tingkat signifikansi α = 0.05
B. H 0 ditolak pada tingkat signifikansi α = 0.10
C. A) dan B) benar.
D. A) dan B) salah.

Bagian Kedua
Pilihlah satu jawaban yang paling benar !
Dimiliki data penghasilan bulanan 160 keluarga di sebuah desa
(dalam ribuan rupiah):
Penghasilan bulanan Banyak keluarga
129.5-139.5 9
139.5-149.5 18
149.5-159.5 23
159.5-169.5 23
169.5-179.5 26
179.5-189.5 22
189.5-199.5 18
199.5-205.5 15
209.5-219.5 6

268
1. Rerata dan standar deviasi sampel di atas adalah:
A. 165.75 dan 18.260 C. 175.000 dan 22.740
B. 172.50 dan 21.568 D. 183.50 dan 24.680

2. Seandainya sampel di atas benar berasal dari populasi normal, luas


area kelas interval ketiga (149.5 < X < 159.5 ) adalah:
A. 6.30% C. 13.20%
B. 7.93% D. 17.00%

3. Frekuensi harapan kelas interval keenam (179.5 < X < 189.5 ) adalah:
A. 10.08 C. 17.47
B. 12.69 D. 25.55

4. Dengan α = 5%, daerah kritis untuk uji kebaikan-suai (goodness-of-


fit) distribusi normal terhadap sampel di atas adalah:
A. W > 7.815 C. W > 14.449
B. W > 12.592 D. W > 16.919

5. Deviasi frekuensi observasi pada kelas interval kelima terhadap nilai


harapannya ( O5 − E5 ) adalah:
A. −2.99 C. 1.90
B. −1.08 D. 4.94

2
6. Nilai ( O8 − E8 ) / E8 adalah:
A. 0.171 C. 2.222
B. 0.308 D. 2.426

7. Nilai statistik penguji pada uji kebaikan-suai distribusi normal untuk


sampel di atas adalah:
A. 3.9815 C. 6.3969
B. 4.1706 D. 6.4978

8. Dengan α = 5%, kesimpulan uji kebaikan-suai distribusi normal


terhadap sampel di atas yaitu:
A. Sampel dapat dianggap berasal dari populasi normal.
B. Sampel tidak berasal dari populasi normal.
C. Belum dapat dibuat kesimpulan.
D. Semuanya salah.

269
Bagian Ketiga
Pilihlah satu jawaban yang paling benar !
Misalkan dua orang psikiater secara terpisah memeriksa 85 orang
pengunjung yang sama disebuah rumah sakit jiwa dengan hasil penelitian
sebagai berikut:
Psikiater B
Psikiater A Jumlah
Psikosis Neurosis
Psikosis 4 5 9
Neurosis 1 75 76
Jumlah 5 80 85

1. Uji statistik yang relevan untuk mengkaji ada tidaknya perbedaan


yang bermakna diantara kedua psikiater dalam mendiagnosis
pasiennya adalah:
A. Uji khi-kuadrat Pearson C. Uji McNemar
B. Uji eksak fisher D. Semuanya salah

2. Jika P1 menyatakan proporsi penderita psikosis di antara pengunjung


rumah sakit menurut psikiater A, dan P2 menyatakan proporsi serupa
menurut psikiater B, maka estimasi P1 dan P2 berdasarkan data
sampel masing-masing adalah:
A. Pˆ1 = 4 9; Pˆ2 = 1 76 C. Pˆ1 = 4 9; Pˆ2 = 4 5
B. Pˆ1 = 4 5; Pˆ2 = 5 80 D. Pˆ1 = 9 85; Pˆ2 = 5 85
.

3. Jika paparan data berpasangan tersebut disajikan seperti pada tabel


2×2 di bawah ini, hipotesis nol-nya adalah:
Y=0 Y=1
X=1 a b
X=0 c d

A. P ( a ) = P ( b ) C. P ( a ) = P ( d )
B. P ( c ) = P ( d ) D. P ( b ) = P ( c )

270
4. Dengan uji statistik yang relevan menurut jawaban soal No. 1, nilai
statistik penguji-nya adalah:
A. 0.32 C. 2.67
B. 0.67 D. 27.04

5. Dengan tingkat signifikansi 10%, daerah kritis untuk uji statistik


tersebut adalah:
A. W > 2.71 C. W > 5.02
B. W > 3.84 D. W > 7.81

6. Kesimpulan yang diperoleh dari uji statistik tersebut adalah:


A. Tidak ditemukan perbedaan yang bermakna secara statistik antara
hasil penilaian psikiater A dengn psikiater B pada tingkat
signifikansi 10%
B. Ditemukan perbedaan yang bermakna secara statistik antara hasil
penilaian psikiater A dengan psikiater B pada tingkat signifikansi
5%
C. Ditemukan perbedaan yang bermakna secara statistik antara hasil
penilaian psikiater A dengan psikiater B pada tingkat signifikansi
1%
D. Semuanya salah

271
BAB 9
STATISTIKA NON-PARAMETRIK I
9.1. PENGERTIAN STATISTIKA NON-PARAMETRIK

 Definisi dan Penggunaan


Prosedur non-parametrik adalah ‘prosedur statistika . . . yang berlaku
berdasarkan atas sejumlah asumsi yang relatif sederhana mengenai populasi
sumber data’ (Hollander & Wolfe, 1973).
Hipotesis pada Statistika Non-Parametrik tidak memuat parameter
untuk distribusi tertentu, sehingga ada yang menyatakan bahwa Statistika
Non-Parametrik lebih tepat dinamakan Statistika Bebas-Distribusi
(distribution-free statistics).
Metode statistika non-parametrik digunakan untuk:
a. Data numerik (berskala rasio dan interval; lihat matriks 9.1).
b. Data kategorik (berskala ordinal dan nominal).

Matriks 9.1. Penggunaan metode statistika parametrik dan non-


parametrik untuk data numerik

Distribusi populasi
Ukuran sampel
Normal Sebarang
Besar Parametrik Parametrik

Kecil Parametrik Non-Parametrik

Untuk data numerik dengan populasi sebarang dan sampel kecil,


hanya dapat digunakan metode non-parametrik. Dalam keadaan lainnya pada
matriks 9.1 dapat digunakan baik metode parametrik maupun non-
parametrik, tetapi uji non-parametrik akan menghasilkan kekuatan uji yang
lebih lemah dan kurang efisien dibandingkan dengan uji parametrik.

272
 Keunggulan Metode Statistika Non-Parametrik
Keunggulan Metode Statistika Non-Parametrik antara lain yaitu:
1) Dapat digunakan tanpa tergantung pada bentuk distribusi populasi
sumber data (distribution-free statistics) / memerlukan lebih sedikit
asumsi mengenai populasi sumber data.
2) Dapat digunakan pada sampel ukuran kecil ataupun untuk data yang
berskala lebih rendah daripada interval / dapat diaplikasikan dalam
situasi yang tidak memungkinkan penggunaan prosedur teori normal.
3) Umumnya mudah untuk dipahami.
4) Hanya sedikit kurang efisien dibandingkan metode statistika parametrik
jika populasinya normal, namun dapat lebih efisien daripada metode
statistika parametrik jika populasinya tidak normal.

 Kelemahan Metode Statistika Non-Parametrik


Kelemahan Metode Statistika Non-Parametrik yaitu:
1) Tidak semua uji parametrik memiliki counterpart-nya dalam statistika
non-parametrik.
2) Uji hipotesis non-parametrik memberikan hasil yang lebih lemah
dibandingkan dengan uji hipotesis parametrik.
3) Estimasi interval non-parametrik memiliki presisi lebih rendah
dibandingkan dengan estimasi interval parametrik.
Beberapa uji non-parametrik sebagai counter-part uji statistik
parametrik yang telah dipelajari sebelumnya diperlihatkan pada matriks 9.2.

273
Matriks 9.2. Beberapa uji parametrik dan counter-part non-parametrik-
nya
Metode
Metode non-parametrik
parametrik
Dua sampel Uji jumlah rank Wilcoxon
Uji t
independen (uji Mann-Whitney)

Dua sampel - Uji tanda


Uji t berpasangan
berpasangan - Uji rank bertanda Wilcoxon
Tiga / lebih sampel ANOVA satu-
Uji Kruskal-Wallis
independen arah
ANOVA dua-
Tiga / lebih sampel
arah Uji Friedman
berpasangan
(rancangan blok)

Koefisien Koefisien korelasi


Koefisien korelasi
korelasi Pearson Spearman

 Estimasi interval non-parametrik


Metode Statistika Non-Parametrik umumnya lebih banyak mencakup
prosedur uji hipotesis, sedangkan pengestimasian interval relatif agak jarang
dikerjakan. Beberapa prosedur pengestimasian interval yang tercakup dalam
metode statistika non-parametrik antara lain:
- Estimasi berdasarkan teorema Chebyshev (lihat lampiran 2C)
- Metode bootstrapping (lihat lampiran 9A)

274
9.2. UJI TANDA (SIGN TEST)
Uji tanda merupakan counterpart non-parametrik bagi uji t
berpasangan, namun selain untuk pasangan data kontinu atau numerik seperti
pada uji t berpasangan, uji tanda juga dapat digunakan untuk himpunan
pasangan data ordinal.

Persyaratan:

 Data berpasangan ( X1 ; Y1 ), ( X 2 ; Y 2 ), . . . , ( X n ; Yn ); X i dan Yi tidak


independen.

 Skala pengukuran sekurang-kurangnya ordinal dalam tiap pasangan,


sehingga tiap pasangan dapat digolongkan sebagaim ‘plus’, ‘minus’,
atau ‘nol’:
- Plus jika : X i > Yi atau X i − Yi > 0 (9.1.a)

- Minus jika : X i < Yi atau X i − Yi < 0 (9.1.b)

- Nol jika : X i = Yi (tie; tidak digunakan dalam analisis)

 Uji tanda digunakan untuk sampel berukuran kecil (penentuan daerah


kritis dilakukan dengan menggunakan tabel binomial kumulatif yang
umumnya hanya memuat nilai n sampai dengan 20, 25, atau 30). Untuk
sampel berukuran lebih besar digunakan uji McNemar.

Langkah-langkah uji hipotesis:


1. Jenis uji statistik: Uji tanda.
2. Hipotesis:
a. H 0 : P (+) = P (−) vs H1 : P (+) ≠ P (−) ) (9.2.a)
b. H 0 : P (+) < P (−) vs H1 : P (+) > P (−) ) (9.2.b)
c. H 0 : P (+) > P (−) vs H1 : P (+) < P (−) ) (9.2.c)

dengan: P (+) = P ( X i > Yi ) ) (9.3.a)


dan: P (−) = P ( X i < Yi ) ) (9.3.b)

3. Tingkat signifikansi: α = 0.01, 0,05, atau 0.10.

275
4. Daerah kritis untuk n < 20:
(n = banyaknya ‘+’ dan ‘−‘ dalam sampel = n’ − banyaknya ‘nol’)
a. H1 : P (+) ≠ P (−)
Cari t, yaitu nilai y yang sesuai dengan α1 ≈ α/2 pada tabel
probabilitas binomial kumulatif (dengan n yang sesuai dan p =
0.50; buku Metode Statistika I, Addendum B2). Daerah kritis
adalah:
T < t atau T > n – t (9.4.a)
b. H1 : P (+) > P (−)
Cari t, yaitu nilai y yang sesuai dengan α1 ≈ α pada tabel
binomial kumulatif (dengan n yang sesuai dan p = ½). Daerah
kritis:
T > n’ − t (9.4.b)
c. H1 : P (+) < P (−)
Cari t, yaitu nilai y yang sesuai dengan α1 ≈ α pada tabel
binomial kumulatif (dengan n yang sesuai dan p = ½). Daerah
kritis:
T<t (9.4.c)
5. Statistik penguji:
Tuji = banyaknya ‘+’ dalam sampel (9.5)

6. Kesimpulan: H 0 ditolak jika statistik penguji terletak pada daerah


kritis dan H 0 tidak ditolak jika statistik penguji tidak terletak pada
daerah kritis.

Contoh 9.1:
Misalkan hendak ditentukan daerah kritis untuk uji tanda jika jumlah
‘plus’ dan ‘minus’ dalam sampel adalah 17, dan akan dilakukan uji hipotesis
2-sisi dengan tingkat signifikansi α = 0.005.
n = 17 α / 2 = 0.025
Pada tabel probabilitas binomial kumulatif (buku teks metode
Statistika I, Addendum B2) untuk n = 17 dan p = 0.05, tampak bahwa nilai
α1 yang paling mendekati α/2 = 0.025 adalah α1 = 0.0245. Nilai t = x yang

276
bersesuaian dengan α1 = 0.0245 adalah t = x = 4, sehingga area penolakan
pada sisi kiri adalah T < t, yaitu:
T < 4,
sedangkan area penolakan pada sisi kanan adalah T > n – t, yaitu:
T > 13
(lihat diagram 9.1)

Diagram 9.1. Daerah kritis pada uji tanda dua-sisi dengan n = 17 dan α
= 0.05

Contoh 9.2:
Sebuah pabrik sabun hendak membuat kemasan baru yang
diharapkan lebih menarik daripada kemasan lama. Untuk itu dilakukan
survei terhadap sampel acak konsumen, yang dimimta memilih kemasan
baru (B) atau lama (A). Jika seseorang memilih B diberi tanda ‘+’, jika yang
dipilih A diberi tanda ‘−‘. Dari 16 orang konsumen, 10 orang lebih suka B.

Uji hipotesis:
1. Jenis uji statistik: Uji tanda
2. Hipotesis: H 0 : P (+) < P (−)
H1 : P (+) > P (−)
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis (n = 16):
Pada tabel binomial kumulatif dengan n = 16 dan p = ½ diperoleh t = y
= 4 untuk α1 = 0.038 (paling dekat dengan α = 0.05).

277
Daerah kritis adalah T > n – t atau T > 12.
5. Statistik penguji:
Tuji = 10
6. Kesimpulan: Statistik penguji Tuji tidak terletak pada daerah kritis,
sehingga H 0 tidak ditolak dan disimpulkan pada tingkat signifikansi α
= 0.05, tidak terdapat perbedaan preferensi yang bermakna antara
kemasan sabun baru dengan kemasan lama.

278
9.3. UJI RANK BERTANDA WILCOXON (WILCOXON
SIGNED RANK TEST)
Uji rank bertanda Wilcoxon (Wilcoxon signed rank test) juga
merupakan counter-part non-parametrik bagi uji t berpasangan seperti uji
tanda, tetapi berbeda dengan uji tanda, uji rank bertanda Wilcoxon hanya
dapat digunakan untuk pasangan data kontinu atau numerik (tidak dapat
untuk pasangan data ordinal).
Persyaratan:
 Data berpasangan ( X1 ; Y1 ), ( X 2 ; Y 2 ), . . . , ( X n ; Yn ); X i dan Yi tidak
independen.
 Skala pengukuran sekurang-kurangnya interval dalam tiap pasangan,
sehingga untuk tiap pasangan dapat dihitung:
Di = Yi − X i (9.6)
dan ditentukan nilai Ri , yaitu:
Ri = rank Di jika Di > 0 ) (9.7.a)

Ri = −rank Di jika Di < 0 ) (9.7.b)

 Dua atau lebih Di yang sama disebut ties, dan diberikan peringkat
rata-ratanya.

Contoh 9.3:
Misalkan dimiliki 10 pasangan nilai data berikut (tabel 9.1).
Perhatikan cara menentukan Ri :

279
Tabel 9.1. Sepuluh pasangan nilai data dan penentuan Ri −nya

No Xi Yi Di = Yi − X i Di Rank Di Ri
1 5 7 2 2 2.5 2.5
2 4 4 0 0 − −
3 6 2 −4 4 5.5 −5.5
4 9 7 −2 2 2.5 −2.5
5 6 6 0 0 − −
6 3 8 5 5 7 7
7 5 6 1 1 1 1
8 7 3 −4 4 5.5 −5.5
9 2 9 7 7 8 8
10 4 7 3 3 4 4

Nilai-nilai Di sebelum diurutkan disajikan sendiri secara terpisah


pada tabel 9.2, dan setelah diurutkan menurut besarnya (di-ranking), hasilnya
diperlihatkan pada tabel 9.3 beserta nilai-nilai Ri −nya.

Tabel 9.2. Nilai-nilai Di untuk kesepuluh pasangan nilai data

No 1 2 3 4 5 6 7 8 9 10
Di 2 0 4 2 0 5 1 4 7 3
Tanda Di + − − + + − + +

Tabel 9.3. Hasil pengurutan nilai-nilai Di beserta nilai-nilai Ri untuk


kesepuluh pasangan nilai data

Di 1 2 2 3 4 4 5 7
Rank Di 1 2.5 2.5 4 5.5 5.5 7 8
Tanda Di + + − + − − + +
Ri 1 2.5 −2.5 4 −5.5 −5.5 7 8

280
Langkah-langkah uji hipotesis:
Setelah nilai-nilai Ri ditentukan, dapat dilakukan uji hipotesis
dengan langkah-langkah sebagai berikut:
1. Jenis uji statistik: Uji rank bertanda Wilcoxon.
2 Hipotesis:
a. H 0 : E ( Di ) = 0 vs H1 : E ( Di ) ≠ 0 ) (9.8.a)
b. H 0 : E ( Di ) < 0 vs H1 : E ( Di ) > 0 ) (9.8.b)
c. H 0 : E ( Di ) > 0 vs H1 : E ( Di ) < 0 ) (9.8.c)

3. Tingkat signifikansi: α = 0.01, 0.05, atau 0.10.


4. Daerah kritis jika tidak ada ties dan n < 50:
a. H1 : E ( Di ) ≠ 0 T < wα 2
atau T > w1−α 2
(9.9.a)

b. H1 : E ( Di ) > 0 T > w 1−α (9.9.b)


c. H1 : E ( Di ) < 0 T < wα (9.9.c)

α adalah tingkat signifikansi, sedangkan nilai wα diperoleh dari tabel


kuantil statistik penguji rank bertanda Wilcoxon untuk α < 0.05
(Addendum E).
Jika α > 0.50, wα diperoleh dengan rumus:
n ( n + 1)
wα = w 1−α (9.10)
2
n menyatakan jumlah pasangan tersisa setelah dikurangi jumlah
pasangan dengan Di = 0.
5. Statistik penguji:
n
Tuji = ∑
i =1
( Ri jika Di positif ) (9.11)

Jika terdapat banyak ties atau n > 50, digunakan pendekatan normal
dengan statistik penguji:

281
n

i =1
Ri
Zuji = (9.12)
n
∑ Ri2
i =1

yang berdistribusi normal standar. Untuk rumus 9.12 dengan


pendekatan normal ini digunakan seluruh nilai Ri , baik yang bertanda
positif maupun negatif.
6. Kesimpulan: H 0 tidak ditolak jika statistik penguji tidak terletak pada
daerah kritis.

Contoh 9.4:
Misalkan hendak diteliti apakah anak yang lahir lebih dahulu pada
pasangan kembar memiliki skor agresivitas yang lebih tinggi dibandingkan
dengan adik kembarnya. Diperoleh hasil pengamatan sebagai berikut (tabel
9.4):

Tabel 9.4. Skor agresivitas 12 pasangan anak kembar


No 1 2 3 4 5 6 7 8 9 10 11 12
Xi 86 71 77 68 91 72 77 91 70 71 88 87
Yi 88 77 76 64 96 72 65 90 65 80 81 72
Xi : Skor agresivitas anak lahir pertama
Yi : Skor agresivitas anak lahir kedua
Pada pengolahan data diperoleh nilai-nilai Di , Rank Di , dan Ri
seperti terlihat tabel 9.5 di bawah ini:

Tabel 9.5. Penentuan Ri untuk skor agresivitas 12 pasangan anak


kembar
No 1 2 3 4 5 6 7 8 9 10 11 12
Di 2 6 −1 −4 5 0 −12 −1 −5 9 −7 −15
Rank
3 7 1.5 4 5.5 − 10 1.5 5.5 9 8 11
Di
Ri 3 7 −1.5 −4 5.5 − −10 −1.5 −5.5 9 −8 −11

282
Uji hipotesis untuk data di atas yaitu:
1. Jenis uji statistik: Uji rank bertanda Wilcoxon.
2. Hipotesis: H 0 : E ( Di ) > 0
H1 : E ( Di ) < 0
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis:
Karena didapatkan beberapa ties, akan digunakan statistik penguji
dengan pendekatan normal dengan daerah kritis untuk H1 : E ( Di ) < 0
adalah:
Z < Z 0.05 , yaitu Z < −1.64.
Jika digunakan rumus 9.11, maka daerah kritis adalah:
T < w 0.05 atau T < 14.
5. Statistik penguji:
Statistik penguji dengan pendekatan normal adalah:
n

i =1
Ri = 3 + 7 + . . . – 11 = −17
n
∑ Ri2 = 32 + 7 2 + . . . − (11)2 = 505
i =1
n

i =1
Ri
−17
Zuji = = = −0.76
n 505
∑ Ri2
i =1

Jika digunakan rumus 9.11, maka statistik penguji adalah:


n
Tuji = ∑
i =1
( Ri jika Di positif ) = 3 + 7 + 5.5 + 9 = 24.5
6. Kesimpulan: Statistik penguji Zuji = −0.76 tidak terletak pada daerah
kritis, sehingga H 0 tidak ditolak dan disimpulkan pada tingkat
signifikansi α 0.05 tidak terdapat perbedaan skor agresivitas yang
bermakna antara anak lahir pertama dan anak lahir kedua pada
pasangan kembar. Statistik penguji Tuji = 24.5 juga tidak terletak pada
daerah kritis, sehingga memberikan hasil yang sama dengan
pendekatan normal.

283
LAMPIRAN 9A: INTERVAL KONFIDIENSI
BOOTSTRAP
Bootstrapping tergolong dalam salah satu metode non-parametrik
untuk memperoleh inferensi statistik, yang sebagaimana metode non-
parametrik lainnya, menunjukkan manfaat terbesar apabila distribusi
sampling tidak diketahui.
Dasar metode bootstrapping ialah dengan menganggap sampel
sebagai suatu populasi, dan menerapkan proses ‘resampling’ (sampling
dengan pengembalian) untuk menghasilkan estimasi distribusi sampling
statistik secara empiris.
Misalkan dimiliki sampel awal berukuran n yang dalam metode
bootstrapping dianggap sebagai populasi dan hendak dilakukan estimasi
interval terhadap rerata populasi sesungguhnya µ. Terhadap sampel awal ini
diterapkan proses resampling, yaitu pengambilan subsampel berukuran n
dengan pengembalian. Dari sampel awal berukuran n dapat diperoleh
n
sebanyak n subsampel, namun yang dianjurkan ialah mengambil sekurang-
kurangnya 1,000 subsampel untuk melakukan pengestimasian interval
terhadap rerata populasi µ.

Contoh IX.1:
Misalkan dimiliki data sampel dengan n = 4:
X1 = 3 X2 = 7 X3 = 5 X4 = 8
Dari sampel berukuran n = 4 ini, dilakukan proses resampling dengan ukuran
subsampel n = 4 untuk menghitung interval konfidensi bootstrap 95% bagi
rerata populasi µ (dari sampel berukuran 4 dengan proses resampling
4
berukuran 4 hanya akan diperoleh 4 = 256 subsampel, tetapi tujuannya di
sini adalah untuk menjelaskan prosedur perhitungan interval konfidensi
bootstrap).
Diperoleh 256 subsampel dengan rerata masing-masing seperti
terlihat pada tabel IX.1.

284
Tabel IX.1. Contoh daftar hasil proses resampling untuk metode
bootstrapping

Anggota resample Rerata


No
1 2 3 4 subsampel
1 3 3 3 3 3.00
2 3 3 3 7 4.00
3 3 3 3 5 3.50
4 3 3 3 8 4.25
5 3 3 7 3 4.00
6 3 3 7 7 5.00
7 3 3 7 5 4.50
8 3 3 7 8 5.25
9 3 3 5 3 3.50
... ... ... ... ... ...
... ... ... ... ... ...
... ... ... ... ... ...
253 8 8 8 3 6.75
254 8 8 8 7 7.75
255 8 8 8 5 7.25
256 8 8 8 8 8.00

Proses resampling menghasilkan distribusi sampling nilai rerata


subsampel, yang diperlihatkan pada diagram IX.1.

285
Diagram IX.1. Contoh distribusi sampling nilai rerata subsampel

Dari distribusi sampling ini, interval konfidensi bootstrap dapat


ditentukan secara empiris, yaitu setelah nilai-nilainya diurutkan menurut
besarnya (di-ranking):
X (1) , X ( 2 ) , . . . , X ( 256 )
(lihat tabel IX.2.)

286
Tabel IX.2. Nilai-nilai rerata subsampel yang telah diurutkan menurut
besarnya

X (1) 3.00 ... ...


X ( 2) 3.50 X ( 250 ) 7.50
X ( 3) 3.50 X ( 251) 7.50
X ( 4) 3.50 X ( 252 ) 7.75
X (5) 3.50 X ( 253) 7.75
X (6) 4.00 X ( 254 ) 7.75
X (7) 4.00 X ( 255 ) 7.75
... ... X ( 256 ) 8.00

Maka interval konfidensi bootstrap 95% untuk rerata populasi µ


mencakup 95% × 256 = 243.2 nilai-nilai rerata subsampel 2.5% ekornya (kiri
dan kanan) masing-masing mencakup (256 – 243.2)/2 = 6.4 ≈ 6 nilai rerata
subsampel, sehingga interval konfidensi bootstrap 95% adalah:
[ X ( 7 ) ; X ( 250 ) ]
yaitu: [4.00 ; 7.50]

287
LATIHAN 9
Bagian Pertama
Pilihlah satu jawaban yang paling benar !

1. Syarat penggunaan metode Statistika Non-Parametrik yaitu:


A. Distribusi populasi tidak diketahui.
B. Ukuran sampel kecil.
C. A) dan B) benar.
D. A) dan B) salah.

2. Inferensi statistik hanya mungkin dilakukan dengan Metode Statistika


Non-Parametrik jika:
A. Ukuran sampel kecil dan distribusi populasi normal.
B. Ukuran sampel kecil dan distribusi populasi sebarang.
C. Ukuran sampel besar dan distribusi populasi normal.
D. Ukuran sampel besar dan distribusi populasi sebarang.

3. Yang merupakan padanan yang sesuai bagi uji parametrik dan uji
non-parametrik di antara pasangan berikut yaitu:
A. Uji t independen dan uji jumlah rank (rank sum) Wilcoxon.
B. Uji t berpasangan dan uji rank bertanda (sign rank) Wilcoxon,
C. ANOVA 1-arah dan uji Kruskal Wallis.
D. Semuanya benar.

Untuk soal No. 4 s.d. 11:


Tujuh orang mahasiswa mencoba sebuah diet untuk menurunkan
berat badan, dengan hasil sebagai berikut:
Mahasiswa 1 2 3 4 5 6 7
BB pra-diet 87 95 94 91 100 92 94
BB pasca-diet 82 93 91 89 101 94 90
BB: Berat badan
Hendak diuji apakah diet tersebut efektif untuk menurunkan berat badan.

4. Uji yang relevan untuk menilai efektivitas diet tersebut ialah:


A. Uji tanda C. A) dan B) benar
B. Uni rank bertanda Wilcoxon D. A) dan B) salah

288
5. Seandainya diketahui data di atas berasal dari populasi normal, maka
uji parametrik yang relevan menilai efektivitas diet adalah:
A. Uji t C. Uji t berpasangan
B. Uji Z D. Uji khi-kuadrat

6. Jika P (+) = P (BB pra-diet > BB pasca-diet), maka H 0 yang sesuai


bagi uji tanda ialah:
A. H 0 : P ( + ) = P ( − ) C. H 0 : P ( + ) ≥ P ( − )
B. H 0 : P ( + ) ≤ P ( − ) D. Semua salah

7. Nilai kritis untuk uji tanda diperoleh ialah:


A. Tabel Z C. Tabel khi-kuadrat
B. Tabel t D. tabel binomial

8. Pada uji tanda, dengan tingkat signifikansi 5%, nilai t yang sesuai
adalah:
A. 0 C. 2
B. 1 D. 3

9. Nilai t di atas diperoleh untuk α1 =


A. 0.0078 C. 0.0625
B. 0.0357 D. 0.1094

10. Statistik penguji untuk uji tanda adalah:


A. 1 C. 5
B. 3 D. 7

11. Daerah kritis untuk uji tanda ialah:


A. T < 1 C. T > 6
B. T < 1 D. T < 6

289
Bagian Kedua
Pilihlah satu jawaban yang paling benar !

1. Jika D1 = BB pasca-diet – BB pra-diet, maka H 0 yang sesuai bagi


uji rank bertanda Wilcoxon adalah:
A. H 0 : E ( Di ) ≤ 0 C. H 0 : E ( Di ) = 0
B. H 0 : E ( Di ) ≥ 0 D. Semuanya salah

2. Dengan uji rank bertanda Wilcoxon, jumlah ties(s) adalah:


A. 0 C. 2
B. 1 D. 3

2
3. Nilai ∑ R i dan ∑R i
adalah:
A. 4 dan 10 C. 20 dan 138
B. −4 dan 10 D. −20 dan 138

4. Dengan pendekatan normal, nilai statistik penguji untuk uji rank


bertanda Wilcoxon adalah:
A. Z uji = 1.70 C. Tuji = 4
B. Z uji = −1.70 D. Tuji = −20

5. Tanpa menggunakan pendekatan normal, nilai statistik penguji uji


rank bertanda Wilcoxon adalah:
A. Z uji = 1.70 C. Tuji = 4
B. Z uji = −1.70 D. Tuji = −20

6. Tanda menggunakan pendekatan normal, pada tingkat signifikansi


5% daerah kritis untuk uji rank bertanda Wilcoxon adalah:
A. T < 4 C. T > 24
B. T < 4 D. T > 24

290
7. Kesimpulan yang diperoleh pada uji hipotesis ialah:
A. Dengan uji tanda, H 0 ditolak.
B. Dengan uji rank bertanda Wilcoxon (pendekatan normal), H 0
ditolak.
.
C. Dengan uji rank bertanda Wilcoxon (tanpa pendekatan normal),
H 0 ditolak.
D. Semuanya salah.

291
BAB 10
STATISTIKA NON-PARAMETRIK II

10.1. UJI JUMLAH RANK WILCOXON (WILCOXON


RANK SUM TEST; UJI MANN-WHITNEY)
Uji jumlah rank Wilcoxon (Wilcoxon rank sum test; uji Mann-
Whitney) merupakan counter part non-parametrik bagi uji t independen,
yaitu uji bagi ukuran tengah 2 populasi data independen yang berskala
kontinu atau numerik.
Uji ini dikembangkan secara terpisah oleh Wilcoxon pada tahun 1945
serta Mann dan Whitney pada tahun 1947. Perbedaan uji jumlah rank
Wilcoxon dengan uji Mann-Whitney terletak pada rumus statistik penguji
yang tampaknya berbeda, namun sebenarnya memiliki dasar pemahaman
yang sama.

Persyaratan:
 Data dua kelompok X1 , X 2 , . . . , X n ; dan Y1 , Y 2 , . . . , Yn ; yang
saling independen.
 Skala pengukuran sekurang-kurangnya ordinal, sehingga dapat
ditentukan nilai R ( X i ) dan R ( Yi ) (ranking) untuk tiap nilai data X i
dan Yi pada kelompok gabungan yang telah diurutkan.
 Dua atau lebih data yang sama disebut ties, dan diberikan peringkat
rata-ratanya.

Contoh 10.1:
Misalkan dimiliki data berikut yang hendak ditentukan rank-nya (tabel
10.1):

292
Tabel 10.1. Contoh data untuk penentuan Ri pada uji jumlah rank
Wilcoxon
X Y
7.3 6.3 4.2 12.6 11.8 16.0
12.5 11.4 2.7 5.6 8.3 1.0
9.1 3.2 15.3 5.9 14.8 4.0

Penentuan rank dilakukan sebagai berikut (tabel 10.2):

Tabel 10.2. Penentuan rank pada uji jumlah rank Wilcoxon untuk data
pada tabel 10.1
X Y Rank X Y Rank
1.0 1 8.3 10
2.7 2 9.1 11
3.2 3 11.4 12
4.0 4 11.8 13
4.2 5 12.5 14
5.6 6 12.6 15
6.3 7.5 14.8 16
6.3 7.5 15.3 17
7.3 9 16.0 18

Langkah-langkah uji hipotesis:


1. Jenis uji statistik: Uji jumlah rank Wilcoxon (uji Mann-Whitney).
2. Hipotesis:
a. H 0 : E (X) = E (Y) vs H1 : E (X) ≠ E (Y) ) (10.1.a)
b. H 0 : E (X) < E (Y) vs H1 : E (X) > E (Y) ) (10.1.b)
c. H 0 : E (X) > E (Y) vs H1 : E (X) < E (Y) ) (10.1.c)

3. Tingkat signifikansi: α = 0.01, 0.05, atau 0.10.


4. Daerah kritis (untuk n < 20 dan m < 20):
a. H1 : E (X) ≠ E (Y) T < wα 2
atau T > w1−α 2
) (10.2.a)

b. H1 : E (X) > E (Y) T > w 1−α ) (10.2.b)


c. H1 : E (X) < E (Y) T < wα ) (10.2.c)

293
α adalah tingkat signifikansi, sedangkan nilai wα diperoleh dari tabel
statistik uji Wilcoxon (lihat Addendum F). Nilai w 1−α diperoleh
dengan rumus:
w 1−α = n (N + 1) − wα (10.3)
Jika banyak ties, dan akan digunakan statistik penguji Tuji yang
berdistribusi normal standar, daerah kritis untuk ketiga hipotesis di atas
masing-masing adalah:
a. T ′ < − Zα 2 atau T ′ > Zα 2

b. T ′ > Zα
c. T ′ < − Zα

5. Statistik penguji:
n
Tuji = ∑
i =1
Ri (10.4)

Jika banyak ties, Tuji dikurangi dengan reratanya dan dibagi dengan
standar deviasinya:
N +1
Tuji − n
Tuji' = 2 (10.5.a)
2
nm N nm ( N + 1)

N ( N − 1) i =1
Ri2 −
4 ( N − 1)
yang berdistribusi normal standar dengan N menyatakan ukuran sampel
N
seluruhnya dan ∑
i =1
Ri2 menyatakan penjumlahan seluruh kuadrat nilai-

nilai rank:
N=n+m (10.5.b)

{ ( )} 
N n m 2
∑∑
2
dan: ∑ Ri2 = {R ( X i )} + R Yj
i =1 i =1 j =1
N n m 2

2
∑ Ri2 =
i =1
∑  R ( X i ) +
i =1 j =1
R Yj 
 ( )

(10.5.c)

294
6. Kesimpulan: H 0 ditolak jika statistik penguji terletak pada daerah
kritis dan H 0 tidak ditolak jika statistik penguji tidak terletak pada
daerah kritis.

Contoh 10.2:
Lihat kembali data pada contoh 10.1. Misalkan X menyatakan nilai tes
kebugaran fisik anak desa dan Y adalah nilai tes kebugaran fisik anak kota.
Hendak diuji kebenaran dugaan bahwa kebugaran fisik anak desa lebih baik
daripada kebugaran fisik anak kota.

Uji hipotesis:
1. Jenis uji statistik: Uji jumlah rank Wilcoxon (uji Mann-Whitney).
2. Hipotesis: H 0 : E (X) < E (Y)
H1 : E (X) > E (Y)
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis:
Pada tabel statistik uji jumlah rank Wilcoxon untuk n = 6 dan m = 12
diperoleh w 0.05 = 39. Dengan rumus w 1−α = n (N + 1) − wα ,
diperoleh:
w 0.95 = n (N + 1) − w 0.05
= (6)(18 + 1) – 39 = 75
Daerah kritis adalah T > w 0.95 atau T > 75.
5. Statistik penguji:
n
Tuji = ∑
i =1
Ri

= 2 + 5 + 7.5 + 9 + 12 + 14 = 49.5
6. Kesimpulan: statistik penguji T = 49.5 tidak terletak pada daerah kritis,
sehingga H 0 tidak ditolak dan disimpulkan pada tingkat signifikansi α
= 0.05, tidak terdapat perbedaan yang bermakna antara kebugaran fisik
anak desa dengan anak kota.

295
10.2 KOEFISIEN KORELASI SPEARMAN
Misalkan dimiliki data bivariat ( X1 ; Y1 ), ( X 2 ; Y 2 ), . . . , ( X n ; Yn ),
maka koefisien korelasi Pearson (koefisien korelasi produk momen) antara
variabel X dan Y adalah:
S xy
rP =
S xx S yy
n

i =1
( X i − X )(Yi − Y )
=
n 2 n 2
∑ i ( X − X )  ∑ (Yi − Y ) 
 i =1   i =1 
dengan syarat X i dan Yi sekurang-kurangnya berskala interval.
Pada Statistika Non-Parametrik, untuk data skala ordinal diperlukan
ukuran korelasi lain, namun dengan persyaratan umum yang serupa seperti
pada koefisien korelasi Pearson:
1. Nilai ukuran berkisar antara −1 dan +1.
2. Jika nilai-nilai X yang lebih besar cenderung berpasangan dengan nilai-
nilai Y yang lebih besar, ukuran korelasi haruslah positif, dan jika
kecenderungannya kuat maka nilai ukuran korelasi mendekati +1.
3. Jika nilai-nilai X yang lebih besar cenderung berpasangan dengan nilai-
nilai Y yang lebih kecil, ukuran korelasi haruslah negatif, dan jika
kecenderungannya kuat maka nilai ukuran korelasi mendekati −1.
4. Jika nilai-nilai X berpasangan secara acak dengan nilai-nilai Y, maka
nilai ukuran korelasi mendekati nol.
Jika nilai-nilai X i dan Yi pada rumus koefisien korelasi Pearson
diganti dengan nilai-nilai rank-nya [R ( X i ) dan R ( Yi )], diperoleh ukuran
koefisien korelasi rank Spearman yang dapat digunakan untuk data berskala
ordinal:
n 2
 n +1 
∑i =1
R ( X i ) R (Yi ) − n 
 2 

rS = (10.6)
 n n + 1 2  n  n + 1  
2
 ∑ R ( X i ) − n    ∑ i  2  
R ( Y ) − n
 i =1  2  
  i =1 
Jika tidak ada tie, dapat digunakan rumus yang lebih sederhana:

296
n
6∑  R ( X i ) − R (Yi ) 
2

rS = 1 − i =1 (10.7)
( )
n n −12

6T
atau: rS = 1 − (10.7.a)
(
n n −1 2
)
n

2
dengan: T=  R ( X i ) − R (Yi )  (10.7.b)
i =1

Contoh 10.3:
Misalkan hendak dinilai kebenaran dugaan adanya korelasi
agresivitas antar anggota pasangan kembar ganda. Untuk itu dilakukan tes
psikologi pada 12 pasangan kembar dengan hasil skala agresivitas sebagai
berikut:

Tabel 10.3. Skor agresivitas anak lahir pertama dan anak lahir kedua
pada 12 pasangan anak kembar
i 1 2 3 4 5 6 7 8 9 10 11 12
Xi 86 71 77 68 91 72 77 91 70 71 88 87
Yi 88 77 76 64 96 72 65 90 65 80 81 72

Xi : Skor agresivitas anak lahir pertama


Yi : Skor agresivitas anak lahir kedua

Nilai-nilai R ( X i ) dan R ( Yi ) adalah:

Tabel 10.4. Nilai-nilai R ( X i ) dan R ( Yi ) untuk skor agresivitas 12


pasangan anak kembar
i 1 2 3 4 5 6 7 8 9 10 11 12
Xi 8 3.5 6.5 1 11.5 5 6.5 11.5 2 3.5 10 9
Yi 10 7 6 1 12 4.5 2.5 11 2.5 8 9 4.5

297
n n
∑ R ( Xi ) = 8 ∑
2
R ( Xi ) = 648.5
i =1 i =1
n n
∑ ∑
2
R (Yi ) = 78 R (Yi ) = 649
i =1 i =1
n 2 2
 n +1   12 + 1 
∑ R ( X i ) R (Yi ) = 611.25
i =1
n
 2 
 = 12 
 2 
 = 507

Koefisien korelasi Spearman adalah:


n 2
 n +1 

i =1
R ( X i ) R (Yi ) − n 
 2 

rS =
 n n + 1 2  n  n + 1  
2
 ∑ R ( X i ) − n    ∑ ( i )  2  
R Y − n
 i =1  2  
  i =1 
611.25 − 507
= = 0.736
( 648.5 − 507 )( 649 − 507 )
Jika hendak digunakan rumus 10.6, terlebih dahulu dihitung nilai
2
 R ( X i ) − R (Yi ) 

2
Tabel 10.5 Perhitungan nilai  R ( X i ) - R (Yi )  untuk skor agresivitas
12 pasangan anak kembar
2
i R ( Xi ) R ( Yi )  R ( X i ) − R (Yi ) 
1 8 10 4
2 3.5 7 12.25
3 6.5 s 6 0.25
4 1 1 0
5 11.5 12 0.25
6 5 4.5 0.25
7 6.5 2.5 16
8 11.5 11 0.25
9 2 2.5 0.25
10 3.5 8 20.25
11 10 9 1
12 9 4.5 20.25
T = 75

298
Koefisien korelasi Spearman dengan rumus penyederhanaan adalah:
6T
rS = 1 −
(
n n2 − 1 )
=1−
( 6 )( 75) = 0.738
(
12 122 − 1 )
Diperoleh hasil yang praktis hampir sama dengan hasil terdahulu
(perbedaan disebabkan adanya satu tie).
Dengan menggunakan nilai-nilai sesungguhnya (bukan rank),
diperoleh nilai koefisien korelasi Pearson sebesar 0.735.

299
10.3. UJI KORELASI RANK SPEARMAN
Terhadap nilai koefisien korelasi Spearman yang diperoleh dapat pula
dilakukan uji hipotesis untuk menguji apakah korelasi yang ditemukan
memiliki kemaknaan statistik. Hipotesis yang diuji yaitu:
 Uji satu-sisi:
A. H 0 : X dan Y independen
H1 : Nilai-nilai X yang besar cenderung berpasangan dengan
nilai-nilai Y yang besar; atau:
H0 : ρ = 0 vs H1 : ρ > 0 (10.8.a)
B. H0 : X dan Y independen
H1 : Nilai-nilai X yang kecil cenderung berpasangan dengan
nilai-nilai Y yang besar; atau:
H0 : ρ = 0 vs H1 : ρ < 0 (10.8.b)

 Uji dua-sisi:
H 0 : X dan Y independen
H1 : Nilai-nilai X yang besar cenderung berpasangan dengan
nilai-nilai Y yang besar, atau nilai-nilai X yang kecil
cenderung berpasangan dengan nilai-nilai Y yang besar;
atau:
H0 : ρ = 0 vs H1 : ρ ≠ 0 (10.8.c)

Nilai-nilai kritisnya untuk uji satu arah dan n < 30 dapat dilihat pada
tabel nilai kritis koefisien korelasi rank Spearman (Addendum G).

Contoh 10.4:
Lihat kembali data pada contoh 10.3. Hendak diuji, apakah terdapat
korelasi yang bermakna secara statistik antara skala agresivitas anak pertama
dengan anak kedua pada pasangan kembar ganda.

300
Uji hipotesis:
1. Jenis uji statistik: Uji korelasi rank Spearman.
2. Hipotesis:
H 0 : X dan Y independen
H1 : Nilai-nilai X yang besar cenderung berpasangan dengan nilai-
nilai Y yang besar.
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis:
Pada tabel nilai kritis koefisien korelasi rank Spearman, daerah kritis
untuk n = 12 dan tingkat signifikansi α = 0.05 adalah r > 0.4965.
5. Statistik penguji:
Statistik penguji adalah nilai koefisien korelasi itu sendiri (rumus 10.6),
yaitu:
rS = 0.736

6. Kesimpulan: Koefisien korelasi rS = 0.736 lebih besar daripada nilai


kritis 0.4965, sehingga H 0 ditolak dan disimpulkan bahwa tingkat
signifikansi α = 0.05 terdapat korelasi yang bermakna secara statistik
antara skala agresivitas anak pertama dan kedua pada pasangan kembar
ganda.

301
LAMPIRAN 10A: STATISTIK U MANN-
WHITNEY
Dalam subbab 10.1 telah disebutkan bahwa uji Mann-Whitney dan
uji jumlah rank Wilcoxon pada hakekatnya adalah sama, walaupun keduanya
memiliki rumus perhitungan statistik penguji yang berbeda. Statistik penguji
uji Mann-Whitney, yang dikenal juga sebagai stastistik U Mann-Whitney
adalah:
n m
U uji = ∑∑
i =1 j =1
φ ( X i ;Y j ) (10.8)

1 jika b < a
dengan: φ ( a; b ) = 
0 untuk lainnya
m
Secara sederhana dapat dijelaskan bahwa ∑
j =1
φ ( X i ;Y j ) menyatakan

banyaknya nilai Yj yang lebih kecil daripada suatu nilai X i tertentu. Telah
dinyatakan pula dalam pembahasan subbab 10.1 bahwa statistik penguji pada
uji Mann-Whitney dan uji jumlah rank Wilcoxon adalah sama secara
matematis, dan pada contoh berikut diperlihatkan bahwa besar keduanya
adalah sama.

Contoh X.1:
Lihat kembali contoh data nilai tes kebugaran fisik anak kota dan
anak desa pada contoh 10.1. Pada contoh 10.2 telah dihitung nilai statistik
penguji untuk uji jumlah rank Wilcoxon, yaitu Tuji = 49.5.

Hubungan antara Tuji untuk uji jumlah rank Wilcoxon dengan


statistik U Mann-Whitney dapat dinyatakan sebagai:
n ( n + 1)
Tuji = U + (10.9)
2
Untuk menghitung statistik U Mann-Whitney, data tersebut disajikan
kembali pada tabel X.1 di bawah ini.

302
Tabel X.1. Contoh perhitungan statistik U Mann-Whitney
m
X Y ∑
j =1
φ ( X i ;Y j )

1.0
2.7 1
3.2
4.0
4.2 3
5.6
6.3
6.3 4.5
7.3 5
8.3
9.1
11.4 7
11.8
12.5 8
12.6
14.8
15.3
16.0
n m
∑∑
i =1 j =1
φ ( X i ;Y j ) 28.5

Perhatikan bahwa:
- Ada 1 nilai Y yang lebih kecil daripada X1 = 2.7, sehingga
m

j =1
φ ( X i ; Y j ) = 1.

- Ada 3 nilai Y yang lebih kecil daripada X 2 = 4.2, sehingga


m

j =1
φ ( X i ; Y j ) = 3.

- Ada 4 nilai Y yang lebih kecil daripada X 3 = 6.3 dan 1 nilai Y yang
m
sama dengan X 3 = 6.3, sehingga ∑
j =1
φ ( X i ; Y j ) = 4.5.

- Dan seterusnya.

303
Statistik penguji untuk uji jumlah rank Wilcoxon dapat dihitung dari
statistik U Mann-Whitney:
n ( n + 1)
Tuji = U +
2
6 ( 6 + 1)
= 28.5 + = 49.5
2
Jika dibandingkan dengan statistik penguji pada uji rank Wilcoxon,
statistik U Mann-Whitney lebih mudah untuk dijelaskan dan juga lebih
mudah untuk dihitung pada sampel berukuran kecil, namun untuk sampel
besar, statistik penguji pada uji jumlah rank Wilcoxon lebih praktis untuk
digunakan.

304
LATIHAN 10
Bagian Pertama
Pilihlah satu jawaban yang paling benar !

Untuk soal No. 1 s.d. 7:


Dalam sebuah laboratorium, sepuluh orang pria dan sepuluh orang
wanita dites untuk menentukan suhu ruang yang paling nyaman bagi tiap
peserta tes masing-masing. Hasil yang diperoleh yaitu:
Pria : 23,22,25,24,24,23,24,23,23,24
Wanita: 24,25,26,26,23,26,26,26,26,27
Hendak diuji apakah ada perbedaan yang bermakna antara suhu ruang
yang paling nyaman bagi pria dan wanita.

1. Seandainya diketahui bahwa suhu ruang yang paling nyaman bagi


pria dan wanita berdistribusi normal, uji paling relevan bagi data di
atas ialah:
A. Uji t
B. Uji t berpasangan
C. Uji rank bertanda Wilcoxon
D. Uji jumlah rank bertanda Wilcoxon

2. Seandainya distribusi suhu ruang yang paling nyaman bagi pria dan
wanita tidak diketahui, uji yang paling relevan bagi data di atas ialah:
A. Uji t
B. Uji t berpasangan
C. Uji rank bertanda Wilcoxon
D. Uji jumlah rank bertanda Wilcoxon

3. Jika X menyatakan suhu ruang yang paling nyaman bagi pria dan Y
suhu ruang yang paling nyaman bagi wanita, maka dengan uji
Wilcoxon, hipotesis nol yang sesuai bagi tujuan uji diatas ialah:
A. H 0 : E ( X ) = E (Y ) C. H 0 : E ( X ) ≥ E (Y )
B. H 0 : E ( X ) ≤ E (Y ) D. Semuanya salah

305
n
4. Nilai ∑
i =1
R ( X i ) adalah:

A. 61 C. 144
B. 66 D. 149

5. Tanpa memperhitungkan keberadaan ties, dengan tingkat signifikansi


5%, daerah kritis untuk uji hipotesis ini adalah:
A. T < 79 atau T > 131 C. T > 127
B. T < 83 D. Semuanya salah

6. Nilai statistik penguji dengan memperhitungkan keberadaan ties


ialah:
A. −0.42 C. 0.37
B. −0.37 D. 0.42

7. Dengan memperhitungkan keberadaan ties serta tingkat signifikansi


yang sama seperti pada soal No. 5, daerah kritis untuk uji hipotesis
ini adalah:
A. T ’ < −1.96 atau T ’ > 1.96 C. T ‘ > 1.64
B. T ‘ < −1.64 D. Semuanya salah

8. Kesimpulan uji hipotesis yaitu:


A. Tidak ada perbedaan yang bermakna antara suhu ruang yang
paling nyaman bagi pria dan wanita.
B. Ada perbedaan yang bermakna antara suhu ruang yang paling
nyaman bagi pria dan dan wanita.
C. Suhu ruang yang paling nyaman bagi pria secara bermakna
lebih tinggi daripada suhu ruang yang paling nyaman bagi
wanita.
D. Semuanya salah.

Untuk soal No. 9 s.d. 15:


Data di bawah ini menunjukkan kadar nikotin 16 batang rokok yang
dipilih secara acak dari 2 merek rokok.
Hendak A: 0.29,0.57,0.36,0.46,0.16,0.82,0.66,0.34
Hendak B: 0.42,0.65,0.51,0.40,0.63,0.47,1.24,0.43
Hendak diuji apakah kadar nikotin pada rokok merek A secara
bermakna lebih rendah daripada kadar nikotin pada rokok merek B.

306
9. Uji non parametrik yang paling relevan bagi di atas ialah:
A. Uji rank bertanda Wilcoxon
B. Uji jumlah rank Wilcoxon (uji Mann-Whitney)
C. Keduanya benar
D. Keduanya salah

10. Jika X menyatakan kadar nikotin pada rokok merek A dan Y kadar
nikotin pada rokok merek B, maka dengan uji Mann-Whitney,
hipotesis nol yang sesuai bagi tujuan uji di atas ialah:
A. H 0 : E ( X ) = E (Y ) C. H 0 : E ( X ) ≥ E (Y )
B. H 0 : E ( X ) ≤ E (Y ) D. Semuanya salah

n
11. Nilai R1 = ∑
i =1
R ( X i ) adalah:

A. 58 C. 78
B. 66 D. 136

m
12. Nilai R2 = ∑ R Y j adalah:
( )
j =1
A. 58 C. 78
B. 66 D. 136

13. Nilai statistik U Mann-Whitney ialah:


A. 11 C. 42
B. 22 D. 96

14. Untuk uji 1-sisi, nilai p 1-sisi yang bersesuaian dengan nilai statistik
U di atas adalah:
A. p < 0.05 C. p > 0.10
B. 0.05 < p < 0.10 D. Semuanya salah

15. Pada tingkat signifikansi α = 0.05, kesimpulan uji hipotesis adalah:


A. Tidak ada perbedaan yang bermakna antara kadar nikotin
dalam rokok merek A dan rokok merek B.
B. Ada perbedaan yang bermakna antara kadar nikotin dalam
rokok merek A dan rokok merek B.
C. Kadar nikotin dalam rokok merek A secara bermakna lebih
rendah daripada kadar nikotin dalam rokok merek B.
D. Semuanya salah

307
Bagian Kedua
Pilihlah satu jawaban yang paling benar !

Untuk soal No. 1 s.d. 6:


Misalkan dimiliki data hasil tes psikologi dan hasil tes akademik
delapan orang siswa seperti terlihat di bawah ini:

Siswa 1 2 3 4 5 6 7 8
X 76 67 93 70 68 89 65 82
Y 84 57 88 62 76 65 63 74
X : Hasil tes psikologi
Y : Hasil tes akademik

1. Koefisien korelasi produk momen Pearson adalah:


A. 0.3018 C. 0.6190
B. 0.5494 D. 0.8333

n
Nilai T = ∑  R ( X i ) − R (Yi )  adalah:
2
2.
i =1
A. 0 C. 14
B. 7 D. 32

3. Dengan rumus penyederhanaan, koefisien korelasi rank Spearman


adalah:
A. 0.5494 C. 0.7440
B. 0.6190 D. 0.9167

4. Untuk menguji ada tidaknya korelasi hasil tes psikologi dengan hasil
tes akademik adalah:
A. Uji satu-sisi untuk korelasi positif
B. Uji satu-sisi untuk korelasi negatif
C. Uji dua-sisi
D. Semuanya salah

5. Dengan tingkat signifikansi 5%, daerah kritis uji korelasi rank di sini
adalah:
A. r > 0.463 C. r > 0.619
B. r > 0.591 D. r > 0.786

308
6. Kesimpulan yang paling tepat uji korelasi rank ini adalah:
A. Ada korelasi yang bermakna secara statistik antara hasil tes
psikologi dengan hasil tes akademik.
B. Ada korelasi positif yang bermakna secara statistik antara
hasil tes psikologi dengan hasil tes akademik.
C. Ada korelasi negatif yang bermakna secara statistiok antara
hasil tes psikologi dengan hasil tes akademik.
D. Tidak ada korelasi yang bermakna secara statistik antara hasil
tes psikologi dengan hasil tes akademik.

309
KEPUSTAKAAN

Aczel AD. Complete Business Statistics. Homewood, Illinois: Richard D


Irwin, Inc, 1989.
Bhattacharyya GK, RA Johnson. Statistical Concepts and Methods. New
York: John Wiley & Sons, 1977.
Conover WJ. Practical Nonparametric Statistics, Third Edition. New York:
John Wiley & Sons, Inc, 1999.
Draper NR, H Smith. Applied Regression Analysis, Second Edition. New
York: John Wiley & Sons, Inc, 1981.
Everitt BS. The Analysis of Contingency Tables. London: Chapman and Hall,
1977.
Everitt BS. The Cambridge Dictionary of Statistics. Cambridge: Cambridge
University Press, 1998.
Fienberg SE. The Analysis of Cross-Classified Categorical Data, Second
Edition. Cambridge: The Massachusetts Institute of Technology, 1987.
Fleiss JL. Statistical Methods for Rates and Proportions, Second Edition.
New York: John Wiley & Sons, 1981.
Fox J. Linear Statistical Models and Related Methods-With Application to
Social Research. New York: John Wiley & Sons, 1984.
Harlan J. Metode Statistika 1. Jakarta: Penerbit Gunadarma, 2004.
Hollander M, DA Wolfe. Nonparametric Statistical Methods. New York:
John Wiley & Sons, 1973.
Hosmer DW, S Lemeshow. Applied Logistic Regression. New York: John
Wiley & Sons, 1989.
Kleinbaum DG, LL Kupper, KE Muller. Applied Regression Analysis and
Other Multivariable Methods, Second Edition. Boston: PWS-KENT
Publishing Company, 1988.
Lemeshow S, DW Hosmer Jr, J Klar, et al. Adequacy of Sample Size in
Health Studies. Chichester: New York: John Wiley & Sons, 1990.
Mooney CZ, RD Duval. Bootstrapping: A Nonparametric Approach to
Statistical Inference. Newbury Park: Sage Publications, 1993.
Neter J, W Wasserman. Applied Linear Statistical Models: Regression,
Analysis of Variance, and Experimental Designs. Homewood, Illinois:
Richard D Irwin, Inc, 1977.

310
Sanders DH. Statistics: A First Course, Fifth Edition. New York: McGraw-
Hill, Inc, 1995.
Siegel S. Statistik Nonparametrik untuk Ilmu-ilmu Sosial (terjemahan Z
Suyuti). Jakarta: PT Gramedia, 1986.
Snedecor GW, WG Cochran. Statistical Methods, Seventh Edition. Ames,
Iowa: The Iowa State University Press, 1982.
Steel RGD, JH Torrie. Principles and Procedures of Statistics: A Biometrical
Approach, Second Edition. Auckland: The McGraw-Hill International
Book Company, 1981.
Subiyakto H. Statistika 2. Jakarta: Penerbit Gunadarma, 1994.
Upton GJG. The Analysis of Cross-tabulated Data. Chichester: John Wiley
& Sons, 1980.

311
Addendum A: Distribusi Z

ADDENDUM A: DISTRIBUSI Z

P ( Z > Zα ) = α

Sumber: GEP Box, et al, Statistics for Experimenters, John Wiley & Sons, 1978.

313
Addendum B: Nilai Kritis Distribusi t

ADDENDUM B: NILAI KRITIS DISTRIBUSI t

α = P ( t > tα )

Sumber: M Merrington, Table of Percentage Points of the t-Distribution, Biometrika 32


(1941) p 300.

314
ADDENDUM C: NILAI KRITIS DISTRIBUSI F
P ( F > Fα ) = α
Nilai Kritis Distribusi F (Lanjutan)
Nilai Kritis Distribusi F (Lanjutan)

db1 : derajat bebas pembilang (numerator); db2 : derajat bebas penyebut (denominator)
Sumber: M Merrington & CM Thompson, Tables of Percentage of the Inverted Beta (F)-Distribution, Biometrika 33 (1943) pp 73-88.
ADDENDUM D: NILAI KRITIS DISTRIBUSI χ 2

(
P χ 2 > χα2 ) =α

2
Sumber: CM Thompson, Tables of Percentage Points of the χ -Distribution, Biometrika 32
(1941) pp 188-89.

318
ADDENDUM E: KUANTIL STATISTIK PENGUJI RANK BERTANDA WILCOXON
α n( n+1)
n
.005 .01 .025 .05 .10 .20 .30 .40 .50 2
4 0 0 0 0 1 3 3 4 5 10
5 0 0 0 1 3 4 5 6 7.5 15

6 0 0 1 3 4 6 8 9 10.5 21
7 0 1 3 4 6 9 11 12 14 28
8 1 2 4 6 9 12 14 16 18 36
9 2 4 6 9 11 15 18 20 22.5 45
10 4 6 9 11 15 19 22 25 27.5 55
11 6 8 11 14 18 23 27 30 33 66
12 8 10 14 18 22 28 32 36 39 78
13 10 13 18 22 27 33 38 42 45.5 91
14 13 16 22 26 32 39 44 48 52.5 105
15 16 20 26 31 37 45 51 55 60 120

16 20 24 30 36 43 51 58 63 68 136
17 24 28 35 42 49 58 65 71 76.5 153
18 28 33 41 48 56 66 73 80 85.5 171
19 33 38 47 54 63 74 82 89 95 190
20 38 44 53 61 70 83 91 98 105 210
21 44 50 59 68 78 91 100 108 115.5 231
22 49 56 67 76 87 100 110 119 126.5 253
23 55 63 74 84 95 110 120 130 138 276
24 62 70 82 92 105 120 131 141 150 300
25 69 77 90 101 114 131 143 153 162.5 325

26 76 85 99 111 125 142 155 165 175.5 351


27 84 94 108 120 135 154 167 178 189 378
28 92 102 117 131 146 166 180 192 203 406
29 101 111 127 141 158 178 193 206 217.5 435
30 110 121 138 152 170 191 207 220 232.5 465

31 119 131 148 164 182 205 221 235 248 496
32 129 141 160 176 195 219 236 250 264 528
33 139 152 171 188 208 233 251 266 280.5 561
34 149 163 183 201 222 248 266 282 297.5 595
35 160 175 196 214 236 263 283 299 315 630
36 172 187 209 228 251 279 299 317 333 666
37 184 199 222 242 266 295 316 335 351.5 703
38 196 212 236 257 282 312 334 353 370.5 741
39 208 225 250 272 298 329 352 372 390 780
40 221 239 265 287 314 347 371 391 410 820

41 235 253 280 303 331 365 390 411 430.5 861
42 248 267 295 320 349 384 409 431 451.5 903
43 263 282 311 337 366 403 429 452 473 946
44 277 297 328 354 385 422 450 473 495 990
45 292 313 344 372 403 442 471 495 517.5 1035
46 308 329 362 390 423 463 492 517 540.5 1081
47 324 346 379 408 442 484 514 540 564 1128
48 340 363 397 428 463 505 536 563 588 1176
49 357 381 416 447 483 527 559 587 612.5 1225
50 374 398 435 467 504 550 583 611 637.5 1275

Sumber: HL Harter & DB Owen, Selected Tables in Mathematical Statistics, Vol. 1 (1970).
n( n+1)
Untuk α > 0.50: wα = ‒ w 1−α
2

319
ADDENDUM F: KUANTIL STATISTIK PENGUJI JUMLAH RANK WILCOXON
P (T < wα ) < α
m
n ∝
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

2 0.001 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
0.005 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4
0.01 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 5 5
0.025 3 3 3 3 3 3 4 4 4 5 5 5 5 5 5 6 6 6 6
0.05 3 3 3 4 4 4 5 5 5 5 6 6 7 7 7 7 8 8 8
0.10 3 4 4 5 5 5 6 6 7 7 8 8 8 9 9 10 10 11 11

3 0.001 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 7 7 7 7
0.005 6 6 6 6 6 6 6 7 7 7 8 8 8 9 9 9 9 9 10
0.01 6 6 6 6 6 7 7 8 8 8 9 9 9 10 10 11 11 11 12
0.025 6 6 6 7 8 8 9 9 10 10 11 11 12 12 13 13 14 14 15
0.05 6 7 7 8 9 9 10 11 11 12 12 13 14 14 15 16 16 17 18
0.10 7 8 8 9 10 11 12 12 13 14 15 16 17 17 18 19 20 21 22
4 0.001 10 10 10 10 10 10 10 10 11 11 11 12 12 12 13 13 14 14 14
0.005 10 10 10 10 11 11 12 12 13 13 14 14 15 16 16 17 17 18 19
0.01 10 10 10 11 12 12 13 14 14 15 16 16 17 18 18 19 20 20 21
0.025 10 10 11 12 13 14 15 15 16 17 18 19 20 21 22 22 23 24 25
0.05 10 11 12 13 14 15 16 17 18 19 20 21 22 23 25 26 27 38 29
0.10 11 12 14 15 16 17 18 20 21 22 23 24 26 27 28 29 31 32 33
5 0.001 15 15 15 15 15 15 16 17 17 18 18 19 19 20 21 21 22 23 23
0.005 15 15 15 16 17 17 18 19 20 21 22 23 23 24 25 26 27 28 29
0.01 15 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
0.025 15 16 17 18 19 21 22 23 24 25 27 28 29 30 31 33 34 35 36
0.05 16 17 18 20 21 22 24 25 27 28 29 31 32 34 35 36 38 39 41
0.10 17 18 20 21 23 24 26 28 29 31 33 34 36 38 39 41 43 44 46

320
KUANTIL STATISTIK PENGUJI JUMLAH RANK WILCOXON (Lanjutan)
m
n ∝
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
6 0.001 21 21 21 21 21 21 23 24 25 26 26 27 28 29 30 31 32 33 34
0.005 21 21 22 23 24 25 26 27 28 29 31 32 33 34 35 37 38 39 40
0.01 21 21 23 24 25 26 28 29 20 31 33 34 35 37 38 40 41 42 44
0.025 21 23 24 25 27 28 30 32 33 35 36 38 39 41 43 44 46 47 49
0.05 22 24 25 27 29 30 32 34 36 38 39 41 43 45 47 48 50 52 54
0.10 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 56 58 60
7 0.001 28 28 28 28 29 30 31 32 34 35 36 37 38 39 40 42 43 44 45
0.005 28 28 29 30 32 33 35 36 38 39 41 42 44 45 47 48 50 51 53
0.01 28 29 30 32 33 35 36 38 40 41 43 45 46 48 50 52 53 55 57
0.025 29 31 33 35 37 40 42 44 46 48 50 53 55 57 59 62 64 66 68
0.05 29 31 33 35 37 40 42 44 46 48 50 53 55 57 59 62 64 66 68
0.10 30 33 35 37 40 42 45 47 50 52 55 57 60 62 65 67 70 72 75
8 0.001 36 36 36 37 38 39 41 42 43 45 46 48 49 51 52 54 55 57 56
0.005 36 36 38 39 41 43 44 46 48 50 52 54 55 57 59 61 63 65 67
0.01 36 37 39 41 43 44 46 48 50 52 54 56 59 61 63 65 67 69 71
0.025 37 39 41 43 45 47 50 52 54 56 59 61 63 66 68 71 73 75 78
0.05 38 40 42 45 47 50 52 55 57 60 63 65 68 70 73 76 78 81 84
0.10 39 42 44 47 50 53 56 59 61 64 67 70 73 76 79 82 85 88 91
9 0.001 45 45 45 47 48 49 51 53 54 56 58 60 61 63 65 67 69 71 72
0.005 45 46 47 49 51 53 55 57 59 62 64 66 68 70 73 75 77 79 82
0.01 45 47 49 51 53 55 57 60 62 64 67 69 72 74 77 79 82 84 86
0.025 46 48 50 53 56 58 61 63 66 69 72 74 77 80 83 85 88 91 94
0.05 47 50 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 97 100
0.10 48 51 55 58 61 64 78 71 74 77 81 84 87 91 94 98 101 104 108
10 0.001 55 55 56 57 59 61 62 64 66 68 70 73 75 77 79 81 83 85 88
0.005 55 56 58 60 62 65 67 69 72 74 77 80 82 85 87 90 93 95 98
0.01 55 57 59 62 64 67 69 72 75 78 80 83 86 89 92 94 97 100 103
0.025 59 62 66 69 73 77 80 84 88 92 95 99 103 107 110 114 118 122 126
0.05 57 60 63 67 70 73 76 80 83 87 90 93 97 100 104 107 111 114 118
0.10 59 62 66 69 73 77 80 84 88 92 95 99 103 107 110 114 118 122 126

321
KUANTIL STATISTIK PENGUJI JUMLAH RANK WILCOXON
(Lanjutan)
m
n ∝
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
11 0.001 66 66 67 69 71 73 75 77 79 82 84 87 89 91 94 96 99 101 104
0.005 66 67 69 72 74 77 80 83 85 88 91 94 97 100 103 106 109 112 115
0.01 66 68 71 74 76 79 82 85 89 92 95 98 101 104 108 111 114 117 120
0.025 67 70 73 76 80 83 86 90 93 97 100 104 107 111 114 118 122 125 129
0.05 68 72 75 79 83 86 90 94 98 101 105 109 113 117 121 124 128 132 136
0.10 70 74 78 82 86 90 94 98 103 107 111 115 119 124 128 132 136 140 145
12 0.001 78 78 79 81 83 86 88 91 93 96 98 102 104 106 110 113 116 118 121
0.005 78 80 82 85 88 91 94 97 100 103 106 110 113 116 120 123 126 130 133
0.01 78 81 84 87 90 93 86 100 103 107 110 114 117 121 125 128 132 135 139
0.025 80 83 86 90 93 97 101 105 108 112 16 120 124 128 132 136 140 144 148
0.05 81 84 88 92 96 100 105 109 111 117 121 126 130 134 139 143 147 151 156
0.10 83 87 91 96 100 105 109 114 118 123 128 132 137 142 146 151 156 160 165
13 0.001 91 91 93 95 97 100 103 106 109 112 115 118 121 124 127 130 134 137 140
0.005 91 93 95 99 102 105 109 112 116 119 123 126 130 134 137 141 145 149 152
0.01 92 94 97 101 104 108 112 115 119 123 127 131 135 149 143 147 151 155 159
0.025 93 96 100 104 108 112 116 120 125 129 133 137 142 146 151 155 159 164 168
0.05 94 98 102 107 111 116 120 125 129 134 139 143 148 153 157 162 167 172 176
0.10 96 101 105 110 115 120 125 130 135 140 145 150 455 160 166 171 176 181 186
14 0.001 105 105 104 109 112 115 118 121 125 128 131 135 138 142 145 149 152 156 160
0.005 105 107 110 113 117 121 124 128 132 136 140 144 148 152 156 160 164 169 173
0.01 106 111 115 119 123 128 132 137 142 146 151 156 161 165 170 175 181 184 189
0.025 107 111 115 119 123 128 132 137 142 146 151 156 161 168 170 175 180 184 189
0.05 109 113 117 122 127 132 137 145 147 152 157 162 167 172 177 183 188 193 198
0.10 110 116 121 126 131 137 142 147 153 158 164 169 175 180 186 191 197 203 208
15 0.001 120 120 122 125 128 133 135 158 142 145 149 153 157 161 164 168 172 176 180
0.005 120 123 126 129 133 137 141 145 150 154 158 163 167 172 176 181 185 190 194
0.01 121 124 128 132 136 140 145 149 154 158 163 168 175 177 182 187 191 196 201
0.025 122 126 131 135 140 145 150 155 160 498 170 175 181 185 194 496 201 206 211
0.05 124 128 133 139 155 159 154 160 165 171 176 182 187 193 198 204 209 215 221
0.10 126 131 137 143 148 154 160 166 172 178 184 189 195 201 207 213 219 225 231

322
KUANTIL STATISTIK PENGUJI JUMLAH RANK WILCOXON (Lanjutan)
m
n ∝
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
16 0.001 136 136 139 142 145 148 152 156 160 164 168 172 176 180 195 189 193 197 202
0.005 136 139 142 146 150 155 159 164 168 173 178 182 187 192 197 101 107 211 216
0.01 137 140 144 149 153 158 163 168 173 178 183 188 193 198 203 208 213 219 224
0.025 138 143 148 152 158 163 168 174 179 184 190 196 201 207 212 218 223 229 235
0.05 140 145 151 156 162 167 173 179 185 191 197 202 208 214 220 226 232 238 244
0.10 142 148 154 160 166 173 179 185 191 198 204 211 217 223 130 136 243 149 256

17 0.001 153 154 156 159 163 167 171 175 179 183 188 192 197 201 206 211 215 220 224
0.005 153 156 160 164 169 179 179 183 188 193 198 203 208 214 219 224 229 235 240
0.01 154 158 162 167 172 177 182 187 192 198 203 109 214 220 225 231 236 242 247
0.025 156 160 165 171 176 182 188 193 199 205 211 217 223 229 235 241 247 253 259
0.05 157 163 169 174 180 187 193 199 205 211 218 224 231 237 243 250 256 263 269
0.10 160 166 172 179 185 192 199 206 212 219 226 233 239 246 253 260 167 274 281
18 0.001 171 172 175 178 182 186 190 195 199 204 209 214 218 223 228 233 238 243 243
0.005 171 174 178 183 188 193 193 203 204 214 219 225 230 236 242 247 253 259 264
0.01 172 176 181 186 191 196 202 208 213 219 225 231 237 242 248 254 260 266 272
0.025 174 179 184 190 196 202 208 214 220 227 233 239 246 252 258 265 271 278 284
0.05 176 181 188 194 200 207 213 220 227 233 240 247 254 260 267 274 281 288 295
0.10 178 185 192 199 206 213 220 227 234 241 249 256 263 270 278 285 292 300 307
19 0.001 190 191 194 198 202 206 211 216 220 225 231 236 241 246 251 257 262 268 273
0.005 191 194 198 203 208 213 219 224 230 236 242 248 254 260 265 272 278 284 290
0.01 192 195 200 206 211 217 223 229 235 241 247 254 260 266 273 279 285 195 298
0.025 193 198 204 210 216 223 229 236 243 249 256 263 269 276 283 290 297 304 310
0.05 195 201 208 214 221 228 235 242 249 256 263 271 278 285 292 300 307 314 321
0.10 198 205 242 249 227 234 242 249 257 264 272 280 288 295 303 300 319 326 334
20 0.001 210 211 214 218 223 227 232 237 243 248 253 259 265 270 276 281 287 293 299
0.005 211 214 219 224 229 235 241 247 253 259 265 271 278 284 290 297 303 310 216
0.01 212 216 221 227 233 239 245 251 258 264 271 278 284 291 298 304 311 318 325
0.025 213 219 225 231 238 245 251 250 266 273 280 287 294 301 309 316 323 330 338
0.05 215 222 229 236 243 250 258 265 273 280 288 295 303 311 318 326 334 341 349
0.10 218 226 233 241 249 257 265 273 281 289 297 305 313 321 330 338 346 354 362

Sumber: WJ Conover, Practical Nonparametric Statistics,3rd Ed, John Wiley & Sons, 1999.
323
ADDENDUM G: NILAI KRITIS KOEFISIEN KORELASI SPEARMAN

α
n
0.10 0.05 0.025 0.01 0.005 0.001

4 0.8000 0.8000
5 0.7000 0.8000 0.9000 0.9000

6 0.6000 0.7714 0.8286 0.8857 0.9429


7 0.5357 0.6786 0.7500 0.8571 0.8929 0.9643
8 0.5000 0.6190 0.7143 0.8095 0.8571 0.9286
9 0.4667 0.5833 0.6833 0.7667 0.8167 0.9000
10 0.4424 0.5515 0.6364 0.7333 0.7818 0.8667

11 0.4182 0.5273 0.6091 0.7000 0.7455 0.8364


12 0.3986 0.4965 0.5804 0.6713 0.7203 0.8112
13 0.3791 0.4780 0.5549 0.6429 0.6978 0.7857
14 0.3626 0.4593 0.5341 0.6220 0.6747 0.7670
15 0.3500 0.4429 0.5179 0.6000 0.6500 0.7464

16 0.3382 0.4265 0.5000 0.5794 0.6324 0.7265


17 0.3260 0.4118 0.4853 0.5637 0.6152 0.7083
18 0.3148 0.3994 0.4696 0.5480 0.5975 0.6904
19 0.3070 0.3895 0.4579 0.5333 0.5825 0.6737
20 0.2977 0.3789 0.4451 0.5203 0.5684 0.6586

21 0.2909 0.3688 0.4351 0.5078 0.5545 0.6455


22 0.2829 0.3597 0.4241 0.4963 0.5426 0.6318
23 0.2767 0.3518 0.4150 0.4852 0.5306 0.6186
24 0.2704 0.3435 0.4061 0.4748 0.5200 0.6070
25 0.2646 0.3362 0.3977 0.4654 0.5100 0.5962

26 0.2588 0.3299 0.3894 0.4564 0.5002 0.5856


27 0.2540 0.3236 0.3822 0.4481 0.4915 0.5757
28 0.2490 0.3175 0.3749 0.4401 0.4828 0.5660
29 0.2443 0.3113 0.3685 0.4320 0.4744 0.5567
30 0.2400 0.3059 0.3620 0.4251 0.4665 0.5479

Sumber GJ Glasser &RF Winter, Critical Values of The Coefficient of Rank Correlation for
Testing the Hypothesis of Independence, Biometrika 48 (1961) pp 444-448 (Appendix).

Anda mungkin juga menyukai