Fix Statistika
Fix Statistika
1. Di bawah ini merupakan sifat yang harus dipenuhi oleh estimator titik, kecuali …
a. Efisien c. Koefisien
b. Konsisten d. Sufisien
2. Untuk estimasi interval nilai rerata populasi, ukuran sampel minimum tergantung pada …
a. Tingkat Keyakinan Estimasi √ c. Jumlah Sampel
b. Jumlah Populasi d. Parameter
4. Jika dari hasil suatu penelitian, dinyatakan bahwa interval konfidensi 95% nilai rerata tinggi
badan penduduk Indonesia (dalam cm) adalah [145 ; 165]. Pernyataan ini berarti …
a. 95% nilai-nilai ȳ (tinggi badan penduduk Indonesia) terletak dalam interval [145 ; 165]
b. 95% nilai-nilai ȳ terletak dalam interval [145 ; 165]
c. Nilai μ memiliki probabilitas 95% untuk berada dalam interval [145 ; 165]
d. Semuanya salah
10. Peneliti membuka kesempatan dengan mengumumkan penarikan sampel di media massa,
sehingga responden mendaftar menjadi anggota sampel. Teknik sampling tersebut
dinamakan …
a. Self – Selection Sample √ c. Snowball Sample
b. Judgemental Sample d. Quota Sample
11. Antar kelas bersifat homogen dan anggota dalam suatu kelas bersifat heterogen. Disebut
teknik sampling …
a. Systematic Sampling c. Area Sampling
b. Stratified Sampling √ d. Cluster Sampling
12. Distribusi t digunakan pada estimasi interval nilai rerata populasi jika …
a. n besar dan populasi berdistribusi normal
b. n besar dan populasi berdistribusi sembarang
c. n kecil, populasi berdistribusi normal dan σ tidak diketahui √
d. n kecil, populasi berdistribusi normal, dan σ diketahui
13. Misalkan hendak diestimasi rerata tekanan darah atlet peserta Pelatda dengan lebar interval
tidak lebih daripada 20 mm Hg. Apabila diketahui standar deviasi populasinya adalah 40
mm Hg, maka ukuran sampel minimum yang dibutuhkan untuk memperoleh estimasi
interval rerata populasinya dengan tingkat keyakinan 95% adalah …
a. 16 c. 157
b. 62 d. 44
14. Sampel yang baik diperoleh dengan memperhatikan hal-hal berikut, kecuali …
a. Distribusi sampling √
b. Randomness
c. Ukuran
d. Teknik penarikan sampel (sampling)
15. Pada pengujian hipotesis satu rerata sampel dengan hipotesis H0 : μ = μ0, syarat
penggunaan uji t ialah …
a. Ukuran sampel kecil c. Populasi berdistribusi normal
b. Variansi populasi tak diketahui d. Semuanya benar √
16. Pada uji Z terhadap rerata satu populasi dengan hipotesis nol H0 : μ ≥ μ0, maka daerah
kritisnya (daerah penolakan) terletak pada …
a. Ekor kiri dan kanan distribusi sampling statistik penguji √
b. Ekor kanan distribusi sampling statistik penguji
c. Ekor kiri distribusi sampling statistik penguji
d. Semuanya salah
17. Dari 150 orang mahasiswa yang dipilih secara acak, 44 orang berkaca mata untuk melihat
jauh. Interval konfidensi 95%, proporsi mahasiswa yang berkaca mata adalah …
a. 0,197 < P < 0,389 c. 0,232 < P < 0,354
b. 0,220 < P < 0,366 d. 0,246 < P < 0,341
18. Pada soal no. 17 di atas, apabila dengan tingkat keyakinan yang sama diinginkan lebar
estimasi yang tidak lebih daripada 12%, ukuran sampel minimum yang dibutuhkan adalah …
a. 222 c. 95
b. 381 d. 155
Perkotaan Pedesaan
19. Uji statistik yang relevan untuk menilai ada tidaknya perbedaan keterampilan bermain
musik siswa perkotaan dan pedesaan adalah
a. Uji t berpasangan c. uji Z
b. Uji t independen d. Semuanya salah
11. Dengan tingkat signifikansi q=0.05 dan uji satu sisi: H0: ditolak
𝜎 𝜎
𝑥̅ − (𝑧𝛼 × ) < 𝜇 < 𝑥̅ + (𝑧𝛼 × )
2 √𝑛 2 √𝑛
15. D melakukan pengujian hipotesis dengan SPSS. D mendapatkan bahwa nilai
signifikansi dari penelitiannya adalah sebesar 0.000. Kesimpulan dari hasil uji
hipotesis D adalah… (Ho tolak dan H1 diterima)
B. Esai
1. Dari 550 karyawan diketahui skor rata-rata kinerjanya adalah 90 dengan ragam
729. Jika akan diambil 150 orang karyawan sebagai sampel acak dengan pemulihan
dan rata-rata skor kinerjanya diasumsikan berdistribusi normal, Hitunglah: (30
POIN)
a. Galat Baku (signifikansi 1 angka dibelakang koma)
b. Peluang rata-rata skor lebih dari 95 (signifikansi 2 angka dibelakang
koma)
c. Gambarkan kurvanya
Diketahui:
• N = 550
• µ = 90
• σ2 = 729 σ = √729 = 27
• n = 150
Ditanya:
a. 𝜎𝑥̅
b. P( 𝑥̅ > 92) = P(Z > ? )
c. Kurva
Jawab:
a. Galat baku
𝜎 27 27
𝜎𝑥̅ = = = = 𝟐, 𝟐
√𝑛 √150 12,25
b. Peluang rata-rata skor lebih dari 95.
P( 𝑥̅ > 92) = P(Z > ? )
𝑥̅ − 𝜇 95 − 90 5
𝒛= 𝜎 = = = 𝟐, 𝟐𝟕
2,2 2,2
√𝑛
P (Z > 2,27) = 0,5 – 0,4884 = 0,0116
= 0,0116 x 100% = 1,16%
c. Gambarkan kurvanya.
0,0446
0,4554
82 85
Jawaban Latihan Ujian
1
Jawaban Latihan Ujian
Penjelasan: Data interval dan rasio (lihat jawaban soal nomor 6) tergolong dalam
data kuantitatif (numerik), karena menyatakan nilai-nilai numerik untuk
karakteristik subjek yang dipelajari.
8. Data yang diperoleh langsung dari subjek yang ingin diketahui karakteristiknya
dinamakan:
Jawab: C. Data primer.
Penjelasan: Data primer adalah data yang langsung diperoleh dari subjek yang
hendak dipelajari (lihat juga jawaban soal nomor 9).
9. Data yang diperoleh dari pihak ketiga, yang biasanya telah dikumpulkan
sebelumnya untuk keperluan lain dari subjek yang hendak dipelajari dinamakan:
Jawab: D. Data sekunder.
2
Jawaban Latihan Ujian
Penjelasan: Data yang tidak diperoleh langsung dari subjek yang hendak
dipelajari, melainkan dari sumber data lain yang telah mengumpulkannya terlebih
dahulu untuk keperluan berbeda, disebut sebagai data sekunder (lihat juga jawaban
soal nomor 8).
10. Luas lantai berbagai tipe rumah di sebuah real estate merupakan contoh data:
Jawab: D. Rasio.
Penjelasan: Lihat kembali sifat-sifat data nominal, ordinal, interval, dan rasio pada
matriks 1.1 serta algoritma untuk menentukan skala pengukuran pada Lampiran 1B
dalam buku teks. Luas lantai dinyatakan dalam angka (numerik) dan memiliki nol
mutlak (selalu bernilai non-negatif), sehingga tergolong dalam data rasio.
11. Jumlah halaman pada buku-buku di sebuah perpustakaan merupakan contoh data:
Jawab: C. Rasio dan diskret.
Penjelasan: Jumlah halaman buku adalah data rasio (berupa angka dan memiliki
nol mutlak) yang bersifat diskret (diperoleh dengan mencacah).
12. Nilai IPK mahasiswa semester akhir Gunadarma merupakan contoh data:
Jawab: D. Rasio dan kontinu.
Penjelasan: Nilai IPK adalah data rasio (berupa angka dan memiliki nol mutlak)
yang bersifat kontinu (nilainya dapat terletak di setiap titik pada garis bilangan)
3
Jawaban Latihan Ujian
15. Contoh data berskala rasio di antara pilihan di bawah ini adalah:
Jawab: C. Suhu dalam skala Kelvin.
Penjelasan: Suhu dalam skala Celsius dan Fahrenheit (serta Reaumur) adalah data
interval (mungkin bernilai negatif), tetapi suhu dalam skala Kelvin adalah data rasio
(memiliki titik nol mutlak).
Penjelasan: Sumasi perkalian dua variabel tidak sama dengan perkalian dua
sumasi variabel. Jawaban:
n
A) ∑k = n k
i =1
; k konstante ,
n n
B) ∑ k xi = k ∑ xi , dan
i =1 i =1
n n n
D) ∑( x
i =1
i + y i ) = ∑ xi + ∑ y i ,
i =1 i =1
merupakan sifat-sifat dasar bagi notasi sigma.
4
Jawaban Latihan Ujian
20 −
Diagram. Jumlah penjualan komputer
15 − di Toko A, B, dan C
Agustus 2000
10 −
5
A B C
Jawab: D. A) dan B) salah:
A) Jumlah penjualan di Toko B kurang lebih dua kali
penjualan di Toko A.
B) Jumlah penjualan di Toko A kurang lebih sepertiga penjualan di
Toko C.
Penjelasan: Grafik di atas merupakan salah satu bentuk penyajian yang tidak
dianjurkan untuk dipergunakan (buku: How to lie with Statistics), karena baik
disengaja ataupun tidak, dapat mengecoh pembaca. Perhatikan bahwa titik awal
pada sumbu tegak bukan 0, melainkan 5.
21. Jumlah seluruh angka data dalam kelompoknya dibagi dengan banyaknya data
disebut:
Jawab: A. Rerata hitung (arithmetic mean)
22. Jika setengah di antara seluruh observasi nilai-nilainya lebih kecil daripada suatu
nilai tertentu, dan setengah observasi lainnya nilai-nilainya lebih besar daripada
nilai tertentu tersebut, nilai tertentu itu adalah:
Jawab: B. Median.
Penjelasan: Median adalah nilai yang terletak ditengah-tengah kumpulan data
yang telah diurutkan menurut besarnya.
5
Jawaban Latihan Ujian
n
24. ∑( x
i =1
i − x)
∑( x − x) =
2
25. i
i =1
2
n
Jawab: C. n 2 ∑
xi
∑ xi − i =1
i =1 n
i =1 i =1 i =1 i =1
Diketahui data hasil ujian Ilmu Alamiah Dasar sekelompok mahasiswa sebagai
berikut: 72, 86, 63, 59, 74, 67, 74, 77, 63, 74, 82, 67.
∑x i
=
858
= 71.50
x= i =1
12
12
6
Jawaban Latihan Ujian
n
28. Jika diketahui ∑x
i =1
2
i = 62, 058 , dengan menggunakan pembagi ( n −1) hitunglah
Misalkan dimiliki data hasil ujian Statistika 10 orang mahasiswa: 75, 40, 80, 55, 90,
70, 55, 60, 60, 55.
Penjelasan:
10
n = 10 ∑x = x + x
i =1
i 1 2 + ... + x10 = 75 + 40 + . . . + 55 = 640
10
∑x i
=
640
= 64
x= i =1
10
10
Penjelasan:
Array: 40, 55, 55, 55, 60, 60, 70, 75, 80, 90.
n = 10 (genap)
x( 5) + x( 6 ) 60 + 60
Med = = = 60
2 2
7
Jawaban Latihan Ujian
33. Sebuah dadu yang setimbang dilemparkan dua kali berturut-turut. Probabilitas
untuk mendapatkan jumlah angka 7 pada kedua pelemparan adalah:
11 1
Jawab: C. 6 =
66 6
34. Sebuah dadu dan sebuah mata uang, keduanya setimbang, dilemparkan bersama-
sama. Probabilitas untuk mendapatkan angka lebih besar daripada 4 pada dadu dan
sisi belakang mata uang bersama-sama adalah:
2 1 1
Jawab: D. . =
6 2 6
35. Tiga buah lampu tanda darurat masing-masing mempunyai probabilitas 0.7 akan
menyala. Dengan anggapan ketiga lampu itu menyala secara independen, maka
probabilitas bahwa ketiganya menyala adalah:
Jawab: B. 0.343
Penjelasan: Probabilitas tiga peristiwa yang saling independen untuk terjadi
bersama-sama dapat dihitung dengan hukum perkalian:
(0.7)(0.7)(0.7) = 0.73 = 0.343
8
Jawaban Latihan Ujian
37. Jika pada suatu distribusi diketahui bahwa rerata, median, dan modusnya berimpit,
maka distribusi tersebut:
40. Jika distribusi populasi adalah normal, maka distribusi sampling nilai rerata-nya:
Jawab: A. Selalu berdistribusi normal.
Penjelasan: Jika distribusi parental X normal, maka distribusi sampling X akan
selalu berdistribusi normal, tak tergantung pada ukuran sampel (lihat matriks 1 pada
Lampiran 6A).
41. Jika distribusi populasi sebarang, maka distribusi sampling nilai rerata-nya:
Jawab: B. Dapat berdistribusi normal jika ukuran sampelnya besar.
9
Jawaban Latihan Ujian
44. Validitas data antara lain ditentukan oleh faktor berikut, kecuali:
Jawab: D. Semua faktor di atas ikut menentukan validitas data:
A) Subjek / objek yang diukur
B) Instrumen pengukuran
C) Subjek pelaku pengukuran
Penjelasan: Semua faktor yang dinyatakan pada jawaban A), B), dan C) tanpa
kecuali ikut menentukan validitas data.
46. Kumpulan elemen yang ‘terdaftar’ sebagai calon anggota sampel dinamakan:
Jawab: D. Kerangka sampel.
Penjelasan: Kumpulan elemen yang ‘terdaftar’ sebagai calon anggota sampel
adalah kerangka sampel. Kerangka sampel diharapkan, namun dalam kenyataan
tidak selalu identik dengan populasi aktual, yaitu kumpulan subjek / objek yang
eligibel untuk diikutsertakan dalam penelitian dan proses sampling.
10
Jawaban Latihan Ujian
48. Tiap elemen anggota populasi memiliki probabilitas yang pasti sama untuk terpilih
menjadi anggota sampel pada:
Jawab: A. Sampling acak sederhana.
Penjelasan: Probabilitas yang pasti sama untuk terpilih bagi tiap elemen anggota
populasi hanya terjadi pada sampling acak sederhana. Pada sampling acak
stratifikasi, probabilitas terpilih anggota satu stratum belum tentu sama dengan
probabilitas terpilih anggota stratum lainnya, demikian pula pada sampling acak
klaster, probabilitas terpilih anggota satu klaster juga belum tentu sama dengan
probabilitas terpilih anggota klaster lainnya, walaupun demikian probabilitas
tersebut diketahui / ditetapkan oleh peneliti.
49. Yang tidak termasuk dalam sampling probabilitas di antara prosedur sampling
berikut yaitu:
Jawab: A. Sampling purposif (purposive sampling)
Penjelasan: Sampling purposif, kuota, haphazard, dan judgment adalah cara-cara
pengambilan sampel yang tergolong dalam sampling non-probabilitas (lihat matriks
6.1 pada buku teks).
50. Inferensi statistik berlaku secara valid pada penelitian yang menggunakan:
Jawab: B. Sampel acak.
Penjelasan: Inferensi statistik hanya berlaku secara valid pada penarikan sampel
secara objektif atas dasar probabilitas, yaitu pada sampel acak.
51. Pernyataan bahwa interval konfidensi 95% nilai rerata adalah [ yB ; y A ] berarti:
11
Jawaban Latihan Ujian
52. Jika dari hasil suatu penelitian, dinyatakan bahwa interval konfidensi 95% nilai
rerata tinggi badan penduduk Indonesia (dalam cm) adalah [145 ; 165], pernyataan
ini berarti:
Jawab: D. Semuanya salah
Penjelasan: Jika suatu interval konfidensi telah dimuati dengan nilai-nilai tertentu,
hanya ada dua kemungkinan: rerata populasi µ terletak dalam rentang interval
tersebut (probabilitas berada dalam interval sama dengan satu) atau berada di luar
rentang tersebut (probabilitas berada dalam interval sama dengan nol). Rerata
populasi µ hanya memiliki probabilitas 95% untuk berada rentang interval
konfidensi 95% selama interval tersebut masih bersifat konseptual dan belum
dimuati dengan nilai-nilai tertentu.
54. Apabila nilai IPK mahasiswa dianggap berdistribusi normal dan dari hasil proses
sampling diperoleh interval konfidensi 90% nilai IPK lulusan Universitas
Gunadarma adalah [2.20 ; 3.10], maka nilai rerata sampelnya adalah:
Jawab: B. 2.65
Penjelasan: Apabila nilai IPK berdistribusi normal, distribusi sampling nilai rerata
akan selalu normal (simetris), sehingga nilai rerata sampel y terletak tepat di
2.20 + 3.10
tengah interval konfidensi [2.20 ; 3.10], yaitu = 2.65.
2
55. Upaya memperkecil biaya pada proses sampling untuk pengestimasian interval
dapat dilakukan antara lain dengan:
Jawab: B. Menurunkan tingkat keyakinan estimasi
Penjelasan: Upaya memperkecil biaya pada proses sampling adalah dengan
memperkecil ukuran sampel, dan hal ini dapat terlaksana dengan:
a. Memperkecil nilai Zα 2 [menurunkan tingkat keyakinan 100 ( 1 − α ) % ]
b. Memperkecil variansi σ 2 atau s 2 (mencari populasi yang lebih homogen)
12
Jawaban Latihan Ujian
atau n = ( α 2 )
2
Z s2
]
I2
59. Pernyataan yang benar mengenai α (kesalahan tipe I), β (kesalahan tipe II), dan
kekuatan uji (power) pada ukuran sampel yang sama adalah:
Jawab: D. Yang benar lebih daripada satu:
A) Semakin besar nilai α , semakin kecil nilai β
C) Semakin kecil nilai α , semakin kecil nilai kekuatan uji
Penjelasan: Baik diagram 1.3, 1.4, ataupun 1.5 dapat dilihat bahwa pergeseran
titik kritis c ke kanan akan memperkecil nilai α , namun memperbesar nilai β
serta memperkecil nilai kekuatan uji (1 - β ), demikian pula sebaliknya:
Pergeseran titik kritis c ke kiri akan memperbesar nilai α , tetapi memperkecil
nilai β
13
Jawaban Latihan Ujian
Penjelasan: Lihat diagram 1.6 dan 1.7: Nilai p (satu-sisi) menyatakan luas area di
luar titik statistik penguji pada distribusi sampling H 0 (di sisi ekor yang menjauhi
pusat distribusi). Perhatikan bahwa untuk jawaban A), probabilitas untuk
mendapatkan nilai di satu titik tertentu pada distribusi kontinu selalu sama dengan
nol.
61. Keputusan pada uji hipotesis dengan uji Z 2-sisi jika didapatkan nilai p 1-sisi yang
lebih kecil daripada α , namun lebih besar daripada α 2 ialah:
Penjelasan: Lihat diagram 1.6: Pada uji hipotesis 2-sisi, daerah penolakan adalah
area seluas α 2 pada ekor kiri dan ekor kanan distribusi H 0 . Apabila nilai p satu-
sisi lebih besar daripada α 2 , statistik penguji akan berada di luar daerah kritis, H 0
tidak ditolak.
63. Dalam pengujian statistik yang tidak mencakup penelitian negatif, pernyataan
verbal yang hendak dibuktikan diubah menjadi pernyataan matematik dalam
bentuk:
Jawab: B. Hipotesis alternatif.
Penjelasan: Pada pengujian statistik yang tidak mencakup penelitian negatif,
pernyataan verbal yang hendak dibuktikan selalu dikonversikan menjadi hipotesis
14
Jawaban Latihan Ujian
alternatif (lihat kembali pembahasan dalam Lampiran 1B: Hipotesis penelitian dan
hipotesis statistik).
64. Di antara batu baterei produksi pabrik XYZ, hanya 70% yang memenuhi kualitas
standar. Konsultan pabrik mengajukan hipotesis (verbal) bahwa cara produksi baru
yang disarankannya dapat menghasilkan persentase yang lebih tinggi yang
memenuhi kualitas standar. Pada pengujian statistik, hipotesis verbal yang hendak
dibuktikan ini ditransformasikan menjadi:
Jawab: B. Hipotesis alternatif
Penjelasan: Setiap penggantian cara lama dengan cara baru hanya dapat
dibenarkan jika cara baru itu terbukti lebih baik daripada cara lama, dan dalam uji
hipotesis, pernyataan (untuk dibuktikan) bahwa cara baru lebih baik daripada cara
lama dikonversikan menjadi hipotesis alternatif.
65. Untuk soal No. 64 di atas, pernyataan verbal yang hendak dikaji tersebut dianggap
terbukti kebenarannya jika pada akhir pengujian statistik:
Jawab: A. H 0 ditolak.
Penjelasan: Pernyataan verbal yang ingin dibuktikan dan telah dikonversi menjadi
hipotesis alternatif dianggap terbukti kebenarannya jika pada uji hipotesis, hipotesis
nol ditolak.
66. Apabila efek yang diuji dianggap memiliki nilai penting secara substantif, namun
hasil pengujian ternyata tidak menunjukkan kemaknaan statistik, maka:
Jawab: C. Pengujian secara statistik perlu diulangi dengan ukuran sampel yang
lebih besar.
Penjelasan: Hasil pengujian yang tidak menunjukkan kemaknaan statistik dapat
terjadi karena ukuran sampel yang digunakan terlalu kecil (kekuatan uji terlalu
rendah), karena itu jika efek tersebut dianggap memiliki nilai penting secara
substantif, pengujian secara statistik perlu diulangi dengan ukuran sampel yang
lebih besar.
67. Apabila efek yang diuji bermakna secara statistik, namun secara substantif dianggap
tidak penting, maka:
Jawab: B. Efek tersebut tidak penting, dan hasil uji statistik tidak perlu
diperhatikan.
Penjelasan: ‘Kemaknaan secara substantif’ selalu lebih penting daripada
‘kemaknaan secara statistik’, sehingga efek yang dianggap tidak penting secara
substantif, walaupun hasil ujinya bermakna secara statistik, untuk selanjutnya tidak
perlu diperhatikan lagi.
15
Jawaban Latihan Ujian
68. Dari sampel yang berukuran n = 36 diperoleh interval konfidensi 95% untuk rerata
populasinya adalah 80 < µ < 120, maka bagi nilai rerata sampelnya disimpulkan:
Jawab: B. y = 100
Penjelasan: Karena ukuran sampel besar (n > 30), rerata sampel y berdistribusi
normal (simetris) dan nilai y terletak tepat di tengah-tengah rentang estimasi
intervalnya:
80+120
y = = 100
2
69. Untuk soal No. 68 juga dapat disimpulkan bagi standar deviasi sampelnya:
Jawab: A. s < 80
Penjelasan: Interval konfidensi 95% untuk rerata populasi adalah:
s s
y − Z 0.025 . < µ < y + Z 0.025 .
n n
s s
yaitu: y − (1.96) < µ < y + (1.96)
36 36
sehingga lebar interval konfidensi adalah:
s
(2)(1.96) = 120 – 80 = 40
36
Diperoleh: s = 61.22
(Untuk perhitungan cepat, jika Z 0.025 ≈ 2, maka s ≈ 60)
70. Pada uji Z terhadap rerata satu populasi dengan hipotesis nol H 0 : µ ≥ µ0 , maka
daerah kritisnya (daerah penolakan) terletak pada:
Jawab: A. Ekor kiri distribusi sampling statistik penguji.
Penjelasan: Pada uji Z terhadap rerata satu populasi dengan hipotesis nol
H 0 : µ ≥ µ0 , hipotesis alternatifnya adalah H1 : µ < µ0 dengan daerah kritis terletak
pada ekor kiri distribusi H 0 , yaitu Z < − Zα .
Penjelasan: Daerah kritis pada uji Z 1-sisi dengan hipotesis alternatif H1 : θ < θ 0
dan tingkat signifikansi α = 0.05 adalah Z < − Zα atau Z < − Z 0.05 .
16
Jawaban Latihan Ujian
72. Interval konfidensi 95% proporsi lulusan Universitas Gunadarma yang berhasil
memperoleh pekerjaan dalam tahun pertama setelah lulus adalah [64% ; 78%]. Uji
2-arah terhadap H 0 : P = 65% akan menghasilkan kesimpulan:
73. Ujian tingkat mahir bahasa Inggris yang telah distandardisasi menghasilkan nilai
rerata 62 dengan standar deviasi 12. Kelompok yang terdiri dari 30 orang yang
telah menyelesaikan kursus bahasa Inggris memperoleh nilai rerata 65 untuk ujian
tersebut. Untuk menguji manfaat kursus bahasa Inggris tersebut, hipotesis nol yang
relevan adalah:
Jawab: A. µ < 62
Penjelasan: Kursus yang bermanfaat diharapkan meningkatkan nilai rerata ujian,
sehingga hipotesis alternatif yang perlu dibuktikan ialah H1 : µ > 62, dan hipotesis
nol-nya ialah H 0 : µ < 62.
74. Data lampau menunjukkan bahwa persentase rabun jauh di antara pemuda seusia
mahasiswa adalah 20%. Untuk membuktikan adanya peningkatan persentase rabun
jauh pada populasi mahasiswa, hipotesis nol yang perlu diuji adalah:
75. Panitia penilai kualitas dosen Universitas Gunadarma menyatakan bahwa 90%
mahasiswa puas dengan pengajaran yang diperolehnya. Tuan Hasan, seorang
aktivis mahasiswa, merasa bahwa pernyataan ini terlalu berlebihan. Untuk menguji
proporsi kepuasan mahasiswa, hipotesis nol yang relevan adalah:
Jawab: C. P > 90%
17
Jawaban Latihan Ujian
76. Pada penggunaan uji Z bagi kesamaan 2 rerata sampel berukuran besar n1 dan n2 ,
yang dimaksud dengan pernyataan ‘sampel berukuran besar’ ialah:
Penjelasan: Pada inferensi statistik selisih rerata dua populasi, normal atau
sebarang, dengan sampel besar dipersyaratkan ukuran sampel masing-masing n1 >
30 dan n2 > 30 (lihat pembahasan pada buku teks, bab 3, subbab 3.1).
77. Pernyataan yang benar mengenai variansi dan SE selisih rerata 2 populasi
independen adalah:
78. Misalkan dimiliki data sampel acak nilai IQ mahasiswa Fakultas Ilmu Komputer
dan Fakultas Ekonomi Universitas Gunadarma (diasumsikan σ 1 ≠ σ 2 )
2 2
Filkom: n1 = 40 y1 = 131 s1 = 15
FE: n 2 = 36 y2 = 126 s 2 = 17
Jika diperoleh statistik penguji Zuji = 1.35, maka dengan daerah kritis untuk H 0 :
µ1 − µ2 = 0 berupa | Z| > 1.96 untuk tingkat signifikansi α = 0.05, kesimpulan
yang diperoleh yaitu:
Penjelasan: Dengan α = 0.05, daerah kritis (daerah penolakan) adalah Z < −1.96
atau Z > 1.96. Statistik penguji Zuji = 1.35 tidak terletak pada daerah kritis tersebut,
sehingga H 0 tidak ditolak.
18
Jawaban Latihan Ujian
Misalkan dimiliki data sampel acak gaji guru pria dan wanita di suatu daerah
(diasumsikan σ 1 ≠ σ 2 ):
2 2
Jawab: B. µ1 − µ2 = 0
Penjelasan: Tanpa ada penjelasan lebih lanjut mengenai tujuan penelitian, uji
statistik yang paling relevan di sini adalah uji 2-sisi, yang bertujuan untuk mengkaji
ada tidaknya perbedaan antara rerata gaji guru pria dan gaji guru wanita, dengan
hipotesis H 0 : µ1 − µ2 = 0.
80. Dengan tingkat signifikansi α = 0.05 dan daerah kritis untuk uji 2-sisi adalah | Z|
> 1.96, jika diperoleh statistik penguji Zuji = 4.30, maka kesimpulan yang
diperoleh yaitu:
Jawab: A. H 0 ditolak
81. Hipotesis nol yang perlu diuji untuk membuktikan efektivitas metode pengajaran
dengan cara baru itu ialah ( P1 menyatakan proporsi yang lulus pada cara baru dan
P2 pada cara lama):
Jawab: D. H 0 : P1 < P2
Penjelasan: Setiap cara baru dalam bidang apapun penerapannya hanya boleh
dilakukan apabila telah terbukti lebih baik daripada cara lama, karena itu hipotesis
alternatif yang harus dibuktikan adalah H1 : P1 > P2 (proporsi yang lulus dengan
cara baru lebih besar daripada proporsi yang lulus dengan cara lama), sehingga
hipotesis nol-nya adalah H 0 : P1 < P2 .
19
Jawaban Latihan Ujian
82. Jika daerah kritis untuk uji hipotesis tersebut adalah Z > 1.64 untuk α = 0.05 dan Z
> 1.28 untuk α = 0.10, sedangkan statistik penguji untuk uji hipotesis tersebut
adalah Zuji = 1.37, maka kesimpulan yang diperoleh adalah:
Penjelasan:
- Dengan α = 0.05, daerah kritis adalah Z > 1.64 ( Zuji = 1.37 tidak terletak pada
daerah kritis), sehingga H 0 : P1 < P2 tidak ditolak, berarti:
‘Tidak ditemukan peningkatan efektivitas pada metode pengajaran dengan cara
baru yang bermakna secara statistik pada tingkat signifikansi α = 0.05’
- Dengan α = 0.10, daerah kritis adalah Z > 1.28 ( Zuji = 1.37 terletak pada
daerah kritis), sehingga H 0 : P1 < P2 ditolak, berarti:
‘Ditemukan peningkatan efektivitas pada metode pengajaran dengan cara baru
yang bermakna secara statistik pada tingkat signifikansi α = 0.10’
83. Pada uji khi-kuadrat terhadap tabel kontijensi r × c (r baris dan c kolom), statistik
penguji yang dihasilkan memiliki derajat bebas sebesar:
Jawab: C. (r – 1) × (c – 1)
20
Jawaban Latihan Ujian
86. Jika P1 menyatakan proporsi orang usia muda yang tidurnya kurang daripada 8
jam/hari, dan P2 menyatakan proporsi hal yang sama pada orang usia lanjut, maka
dengan menggunakan uji khi-kuadrat untuk data di atas, hipotesis yang diuji ialah:
Jawab: B. H 0 : P1 = P2
Penjelasan: Pada uji Z untuk kesamaan proporsi, konversi dugaan yang hendak
dibuktikan bahwa kelompok orang usia lanjut lebih sedikit tidurnya dibandingkan
kelompok orang usia muda menjadi hipotesis alternatif menghasilkan H1 : P1 < P2 ,
sehingga hipotesis nol-nya adalah H 0 : P1 ≥ P2 , namun uji khi-kuadrat untuk tabel
kontijensi selalu merupakan uji 2-sisi (tetapi 1-ekor), sehingga hipotesis nol-nya
adalah H 0 : P1 = P2 .
87. Statistik penguji untuk data di atas besarnya adalah 22.26 dengan derajat bebas 1.
Dengan nilai kritis 3.84 untuk tingkat signifikansi α = 5%, kesimpulan yang
diperoleh yaitu:
Jawab: A. Pada tingkat signifikansi 5%, terdapat perbedaan proporsi individu
yang tidur lebih sedikit yang bermakna secara statistik di antara
kelompok usia muda dan kelompok usia lanjut.
Penjelasan: Pada tingkat signifikansi 5%, statistik penguji Wuji = 22.26 terletak
pada daerah kritis, sehingga hipotesis H 0 : P1 = P2 ditolak. Karena nilai p < 0.05,
maka pada tingkat signifikansi 10% hipotesis nol juga pasti ditolak.
88. Tabel di bawah ini menunjukkan hasil uji coba sebuah vaksin baru terhadap hewan
ternak, yaitu jumlah ternak yang hidup dan mati pada saat wabah.
Fatal Non-fatal
Vaksinasi 6 114
Tanpa vaksinasi 18 162
Pada pengujian statistik dengan uji khi-kuadrat Pearson diperoleh statistik penguji
sebesar 2.446. Dengan nilai kritis sebesar 3.84 untuk tingkat signifikansi α = 5%,
kesimpulan yang diperoleh yaitu:
21
Jawaban Latihan Ujian
Baik untuk tingkat signifikansi 5% maupun 10%, statistik penguji tidak terletak
pada daerah kritis, sehingga untuk kedua tingkat signifikansi H 0 tidak ditolak.
Usia perkawinan
Masa penjajagan pra-nikah
< 4 tahun > 4 tahun
Kurang daripada ½ tahun 11 8
½ - 1 ½ tahun 28 24
Lebih daripada 1 ½ tahun 21 19
Pada pengujian H 0 : Tidak ada asosiasi antara masa penjajagan pra-nikah dengan
usia perkawinan, jika diperoleh statistik penguji sebesar 0.15, maka dengan nilai
kritis untuk statistik penguji sebesar 5.991 untuk tingkat signifikansi α = 5%,
kesimpulan yang diperoleh yaitu:
Jawab: D. Semuanya salah:
A) Pada tingkat signifikansi 1%, terdapat asosiasi yang bermakna
secara statistik antara masa penjajagan pra-nikah dengan usia
perkawinan.
B) Pada tingkat signifikansi 5%, terdapat asosiasi yang bermakna
secara statistik antara masa penjajagan pra-nikah dengan usia
perkawinan.
C) Pada tingkat signifikansi 10%, terdapat asosiasi yang bermakna
secara statistik antara masa penjajagan pra-nikah dengan usia
perkawinan.
Penjelasan: Lihat matriks di bawah ini:
Wuji α Daerah kritis Kesimpulan
22
Jawaban Latihan Ujian
Untuk tingkat signifikansi 1%, 5%, dan 10%, statistik penguji tidak terletak pada
daerah kritis, sehingga pada ketiga keadaan tersebut H 0 tidak ditolak.
90. Pada analisis variansi terhadap suatu himpunan data, akan diperoleh kesimpulan
yang mengarah pada adanya perbedaan nilai rerata (mean) antar kelompok
perlakuan, jika:
Jawab: C. Variansi antar-kelompok besar dan variansi dalam-kelompok kecil.
Penjelasan: Perbedaan rerata antar kelompok pada analisis variansi akan semakin
jelas jika:
a) Variansi antar-kelompok (between-groups) lebih besar.
b) Variansi dalam-kelompok (within-group) lebih kecil.
(lihat kembali diagram 6.1)
Mesin
A B C D E
4.2 3.9 4.1 3.6 3.8
4.1 3.8 4.0 3.9 3.6
4.2 3.7 4.2 3.5 3.9
4.3 3.8 4.0 4.0 3.5
4.4 3.6 4.1 4.1 3.7
4.0 3.5 3.8 3.8 3.6
92. Hipotesis nol dan hipotesis alternatif analisis variansi ini dirumuskan sebagai:
Jawab: C. H 0 : µ1 = µ 2 = µ3 = µ 4 = µ5
23
Jawaban Latihan Ujian
Jawab: A. 10.768
Penjelasan: Statistik penguji adalah:
KRP JKP ( k − 1)
Fuji = =
KRG JKG ( n − k )
1.169 4
= = 10.768
0.678 25
24
Jawaban Latihan Ujian
Penjelasan:
Fuji α Ftabel Kesimpulan
0.01 4.177 H 0 ditolak
10.768 0.05 2.759 H 0 ditolak
0.10 2.184 H 0 ditolak
Jawab: D. 2.69
Penjelasan: Statistik penguji adalah:
KRP JKP ( k − 1)
Fuji = =
KRG JKG ( n − k )
64,586.17 2
= = 2.693
108,335.50 9
25
Jawaban Latihan Ujian
Penjelasan: Nilai statistik penguji Fuji lebih kecil daripada nilai titik kritis Ftabel
(tidak terletak pada daerah kritis:
Fuji = 2.693 lebih kecil daripada F( 2; 9; 0.05) = 4.256
sehingga hipotesis H 0 : µ1 = µ2 = µ3 tidak ditolak.
98. Dua macam pupuk (P dan Q) digunakan dalam kuantitas 1 kg dan 2 kg per petak.
Dilakukan eksperimen faktorial 2x2 dengan empat observasi replikasi dengan hasil
sebagai berikut:
B: Dosis pemupukan
1 kg 2 kg
P 17, 16, 15, 18 13, 13, 14, 12
A: Jenis pupuk
Q 21, 20, 19, 18 14, 16, 16, 14
26
Jawaban Latihan Ujian
B: Pekerja
B1 B2 B3 B4
A1 44 46 34 43
A:
A2 38 40 36 38
Tipe mesin
A3 47 52 44 46
99. Pada uji analisis variansi 2-arah (two-way ANOVA) terhadap data dengan 1
pengamatan / observasi per sel, model statistik yang dapat digunakan ialah:
A. yij = µ + αi + β j + εij C. Keduanya dapat digunakan.
B. yij = µ + αi + β j + ( αβ ) ij + εijk D. Keduanya tidak dapat digunakan.
27
Upah rata-rata 50 pekerja di suatu perusahaan adalah $500 dengan simpangan baku $60. Diketahui
ukuran sampel kurang dari 5% ukuran populasi. Tentukan standard error data tersebut!
Select one:
a. 8.07
b. 1.02
c. 8.48
d. 7.07
Select one:
True
False
Jika ditentukan nilai α = 5% dan didapatkan nilai signifikansi 0.02 maka hipotesis nol diterima
Select one:
True
False
α = 5% = 0.05
sig= 0.02
0.02 < 0.05 = sig < α maka hipotesis nol ditolak
The correct answer is 'False'.
Dari populasi pengguna gadget yang berukuran 8.7 juta, diketahui rata-rata mengeluarkan uang
sebesar $6986.91 per tahun untuk membeli gadget dengan simpangan baku $298.45. Data dapat
dinyatakan terdistribusi normal Jika dari populasi tersebut diambil sampel acak sebanyak 2209
orang, tentukan nilai Z jika ingin diketahui peluang rata-rata biaya belanja gadget dalam sampel
tersebut kurang dari $7000 per tahun ...
Select one:
a. 0.48
b. 2.06
c. 0.10
d. 1.05
Dari 20 pemilik gadget yang dipilih sebagai sampel acak, diketahui rata-rata setiap bulan melakukan
168 (kali) komunikasi dengan orang-orang terdekat melalui gadget dan simpangan baku 19.60
dengan data diasumsikan terdistribusi normal. Selang Kepercayaan 95% untuk menduga rata-rata
banyak komunikasi antara pemilik gadget dengan orang-orang terdekat yang dilakukan melalui
gadget yaitu ...
Select one:
Terdapat dua jenis perhitungan dalam ANOVA dua jalur berdasarkan ada tidaknya interaksi
Select one:
True
False
Select one:
True
False
Nilai T Tabel untuk data berjumlah 9, selang kepercayaan 95%, dalam penelitian dua arah adalah
2.262
Select one:
True
False
Answer 3
Menguji parameter populasi melalui statistik Statistika Parametrik
Answer 4
Menguji distribusi Statistika Non Parametrik
Select one:
a. 3.68
b. 3.29
c. 5.61
d. 6.72
Answer: 3.11
Answer: True
3. Dari 20 pemilik gadget yang dipilih sebagai sampel acak, diketahui rata-rata setiap bulan
melakukan 168 (kali) komunikasi dengan orang-orang terdekat melalui gadget dan simpangan baku
19.60 dengan data diasumsikan terdistribusi normal. Selang Kepercayaan 95% untuk menduga rata-
rata banyak komunikasi antara pemilik gadget dengan orang-orang terdekat yang dilakukan melalui
gadget yaitu ...
4. Upah rata-rata 50 pekerja di suatu perusahaan adalah $500 dengan simpangan baku $60.
Diketahui ukuran sampel kurang dari 5% ukuran populasi. Tentukan standard error data tersebut!
Answer: 8.48
5. Setiap pengunjung di supermarket tadinya tidak perlu cek suhu tubuh ketika akan berbelanja,
karenanya rata-rata waktu yang dibutuhkan untuk berbelanja hanya 60 menit. Tetapi semenjak
penyebaran covid-19, semua pengunjung diwajibkan untuk cek suhu tubuh. Peneliti ingin
membuktikan bahwa rata-rata waktu yang dibutuhkan pengunjung untuk berbelanja semakin
panjang semenjak adanya peraturan baru tersebut. Maka hipotesis alternatif yang dirumuskan
sebagai berikut: 𝐻1 : μ > 60 menit
Answer: True
6. Jika ditentukan nilai α = 1% dan didapatkan nilai signifikansi 0.003 maka hipotesis nol ditolak dan
hipotesis alternatif diterima
Answer: True
α = 1% = 0.01
sig= 0.003
Answer: True
8. Jika ditentukan nilai α = 5% dan didapatkan nilai signifikansi 0.450 maka hipotesis nol diterima
Answer: True
Answer: 3.11
Answer: Dalam pengujian hipotesis dua arah, nilai α tidak dibagi dua
Suatu hipotesis diterima karena hipotesis tersebut benar dan ditolak karena hipotesis tersebut salah
Select one:
True
False
Feedback
The correct answer is 'False'.
Question 2
Correct
Mark 1 out of 1
Flag question
Question text
Jika ditentukan nilai α = 5% dan didapatkan nilai signifikansi 0.02 maka hipotesis nol diterima
Select one:
True
False
Feedback
Question 3
Correct
Mark 1 out of 1
Flag question
Question text
Terdapat dua jenis perhitungan dalam ANOVA dua jalur berdasarkan ada tidaknya interaksi
Select one:
True
False
Feedback
Question 4
Correct
Mark 1 out of 1
Flag question
Question text
Select one:
True
False
Feedback
Question 5
Correct
Mark 1 out of 1
Flag question
Question text
Dari 20 pemilik gadget yang dipilih sebagai sampel acak, diketahui rata-rata setiap bulan melakukan
168 (kali) komunikasi dengan orang-orang terdekat melalui gadget dan simpangan baku 19.60
dengan data diasumsikan terdistribusi normal. Selang Kepercayaan 95% untuk menduga rata-rata
banyak komunikasi antara pemilik gadget dengan orang-orang terdekat yang dilakukan melalui
gadget yaitu ...
Select one:
Feedback
Correct
Mark 1 out of 1
Flag question
Question text
Select one:
True
False
Feedback
Question 7
Correct
Mark 1 out of 1
Flag question
Question text
Jika ditentukan nilai α = 5% dan didapatkan nilai signifikansi 0.450 maka hipotesis nol diterima
Select one:
True
False
Feedback
Question 8
Correct
Mark 1 out of 1
Flag question
Question text
Jika ditentukan nilai α = 1% dan didapatkan nilai signifikansi 0.003 maka hipotesis nol ditolak dan
hipotesis alternatif diterima
Select one:
True
False
Feedback
Question 9
Correct
Mark 1 out of 1
Flag question
Question text
150 orang anak perempuan memiliki rata-rata berat badan 56 kg dan standar deviasi 8 kg. Dari total
tersebut akan diambil 64 orang anak sebagai sampel acak tanpa pemulihan. Jika rata-rata berat
badan mereka terdistribusi normal, tentukan nilai dari P (x >̅ 57)!
Select one:
a. 1.33
b. 0.0918
c. 0.9082
d. 0.4082
Feedback
Question 10
Correct
Mark 1 out of 1
Flag question
Question text
Dari populasi pengguna gadget yang berukuran 8.7 juta, diketahui rata-rata mengeluarkan uang
sebesar $6986.91 per tahun untuk membeli gadget dengan simpangan baku $298.45. Data dapat
dinyatakan terdistribusi normal Jika dari populasi tersebut diambil sampel acak sebanyak 2209
orang, tentukan nilai Z jika ingin diketahui peluang rata-rata biaya belanja gadget dalam sampel
tersebut kurang dari $7000 per tahun ...
Select one:
a. 2.06
b. 1.05
c. 0.10
d. 0.48
Feedback
1. 150 orang anak perempuan memiliki rata-rata berat badan 56 kg dan standar deviasi 8 kg. Dari
total tersebut akan diambil 64 orang anak sebagai sampel acak tanpa pemulihan. Jika rata-rata berat
badan mereka terdistribusi normal, tentukan nilai dari P (x >̅ 57)!
Select one:
c. 0.0918
Select one:
True
3. Untuk memastikan kebenaran suatu hipotesis kita dapat mengambil sampel acak dan
menggunakan informasi dari sampel itu untuk menerima atau menolak suatu hipotesis
Select one:
True
4. Upah rata-rata 50 pekerja di suatu perusahaan adalah $500 dengan simpangan baku $60.
Diketahui ukuran sampel kurang dari 5% ukuran populasi. Tentukan standard error data tersebut!
Select one:
d. 8.48
5. Dalam sebuah inspeksi pabrik diambil 36 makanan kaleng yang memiliki berat kotor rata-rata
290ml dan simpangan baku 42ml. Dengan menggunakan taraf nyata 5%, ujilah hipotesis yang
menyatakan bahwa berat kotor rata-rata populasi makanan kaleng di pabrik tersebut sama dengan
295ml. Berikut adalah pernyataan yang tepat mengenai soal tersebut, kecuali ...
Select one:
Select one:
d. 3.11
7. Dalam sebuah inspeksi pabrik diambil 36 makanan kaleng yang memiliki berat kotor rata-rata
290ml dan simpangan baku 42ml. Dengan menggunakan taraf nyata 5%, ujilah hipotesis yang
menyatakan bahwa berat kotor rata-rata populasi makanan kaleng di pabrik tersebut sama dengan
295ml. Nilai statistik hitung dari data tersebut adalah ...
Select one:
b. -0.71
8. Diketahui rata-rata skor penerimaan diri mahasiswi adalah 127 dengan ragam (varians) = 119
sedangkan rata-rata skor penerimaan diri mahasiswa adalah 124 dengan ragam (varians) 181.
Diasumsikan kedua populasi berukuran besar, kemudian diambil 100 orang mahasiswi dan 100
mahasiswa sebagai sampel. Probabilitas adanya perbedaan rata-rata skor penerimaan diri kedua
kelompok kurang dari 2 adalah ...
Select one:
b. 25.61%
9. Dari 20 pemilik gadget yang dipilih sebagai sampel acak, diketahui rata-rata setiap bulan
melakukan 168 (kali) komunikasi dengan orang-orang terdekat melalui gadget dan simpangan baku
19.60 dengan data diasumsikan terdistribusi normal. Selang Kepercayaan 95% untuk menduga rata-
rata banyak komunikasi antara pemilik gadget dengan orang-orang terdekat yang dilakukan melalui
gadget yaitu ...
Select one:
Select one:
Select one:
True
False
2. Jika ditentukan nilai α = 1% dan didapatkan nilai signifikansi 0.003 maka hipotesis nol ditolak dan
hipotesis alternatif diterima
Select one:
True
False
3. Diketahui rata-rata skor penerimaan diri mahasiswi adalah 127 dengan ragam (varians) = 119
sedangkan rata-rata skor penerimaan diri mahasiswa adalah 124 dengan ragam (varians) 181.
Diasumsikan kedua populasi berukuran besar, kemudian diambil 100 orang mahasiswi dan 100
mahasiswa sebagai sampel. Probabilitas adanya perbedaan rata-rata skor penerimaan diri kedua
kelompok kurang dari 2 adalah ...
Select one:
a. 25.61%
b. 0.57%
c. 74.39%
d. 24.39%
4. Dalam sebuah inspeksi pabrik diambil 36 makanan kaleng yang memiliki berat kotor rata-rata
290ml dan simpangan baku 42ml. Dengan menggunakan taraf nyata 5%, ujilah hipotesis yang
menyatakan bahwa berat kotor rata-rata populasi makanan kaleng di pabrik tersebut sama dengan
295ml. Nilai statistik hitung dari data tersebut adalah ...
Select one:
a. 0.71
b. -1.96
c. 1.96
d. -0.71
Select one:
True
False
6. Upah rata-rata 50 pekerja di suatu perusahaan adalah $500 dengan simpangan baku $60.
Diketahui ukuran sampel kurang dari 5% ukuran populasi. Tentukan standard error data tersebut!
Select one:
a. 1.02
b. 8.48
c. 7.07
d. 8.07
7. Setiap pengunjung di supermarket tadinya tidak perlu cek suhu tubuh ketika akan berbelanja,
karenanya rata-rata waktu yang dibutuhkan untuk berbelanja hanya 60 menit. Tetapi semenjak
penyebaran covid-19, semua pengunjung diwajibkan untuk cek suhu tubuh. Peneliti ingin
membuktikan bahwa rata-rata waktu yang dibutuhkan pengunjung untuk berbelanja semakin
panjang semenjak adanya peraturan baru tersebut. Maka hipotesis alternatif yang dirumuskan
sebagai berikut:
𝐻1 : μ > 60 menit
Select one:
True
False
8. 150 orang anak perempuan memiliki rata-rata berat badan 56 kg dan standar deviasi 8 kg. Dari
total tersebut akan diambil 64 orang anak sebagai sampel acak tanpa pemulihan. Jika rata-rata berat
badan mereka terdistribusi normal, tentukan nilai dari P (x >̅ 57)!
Select one:
a. 0.4082
b. 0.9082
c. 1.33
d. 0.0918
Select one:
a. 5.26
b. 2.54
c. 3.32
d. 3.11
10. Dari populasi pengguna gadget yang berukuran 8.7 juta, diketahui rata-rata mengeluarkan uang
sebesar $6986.91 per tahun untuk membeli gadget dengan simpangan baku $298.45. Data dapat
dinyatakan terdistribusi normal Jika dari populasi tersebut diambil sampel acak sebanyak 2209
orang, tentukan nilai Z jika ingin diketahui peluang rata-rata biaya belanja gadget dalam sampel
tersebut kurang dari $7000 per tahun ...
Select one:
a. 0.48
b. 2.06
c. 0.10
d. 1.05
True❌
False
~>Hipotesis nol ditulis dalam bentuk persamaan (=), sedangkan hipotesis alternatif ditulis dalam
bentuk pertidaksamaan (<;>;≠)
Select one:
a. 3.68
b. 5.61
c. 3.29
d. 6.72
Select one:
a. 5.26
b. 3.11
c. 2.54
d. 3.3
4. Jika diketahui daerah penolakan H0 adalah t < -t (15;0.5%) dan t > t (15;0.5%), kemudian nilai t
hitung nya adalah 1.065 maka kesimpulan yang dapat diambil adalah H0 nya diterima
True
False
5. 150 orang anak perempuan memiliki rata-rata berat badan 56 kg dan standar deviasi 8 kg. Dari
total tersebut akan diambil 64 orang anak sebagai sampel acak tanpa pemulihan. Jika rata-rata berat
badan mereka terdistribusi normal, tentukan nilai dari P (x >̅ 57)!
Select one:
a. 0.9082
b. 0.4082
c. 0.0918
d. 1.33❌
6. Dari populasi pengguna gadget yang berukuran 8.7 juta, diketahui rata-rata mengeluarkan uang
sebesar $6986.91 per tahun untuk membeli gadget dengan simpangan baku $298.45. Data dapat
dinyatakan terdistribusi normal Jika dari populasi tersebut diambil sampel acak sebanyak 2209
orang, tentukan nilai Z jika ingin diketahui peluang rata-rata biaya belanja gadget dalam sampel
tersebut kurang dari $7000 per tahun ...
Select one:
a. 0.48
b. 1.05❌
c. 0.10
d. 2.06
Select one:
True❌
False
8. Dalam sebuah inspeksi pabrik diambil 36 makanan kaleng yang memiliki berat kotor rata-rata
290ml dan simpangan baku 42ml. Dengan menggunakan taraf nyata 5%, ujilah hipotesis yang
menyatakan bahwa berat kotor rata-rata populasi makanan kaleng di pabrik tersebut sama dengan
295ml. Nilai statistik hitung dari data tersebut adalah ...
Select one:
a. -0.71
b. -1.96
c. 1.96
d. 0.71
9. Dalam sebuah inspeksi pabrik diambil 36 makanan kaleng yang memiliki berat kotor rata-rata
290ml dan simpangan baku 42ml. Dengan menggunakan taraf nyata 5%, ujilah hipotesis yang
menyatakan bahwa berat kotor rata-rata populasi makanan kaleng di pabrik tersebut sama dengan
295ml. Nilai statistik hitung dari data tersebut adalah ...
a. -0.71
b. 1.96
c. 0.71
d. -1.96
10. Untuk memastikan kebenaran suatu hipotesis kita dapat mengambil sampel acak dan
menggunakan informasi dari sampel itu untuk menerima atau menolak suatu hipotesis
11. True
Question 1
Correct
Mark 1 out of 1
Flag question
Question text
Dalam sebuah inspeksi pabrik diambil 36 makanan kaleng yang memiliki berat kotor rata-rata 290ml
dan simpangan baku 42ml. Dengan menggunakan taraf nyata 5%, ujilah hipotesis yang menyatakan
bahwa berat kotor rata-rata populasi makanan kaleng di pabrik tersebut sama dengan 295ml.
Berikut adalah pernyataan yang tepat mengenai soal tersebut, kecuali ...
Select one:
a. H_0 diterima
b. H_1 ∶ μ≠295
Feedback
Question 2
Correct
Mark 1 out of 1
Flag question
Question text
Select one:
a. 6.72
b. 3.29
c. 3.68
d. 5.61
Feedback
Question 3
Correct
Mark 1 out of 1
Flag question
Question text
Dari populasi pengguna gadget yang berukuran 8.7 juta, diketahui rata-rata mengeluarkan uang
sebesar $6986.91 per tahun untuk membeli gadget dengan simpangan baku $298.45. Data dapat
dinyatakan terdistribusi normal Jika dari populasi tersebut diambil sampel acak sebanyak 2209
orang, tentukan nilai Z jika ingin diketahui peluang rata-rata biaya belanja gadget dalam sampel
tersebut kurang dari $7000 per tahun ...
Select one:
a. 0.48
b. 1.05
c. 2.06
d. 0.10
Feedback
Question 4
Correct
Mark 1 out of 1
Flag question
Question text
Dalam sebuah inspeksi pabrik diambil 36 makanan kaleng yang memiliki berat kotor rata-rata 290ml
dan simpangan baku 42ml. Dengan menggunakan taraf nyata 5%, ujilah hipotesis yang menyatakan
bahwa berat kotor rata-rata populasi makanan kaleng di pabrik tersebut sama dengan 295ml.
Berikut adalah pernyataan yang tepat mengenai soal tersebut, kecuali ...
Select one:
b. H_0 diterima
c. H_1 ∶ μ≠295
Feedback
Question 5
Correct
Mark 1 out of 1
Flag question
Question text
Nilai T Tabel untuk data berjumlah 9, selang kepercayaan 95%, dalam penelitian dua arah adalah
2.262
Select one:
True
False
Feedback
Question 6
Correct
Mark 1 out of 1
Flag question
Question text
Statistika non parametrik banyak digunakan untuk untuk menganalisis data nominal dan ordinal
Select one:
True
False
Feedback
Question 7
Correct
Mark 1 out of 1
Flag question
Question text
Upah rata-rata 50 pekerja di suatu perusahaan adalah $500 dengan simpangan baku $60. Diketahui
ukuran sampel kurang dari 5% ukuran populasi. Tentukan standard error data tersebut!
Select one:
a. 7.07
b. 8.07
c. 1.02
d. 8.48
Feedback
Question 8
Correct
Mark 1 out of 1
Flag question
Question text
Select one:
a. 2.54
b. 5.26
c. 3.11
d. 3.32
Feedback
Question 9
Correct
Mark 1 out of 1
Flag question
Question text
150 orang anak perempuan memiliki rata-rata berat badan 56 kg dan standar deviasi 8 kg. Dari total
tersebut akan diambil 64 orang anak sebagai sampel acak tanpa pemulihan. Jika rata-rata berat
badan mereka terdistribusi normal, tentukan nilai dari P (x >̅ 57)!
Select one:
a. 1.33
b. 0.0918
c. 0.9082
d. 0.4082
Feedback
Question 10
Correct
Mark 1 out of 1
Flag question
Dalam sebuah inspeksi pabrik diambil 36 makanan kaleng yang memiliki berat kotor rata-rata 290ml
dan simpangan baku 42ml. Dengan menggunakan taraf nyata 5%, ujilah hipotesis yang menyatakan
bahwa berat kotor rata-rata populasi makanan kaleng di pabrik tersebut sama dengan 295ml. Nilai
statistik hitung dari data tersebut adalah ...
Select one:
a. -0.71
b. 0.71
c. 1.96
d. -1.96
Feedback
Select one:
True
False
Feedback
Jika ditentukan nilai α = 5% dan didapatkan nilai signifikansi 0.02 maka hipotesis nol diterima
Select one:
True
False
Feedback
Select one:
a. 5.26
b. 3.32
c. 2.54
d. 3.11
Feedback
Diketahui rata-rata skor penerimaan diri mahasiswi adalah 127 dengan ragam (varians) = 119
sedangkan rata-rata skor penerimaan diri mahasiswa adalah 124 dengan ragam (varians) 181.
Diasumsikan kedua populasi berukuran besar, kemudian diambil 100 orang mahasiswi dan 100
mahasiswa sebagai sampel. Probabilitas adanya perbedaan rata-rata skor penerimaan diri kedua
kelompok kurang dari 2 adalah ...
Select one:
a. 0.57%
b. 74.39%
c. 24.39%
d. 25.61%
Feedback
Nilai T Tabel untuk data berjumlah 9, selang kepercayaan 95%, dalam penelitian dua arah adalah
2.262
Select one:
True
False
Feedback
Jika diketahui daerah penolakan H0 adalah t < -t (15;0.5%) dan t > t (15;0.5%), kemudian nilai t
hitung nya adalah 1.065 maka kesimpulan yang dapat diambil adalah H0 nya diterima
Select one:
True
False
Feedback
Select one:
b. Jika ditentukan nilai α = 1% dan nilai signifikansi = 0.003 maka hipotesis nol ditolak
d. Jika ditentukan nilai α = 5% dan nilai signifikansi = 0.450 maka hipotesis nol diterima
Feedback
The correct answer is: Dalam pengujian hipotesis dua arah, nilai α tidak dibagi dua
Diketahui rata-rata skor penerimaan diri mahasiswi adalah 127 dengan ragam (varians) = 119
sedangkan rata-rata skor penerimaan diri mahasiswa adalah 124 dengan ragam (varians) 181.
Diasumsikan kedua populasi berukuran besar, kemudian diambil 100 orang mahasiswi dan 100
mahasiswa sebagai sampel. Probabilitas adanya perbedaan rata-rata skor penerimaan diri kedua
kelompok kurang dari 2 adalah ...
Select one:
a. 0.57%
b. 24.39%
c. 74.39%
d. 25.61%
Feedback
Setiap pengunjung di supermarket tadinya tidak perlu cek suhu tubuh ketika akan berbelanja,
karenanya rata-rata waktu yang dibutuhkan untuk berbelanja hanya 60 menit. Tetapi semenjak
penyebaran covid-19, semua pengunjung diwajibkan untuk cek suhu tubuh. Peneliti ingin
membuktikan bahwa rata-rata waktu yang dibutuhkan pengunjung untuk berbelanja semakin
panjang semenjak adanya peraturan baru tersebut. Maka hipotesis alternatif yang dirumuskan
sebagai berikut:
𝐻1 : μ > 60 menit
Select one:
True
False
Feedback
1. Diketahui rata-rata skor penerimaan diri mahasiswi adalah 127 dengan ragam (varians) =
119 sedangkan rata-rata skor penerimaan diri mahasiswa adalah 124 dengan ragam (varians)
181. Diasumsikan kedua populasi berukuran besar, kemudian diambil 100 orang mahasiswi
dan 100 mahasiswa sebagai sampel. Probabilitas adanya perbedaan rata-rata skor
penerimaan diri kedua kelompok kurang dari 2 adalah ...
a. 0.57%
b. 24.39%
c. 74.39%
d. 25.61%
3. Terdapat dua jenis perhitungan dalam ANOVA dua jalur berdasarkan ada tidaknya interaksi
Select one:
True
False
Select one:
True
False
5. Upah rata-rata 50 pekerja di suatu perusahaan adalah $500 dengan simpangan baku $60.
Diketahui ukuran sampel kurang dari 5% ukuran populasi. Tentukan standard error data
tersebut!
Select one:
a. 8.07
b. 8.48
c. 1.02
d. 7.07
6. Untuk memastikan kebenaran suatu hipotesis kita dapat mengambil sampel acak dan
menggunakan informasi dari sampel itu untuk menerima atau menolak suatu hipotesis
Select one:
True
False
Select one:
True
False
Select one:
True
False
Select one:
True
False
Select one:
True
False
16. Berikut yang merupakan teknik nonprobability sampling adalah..
a. Cluster sampling
d. Accidental sampling
a. jumlah populasi
b. jumlah sample
c. rata-rata sample
d. rata-rata populasi
18. Di bawah ini yang bukan termasuk uji statistika non parametrik, kecuali
a. Uji Run(S)
b Uji anova
19. Di bawah ini yang bukan termasuk dari kelebihan uji non parametri
a. Ronald A Fisher
b. Ron A Fisher
c. Randalt A Fisher
d. Rendalt A Fisher
a. 1,645
b. 2,575
c. 2,32
d. 1,96
14. Nilai titik kritis pada pengujian hipotesis didapat dari nilai di bawah ini, kecuali.
a. Nilai N table
b. Nilai Z table
c. Nilai T table
d. Nilai F table
a. Snowball sampling
b. Purposive sampling
c. Multistage sampling
d. Judgement sampling
1. Sekumpulan individu dengan karakteristik khas yang menjadi perhatian dalam suatu
penelitian (pengamatan) disebut..
a. Populasi
b. Sampel
c. Variabel
d. Atribut
2. Hubungan antara sampel dan populasi pada statika inferensial adalah adanya proses..
setelah penelitian pada sampel terhadap populasi
a. Generalisasi
b. Spesialisasi
c. Seleksi
d. Reduksi
3. Di bawah ini merupakan syarat sampel yang baik, kecuali..
a. Memiliki variasi yang besar
b. Objektif
c. Representatif (mewakili keadaan yang sebenarnya)
d. Tepat waktu dan relevan
4. Teknik sampling dimana peneliti memiliki beberapa kriteria khusus yang sesuai dengan
penelitian untuk menjadikan suatu individu menjadi sampel penelitiannya adalah..
a. Purposive sampling
b. Accidental sampling
c. Simple random sampling
d. Cluster sampling
5. Pernyataan hipotesis 0 bahwa tidak terdapat perbedaan nilai rata-rata ujian siswa yang
mengikuti kelas tambahan dan tidak mengikuti kelas tambahan, dan H 1 bahwa terdapat
perbedaan nilai rata-rata ujian siswa yang mengikuti kelas tambahan dan tidak mengikuti
kelas tambahan. Jika dilambangkan dengan bahasa statistika akan menjadi..
a. H0: µ1 = µ2 H1:µ1 ≠ µ2
b. H0: µ1 = µ2 H1:µ1 > µ2
c. H0: µ1 = µ2 H1:µ1 < µ2
d. H0: µ1 = µ2 H1: µ1 ≥ µ2
21. Jika ingin diuji proporsi sampel 2 maka berapa PO sama dengan q0 …
0,05
22. Dibawah ini yang bukan langkah pertama pengujian mann-whitney, kecuali…
peringkat= £ urutan data yang bernilai sama / banyak data yang bernilai sama
24. 10 pengamen ditanyai dan diketahui setiap bulan mereka makan 2 liter nasi dengan
simpagangan baku = 1.
15 pengemis ditannyai dan diketahui setiap bulan mereka makan 4 liter nasi dengan
simpangan baku = 2. Ragam ke-2 populasi bernilai sama (selang kepercayaan 5).
Belum di isi
25. Berdasarkan table di atas, apakah nilai mahasiswa fakultas psikologi lebih
besar di banding mahasiswa sastra, tentukan dengan HO dan H 1..
c. H0 : µ1 = µ2 : HI: µ1 ≥ µ2
26. Berdasarkan table di atas, dengan taraf nyata 5%, berapakah hasil statistik uji
z.....
a. 0.81
b. 0.91
c. 0.71
d. 0.61
27. Berdasarkan hasil statistic uji di atas, tentukan kesimpulan yang paling tepat
untuk soal di atas….
a. Nilai statistika di fakultas psikologi sama dengan fakultas sastra
b Nilai statistika di fakultas psikologi lebib besar dibandingkan dengan fakultas
sastra
b. Nilai statistika di fakultas psikologi lebih kecil dibandingkan dengan fakultas
sastra
d. Nilai statistika di fakultas psikologi tidak sama dengan fiakultas sastra
28. Di bawah ini yang merupakan focus uji peringkat 2 sampel wilcoxon,
adalah.....
a. Sampel dengan ukuran terkecil
b. Sampel dengan ukuran yang sama
c. Sampel dengan ukuran yang terbesar
d. Semua jawaban salah
40 SOAL STATISTIKA
6. Seorang peneliti akan meneliti apakah terdapat perbedaan hasil belajar pada siswa yang
cerdas dan siswa dengan kemampuan intelcgensi rata-rata jika menggunakan metode belajar
Audio, Visual, dan Kinestetik. Untuk menganalisa data hasil penelitian terscbut, peneliti dapat
menggunakan teknik analisis...
a. Uji Hipotesis 1 Arah
b. Anova 1 Arah
c. Anova 2 Arah
d. Uji Hipotesis 2 Arah
7. Pada uji hipotesis 2 arah, daerah penerimaan untuk H1 dan penolakan HO berada di...
a. Sebelah kanan kurva
b. Sebelah kin kurva
c. Sebelah kanan dan kiri kurva
d. Tengah kurva
8. Parameter adalah suatu nilai yang menggambarkan ciri/ karakteristik dari...
a. Sampel
b. Variasi
c. Populasi
d. Variabel
9. Table pengujian analisis varian atau anova adalah..
a. Table Z
b. Table T
c. Table F
d. Table N
10. Analisis varian biasa digunakan untuk menguji.....
a. Pengujian ≥ 2 rata-rata
b. Pengujian ≤ 2 rata-rata
c. Pengujian > 2 rata-rata
d. Pengujian < 2 rata-rata
Untuk soal 37-39
Terdapat 2 metode diet dan 2 golongan usia peserta program diet. Berikut data rata-rata
penurunan berat badan peserta kedua metode dalam dua kelompok umur. Ujilah dengan taraf
nyata 5%!
Kelompok umur Metode 1 Metode 2 Total baris
< 20 tahun 4 6 10
20-40 tahun 2 3 5
Total kolom 6 9 Total = 15
STATISTIKA LANJUTAN
THOMAS WIDODO
Evaluasi
v UTS+Tugas (50 %)
v UAS (50 %)
SAP STATISTIKA 2 (IT-045228)
M POKOK/SUB POKOK BAHASAN
1 Konsep Dasar Sampling
·pengertian populasi, sampel, parameter dan statistik
·manfaat sampling
·metode sampling acak sederhana, sampling acak sistematis,
sampling berstrata dan sampling kelompok.
2 Lanjutan cara penentuan sampel
3 Konsep Selang kepercayaan
• Tabel Z`dan t
• Tingkat signifikansi 90%-99%
M POKOK/SUB POKOK BAHASAN
8 PENGUJIAN HIPOTESIS
Konsep dasar uji hipotesis proporsi
Prosedur uji hipotesis proporsi (1 & 2 populasi)
Galat dalam pengujian (tipe alpha dan beta
11 Uji kontigensi
Teori dan contoh kasus
12 Uji linear sederhana, Berganda dan uji korelasi
Persamaan Regresi sederhana
Korelasi
Konsep variable dependen dan independen
Persamaan uji regresi berganda
M POKOK/SUB POKOK BAHASAN
Sampling
DEDUKTIF
POPULASI SAMPLE
INDUKTIF
Generalisasi
Parameter Statistik
POPULASI , SAMPEL DAN PARAMETER
DEFINISI SELURUH UNSUR YANG MEMILIKI SATU ATAU LEBIH CIRI SEBAGIAN UNSUR ATAU ANGGOTA POPULASI YANG DIPILIH
KARAKTERISTIK YANG SAMA YANG BESARNYA DITENTUKAN UNTUK KEBUTUHAN STUDI OLEH PENELITI, YANG DIANGGAP
OLEH PENELITI MEWAKILI POPULASINYA
1. MENGHEMAT BIAYA
ØDATASEBAGIAN DARI POPULASI.
ØPETUGAS YANG DIBUTUHKAN
LEBIH SEDIKIT,
ØHEMAT BIAYA PERCETAKAN,
ØHEMAT BIAYA PELATIHAN,
PENCACAHAN, DAN
PENGOLAHAN.
lanjutan
1 2
DISTRIBUSI DISTRIBUSI
Sampling Sampling
BEDA BEDA
HARGA HARGA
3 4
RATA- DUA RATA-
RATA RATA
DISTRIBUSI
DISTRIBUSI
Sampling
Sampling
BEDA
BEDA DUA
HARGA
HARGA
Proporsi
1.DISTRIBUSI Sampling BEDA
HARGA RATA-RATA
Sampel 1
Rata-rata (1)
5,8,6,10,12,25,20, 10,
Sampel 2
POPULASI 15,8,6,10,12,30,20, 10,
Rata-rata (2)
Sampel 3
Rata-rata (3)
5,8,6,10,12,35,30, 20, 28
Sampel A1
5,8,6,10,12,25,, Rata-rata (1)
POPULASI
A Rata-rata (A)
Sampel A2
Rata-rata (2)
15,8,6,10,12,, 10,
Sampel B2
Rata-rata (2)
15,8,6,10,12,, 10,
2. Beda Harga Dua Rata-rata
3.DISTRIBUSI Sampilng BEDA
HARGA PROPORSI
Sampel 1
2 PRIA p1
10 mahasiswa
Sampel 2
POPULASI 15 mahasiswa 3 PRIA p2
Sampel 3
2 PRIA p3
20 mahasiswa
Sampel A1
10 mahasiswa (n1) 2 pria
POPULASI
A Proporsi
gabungan(A)
Sampel A2
3 pria
15 mahasiswa(n2)
Sampel B1 4 pria
POPULASI 14 mahasiswa(n1)
B Proporsi
gabungan (B)
Sampel B2
5 pria
16 mahasiswa(n2)
4.18
CONTOH 6
DUA KELOMPOK MHSW SANGAT RAJIN DAN RAJIN DIPERKIRAKAN
MENGHABISKAN WAKTU BELAJAR SELAMA SATU TAHUN MASING-2
1.400 JAM DAN 1200 JAM, DNG. SIMPANGAN BAKU 200 JAM DAN
100 JAM. APABILA DARI TIAP KELOMPOK DIAMBIL SAMPEL
SEBANYAK 125 MHSW SELANJUTNYA DITELITI WAKTU BELAJARNYA.
TENTUKAN PROBABILITAS BAHWA KLP. MAHASISWA SANGAT RAJIN
MEMILIKI WAKTU BELAJAR PALING SEDIKIT;
• 160 JAM LEBIH LAMA DARI PADA KLP.RAJIN.
• 250 JAM LEBIH LAMA DARIPADA KLP. RAJIN.
4.19
Contoh 7
INGAT KEMBALI
vNILAI PARAMETER DIDUGA ATAU
DIESTIMASIKAN DENGAN NILAI STATISTIK
DARI SAMPEL RANDOM.
vHARGA SAMPEL YG DIGUNAKAN UNTUK
MENDUGA DISEBUT ESTIMATOR DAN
PENDUGANYA DISEBUT VARIABEL RANDOM.
vHASIL PENDUGAAN INI TIDAK SELALU TEPAT
100 % ATAU SELALU ADA ERROR .
Teknik Sampling
Sampling
POPULASI SAMPLE
Generalisasi
Parameter Statistik
ESTIMATOR YANG BAIK
• TIDAK BIAS
Jika harga statistik (Hst)= harga
parameter (Hp) atau error (E) relatif
kecil
• EFISIEN
PENDUGA EFISIEN JIKA SIMPANGAN
BAKUNYA ( )KECIL
• KONSISTEN
ØPENDUGA TERKONSENTRASI PADA
PARAMETER, MESKIPUN SAMPEL
BERTAMBAH BESAR SAMPAI TIDAK
TERHINGGA. SEMAKIN BESAR ANGGOTA
SAMPEL SEMAKIN KECIL HARGA
SIMPANGAN BAKU.
ØE= (Hp – Hst) = 0 , jk n =∞
• CARA MENDUGA
PENDUGAAN HARGA
TITIK (POINT PARAMETER (Hp)
ESTIMATION)
Harga parameter diduga dengan satu harga statistik sampel. Dalam
pendugaan ini selain menentukan harga statistik ditentukan pula
besarnya kesalahan (error).
0,5α 0,5α
Pendugaan salah =
Area tembak =
Titik tengah =
Batas probabilitas =
Pendugaan dalam batas =
? ?
0,5α 0,5α
X
-3 -2 -1
0
1 2 3
Z
Area tembak = Tergantung dari probabilitas yg kita tentukan,
umumnya digunakan 90%, 95%, 97,5% atau 99%, ini
disebut sebagi selang kepercayaan (interval of
confidence, interval of probability)
Ingat kurva normal tersebut bernilai 100% atau nilai peluang seluruhnya 1
sehingga jika interval diketahui maka alpha bisa dihitung dan sebaliknya.
RUANG LINGKUP PENDUGAAN
1- α p = 95%; α=5%
p(Zα/2 ) = 1,96
0,5 α 0,5 α
µx X
-3 -2 -1,96 -1
0
1 1,96 2 3
Z
R1
Contoh 1.
Sebuah penelitian ingin mengetahui rata-rata nilai yg diperoleh siswa SMU Kelas 3
pada ujian matematika. Sebuah sampel random sebanyak 100 siswa telah terpilih.
Rata-2 nilai tsb 96 dng simpangan baku 1,6. Hitunglah interval keyakinan 98% untuk
menghitung rata-2 nilai ujian matematika tsb.
=s=1,6
2. MENGHITUNG E ( ERROR)
R2
Jika dalam perhitungan Nilai E , misalnya 0,75 artinya nilai harus lebih kecil dari
0,75 atau maksimum 0,75
MENENTUKAN BESARNYA SAMPEL (n)
R3
n dibaca minimal
Contoh 2.
Sebaran nilai sikap Siswa SMP menyebar
normal dng simpangan baku 0,50. Berapa
sampel yang harus diambil agar rata-2 sampel
tidak akan berbeda dari rata-2 populasinya
lebih dari 0,1. Gunakan selang kepercayaan
95%.
2. PENDUGAAN HARGA PROPORSI POPULASI
1. Interval estimasi untuk p
jika populasi sangat besar dan proporsi p tdk terlalu
dekat dng 0 atau 1 , mk dist.harga proporsi ( ) akan
mendekati dist. normal dan mempuyai rata-2 = proporsi
populasinya, yaitu;
R4
R6
Nilai maksimum diperoleh apabila
R7
Interval 1 - α
R8
CONTOH 5.
Sampel random sebanyak 150 mahasiswa sangat rajin dan 200 mahasiswa rajin
diperkirakan menghabiskan waktu belajar masing-2 1.400 jam dan 1200 jam
pertahun , dengan simpangan baku 120 jam dan 80 jam. Dengan interval
konfidensi 95% berapakah perbedaan waktu belajar yang digunakan antara
kelompok mahasiswa sangat rajin dan kelompok mahasiswa rajin?
Jawab.
Interval keyakinan= 95% atau alpha 5% ; n1= 150 n2=200 ; S1 = 120; S2 = 80; X1 =
1400 dan X2 = 1200
Pertanyaan ( µ1 - µ2 )?
=
2. Point estimasi
Dengan interval
1-α
R9
PENDUGAAN BEDA DUA PROPORSI
• Interval estimasi untuk ( p1- p2 )
R1
0
Contoh 6
Dari sampel random sebanyak 400 pemirsa dewasa
dan 600 pemirsa remaja yang mengikuti program
siaran TV “Take Me Out” , diketahui 100 pemirsa
dewasa dan 300 pemirsa remaja menyatakan
menyukai program TV tersebut. Dengan interval
konfidensi 99%, tentukan perbedaan proporsi
pemirsa yang menyukai program TV tersebut
antara semua pemirsa dewasa dan pemirsa
remaja.
PENDUGAAN PARAMETER DENGAN SAMPEL KECIL
α
µx tα
1.Jika µ dengan tidak diketahui dan
populasi tidak terbatas.
Tidak diketahui dapat dihitung dengan S, maka µx
dengan interval (1- α) dapat ditentukan dengan
cara sbb;
df = n-1
Contoh 8.
Sebuah studi kasus terhadap kinerja /prestasi
kerja karyawan telah dilakukan di Pabrik
Sepatu mengenai karyawan di suatu
perusahan. Sampel random sebanyak 25
karyawan dan nilai rata-rata kinerja karyawan
yaitu 2.850 skor; simpangan baku 120 skor.
Hitunglah dengan interval 95% untuk harga
rata-rata nilai kinerja karyawan perusahaan
tersebut.
2.Jika µ dengan tidak diketahui dan
populasi terbatas.
Faktor koreksi
Contoh 9.
Sebuah lembaga Psikologi melakukan tes untuk mengetahui muatan
leadership dari mahasiswa FISIP sebuah PT. Sampel random telah diambil
sebanyak 14 mahasiswa dari 90 mahasiswa yang dianggap memiliki
karakteristik leadership tinggi. Rata-rata nilai yang diperoleh 75,6 dengan
simpangan baku 2,65. Buatlah interval keyakinan sebesar 95% untuk
menduga rata-rata nilai muatan leadership dari mahasiswa FISIP yang
dimaksud.
3. Interval estimasi µ1-µ2, jika dan
tidak diketahui
Jika dan jika tidak
diketahui, maka µ1-µ2 dapat dihitung dengan
interval 1 - α sbb;
4.Apabila ≠ serta maupun tidak diketahui
Kontrol diri
Motivasi berprestasi
Persepsi
Pola Asuh
Efikasi diri, dll
• Impulse buying
• Stress Kerja
• Kebahagiaan
• Komitmen
• Kinerja , dll
Perbedaan ?
Analisis korelasi berkaitan erat dengan regresi, tetapi secara konsep berbeda dengan
analisis regresi. Analisis korelasi adalah mengukur suatu tingkat atau kekuatan
hubungan linear antara dua variabel
Cara Menggambarkan
Nilai r
Lemah
- -0,5 0 +0,5 +1
1
Kuat Kuat
Bentuk hubungan antar variabel
Y = a + bx Y = a - bx Y=a
(a) korelasi positif= r = + (b) korelasi negative=r= - (c) Tidak ada korelasi=r=0
Nilai Koefisien Determinasi (R) sangat berkaitan erat dengan nilai Koefisien
Korelasi (r).
Untuk melihat seberapa besar tingkat pengaruh variabel bebas (X) terhadap
variabel tidak bebas (Y) pada saat melakukan analisis regresi.
Koefisien determinasi merupakan sebagai ukuran untuk mengetahui
kemampuan dari masing-masing variabel yang digunakan
Koefisien determinasi menjelaskan proporsi variasi dalam variabel dependen
(Y) yang dijelaskan oleh hanya satu variabel independen
KRITERIA ANALISIS KOEFISIEN DETERMINASI (Kd)
Keterangan :
r = koefisien korelasi
X = variabel bebas
Y = variabel tidak bebas
n = jumlah sampel N = jumlah populasi
Contoh 1
Diketahui data skor hasil kepada 5 orang karyawan suatu perusahaan tentang
control diri dan stress kerja pada table dibawah ini( data sifatnya simulative untuk
mempermudah). Ujilah hipotesis yang menyatakan adanya hubungan antara
control diri dan stress kerja dengan signifikansi 1%.
1 2 5
2 4 6
3 5 8
4 7 10
5 8 11
Pemecahan Contoh 1
Data Xi Yi XiYi
(X i )2 (Y i )2
1 2 5 10 4 25
2 4 6 24 16 36
3 5 8 40 25 64
4 7 10 70 49 100
5 8 11 88 64 121
Note;
Perhitungan semacam ini dalam praktiknya kita menggunakan soft ware.
Menghitung nilai korelasi (r) dengan rumus sebagai berikut;
Y = 2,53 + 1,053 X
Y
2,530
X
Contoh 7.
Sebuah studi kasus terhadap kinerja /prestasi kerja karyawan telah dilakukan di
Pabrik Sepatu mengenai karyawan di suatu perusahan. Sampel random
sebanyak 25 karyawan dan nilai rata-rata kinerja karyawan yaitu 2.850 skor;
simpangan baku 120 skor. Hitunglah dengan interval 95% untuk harga rata-
rata nilai kinerja karyawan perusahaan tersebut.
Jawaban
df = n-1
n= 25; s = 120;
df = n-1 = 25-1=24;
Contoh 8.
Sebuah lembaga Psikologi melakukan tes untuk mengetahui muatan leadership
dari mahasiswa FISIP sebuah PT. Sampel random telah diambil sebanyak 14
mahasiswa dari 90 mahasiswa yang dianggap memiliki karakteristik leadership
tinggi. Rata-rata nilai yang diperoleh 75,6 dengan simpangan baku 2,65. Buatlah
interval keyakinan sebesar 95% untuk menduga rata-rata nilai muatan
leadership dari mahasiswa FISIP yang dimaksud.
Jawaban.
df = 14-1 =
13;
Analisis Of Varian
(Anova)
1
Kegunaan
Nilai µ1=µ2=µ3
Atau salah satu
tidak sama
Mhsw F. 22,25,24,25
Ekonomi -rata-rata, SD, varian
Hipotesis
(µ2)
(s2)2
Anova satu arah
Mhsw F.
Teknik Inf
(µ3) 25,29,28,30
-rata-rata, SD, varian
(s3)2
Parameter : kedisiplinan
diukur dengan skor 1-303
Tabel Data Anova Satu ARah
Sampel T
o
t
a
l
1 2 … i … k
: : : : : :
n1 n2 n3 nk
4
Tabel Anova Satu Arah
(jumlah sampel sama)
Sumber Derajat
Jumlah Kuadrat Rata
Variasi bebas Statistik F
kuadrat (SS) -rata (MS)
(SV) (df)
Perlakuan KRP =
k–1 JKP
(BG) JKP/(k – 1 ) F=
Galat KRG = KRP/KRG
k(n-1) JKG
(WG) JKG/(k(n-1))
Total nk – 1 JKT
Keterangan;
k= jumlah kategori populasi ; n= jumlah anggota sampel
6
Distribusi F
H0 ditolak
Ho diterima α= 0,05
Titik Kritis
F{a; k – 1; k(n – 1)}
J.K
8
Tabel Anova Satu Arah
(Jumlah sampel berbeda)
Dera-
Sumber Jumlah Kuadrat Rata-
jat Statistik F
Variasi kuadrat rata
bebas
Perlakuan
KRP =
(between k–1 JKP
JKP/(k – 1 )
group)
F = KRP/KRG
Galat (within KRG =
N–k JKG
group) JKG/(N - k)
11
PENYELESAIAN
1. Merumuskan Hipotesis
§ H0: 1 = 2 = 3
§ H1: Ada rata-rata yang tidak sama
2. Menentukan LOS
a = 0.05;
df1= derajat bebas perlakuan =k-1= 2
df2 = derajat bebas galat = n-k = 12-3= 9
F{a; k – 1; (n – k)} .....F(0.05;2;9) = 4,26
3. Kriteria Pengujian
Ho diterima , jika Fhitung ≤ 4,26
Ho ditolak, jika Fhitung > 4,26
12
4. Perhitungan
Sampel Skor kedisiplinan berdasarkan fakultas
1 2 3
13
14
5.Kesimpulan
Dari hasil perhitungsan diperoleh Fhitung = 7,41 > Ftabel= 4,26, maka Ho
ditolak. Artinya 1 = 2 = 3 tidak benar atau dengan kata lain ada yang tidak
sama diantara nilai rata-rata tersebut.
15
Contoh 2, untuk n berbeda
n 4 3 2 9
[(Ti)2 ] : n 2116 1728 1458 5302
16
Sumber Derajat Jumlah Kuadrat Rata-
Statistik F
Variasi bebas kuadrat rata
Total 9 – 1=8 7
17
5.Kesimpulan
Dari hasil perhitungsan diperoleh Fhitung = -17,19 < Ftabel= 4,26, maka Ho
diterima . Artinya 1 = 2 = 3 adalah benar atau dengan kata lain tidak ada
perbedaan diantara nilai rata-rata tersebut.
18
ANOVA DUA ARAH
19
Tabel data Anova dua arah
Perlakuan V1
Perlakuan
V2
C1 C2 Ck Total
R1 Tr1
R2
Tr2
R3 Tr3
20
Tabel Anova Untuk Dua Arah
Sumber Derajat
bebas Jumlah Jumlah Kuadrat Rata
Variasi Fhitung
kuadrat (SS) -rata (MS)
(SV) (df)
1 2 3 4
F
Kolom C C-1 JKC JKCr=JKC/C-1 =JKRc/KRE
F =JKIr/KRE
Interaksi 1 (R-1) (C-1) JKI JKIr= JKI/(J-1)(K-1)
KRE =
Error E RC(n-1) JKE -
JKG/(k(n-1))
Total N-1 JKT - -
21
RUMUS
ANOVA
DUA
ARAH
JKG = JKT-SSR-SSC-SSI
22
Contoh kasus Anova Dua Arah
Seorang mahasiswa di sebuah universitas data; V1= EQ; V2 =
MUATAN LEADERSHIP (uraikan)
Perlakuan V1
Perlakua C1 C2 C3
n V2
R1 10 14 18
13 16 22
R2 13 19 14
16 27 18
R3 9 11 14
14 17 17
23
Langkah Pengujian Hipotesis
Merumuskan Hipotesis
H0: α1=α2 =α2 =0
ß1 = ß2 = ß3=0
(αß)11=(αß)22 = ..........(αß)32 = 0
H1: Paling sedikit satu α tidak sama dengan nol
Paling sedikit satu ß tidak sama dengan nol
Paling sedikit satu (αß) tidak sama dengan nol
LOS
Gunakan F tabel ; α = 5%
§ F(α; R-1; RC) , hasil 4,26
§ F(α; C-1; RC) , hasil 4,26
§ F{α;( R-1)(C-1); J.K} , hasil 3,63
24
3. Kriteria
H0: α1=α2 =α2 =0 diterima, jika Fhit ≤4,26
ß1 = ß2 = ß3=0 diterima, jika Fhit ≤4,26
(αß)11=(αß)22 = ..........(αß)32 = 0 diterima, jika Fhit ≤3,63
4. Perhitungan
25
Contoh data; V1= EQ; V2 = MUATAN LEADERSHIP (uraikan)
V1
V2
C1 C2 C3 Tr
R1 10 14 18
13 16 22 93
R2 13 19 14
16 27 18 107
R3 9 11 14 82
14 17 17
26
Jumlah Kuadrat Total (SST)
27
Jumlah Kuadrat Kolom (SSC)
28
Tabel Anova Untuk Dua Arah
Sumber Derajat Jumlah
Variasi bebas kuadrat Jumlah Kuadrat Rata-
Fhitung
rata
(SV) (df) (SS)
1 2 3 4
26,17/10,44
Baris R 3-1=2 52,33 (52,33)/2=26,17
=2,51
45,17/10,44
Kolom C 3-1=2 90,33 (90.33)/2=45,17 =4,34
20,34/10,44
(3-1)(3-1)
Interaksi 1 81,4 (81,4)/4=20,34 =1,95
=4
30
PENGUJIAN HIPOTESIS
Setelah selesai mengikuti
materi pnegujian hipotesis
mahasiswa diharapkan
mampu merumuskan dan
menguji hipotesis .
1. PENGERTIAN
Ø Hypho = kurang /tidak sempurna
Ø Thesis = pendapat
Ø Hyphothesis adalah pendapat sementara berdasarkan asusmsi
yang hrs dibuktikan kebenarannya. Secara umum diartikan
sebagai pernyataan mengenai sesuatu yang harus diuji
kebenarannya.
Ø Pembuktian bisa menghasilkan kesimpulan bahwa pendapat
tersebut benar, artinya hipotesis diterima dan sebaliknya jika
kesimpulan menyatakan bahwa pendapat tsb salah, artinya
hipotesis ditolak.
Ø Proses pembuktian menggunakan langkah-langkah atau cara
untuk memperoleh hipotesis diterima/ ditolak disebut pengujian
hipotesis.
Ø Pengujian hipotesis dilakukan berdasarkan sejumlah sampel.
Dalam menaksir paramater populasi berdasarkan data sampel, kemungkinan akan
terdapat dua kesalahan, yaitu :
Tipe Kesalahan I (α = alpha) adalah kesalahan yang dibuat oleh peneliti karena
menolak hipotesis nol (H0), padahal hipotesis nol itu benar.
Tipe Kesalahan II (ß = beta) adalah kesalahan yang dibuat oleh peneliti karena
menolak hipotesis alternatif (Ha), padahal hipotesis alternatif itu benar atau dengan
kata lain adalah kesalahan karena gagal menolak H0, padahal hipotesis nol itu salah.
Hubungan antara keputusan menolak atau menerima Ho dapat diperhatikan Tebel
berikut:
Terima Ho Tolak Ho
0,5 α 0,5 α
X
0 Angka titik kritis
dibaca dari
Tabel Z; t ;F ,
Titik kritis Titik kritis dll, tergantung
metode yang
digunakan
1. Uji dua sisi
HO: HP = HST
H1: HP ≠ HST
2. Uji satu sisi kanan Setiap model uji
HO: HP = HST hiptesis memilki
H1: HP > HST gambar yang
3. Uji satu sisi kiri berbeda
HO: HP = HST
H1 : HP < HST
1. Uji dua sisi
HO: HP = HST
H1: HP ≠ HST
Ho ditolak Ho ditolak
Ho
0,5 α diterima 0,5 α
0
2. Uji satu sisi kanan
HO: HP = HST
H1: HP > HST
Ho Ho ditolak
diterima α
0
3. Uji satu sisi kiri
HO: HP = HST
H1 : HP < HST
Ho ditolak Ho diterima
α
0
1. Merumuskan Hipotesis
2. Menentukan level of
significansi (LOS)
3. Menentukan Kriteria
Pengujian
4. Menghitung Nilai Z atau t
atau F atau lainnya
sesuai teknik pengujian
yang digunakan
5. Membuat kesimpulan
§ BEDA HARGA RATA-RATA
§ BEDA HARGA DUA RATA
§ BEDA HARGA PROPORSI
§ BEDA DUA HARGA
PROPORSI
PERHATIKAN KEMBALI
RUMUS Z dan t
1. BEDA HARGA RATA-RATA
atau
α
0
Titik kritis= -2,33
2. Prof. Henry menyatakan bahwa 75% dari para mahasiswa lebih menyukai
belajar secara tatap muka, karena pertimbangan tertentu. Untk menguji
pernyataan tersebut kemudian diambil sampel random sebanyak 320
mahasiswa dan ternyata terdapat 267 mahasiswa yang menyatakan menykai
belajar secara tatap muka. Dengan probabilitas 95% ujilah hipotesis nihil p =
0,75 dengan hipotesis alternatif > 0,75.
Analisis soal ?
………………………………………………………………………………….
………………………………………………………………………………………
Analisis Soal ?
……………………………………………………………………………………
…………………………………………….
Prosedur pengujian hipotesis:
1. Merumuskan Hipotesis (Kasus ini adalah kasus Beda Dua Harga Rata-rata)
Misalkan Kota Alam Raya (A) dan Kota Awan Merah (B)
H0: µA= µB atau µA- µB = 0
H1: µA≠ µB atau µA- µB ≠ 0
Note: Rumusan H1 menunjukan UJI DUA SISI
(6-17)
DISTRIBUSI KHAI KWADRAT
(Pertemuan Minggu ke 6)
1
TEST GOODNESS OF FIT
( Tes Kesesuaian)
2
KEGUNAAN
3
Tabel kerja
Sampel Sampel 2 Sampel jumlah
1 .....k
Hasil Obs. n1 n2 nk A
Frekuensi A
Harapan (e1) (e2) (ek)
4
Tabel kerja
5
n =jumlah seluruh observasi ;
e = frekuensi yang diharapkan dan harus dihitung
n11 = hasil observasi pada baris satu dan kolom satu,
dst
e11 = frekuensi pada baris satu dan kolom satu , dst
Cara menghitung nila e
e11 = X/D x A.............e21= Y/D x A .............e12=X/DxB
dst
6
Bagaimana
Menguji Hipotesis ?
Kriteria Pengujian
Kriteria pengujian ditetapkan dng cara
membandingkan harga2 yg sebenarnya yg
diperoleh dari sampel yg diambil ( nij=
frekuaensi pengamatan) dng harga2 yg
diharapkan (eij = frekuensi yg diharapkan).
Apabila kedua frekuensi serupa atau
bedanya kecil, maka hipotesis null (H0) bisa
diterima dan sebaliknya.
7
Chi-square distribution
Tolak Ho
Terima Ho
α
tab
2
Titik kritis
(nij − eij )
j k 2
=
2
RUMUS
i =1 j =1 eij
8
Contoh 1.
Seorang mahasiswa ingin meneliti kepuasan pernikahan
pasangan suami istri yang telah menikah kurang lebih 10
tahun . Apakah terdapat perbedaan yang berarti
(significant) proporsi ketidakpuasan diantara ketiga
sampel yang terdapat pada data tabel dibawah ini ?
Gunakan probabilitas 95% untuk menguji pendapat
tersebut.
9
Pemecahan 1
1. Merumuskan hipotesis
Ho : P1=P2=P3 (=P)
H1 : P1≠ P2 ≠P3 ≠ (≠P)
Arti Ho adalah proporsi pasangan tidak puas dari
ketiga sampel sama.
2. Menentukan lOS
α= 0,05 dan tab
2
( :k −1)
k-1=3-1=2 ( 0, 05:2) =5,991
(lihat tabel)
2. Menentukan kriteria pengujian
H0 diterima, jika 2hit≤ 5,991
Ho ditolak, jika 2hit > 5,991
10
4. Perhitungan
e11 = 33/300 x 100 = 11 e21 = 267/300 x 100 = 89
e12 = 33/300 x 120 = 13,2 e22 = 267/300 x 120 = 106,8
e13 = 33/300 x 80 = 8,8 e23 = 267/300 x 80 = 71,2
TABEL KERJA CONTOH 1.
(nij − eij )
j k 2
=
2
i =1 j =1 eij
(12 − 11) 2
(15 − 13, 2) 2
( 74 − 71, 2) 2
2 = + +→ = 1,379
11 13,2 71,2
5. Kesimpulan
Nilai χ2hit (1,379) < χ2tab (5,991), maka H0 diterima. Artinya
perbedaan proporsi pasangan suami istri yang tidak puas dari
ketiga sampel tersebut tidak memiliki alasan yang kuat. Atau
tidak terdapat perbedaan proporsi pasangan suami istri yang
mengeluh dari ketiga sampel pada tingkat kepercayaan 95%.
12
PENGUJIAN INDEPENDENSI
( TEST OF INDEPEDENCY)
13
PENGUJIAN INDEPENDENSI
( TEST OF INDEPEDENCY)
14
Tabel kontingensi
(bedakan dengan Tabel kerja Contoh 1)
Var. 1 Var.2
A1 A2 A3 ....... Ak Jmlh
B2
B3
......
Br nr1 nrk nr
Jmlh n.1 n.2 n.3 n.k n
15
Prosedur test of independency
1. Perumusan Hipotesis
H0: P11=P12=...=P1k
P21=P22=...=P2k
Pr1=Pr2 =...=Prk
H1: Tdk semua proporsi sama
2. Menentukan L.o.s
3. Kriteria Pengujian
4. Perhitungan Chi-square
5. Kesimpulan
16
Contoh 2.
sedang 19 42 17 78
Rendah 12 17 10 39
Jmlh 45 96 59 200
18
Pemecahan contoh 2 (independency)
1. Merumuskan hipotesis
H0: P11=P12=P13 Artinya komitmen pernikahan indpendence
P21=P22=P23 dengan kepuasan pernikahan atau kepuasan
pernikahan tidak tergantung dari komitmen
P31=P32=P33 pernikahan.
H1: salah satu dari proporsi tersebut tidak sama
2. Menentukan lOS
α= 0,05 dan χ2tab = χ2α;(r-1) (k-1)
χ2 0,05;(3-1) (3-1) .......χ2 (0,05;4) =9,488 (lihat tabel)
19
4. Perhitungan
Biaya Volume penjualan
promosi Rendah Sedang tinggi Jmlh
Tinggi 14 37 32 83
(18,7) (39,8) (24,5)
Sedang 19 42 17 78
(17,6) (37,4) (23,0)
Rendah 12 17 10 39
(8,7) (18,8) (11,5)
Jmlh 45 96 59 200
21
Koefisien Kontingensi (C)
2
C=
N+ 2
Lihat contoh:
2
7,43 55,2049
= 7,43 , maka
2
C= = = 0,47
200 + 7,43 2
200 + 55,2049
Besarnya angka koefisien menunjukan kekuatan independensi
Komitmen Pernikahan dan Kepuasan Pernikahan.
22
Tabel
2
1 1
2 5,991 2
3 3
4 9.488 4
5 5
6 6
7 7
..... .....
n n
23
24
Materi Pembelajaran - Minggu ke 8.
Bagian 2. Uji Independsi (Independecy
Test )
Learning Out Come (LO)
(Capaian Pembelajaran)
Mahasiswa setelah mempelajari Materi
Pembeajaran diharapkan :
• Pengetahuan
Mampu mengklasifikasi dan membedakan
fungsi dan kegunaan Uji Indepensi.
• Ketrampilan
Mampu memilih , menentukan , dan
menerapkan Uji Independensi untuk berbagai
kasus yang berbeda dalam proses uji hipotesis.
Pengertian
Uji independensi Kai Kuadrat adalah alat uji statistik yang digunakan untuk
mengetahui apakah dua variabel memiliki hubungan secara signifikan. Kedua
variabel yang diuji merupakan variabel kategorik dan disusun dalam bentuk
tabel kontingensi.
Uji kebebasan ini digunakan untuk memeriksa kebebasan atau independensi
dari dua variabel (frekuensi observasi dan frekuensi harapan) sehingga kita
dapat menyimpulkan apakah kedua peubah tersebut saling bebas (tidak
berpengaruh) ataukah keduanya saling bertalian (berpengaruh).
Uji independensi merupakan uji dua arah antara dua variabel, yaituvariabel
kesatu dalam kolom dan variabel kedua dalam baris
Tujuan
Tujuan utama penerapan uji ini adalah untuk mengukur atau mengetahui
linieritas hubungan dua variabel atau lebih dengan skala ordinal atau nominal.
Sehingga kita dapat mengetahui ada tidaknya hubungan diantara dua atau lebih
variabel kualitatif yang dijadikan obyek penelitian. Tentunya dengan hasil uji
tersebut dapat dijadikan landasan untuk dasar pengambilan keputusan.
Mengingat untuk data kualitatif yang menggunakan pengukuran dengan
pendekatan skala nominal atau ordinal belum tentu dapat diyakini ukuran
tersebut mewakili nilai sebenarnya.
Penyajian data
Data yang telah dikumpulkan dari lapangan disajikan dalam bentuk Tabel
dengan ukuran tertentu tergantung rencana analisis terhadap variabel:
Setiap variabel dapat dibuat menjadi 2 kategori atau lebih sesuai dengan
tujuan analisisa yang telah ditentukan.
Data untuk menguji kebebasan dua variabel tersebut disajikan dalam bentuk
Tabel Kontingensi atau Tabel Berkemungkinan yang umumnya berukuran r
baris x k kolom
Contoh Bentuk Tabel Kontingensi
Variabel 1 Variabel 2
A1 A2 A3 ....... Ak Jumlah
B2
B3
......
Br nr1 nrk nr
Jumlah n.1 n.2 n.3 n.k n
Tolak Ho
Terima Ho
α
Titik
kritis
RUMUS
Koefisien Kontingensi
Suatu lembaga riset dibidang psikologi tertarik untuk meneliti apakah ada hubungan
antara kontrol diri dan impulsive buying pada kalangan mahasiswi . Untuk itu telah
diambil 200 sampel mahasiswa di suatu universitas. Berdasarkan data hasil riset pada Tabel
dibawah ini, Ujilah hipotesis yang menyatakan bahwa tidak ada hubungan antara kontrol
diri dan impulsive buying pada taraf alpha 5%.
Tabel 1. Sebaran jumlah mahsiswa berdasarkan impulsive buying dan control diri
mahasiswi.
Kontrol diri Impulsive buying
Tinggi 14 37 32 83
Sedang 19 42 17 78
Rendah 12 17 10 39
Jumlah 45 96 59 200
Langkah pemecahan contoh 1 (Independency Test)
Tinggi 14 37 32 83
(18,7) (39,8) (24,5)
Sedang 19 42 17 78
(17,6) (37,4) (23,0)
Rendah 12 17 10 39
(8,7) (18,8) (11,5)
*) angka dalam kurung adalah nilai frekuensi yang diharapkan (e) dihitung lebih
dahulu, perhatikan Contoh perhitungan)
E11 = 83/200 x 45 =18,7 . E12 = 83/200 x 96 = 39,8. E13 = 83/200 x 59 =
24,5
Hasil perhitungan e11 sd. e33 masukan kedalam tabel dan diberi tanda
kurung.
Menghitung Koefisiens Kontingensi
Kita ingin mengetahui apakah ada hubungan antara motivasi berprestasi dan
perilaku kehadiran mengikuti perkuliahan daring di lingkungan mahasiswa. Untuk
tujuan ini dianalisis 100 mahasiswa yang diambil secara acak, Perilaku kehadiran
dan motivasi berprestasi dikelompokan menjadi tiga (3) kategori yaitu tinggi,
sedang, dan rendah pada Tabel 2 berikut ini. Gunakan level signifikansi 5% untuk
menguji hipotesis tersebut.
Tinggi 14 6 9 29
Sedang 10 16 10 36
Rendah 2 13 20 35
Jumlah 26 35 39 100
Pemecahan 2
Baik 14 6 9 29
(7,54) (10,15) (11,31)
Cukup 10 16 10 36
(9,36) (12,60) (14,04)
Jelek 2 13 20 35
(9,10) (12,25) (13,65)
Jumlah 26 35 39 100
Dengan cara yang sama dapat dihitung E12 ;E13 ; E22 ; E23; E32 ;dan E33
Hasil perhitungan e11 sd. e33 masukan kedalam tabel dan diberi tanda
kurung.
TOPIK 5. M-11.
ANALISIS KORELASI DAN REGRESI.
Bag.2.
Tgl. 26 JUNI 2021.
Learning Out Come (LO)
(Capaian Pembelajaran)
Mahasiswa setelah mempelajari Materi Pembeajaran diharapkan :
Pengetahuan
Mampu menjelaskan fungsi dan kegunaan alnalisis Korelasi dan Regresi
Sederhana dan Berganda dalam analisis statistic inferensial.
Ketrampilan
Mampu mengaplikasikan Analisis Korelasi dan Regresi Sederhana
berdasarkan data tersedia dalam melakukan uji hipotesis pada Analisis
Statistik Parametrik.
Pengertian Analisis Regresi
Regresi merupakan salah satu teknik analisis dalam statistik yang digunakan
untuk mencari pengaruh antara dua variabel atau lebih yang bersifat
kuantitatif. Pengaruh sebuah variabel terhadap variabel lainnya dapat terjadi
karena adanya hubungan sebab akibat atau dapat pula terjadi karena
kebetulan semata.
Sebuah variabel atau lebih dikatakan berpengaruh terhadap suatu variabel
apabila perubahan pada variabel yang satu akan diikuti perubahan pada
variabel yang lain secara teratur dengan arah yang sama (positif) atau
berlawanan (negatif).
Variabel yang mempengaruhi variabel lainnya dalam analisis regresi dapat
dibedakan menjadi variabel bebas (independent) dan variabel terikat
(dependent). Variabel bebas adalah variabel yang perubahannya cenderung di
luar kendali manusia. Sementara itu variabel terikat adalah variabel yang
dapat berubah sebagai akibat dari perubahan variabel bebas (independent).
Persyaratan Analisis Rgeresi Linier
Sederhana
Hubungan antara Variabel Y dan X bersifat linier.
Data terdistribusi secara normal
Data terdistribusi secara homogen.
Data yang digunakan memiliki Skala Ratio atau Interval.
Dalam melaksanakan analisis regresi terlebih dahulu
dilakukan Uji persyaratan No. 1, 2, dan 3 . Uji persyaratan
akan dibicarakan pada bagian tersendiri
Ruang Lingkup Pembahasan
2 4 6 24 16 36
3 5 8 40 25 64
4 7 10 70 49 100
5 8 11 88 64 121
Note;
Perhitungan semacam ini dalam praktik keseharian kita menggunakan soft ware.
Standar Error of Estimate ( Se)
Bagaimana Uji Hipotesis Analisis
Korelasi dan Regresi ?
Prosedur Uji Hipotesis pada dasarya sama dengan prosedur uji hipotesis pada
kasus Distribusi Sampling yang pernah dipelajari sebelumnya. Prosedur uji
hipotesis sebagai bebrikut :
• Merumuskan Hipotesis
• Menentukan level of significansi (LOS)
• Menentukan Kriteria Pengujian
• Menghitung Nilai Z atau t atau F atau lainnya
sesuai teknik pengujian yang digunakan
• Membuat kesimpulan
A. Menguji Kasus Korelasi (r)
(perhatikan Contoh 1 sebelumnya dan hasil perhitungannya)
2 4 6
3 5 8
4 7 10
5 8 11
Berdasarkan data table tersebut dan hasil perhitungan nilai r = 0,33, ujilah hipotesis
yang menyatakan bahwa terdapat hubungan antara jarak tempat tinggal ke tiang
provaider terdekat dengan banyaknya keluhan pada level signifikansi 5%.
Langkah pengujian hipotesis :
Merumuskan Hipotesis
H0 : Tidak terdapat hubungan antara jarak tempat tinggal ke tiang provaider
terdekat dengan banyaknya keluhan atau H0 : r = 0
H1 : Terdapat hubungan antara jarak tempat tinggal ke tiang provaider
terdekat dengan banyaknya keluhan atau H1 : r ≠ 0
Menentukan level of significansi (LOS)
Ø Level signifikansi 5% berarti alpha = α = 5% ; H1 : r ≠ 0 , berarti uji 2 arah
maka α = 5% dibagi 2 menjadi alpha 2,5%.
Ø Untuk menguji nilai r = 0,33 menggunakan distribusi t atau titik kritis
ditentukan berdasarkan Nilai ttable ( baca Tabel Distribusi Nilai t, dengan
df atau db = n-jumlah konstanta= 5-2= 3; dan α = 2,5% = 0,025)
Jumlah konstanta yaitu nilai a dan nilai koefisien regresi (b), dalam hal ini
ada 2 jenis nilai sehingga diperoleh angka 2
Ø Baca table untuk Nilai t0,025: 3 = 4,303. (silahkan browsing Tabel t)
Contoh salah satu tampilan Hasil Uji Hipotesis kasus korelasi menggunakan
aplikasi
Service yang diberikan
K
e
p
Cara menginterpretasikan: u
a
Ø 0,502 adalah nilai r positif yg dihitung dengan Rumus Koefisien Korelasi Pearson.
s
Karena r positif berarti jika service yang diberikan semakin meningkat maka a
n
kepuasan pelangga semakin meningkat pula.
Ø ** tanda ini menunjukan bahwa signifikansi level 1% dan bermaknap korelasi atau
hubungan antara service yang diberikan dan kepuasan pelanggan sangat e signifikan.
l
( NOTE Jika * disebut signifikan). a
Ø Sig. (1-tailed); bermakna diuji satu arah dan 0,00 bermakna lebih kecil n dari
g
signifikansi 1% ( p <0,01), maka hipotesis (Ho) diterima . g
Ø N = 75, bermakna jumlah sampel atau data yang diolah sebanyak 75 orang pelanggan.
a
n
B. Menguji Kasus Regresi
(perhatikan Contoh 1 sebelumnya dan hasil perhitungannya)
Pers. Regresi Y = 2,53 + 1,05 X.
Uji hipotesis dengan level signifikansi 5%
Merumuskan Hipotesis
H0 : Tidak terdapat pengaruh jarak tempat tinggal ke tiang provaider
terdekat dengan banyaknya keluhan atau H0 = b = 0
H1 : Terdapat hubungan antara jarak tempat tinggal ke tiang provaider
terdekat dengan banyaknya keluhan atau H1 : b ≠ 0
Menentukan level of significansi (LOS)
Ø Level signifikansi 5% berarti alpha = α = 5% ; H1 : b ≠ 0, berarti uji 2 arah
maka α = 5% dibagi 2 menjadi alpha 2,5%.
Ø Untuk menguji nilai b = 1,05 menggunakan distribusi t atau titik kritis
ditentukan berdasarkan Nilai ttable ( baca Tabel Distribusi Nilai t, dengan
df atau db = n-jumlah variabel = 5-2= 3; dan α = 2,5% = 0,025)
Ø Baca table untuk Nilai t0,025: 3 = 4,303
Salah satu contoh tampilan analisis regresi menggunakan
aplikasi:
Coefficientsa
Model Unstandardized Stand S
t
Coefficients ardize i
d g
Coeffi .
cients
B Std. Error Beta P < 0,01, bermakana konstanta dan
koefisien regresi
1 30.21 5.33
(Constant) 5.658 .000 Sangat signifikan.
0 9
thitung
Konstanta = a
Koefisien regersi = b
Johan Harlan
Metode Statistika 2
Penulis : Johan Harlan
ISBN 979-1223-00-9
Johan Harlan
Agustus 2018
v
DAFTAR ISI
Kata Pengantar v
vii
Bab 3 Inferensi Statistik untuk Dua Populasi 73
3.1 Inferensi Statistik untuk Rerata Dua Populasi 73
Normal atau Sebarang – Sampel Besar
3.2 Inferensi Statistik untuk Rerata Dua Populasi 80
Normal – Sampel Kecil
3.3 Inferensi Statistik untuk Data Berpasangan 85
3.4 Inferensi Statistik untuk Proporsi Dua Populasi 89
Lampiran 3A Ikhtisar Uji Hipotesis untuk Rerata Dua 96
Populasi
Lampiran 3B Rangkuman Uji Z dan Uji t 99
Lampiran 3C Inferensi Statistik Data Proporsi 100
Lampiran 3D Randomisasi Lengkap dan Randomisasi 102
Blok
Latihan 3 107
viii
Bab 5 Analisis Regresi Linear II 151
5.1 Analisis Regresi Linear Ganda 151
5.2 Variabel Indikator 160
5.3 Koefisien Korelasi Ganda dan Koefisien Korelasi 162
Parsial
Lampiran 5A Model Regresi Logistik 167
Latihan 5 170
ix
Lampiran 7A Ukuran Asosiasi pada Tabel Kontijensi 235
Lampiran 7B Ukuran Sampel Minimum untuk Uji 239
Kesamaan Beberapa Proporsi
Latihan 7 242
Kepustakaan 311
x
Addenda 313
Addendum A Distribusi Z 313
Addendum B Nilai Kritis Distribusi t 314
Addendum C Nilai Kritis Distribusi F 315
Addendum D Nilai Kritis Distribusi χ 2 318
Addendum E Kuantil Statistik Penguji Rank Bertanda Wilcoxon 319
Addendum F Kuantil Statistik Penguji Jumlah Rank Wilcoxon 320
Addendum G Nilai Kritis Koefisien Korelasi Spearman 324
xi
BAB 1
DASAR-DASAR INFERENSI STATISTIK
Inferensi statistik adalah proses pengambilan kesimpulan mengenai
suatu populasi berdasarkan data sampel yang berasal dari populasi tersebut.
Inferensi statistik terdiri atas dua bagian utama, yaitu estimasi parameter dan
uji hipotesis. Dalam bab ini akan dibahas mengenai dasar-dasar kedua bagian
tersebut secara umum.
Estimasi titik
µ̂ = y (1.1)
σˆ 2 = s 2 (1.2)
P̂ = p (1.3)
1
a. Tak bias
()
E θˆ = θ (1.4)
b. Efisien
c. Konsisten
( )
lim P θˆ − θ < ε = 1
n→∞
(1.5)
n : ukuran sampel
d. Cukup (sufisien).
σˆ = s (1.2.a)
2
Pada Metode Statistik II yang pembahasannya terutama menyangkut
Statistik Inferensi, dikenal variabel independen X dan variabel dependen Y.
Pembahasan sifat-sifat statistik selanjutnya terutama akan berkaitan dengan
variabel dependen Y.
Estimasi Interval
Karena itu, estimasi yang lebih baik untuk disajikan pada inferensi
statistik adalah estimasi interval, yaitu pernyataan estimasi dalam suatu
rentang interval dengan disertai pernyataan tingkat keyakinan akan
kebenaran pernyataan tersebut.
Contoh 1.1 :
Misalkan sebagai hasil suatu penelitian disajikan pernyataan bahwa
interval konfidensi 95% (95% confidence interval; 95% CI) usia mahasiswa
Gunadarma adalah [20.3 ; 23.8].
3
penyampelan berulang dengan ukuran sampel n yang sama dan rumus
interval konfidensi yang sama, sehingga diperoleh interval konfidensi CI 2 ,
CI 3 , dan seterusnya. Setelah semua kemungkinan sampel terambil, maka
nilai µ sebenarnya akan tercakup dalam 95% di antara interval-interval
konfidensi tersebut (diagram 1.1). Angka 95% disebut sebagai ‘tingkat
keyakinan’ (confidence = keyakinan) pengestimasian tersebut.
Y −µ Y −µ
Untuk data kontinu, transformasi , yaitu ataupun
SE (Y ) σ/ n
Y −µ
estimatornya dapat berdistribusi Z atau t ( lihat kembali Lampiran
s/ n
6a, buku teks Metode Statistika I).
4
Y −µ
Misalkan transformasi berdistribusi Z , maka :
SE (Y )
P [ − Z a /2 < Z < Z a /2 ] = 1 − a
Y −µ
P −Za/2 < < Za/2 = 1 − a
SE (Y )
diperoleh :
Y −µ
> −Za/ 2
SE (Y )
Y − µ > − Z a / 2 .SE (Y )
µ < Y + Z a / 2 .SE (Y )
dan:
Y −µ
< Za/2
SE (Y )
Y − µ < Z a /2 .SE (Y )
µ > Y − Z a / 2 .SE (Y )
Y ± Z a / 2 .SE (Y ) (1.6.a)
5
atau: [Y − Z a/2. SE (Y ) ; [Y − Z a/2. SE (Y ) ]
(1.6.b)
Y −µ
Jika transformasi berdistribusi t maka interval konfidensi
SE (Y )
100 (1 − a ) % untuk µ adalah :
Y ± ta /2 .SE (Y )
(1.7.a)
6
Pada pengestimasian interval, dibutuhkan ukuran sampel minimum
untuk dapat menghasilkan lebar interval yang telah dispesifikasikan terlebih
dahulu sebelum pengumpulan data dilaksanakan. Untuk estimasi interval
nilai rerata populasi, ukuran sampel minimum tergantung pada:
c. Variabilitas populasi / σ
Contoh 1.2:
I = Z a /2 .SE ( y )
σ
yaitu I = Z a /2 .
n
n=
( Za/2 ) σ 2
sehingga: (1.9)
I2
2
(Z )
n = a/2
s2
(1.9.a)
I2
7
1.2 UJI HIPOTESIS
Hipotesis Nol dan Hipotesis Alternatif
a. H1 : θ > θ 0 ;
b. H1 : θ < θ 0 ; atau
c. H1 : θ ≠ θ 0 .
a. H 0 : θ ≤ θ0 ;
b. H 0 : θ ≥ θ ; atau
c. H 0 : θ = θ0 ,
• H 0 : θ = θ 0 versus H1 : θ ≠ θ 0 (1.10.a)
8
Tujuan uji hipotesis adalah untuk menentukan apakah dugaan tentang
karakteristik suatu populasi memperoleh dukungan kuat oleh informasi yang
berasal dari sampel atau tidak. Jika dengan menggunakan prosedur uji
hipotesis, berdasarkan data yang dikumpulkan peneliti berhasil membuktikan
kebenaran hipotesis alternatif yang diajukannya, dikatakan bahwa hipotesis
nol (yang bersesuaian dengan hipotesis alternatif tersebut) ‘ditolak’ .
Contoh 1.3:
Misalkan hendak dibuktikan rerata waktu tunggu konsumen yang
datang ke sebuah kantor pelayanan masyarakat kurang daripada 15 menit.
Rerata waktu tunggu yang lebih lama daripada 15 menit dianggap tidak
memuaskan dan akan mengakibatkan perlunya dilakukan perombakan dalam
tata kerja di kantor pelayanan tersebut. Hipotesis nol dan hipotesis alternatif
yang diajukan di sini adalah :
H 0 : µ ≤ 15 versus H1 : µ > 15
9
dianggap terbukti kebenarannya akan menghasilkan rekomendasi untuk
memperbaiki sistem pelayanan yang selama ini digunakan.
Contoh 1.4 :
- Hendak dibuktikan bahwa rerata IQ populasi mahasiswa DKI Jakarta
lebih tinggi daripada 120 . Hipotesisnya adalah:
-
H 0 : µ ≤ 120
H1 : µ > 120
- Di antara baterai produksi pabrik XYZ, hanya 70% yang memenuhi
kualitas standar. Hendak diuji apakah cara produksi baru dapat
menghasilkan persentase yang lebih tinggi yang memenuhi kualitas
standar.
H 0 : P ≤ 70
H1 : P > 70
10
nol dinyatakan ‘ditolak’, sebaliknya jika nilai statistik tidak berada pada
daerah penolakan, maka hipotesis nol dinyatakan ‘ tidak ditolak’.
Kesalahan dapat pula terjadi dengan tidak menolak hipotesis nol yang
sebenarnya salah. Kesalahan seperti ini dinamakan ‘kesalahan tipe II’ dan
besarnya dinyatakan dengan lambang β (diagram 1.3), yang hanya dapat
dihitung besarnya jika nilai parameter menurut hipotesis alternatif
dinyatakan secara spesifik (tidak sekedar lebih besar atau lebih kecil
daripada, ataupun tidak sama dengan θ 0):
11
β = P [ H 0 tidak ditolak H A benar] (1.12)
Contoh 1.5:
Misalkan pada contoh 1.3 di atas, waktu tunggu berdistribusi normal
dengan nilai rerata menurut hipotesis nol yaitu µ0 = 15 menit dan nilai rerata
waktu tunggu menurut hipotesis alternatif yaitu µ 1 = 20 menit. Misalkan
pula nilai kritis pengambilan keputusan ditetapkan pada c = 18 menit, maka
jika dari data sampel diperoleh nilai statistik y > 18 menit, hipotesis nol
ditolak, sedangkan jika nilai statistik y ≤ 18 menit, hipotesis nol tidak
ditolak.
Diagram 1.4. Titik kritis dan daerah penolakan untuk wakru tunggu
pada contoh 1.5.
Contoh 1.6:
Lihat kembali contoh 1.3 dan 1.5. Pada diagram 1.4 dapat dilihat a ,
yaitu luas daerah penolakan pada kurva H 0 , serta β , yaitu luas daerah pada
kurva H 1. Tampak bahwa:
a = P y > 18 µ = 15]
12
β = P y ≤ 18 µ = 20]
c−µ
Zα =
σ/ n
18 − 15
= = 2.00
7.5 / 25
dan: a = 0.02
c − µ1
Z1− β = − Z β =
σ/ n
18 − 20
= = −1.33
7.5 / 25
dan: β = 0.09
Statistik Penguji
13
menjadi nilai Z ataupun nilai t . Hasil transformasi ini disebut dengan
sebagai ‘statistik penguji’ ( test statistic ), yang diketahui bentuk distribusi
samplingnya dan digunakan sebagai dasar menolak atau tidak menolak
hipotesis nol setelah diperbandingkan dengan transformasi kritis c , yaitu
untuk penarikan kesimpulan uji hipotesis.
y − µ0
Z uji = (1.13.a)
SE ( y )
y − µ0
t uji = (1.13.b)
SEˆ ( y )
Daerah Penolakan
14
Matriks 1.1. Daerah penolakan pada uji hipotesis dengan Z atau t
Daerah penolakan
Hipotesis nol
Hipotesis alternatif
Uji Z Uji t
• Uji satu-sisi: Daerah kritis ada di satu sisi distribusi sampling statistik
penguji ( H1 : θ > θ0 atau H1 : θ < θ0 ).
Kekuatan Uji
Kekuatan uji ( power of the test) suatu uji hipotesis adalah besarnya
probabilitas untuk menolak hipotesis nol dengan syarat hipotesis alternatif
benar, besarnya adalah (1 − β ) :
15
Misalnya, pada contoh 1.5 untuk uji hipotesis terhadap nilai rerata
dengan hipotesis alternatif H A : µ1 = 20 (lihat diagram 1.4), kekuatan uji
adalah:
1 − β = P Y > 18 µ = 20 ]
Matriks 1.2. Probabilitas kesalahan tipe I dan tipe II pada uji hipotesis
H 0 benar H1 benar
H0 1− a β
H0 a 1− β
a : kesalahan tipe I
β : kesalhan tipe II
16
Diagram 1.5. Dasar perhitungan ukuran sampel minimum untuk uji
hipotesis
Contoh 1.7:
Lihat kembali contoh 1.3 dan 1.6. Misalkan pada uji hipotesis satu-
sisi terhadap waktu tunggu di atas dengan hipotesis nol H 0 : µ ≤ µ0 tetap
akan digunakan nilai a = 0.02 dan β = 0.09, sehingga Zα = 2.00 dan Z β =
1.33. Misalkan pula diketahui σ 0 = σ 1 = σ 2 , maka dari distribusi sampling
menurut H 0 untuk titik kritis (batas) c diperoleh:
(
c = µ0 + Z σ / n )
Dari distribusi sampling statistik penguji menurut H1, untuk titik kritis
c diperoleh:
17
(
c = µ1 − Z σ / n , )
Zaσ Z βσ
Sehingga µ0 + = µ1 −
n n
µ1 − µ0 =
( Za + Z β ) σ
n
2 2
dan n=
(Z a + Zβ ) σ 2
=
(Z a + Zβ ) σ2
(1.14)
2
( µ1 − µ0 ) d2
yaitu: n=
( 2.00 + 1.33) 7.52
= 25
52
Nilai p
18
Diagram 1.6. Nilai p satu-sisi dan dua-sisi.
Contoh 1.8:
Lihat data pada contoh 1.3 dan 1.7. Misalkan pada (satu kali)
pengambilan sampel untuk uji hipotesis di atas dengan sampel berukuran
n = 25 diperoleh nilai rerata waktu tunggu y = 19 menit, maka :
y − µ0
Z uji =
σ/ n
19 − 15
= = 2.67
7.5 / 25
p = 0.0038
19
Langkah-langkah Umum pada Uji Hipotesis
7. Hitung nilai statistik penguji dari data sampel. Periksa apakah nilai
ini terletak pada daerah kritis atau tidak.
10. Jika H 0 tidak ditolak dan ukuran sampel yang diperoleh tidak
mencukupi ukuran minimum yang dibutuhkan, hitung kembali
kekuatan uji yang sesungguhnya.
20
LAMPIRAN 1A: INTERVAL KONFIDENSI SATU-SISI
DAN DUA-SISI
Pengestimasian interval yang lazim dilakukan ialah penentuan
interval konfidensi dua-sisi, misalkan interval konfidensi 100 (1 − a ) % untuk
nilai rerata satu populasi adalah.
(lihat Diagram1.1)
(lihat Diagram1.2)
21
Diagram 1.2. Interval konfidensi satu-sisi dengan batas bawah minus
tak terhingga untuk rerata satu populasi
(lihat Diagram1.3)
22
LAMPIRAN 1B: HIPOTESIS PENELITIAN DAN
HIPOTESIS STATISTIK
Hipotesis penelitian adalah pernyataan mengenai hal yang hendak
dibuktikan oleh peneliti dalam penelitiannya.
Contoh 1.1:
Misalkan bahwa hasil pengajaran matematika pada siswa SMU
dengan metode yang ada selama ini dianggap kurang memuaskan, sehingga
dirasa perlu untuk mengembangkan metode pengajaran matematika baru.
Sebelum dapat diterapkan, metode pengajaran baru tersebut harus terlebih
dahulu dinilai dalam suatu penelitian, apakah hasilnya benar lebih baik
daripada metode pengajaran lama.
Hipotesis statistik:
H 0 : µ1 ≤ µ 2
H1 : µ1 > µ2
23
Hipotesis penelitian dinyatakan (dianggap) terbukti benar, yaitu
pengajaran matematika pada siswa SMU dengan metode baru memberi hasil
yang lebih baik daripada dengan metode yang lama jika analisis statistik
terhadap data sampel menghasilkan penolakan hipotesis nol.
H 0 : µ1 = µ 2 vs H1 : µ1 ≠ µ2
atau: H 0 : µ1 ≥ µ 2 vs H1 : µ1 < µ2
24
LATIHAN 1
Bagian Pertama
25
5. Jika dari hasil suatu penelitian, dinyatakan bahwa interval konfidensi
95% nilai rerata tinggi badan penduduk Indonesia (dalam cm) adalah
[145 ; 165], pernyataan ini berarti:
A. 95% nilai-nilai y (tinggi badan penduduk Indonesia) terletak
dalam interval [145;165]
B. 95% nilai-nilai y terletak dalam interval [145 ; 165]
C. Nilai µ memiliki probabilitas 95% untuk berada dalam interval
[145 ; 165]
D. Semuanya salah
26
9. Upaya memperkecil biaya pada proses sampling untuk
pengestimasian interval dapat dilakukan antara lain dengan:
A. Memperkecil lebar interval yang diinginkan.
B. Menurunkan tingkat keyakinan estimasi.
C. Mencari populasi yang lebih heterogen
D. Semuanya salah
10. Pada interval konfidensi 1-sisi dengan batas atas berhingga, batas
bawahnya adalah:
A. − ∞ C. +1
B. 0 D. Semuanya salah
Bagian Kedua
27
4. Pada pengujian untuk mendeteksi efek suatu perlakuan, tingkat
signifikansi α dapat pula dinyatakan sebagai:
A. Probabilitas untuk mendeteksi efek yang sesungguhnya ada.
B. Probabilitas untuk mendeteksi efek yang sebenarnya tidak ada.
C. Probabilitas untuk tidak mendeteksi efek yang sesungguhnya
ada.
D. Probabilitas untuk tidak mendeteksi efek yang sebenarnya tidak
ada.
28
8. Dalam notasi probabilitas, nilai p pada uji Z terhadap hipotesis H 0 :
µ < µ0 adalah:
A. P Z > Z uji H 0 B. P Z > Zα H 0
B. P Z < Z uji H A D. P Z < Z β H A
9. Keputusan pada uji hipotesis dengan uji Z 2-sisi jika didapatkan nilai
p 1-sisi yang lebih kecil daripada α, namun lebih besar daripada α/2
adalah:
A. H 0 ditolak
B. H 0 tidak ditolak
C. Keduanya mungkin benar
D. Keduanya salah
29
13. Di antara batu baterai produksi pabrik XYZ, hanya 70% yang
memenuhi standar. Konsultan pabrik mengajukan hipotesis (verbal)
bahwa cara produksi baru yang disarankannya dapat menghasilkan
persentase yang lebih tinggi yang memenuhi kualitas standar. Pada
pengujian statistik, hipotesis verbal yang hendak dibuktikan ini
ditransformasikan menjadi:
A. Hipotesis nol C. Keduanya benar
B. Hipotesis alternatif D. Keduanya salah
14. Untuk soal No. 13 di atas, pernyataan verbal yang hendak dikaji
tersebut dianggap terbukti kebenarannya jika pada akhir pengujian
statistik:
A. H 0 ditolak C. H 0 diterima
B. H 0 tidak ditolak D. B) dan C) benar.
16. Jika efek diuji dianggap memiliki nilai penting secara substantif,
namun hasil pengujian ternyata tidak menunjukkan kemaknaan
statistik, maka:
A. Efek tersebut disimpulkan tidak penting, uji statistik lebih lanjut
tidak diperlukan.
B. Efek tersebut disimpulkan penting, dan hasil uji statistik tidak
perlu diperhatikan.
C. Pengujian secara statistik perlu diulangi dengan ukuran sampel
yang lebih besar.
D. Semuanya salah
30
17. Jika efek yang diuji bermakna secara statistik, namun secara
substantif dianggap tidak penting maka:
A. Efek tersebut sebenarnya penting, dan penilaian terdahulu
secara substantif adalah salah.
B. Efek tersebut tidak penting, hasil uji statisik tidak perlu
diperhatikan.
C. Pengujian secara statistik perlu diulangi dengan ukuran sampel
yang lebih besar.
D. Semuanya salah.
31
BAB 2
INFERENSI STATISTIK UNTUK
SATU POPULASI
32
Jika populasi berhingga dan ukuran sampel tak dapat diabaikan
terhadap ukuran populasi ( n / N ≥ 5%), interval konfidensi 100 (1 − a ) %
untuk nilai rerata populasi µ adalah:
σ N −n
y + Za/2. (2.2.a)
n N
Untuk sampel kecil ( n < 30 ) yang berasal dari populasi normal tak
berhingga dan variansi populasi σ 2 tak diketahui, interval konfidensi
100 (1 − a ) % untuk nilai rerata populasi µ adalah:
s
y + t( n −1);a / 2 . (2.3)
n
33
Dasar pemilihan rumus yang akan digunakan di sini yaitu:
1. Penggunaan nilai Z atau nilai t sebagai pengali untuk standard error
rerata sampel ( lihat matriks 2.1) : gunakan nilai t hanya jika populasi
normal, sampel kecil, dan standar deviasi populasi σ tak diketahui.
2. Penggunaan standar deviasi populasi σ atau standar deviasi sampel s :
gunakan s hanya jika standar deviasi populasi σ tak diketahui.
y − µ0
Matriks 2.1. Distribusi transformasi pada populasi normal dan
SE ( y )
sebarang
a. Populasi normal
n ≥ 30 n < 30
σ y − µ0 y − µ0
~ Z (0 ; 1) ~ Z (0 ; 1)
diketahui σ/ n σ/ n
σ tak y − µ0 y − µ0
~ Z (0 ; 1) ~ t( n −1)
diketahui σ/ n σ/ n
b. Populasi sebarang
n ≥ 30 n < 30
σ y − µ0
~ Z (0 ; 1)
diketahui σ/ n
?
σ tak y − µ0
~ Z (0 ; 1)
diketahui σ/ n
34
N −n
Koreksi populasi berhingga sebenarnya adalah . Karena
N −1
N >> 1, maka N − 1 ≈ N , sehingga untuk penyederhanaan koreksi populasi
N −n n
berhingga biasanya dinyatakan sebagai = 1 − . Koreksi populasi
N N
n
berhingga dapat diabaikan jika kecil (misalnya kurang daripada 5%).
N
35
Untuk tingkat konfidensi 100 (1 − a ) % = 95% yaitu a = 0.05 ,
diperoleh Z a /2 = 1.96 , sehingga interval konfidensi 95% untuk nilai rerata
adalah:
y − Z a /2 .SE ( y ) < µ < y + Z a /2 .SE ( y )
yaitu: 1.5 − (1.96 )( 0.05 ) < µ < 1.5 + (1.96 )( 0.05 )
1.40 < µ < 1.60
atau: IK 95% adalah [1.40;1.60]
= 24,570 ± 1,120
atau: [ 23, 450; 25, 690]
36
b. Jumlah total uang yang dibelanjakan oleh 400 pelanggan adalah:
T = N .µ
dan estimasinya adalah:
Tˆ = N . y
Interval konfidensi 95% jumlah total uang yang dibelanjakan
adalah:
N y ± Z a / 2 .SEˆ ( y )
y=
∑y 1
= 12.81
n
s=
∑y 2
i − ( ∑ yi ) 2 n
= 0.463
n −1
s 0.463
SEˆ ( y ) = = = 0.146
n 10
t( n−1);a /2 = t(9;0.05) = 1.833
IK 90% untuk rerata waktu lari 100 m populasi atlet Kodya Tangerang yang
menjalani metode pelatihan baru adalah:
37
y ± t( n −1);a / 2 .SEˆ ( y )
n=
( Z a /2 ) .σ 2
(2.7.a)
I2
Contoh 2.4:
Lihat kembali data pada contoh 2.1. Dengan σ = 0.30 menit,
misalkan hendak diestimasi rerata waktu untuk memproduksi 1 rim kertas
38
dengan tingkat keyakinan 95% dan presisi (lebar interval konfidensi) tidak
lebih daripada 0.10 menit.
(1 − a ) = 0.95 → Z a / 2 = Z 0.025 = 1.96
σ = 0.30 2 I = 0.10 I = 0.10 / 2 = 0.05
Ukuran sampel minimum yang dibutuhkan adalah:
2
n=
( Z a /2 ) .σ 2
I2
=
(1.96 )( 0.30 )
2 2
0.052
= 138.30 ≈ 139 (dibulatkan keatas)
Matriks 2.2. Uji hipotesis untuk rerata satu populasi pada populasi
normal dan sebarang
39
Uji Hipotesis untuk 1 Rerata Populasi Sebarang (Sampel Besar)
40
Diagram 2.1. Daerah kritis pada uji hipotesis untuk satu nilai rerata
populasi dengan sampel besar
Nilai-nilai
nilai titik kritis pada uji 11-sisi dan untuk tingkat signifikansi
0.01, 0.05, dan 0.10 dapat dilihat pada tab
tabel 2.1.
a H1 : µ < µ 0 H1 : µ > µ0
0.01 Z < − Z0.01 (Z < −2.33) Z > Z 0.01 (Z > 2.33)
0.05 Z < − Z0.05 (Z < −1.64) Z > Z 0.05 (Z > 1.64)
0.10 Z < − Z0.10 (Z < −1.28) Z > Z 0.10 (Z > 1.28)
41
b. Nilai Z kritis untuk uji 2-arah:
a H1 : µ ≠ µ0
0.01 Z < − Z 0.005 (Z < −2.58) Z > Z 0.005 (Z > 2.58)
0.05 Z < − Z 0.025 (Z < −1.96) Z > Z 0.025 (Z > 1.96)
0.10 Z < − Z0.05 (Z < −1.64) Z > Z0.05 (Z > 1.64)
Contoh 2.5:
Lihat kembali data pada contoh 2.1 (estimasi interval 1 nilai rerata;
sampel besar; σ diketahui): Rerata waktu yang dibutuhkan mesin milik
sebuah perusahaan untuk memproduksi 1 rim kertas selama ini adalah 1.2
menit. Pada pengambilan sampel acak sebanyak 36 rim kertas, rerata waktu
untuk memproduksi 1 rim adalah 1.5 menit. Jika diasumsikan standar deviasi
populasi 0.30 menit dan digunakan a = 0.01 , kesimpulan apa yang diperoleh
pada uji hipotesis terhadap rerata waktu produksi untuk 1 rim kertas?
5. Statistik penguji:
42
y − µ0
Z uji =
σ/ n
yang berdistribusi normal standar.
y = 1.5 σ = 0.30 n = 36
σ 0.30
SE ( y ) = = = 0.05
n 36
1.5 − 1.2
Z uji = = 6.0,
0.05
yang terletak pada daerah kritis ( Z uji > 2.33 )
a. Hipotesis:
H 0 : µ = 1.2 vs H1 : µ ≠ 1.2
Contoh 2.6:
Lihat kembali data pada contoh 2.2 (estimasi interval 1 nilai rerata;
sampel besar; σ tak diketahui): Pemilik sebuah toko serba ada mentargetkan
setiap pelanggan untuk membelanjakan rata-rata Rp 30.000 per kali
kunjungan ke tokonya. Sampel acak yang terdiri dari 100 pelanggan
menunjukkan bahwa rerata belanja pelanggan adalah Rp 24.570 dengan
standar deviasi Rp 6.600. Dengan a = 0.05 , kesimpulan apa yang ditarik?
43
kunjungan kurang daripada Rp 30.000, karena itu diperlukan uji satu-sisi
dengan hipotesis H 0 : µ ≥ 30, 000 versus H1 : µ < 30, 000 .
5. Statistik penguji:
y − µ0
Zuji =
s/ n
yang berdistribusi normal standar.
y = 24, 570 s = 6, 600 n = 100
s 6, 600
SEˆ ( y ) = = = 600
n 100
24,570 − 30, 000
Z uji = = −8.23
660
yang terletak pada daerah kritis ( Z uji < −1.64 )
5. Kesimpulan : H0 ditolak pada a = 0.05
a. Hipotesis:
H 0 : µ = 30, 000 vs H1 : µ ≠ 30, 000
44
yang juga terletak pada daerah kritis Z < −1.96, diperoleh kesimpulan yang
sama, yaitu H0 ditolak pada a = 0.05.
3. Tingkat signifikansi: a.
4. Statistik penguji:
y − µ0
tuji = (2.12)
s/ n
yang berdistribusi t dengan db ( n − 1) .
5. Daerah kritis: sesuai H1
a. t < − t( n−1) ; α 2 atau t > − t( n−1) ; α 2 untuk H1 : µ ≠ µ0 )
Contoh 2.7:
Lihat kembali data pada contoh 2.3 (estimasi interval; sampel kecil):
Data waktu (dalam detik)yang dicatat dalam lari 100 m oleh sampel acak 10
orang di antara atlet Kodya Tangerang yang menjalani metode pelatihan baru
adalah:
12.2;13.6;12.4;12.8;13.1;
13.5;12.5;12.7;12.5;12.8
45
Dengan a = 0.10 , ujilah hipotesis bahwa rerata waktu yang diperlukan untuk
lari 100 m pada populasi atlet Kodya Tannggerang yang menjalani metode
pelatihan baru kurang daripada 13.00 detik.
Pada contoh 2.3 telah dihitung nilai-nilai rerata sampel dan standar
deviasi sampel:
y = 12.81 s = 0.463
5. Statistik penguji:
y − µ0
tuji =
s/ n
yang berdistribusi t dengan db (n – 1).
y = 12.81 s = 0.463 n = 10
s
SEˆ ( y ) = = 0.146
n
12.81 − 13.0
tuji = = −1.30,
0.146
yang tidak terletak pada daerah kritis ( tuji > −1.38 ) .
6. Kesimpulan: H 0 tidak ditolak pada a = 0.10.
46
a. Hipotesis:
H 0 : µ = 13.00 vs H1 : µ ≠ 13.00
47
dan:
( Za + Z β )σ = µ A − µ0
n
n=
( Za + Zβ ) σ 2
(2.14)
2
( µ A − µ0 )
Nilai σ 2 ataupun estimatornya s 2 diperoleh dari data terdahulu atau
studi pendahuluan. Untuk uji 2-sisi, nilai Zα diganti Zα 2 .
PQ
p ± Z a /2 (2.15.a)
n
dengan Q = 1 − P .
48
pq
p ± Z a /2 (2.15.b)
n
dengan q = 1 − p.
PQ N − n
p ± Za/2 (2.16.a)
n N
Contoh 2.8:
Di antara 900 petani sebagai sampel acak petani di DIY, 610 orang
adalah buruh tani. Hitunglah interval konfidensi 90% proporsi buruh tani di
antara seluruh petani di DIY.
610 290
n = 900 p= = 0.678 q = 1− p = = 0.322
900 900
Estimasi standard error proporsi sampel p adalah:
pq
SEˆ ( p ) =
n
=
( 0.678)( 0.322 ) = 0.0156
900
(1 − a ) = 0.90 → Z a /2 = Z 0.05 = 1.64
49
p ± Z a / 2 .SEˆ ( p )
0.678 ± (1.64 )( 0.0156 ) atau:
[ 0.652; 0.703]
Catatan:
a. Untuk data proporsi, nilai P (dan estiamatornya p ) adalah:
0 ≤ P ≤1 dan Q = 1− P
b. Jika digunakan untuk perhitungan persentase, maka:
0 ≤ P ≤ 100 dan Q = 100 − P
PQ
yaitu: I = Z a /2 .
n
dengan Q = 1 − P , sehingga ukuran sampel minimum yang dibutuhkan
adalah:
2
(Z )
n = a/2
PQ
2
(2.17.a)
I
50
2
(Z )
n = a/2
PQ
2
(2.17.b)
I
dengan q = 1 − p.
Contoh 2.9:
Misalkan pada contoh 2.8 di atas, untuk estimasi interval proporsi
buruh tani di antara seluruh petani di DIY dengan tingkat keyakinan 90%,
lebar estimasi yang diinginkan cukup tidak melebihi 10%, maka ukuran
sampel minimum yang dibutuhkan adalah:
2
(Z )
n = a/2
pq
2
I
Z a /2 = Z 0.05 = 1.64 2 I = 10% I = 5% = 0.05
p = 0.678 q = 0.322
2
n=
(1.64 ) ( 0.678 )( 0.322 )
2
( 0.05)
= 236.36 ≈ 237
Contoh 2.10:
Pada contoh 2.9, jika nilai proporsi populasi maupun estimasinya tak
diketahui, ukuran sampel minimum yang dibutuhkan adalah:
2
( ˆˆ
Z a / 2 ) PQ
n=
I2
51
dengan Pˆ = 0.5 dan Qˆ = 0.5, sehingga:
n=
(1.64 ) ( 0.5)( 0.5)
2
0.052
= 270.57 ≈ 271
Contoh 2.11
Lihat kembali data pada contoh 2.8 (estimasi interval 1 nilai
proporsi): Diantara 900 petani sebagai sampel acak petani di DIY, 610 orang
52
adalah buruh tani. Dengan a = 0.05 akan diuji apakah proporsi buruh tani di
DIY tidak kurang daripada 65%.
=
( 0.65)( 0.35 ) = 0.016
900
53
Ukuran Sampel Minimum untuk Uji Hipotesis 1 Proporsi
54
Beberapa catatan mengenai estimasi interval dan uji hipotesis:
1. Pernyataan bahwa interval konfidensi 100 (1 − a ) % untuk µ adalah
55
H 0 : µ ≤ 160 vs H1 : µ > 160 , jika diperoleh nilai y = 150 , maka uji
hipotesis tidak diperlukan lagi karena H 0 pasti tidak ditolak
(seandainya y > 160 masih perlu diuji apakah kelebihannya daripada
160 itu terjadi secara kebetulan atau tidak).
56
LAMPIRAN 2A: PARAMETER DISTRIBUSI PARENTAL DAN
DISTRIBUSI SAMPLING SERTA ESTIMATORNYA
Rerata µ µˆ = y
N n N n
∑Y ∑y ∑ (Y − µ ) ∑( y − y)
2 2
i i i i
µ= i =1
y= i =1
σ2 = i =1
s2 = i =1
N n N n −1
σ 2 N −n 2
s N −n
Variansi Var ( y ) = σ y2 = ˆ ( y ) = σˆ y2 =
Var
n N n N
σ N −n s N −n
Standard error SE ( y ) = σ y = SEˆ ( y ) = σˆ y =
n N n N
N −n n
Finite population correction: fpc = = 1−
N N
57
Matriks II.3. Parameter distribusi parental Y (data binomial dengan
pendekatan normal) dan estimatornya
PARAMETER ESTIMATOR
Rerata µ = nP µˆ = np
Variansi Var (Y ) = nPQ ˆ (Y ) = npq
Var
PARAMETER ESTIMATOR
Rerata P P̂ = p
Variansi Var ( p ) = PQ / n ˆ ( p ) = pq / n
Var
N n
∑ Yi ∑y i
P= i =1
(Yi = 0,1) p= i =1
( yi = 0,1)
N n
58
LAMPIRAN 2B: RANGKUMAN ESTIMASI INTERVAL UNTUK
NILAI RERATA DAN PROPORSI SATU POPULASI
n ≥ 30
σ σ N −n
σ diketahui y ± Za/2. y ± Z a /2 .
n n N
σ tak s s N −n
y ± Za/2. y ± Z a /2 .
diketahui n n N
σ σ N −n
σ diketahui y ± Za/2. y ± Z a /2 .
n n N
σ tak s s N −n
y ± t( n −1); a /2 . y ± t( n −1);a /2 .
diketahui n n N
59
Matriks II.7. Rangkuman rumus interval konfidensi proporsi satu
populasi sebarang dan normal, sampel besar
n ≥ 30
PQ PQ N − n
P diketahui p ± Za/2 p ± Z a /2
n n N
P tak pq pq N − n
p ± Z a /2 p ± Z a /2
dietahui n n N
60
LAMPIRAN 2C: HUBUNGAN ANTARA UJI HIPOTESIS DAN
ESTIMASI INTERVAL
61
Misalnya, bagi uji hipotesis 2-arah dengan tingkat signifikansi a dan
estimasi interval dengan tingkat keyakinan (tingkat konfidensi) 100 (1 − a ) %
dapat disimpulkan bahwa:
• Jika H 0 ditolak, maka nilai θ0 pasti berada di luar rentang estimasi
interval, demikian pula sebaliknya.
• Jika H 0 ditolak, maka nilai θ0 pasti berada dalam rentang estimasi
interval, demikian pula sebaliknya.
Contoh II.1.
Lihat kembali contoh 2.3 pada teks (contoh estimasi interval untuk
sampel kecil). Pada contoh 2.3 tersebut, telah dihitung interval konfidensi
90% untuk nilai rerata:
[12.54;13.08]
Dalam contoh 2.7, yaitu pada uji hipotesis 2-sisi untuk data yang
sama dengan hipotesis H 0 : µ = 13.00, kesimpulan yang diperoleh adalah H 0
tidak ditolak pada uji 2-sisi dengan a = 10%.
62
LAMPIRAN 2D: TEOREMA CHEBYSHEV
Metode pengestimasian interval yang telah dibahas terdahulu
y −µ
mempersyaratkan diketahuinya distribusi transformasi , yaitu
SE ( y )
berdistribusi Z atau t . Jika populasi parental Y sebarang (tidak normal) dan
sampel berukuran kecil ( n < 30 ) , pengestimasian interval nilai rerata satu
populasi (ataupun parameter populasi lainnya) masih dapat dilakukan secara
kasar dengan menggunakan teorema Chebyshev.
Perhatikan bahwa:
a. Teorema ini dinyatakan dalam bentuk sebuah ‘pertidaksamaan’, sehingga
yang dapat dihitung dengan menggunakan teorema ini adalah nilai
maksimum probabilitas pada ruas kiri pertidaksamaan.
b. Bentuk distribusi variabel random Y tidak dinyatakan secara eksplisit,
sehingga teorema ini berlaku bagi setiap bentuk distribusi variabel
random Y .
Contoh II.2:
Misalkan diketahui rerata tinggi badan populasi mahasiswa
Gunadarma adalah µ = 164 cm dengan standar deviasi populasi σ = 8 cm,
maka:
1
P Y − 164] > (1)( 8 ) ≤ atau: P Y − 164] > 8 ≤ 1
12
1
P Y − 164] > ( 2 )( 8 ) ≤ 2 atau: P Y − 164] > 16 ≤ 0.25
2
1
P Y − 164] > ( 3)( 8 ) ≤ 2 atau: P Y − 164] > 24 ≤ 0.11
3
63
Jika pada teorema Chebyshev di atas Y disubstitusi dengan Y dan σ
disubstitusi dengan σ y , maka diperoleh:
1
P Y − µ > kσ y ≤ 2
k
sehingga teorema ini dapat digunakan untuk perhitungan interval konfidensi
1
dengan 2 menyatakan luas area di luar interval konfidensi, yaitu 100a% .
k
Contoh II.3
Misalkan dimiliki data tinggi badan untuk sampel 10 orang
mahasiswa Gunadarma (data pada contoh 3.1 dan 3.16, buku teks Metode
Statistika I). Pada contoh-contoh tersebut telah dihitung rerata dan standar
deviasi sampel:
y = 161.8 dan s = 4.32
Maka interval konfidensi 90% nilai rerata tinggi badan populasi dapat
dinyatakan sebagai:
y − kσˆ y ; y + kσˆ y
yang diperoleh dari persamaan dengan menggunakan titik-titik batas
maksimum probabilitas:
P Y − µ > kσ y = 1 – α = 0.10
1
sehingga: = 0.10 dan k = 10 = 3.16
k2
Interval konfidensi 95% nilai rerata tinggi badan populasi adalah:
y ± k .σˆ Y
64
yaitu: 161.8 + (3,16)(1.37)
65
LATIHAN 2
Bagian Pertama
66
6. Ukuran sampel minimum yang dibutuhkan untuk estimasi interval
rerata sebuah populasi dapat diperkecil dengan cara berikut:
A. Menurunkan tingkat keyakinan.
B. Menggunakan sampel yang lebih homogen.
C. Memperbesar lebar estimasi interval yang diinginkan.
D. Semuanya benar.
67
11. Pada sampel acak 100 orang usia kerja disebuah kecamatan
didapatkan 25 orang penganggur. Dengan tingkat keyakinan 99%,
hitunglah interval konfidensi tingkat pengangguran di kecamatan
tersebut:
A. 12.12% < P < 37.88%
B. 13.85% < P < 36.15%
C. 15.51% < P < 33.49%
D. 17.88% < P < 32.12%
C. SEˆ ( p ) = ( pq ) n ; q = 1 − p
D. SEˆ ( p ) = ( P0Q0 ) n ; Q0 = 1 − P0
14. Pada data soal No. 13 diatas, jika n << N (N adalah ukuran populasi),
estimasi standard error p yang digunakan untuk menghitung
estimatornya interval proporsi populasi P adalah:
A. SEˆ ( p ) = npq ; q = 1 − p
B. SEˆ ( p ) = nP Q ; Q = 1 − P
0 0 0 0
C. SEˆ ( p ) = ( pq ) n ; q = 1 − p
D. SEˆ ( p ) = ( P0Q0 ) n ; Q0 = 1 − P0
68
15. Interval konfidensi 95% proporsi lulusan Universitas Gunadarma
yang berhasil memperoleh pekerjaan dalam tahun pertama setelah
lulus adalah [64% ; 78%]. Uji 2-sisi terhadap H 0 : P = 65% akan
menghasilkan kesimpulan:
A. H 0 ditolak pada α = 0.01
B. H 0 ditolak pada α = 0.05
C. H 0 tidak ditolak pada α = 0.05
D. H 0 tidak ditolak pada α = 0.10
Bagian Kedua
Pilihlah satu jawaban yang paling benar !
69
3. Untuk menguji manfaat kursus bahasa Inggris tersebut, hipotesis nol
yang relavan adalah:
A. µ ≤ 62 C. µ ≥ 62
B. µ < 62 D. µ > 62
70
10. Jika di antara sampel acak berupa 100 orang mahasiswa didapatkan
25 penderita rabun jauh, kesimpulan yang diperoleh untuk uji
hipotesis pada soal No. 8 dan 9 yaitu:
A. H 0 ditolak
B. H 0 tidak ditolak
C. Keduanya mungkin benar.
D. Keduanya salah.
71
15. Dari 150 orang mahasiswa yang dipilih secara acak, 44 orang berkaca
mata untuk melihat jauh. Interval konfidensi 95% proporsi
mahasiswa yang berkaca mata adalah:
A. 0.197 < P < 0.389
B. 0.220 < P < 0.366
C. 0.232 < P < 0.354
D. 0.246 < P < 0.341
16. Pada soal No. 15 di atas, jika dengan tingkat keyakinan yang sama
diinginkan lebar estimasi yang tidak lebih daripada 12%, ukuran
sampel minimum yang dibutuhkan adalah:
A. 95 C. 222
B. 155 D. 381
72
BAB 3
INFERENSI STATISTIK UNTUK
DUA POPULASI
73
σ1 2 σ22
SE ( y1 − y2 ) = + (3.2.b)
n1 n2
Contoh 3.1:
Misalkan diketahui rerata usia pernikahan pertama bagi 100 orang
wanita suku A yang dipilih secara acak, yaitu 21.7 dengan standar deviasi 6.3
74
tahun, sedangkan untuk 100 orang wanita suku B adalah 19.5 tahun dengan
standar deviasi 5.8 tahun.
Karena tidak ada data terdahulu mengenai rerata usia pernikahan
pertama pada kedua suku, sebaiknya yang diuji hanyalah ada tidaknya
perbedaan rerata usia pernikahan antara kedua suku tersebut, sehingga yang
diperlukan adalah uji 2-sisi dengan hipotesis H 0 : µ1 = µ 2 vs H1 : µ1 ≠ µ2 .
y1 − y2 = 21.7 − 19.5 = 2.2
s1 2 s2 2
SEˆ ( y1 − y2 ) = +
n n2
6.32 5.82
= + = 0.856
100 100
Uji hipotesis (2-sisi):
1. Jenis uji statistik: uji Z.
2. Hipotesis:
H 0 : µ1 = µ 2 vs H1 : µ1 ≠ µ2
3. Tingkat signifikansi: a = 0.05
4. Daerah kritis: Z < − Z 0.025 , yaitu Z < −1.96
atau Z > − Z 0.025 . yaitu Z > 1.96
4. Statistik penguji:
y1 − y2
Z uji =
s1 2 s2 2
+
n1 n2
yang berdistribusi normal standar.
2.2
Z uji = = 2.57
0.856
terletak pada daerah kritis ( Z uji > 1.96 ) .
5. Kesimpulan: H 0 ditolak pada a = 0.05
Jika tetap hendak dilakukan uji 1-sisi, yang perlu dibuktikan adalah
hipotesis H1 : µ1 > µ2 ( µ1 tidak mungkin terbukti lebih kecil daripada µ2
dalam uji hipotesis, jika y1 > y2 ) .
75
Perbedaan uji 1-sisi dengan 2-sisi diatas adalah:
a. Hipotesis:
H 0 : µ1 ≤ µ 2 vs H1 : µ1 > µ 2
b. Daerah kritis: Z > Z 0.025 , yaitu Z > 1.64
SE (Y1 − Y2 ) = 2σ 2 / n
76
Dengan merujuk pada distribusi sampling (Y
1 − Y2 ) menurut H A
diperoleh:
c = d − Z β 2σ 2 / n
sehingga didapatkan:
0 + Z a 2σ 2 / n = d − Z β 2σ 2 / n
2 2σ 2 2
dan: ( Z a + Zβ ) .
n
= d 2 = ( µ1 − µ 2 )
77
dengan asumsi Y1 dan Y2 independen, serta standard error:
σ1 2 σ22
SE ( y1 − y2 ) = + (3.7)
n1 n2
Contoh 3.2:
Lihat kembali data pada contoh 3.1 untuk uji hipotesis selisih 2 nilai
rerata. Rerata usia wanita menikah untuk pertama kalinya bagi 100 orang
wanita suku A yang dipilih secara acak adalah 21.7 tahun dengan standar
deviasi 6.3 tahun, sedangkan untuk 100 orang wanita suku B adalah 19.5
tahun dengan standar deviasi 5.8 tahun. Hendak dihitung interval konfidensi
95% selisih rerata usia pernikahan pertama wanita antara kedua suku.
Pada contoh 3.1 telah dihitung:
s1 2 s2 2
SEˆ ( y1 − y2 ) = + = 0.856
n1 n2
( y1 − y2 ) = 21.7 − 19.5 = 2.2
Interval konfidensi 95% selisih rerata usia saat perkawinan pertama
wanita kedua suku adalah:
( y1 − y2 ) ± Z a / 2 .SEˆ ( y1 − y2 )
atau: 2.2 ± (1.96 )( 0.856 )
yaitu: [ 0.52;3.88]
78
Ukuran Sampel Minimum untuk Estimasi Interval Selisih
2 Rerata:
Misalkan hendak diestimasi interval konfidensi 100 (1 − a ) % untuk
selisih 2 rerata populasi µ1 − µ2 . Interval konfidensi yang akan diperoleh
dinyatakan dengan lambang [ ∆yB ; ∆yA ] ; ∆yB dan ∆yA masing-masing
menyatakan batas bawah dan batas interval konfidensi tersebut. Misalkan
pula:
2I = ∆yA − ∆yB
menyatakan lebar interval maksimum yang diinginkan (= presisi), maka:
I = Z a/2 .SE ( y1 − y2 ) (3.9)
σ1 2 σ22
dengan: Var ( y1 − y2 ) = +
n1 n2
Jika diasumsikan σ 1 2 = σ 2 2 = σ 2 dan n1 = n2 = n, maka:
Var ( y1 − y2 ) = Var ( y1 ) + Var ( y2 )
σ2 σ2
2σ 2
= + =
n n n
2σ 2
SE ( y1 − y2 ) =
n
2σ 2
sehingga: I = Za/2 .
n
2
2 ( Za/2 ) σ 2
dan: n= (3.10)
I2
2
σˆ = s 2
=
( n1 − 1) s1 2 + ( n2 − 1) s2 2
pooled
n1 + n2 − 2
(semua nilai-nilai n1 , n2 ,s1 , dan s2 2 pada rumus terakhir ini adalah nilai-
2
79
Contoh 3.3:
Misalkan hendak diestimasi perbedaan jumlah asupan kalori (dalam
cal) makan siang anak sekolah peserta program gizi dengan anak sekolah
bukan peserta program tersebut, dengan tingkat keyakinan 95% dan lebar
estimasi interval tidak lebih daripada 40 cal. Dari studi pendahuluan
diketahui standar deviasi jumlah asupan kalori makan siang anak sekolah
adalah 75 cal.
(1 − a ) = 0.95 Z a / 2 = Z 0.025 = 1.96
2I = 40 I = 20
s = 75
Ukuran sampel minimum untuk 1 kelompok adalah:
2
2 ( Z a/2 ) s 2
n=
I2
( 2 ) (1.962 )
= = 108.045 ≈ 109
202
Ukuran sampel minimum untuk 2 kelompok perbandingan adalah:
2n = ( 2 )(109 ) = 218
80
y1 − y2
Z uji =
SE ( y1 − y2 )
y1 − y2
Z uji =
σ1 2 σ22
+
n1 n2
Dengan asumsi:
σ1 2 = σ 2 2 = σ 2 (3.11)
(variansi populasi bersama; common population variance), maka variansi
( y1 − y2 ) adalah:
σ1 2 σ22 1 1
Var ( y1 − y2 ) = + =σ2 +
n1 n2 n1 n2
Estimator σ 2 adalah rerata tertimbang s1 2 dan s2 2 dengan derajat
bebas masing-masing sebagai penimbangnya, dan dinamakan estimasi
gabungan (pooled estimate):
( n − 1) s1 2 + ( n2 − 1) s2 2
σˆ 2 = s 2 pooled = 1
( n1 − 1) + ( n2 − 1)
2
σˆ = s 2
=
( n1 − 1) s1 2 + ( n2 − 1) s2 2
pooled (3.12)
n1 + n2 − 2
dan estimasi variansi serta standard error ( y1 − y2 ) adalah:
1 1
ˆ ( y1 − y2 ) = s 2 pooled +
Var
n1 n2
1 1
SEˆ ( y1 − y2 ) = spooled + (3.13)
n1 n2
81
Prosedur uji hipotesis:
1. Jenis uji statistik: uji Z ( σ 1 2 dan σ 2 2 diketahui) atauuji t ( σ 1 2 dan σ 2 2 tak
diketahui).
2. Hipotesis:
a. H 0 : µ1 = µ 2 vs H1 : µ1 ≠ µ 2 )
b. H 0 : µ1 ≤ µ2 vs H1 : µ1 > µ2 ) (3.14)
c. H 0 : µ1 ≥ µ2 vs H1 : µ1 < µ 2 )
3. Tingkat signifikansi: a .
4. Statistik penguji:
Jika σ 1 2 dan σ 2 2 diketahui, statistik penguji adalah:
y1 − y2
Z uji = (3.15)
σ1 2 σ22
+
n1 n2
yang berdistribusi normal standar dengan daerah kritis:
a. Z < − Z a/ 2 atau Z > Z a /2 untuk H1 : µ1 − µ2 ≠ 0 )
b. Z < − Z a untuk H1 : µ1 − µ2 < 0 ) (3.16)
Contoh 3.4:
Misalkan hendak diteliti waktu belajar mingguan (jam) mahasiswa
putra dan putri di sebuah ibukota propinsi. Pada sampel acak 12 orang
mahasiswa pria, rerata waktu belajar adalah 27.8 jam dengan standar deviasi
7.2 jam, sedangkan untuk 10 orang mahasiswa wanita rerata waktu belajar
adalah 21.3 jam dengan standar deviasi 6.9 jam. Ingin diketahui apakah ada
perbedaan waktu belajar mingguan yang bermakna secara statistik antara
mahasiswa pria dan wanita di ibukota propinsi tersebut.
82
Karena tidak dinyatakan apakah menurut data terdahulu rerata waktu
belajar mahasiswa pria lebih lama daripada rerata waktu belajar mahasiswa
wanita, maka hipotesis yang layak diuji adalah H 0 : µ1 = µ 2 vs H1 : µ1 ≠ µ2 .
Dengan asumsi σ 1 2 = σ 2 2 = σ 2 , maka:
2
σˆ = s 2
=
( n1 − 1) s1 2 + ( n2 − 1) s2 2
pooled
n1 + n2 − 2
(11) ( 7.22 ) + ( 9 ) ( 6.92 )
= = 49.94
11 + 9
1 1
SEˆ ( y1 − y2 ) = spooled +
n1 n2
1 1
= 49.94 + = 3.026
12 10
( y1 − y2 ) = 27.8 − 21.3 = 6.5
Uji hipotesis (2-sisi):
1. Jenis uji statistik:uji t .
2. Hipotesis: H 0 : µ1 = µ 2 vs H1 : µ1 ≠ µ2
3. Tingkat signifikansi: a = 0.05.
4. Daerah kritis: t < −t20 ;0.025 , yaitu t < −2.086
atau: t > t20 ;0.025 , yaitu t > 2.086
5. Dengan asumsi σ 1 2 = σ 2 2 = σ 2 , statistik penguji adalah:
y1 − y2
tuji =
1 1
s 2 pooled +
n1 n2
yang berdistribusi t dengan db ( n1 + n2 − 2 ) .
6.5
tuji = = 2.15 ,
3.026
yang terletak pada daerah kritis ( tuji > 2.086 )
6. Kesimpulan: H 0 ditolak pada α = 0.05.
83
b. Daerah kritis: t > t20 ;0.025 , yaitu t > 1.725
Dengan statistik penguji yang sama:
tuji = 2.15 ,
yang juga terletak pada daerah kritis t > 1.725 , diperoleh kesimpulan yang
sama, yaitu H 0 ditolak pada a = 0.05.
Contoh 3.5:
Lihat kembali data pada contoh 3.4. Untuk mengestimasi selisih
waktu belajar mingguan (jam) mahasiswa pria dan wanita di sebuah propinsi,
diambil sampel acak 12 orang mahasiswa pria, rerata waktu belajar adalah
84
27.8 jam dengan standar deviasi 7.2 jam, serta 10 orang mahasiswa wanita,
rerata waktu belajar adalah 21.3 jam dengan standar deviasi 6.9 jam.
Dengan asumsi σ 1 2 = σ 2 2 = σ 2 , telah dihitung:
σˆ 2 = s 2 pooled =
( n1 − 1) s1 2 + ( n2 − 1) s2 2 = 49.94
n1 + n2 − 2
1 1
SEˆ ( y1 − y2 ) = spooled + = 3.026
n1 n2
( y1 − y2 ) = 6.5
Interval konfidensi 95% selisih rerata waktu belajar mingguan
mahasiswa putra dan putri adalah:
( y1 − y2 ) ± t( n1 +n2 −2);a/2 .SEˆ ( y1 − y2 )
atau: 6.5 ± ( 2.086 )( 3.026 )
yaitu: [0.19;12.81]
85
Misalkan dimiliki pasangan variabel random ( X ; Y ) dengan nilai-
nilai ( X 1 ; Y1 ) , ( X 2 ; Y2 ) , . . . , ( X n ; Yn ) . Selisih nilai masing-masing
pasangan membentuk variabel random baru D dengan nilai-nilai:
d1 = x1 − y1 , d 2 = x2 − y2 , . . . , d n = xn − yn ;
dan rerata sampel:
n
d = ∑ di (3.22)
i =1
∑(d
2
1 −d )
sd 2 = i −1
(3.23)
n −1
E (d ) = δ (3.24)
dan variansi:
σD2
Var ( d ) = (3.25)
n
dan estimatornya adalah:
sd 2
Var ( d ) = (3.25.a)
n
(variansi populasi σ D 2 umumnya tak diketahui besarnya)
86
d
tuji = (3.27)
sd / n
yang berdistribusi t dengan db ( n − 1) , n menyatakan jumlah pasangan.
5. Daerah kritis: sesuai H1
a. t < −t( n −1);a/2 atau t > −t( n −1);a /2 untuk H1 : δ ≠ 0 )
b. t < −t( n −1);a untuk H1 : δ < 0 ) (3.28)
c. t > −t( n−1);a untuk H1 : δ > 0 )
Contoh 3.6:
Misalkan dimiliki data tekanan darah diastolik 10 orang akseptor KB
(dalam mm Hg) sebelum dan sesudah menggunakan pil KB (tabel 3.1).
∑d
i −1
1
d =
n
94
= = 9.4
10
n
∑(d
2
1 −d)
sd 2 = i −1
= 91.6
n −1
s
SEˆ ( d ) = d
n
91.6
= = 3.03
10
Uji hipotesis (1-sisi):
1. Jenis uji statistik: uji t berpasangan.
87
2. Hipotesis: H 0 : δ < 0 versus H1 : δ > 0
3. Tingkat signifikansi: a = 0.05.
4. Daerah kritis: t > t( 9;0.05) , yaitu t > 1.833
5. Statistik penguji:
d
tuji =
sd / n
yang berdistribusi t dengan db ( n − 1) .
9.4
tuji = = 3.11, sehingga tuji > 1.833
3.03
6. Kesimpulan: H 0 ditolak pada a = 0.05.
88
sd
atau: d ± t( n −1);a /2 . (3.29)
n
Contoh 3.7:
Lihat kembali data pada contoh 3.6. Data tekanan darah diastolik 10
orang akseptor KB (dalam mm Hg) sebelum dan sesudah menggunakan pil
KB dapat dilihat pada tabel 3.1.
Pada contoh 3.6 tersebut telah dihitung:
n
∑d
i −1
1
d = = 9.4
n
n
∑(d
2
1 −d)
sd 2 = i −1
= 91.6
n −1
s
SEˆ ( d ) = d = 3.03
n
Interval konfidensi 95% untuk δ adalah:
d ±t .SEˆ ( d )
( 9;0.025)
9.4 ± ( 2.26 )( 3.03)
atau: [ 2.55;16.25]
89
Var ( P1 − P2 ) = Var ( P1 ) + Var ( P2 )
PQ
1 1 PQ
=+ 2 2
n1 n2
dengan asumsi Y1 dan Y2 indenpenden; Q1 = 1 − P1 ; Q2 = 1 − P2 .
p1 − p1
atau: Z uji = (3.31.a)
p1q1 p2 q2
+
n1 n2
90
a. Z < − Z a / 2 atau Z > Z a /2 untuk H1 : P1 ≠ P2 )
b. Z < −Za untuk H1 : P1 < P2 ) (3.32)
c. Z > Za untuk H1 : P1 > P2 )
Contoh 3.8:
Misalkan dimiliki 2 sampel acak berupa 100 keluarga dari DKI
Jakarta, 23 di antaranya tergolong ‘mampu’ dan 200 keluarga dari Kodya
Bogor dengan yang tergolong ‘mampu’ berjumlah 12 keluarga dan hendak
diuji apakah ada perbedaan yang bermakna secara statistik antara proporsi
keluarga ‘mampu’ di DKI Jakarta Kodya Bogor. Digunakan a = 0.05.
23 12
p1 − p2 = − = 0.17
100 200
p1q1 p2 q2
SEˆ ( p1 − p2 ) = +
n1 n2
( 0.23)( 0.77 ) + ( 0.06 )( 0.94 ) = 0.045
100 200
91
6. H 0 ditolak, berarti ada perbedaan yang bermakna secara statistik antara
proporsi keluarga ‘mampu’ di DKI Jakarta dan Kodya Bogor pada
tingkat signifikansi a = 0.05.
92
Misalkan c menyatakan nilai titik batas (titik kritis) penerimaan dan
penolakan hipotesis nol pada distribusi sampling ( p1 − p2 ) . maka dengan
merujuk pada distribusi sampling menurut H 0 :
2 PQ
c = 0 + Zα
n
Dengan merujuk pada distribusi sampling ( p1 − p2 ) menurut H A
diperoleh:
PQ + P Q
c = d − Zβ 1 1 2 2
n
sehingga didapatkan:
2 PQ PQ + P Q
0 + Za = d − Zβ 1 1 2 2
n n
2
Z 2 PQ + Z PQ + P Q
a β 1 1 2 2
= d2 = P − P 2
dan ( 1 2)
n
Ukuran sampel minimum yang dibutuhkan untuk mendeteksi H A
perbedaan minimum sebesar d = ( p1 − p2 ) pada uji hipotesis H 0 : P1 − P2 ≤ 0
vs H1 : P1 − P2 > 0 adalah:
2
Z 2 PQ + Z PQ + P Q
n=
a β 1 1 2 2
2 (3.33)
( p1 − p2 )
Untuk 2 kelompok, ukuran sampel seluruhnya adalah 2n . Dalam
praktik, nilai-nilai P1 dan P2 yang tidak diketahui disubstitusikan dengan p1
dan p2 sebagai estimatornya, yang diperoleh dari data terdahulu atau studi
pendahuluan. Untuk uji 2-sisi, nilai Z a diganti dengan Z a / 2 .
93
Var ( p1 − p2 ) = Var ( p1 ) + Var ( p2 )
PQ PQ
SE ( p1 − p2 ) = 1 1
+ 2 2
n1 n2
dengan Q1 = 1 − P1 ; Q2 = 1 − P2 , sehingga interval konfidensi 100 (1 − a ) %
untuk selisih 2 proporsi populasi ( P1 − P2 ) adalah:
( p1 − p2 ) ± Z a /2 .SE ( p1 − p2 )
PQ PQ
yaitu: ( p1 − p2 ) ± Z a /2 . 1 1
+ 2 2 (3.34)
n1 n2
p1q1 p2 q2
( p1 − p2 ) ± Z a /2 . + (3.34a)
n1 n2
Contoh 3.9:
Lihat kembali data pada contoh 3.8. Misalkan dimiliki 2 sampel acak
berupa 100 keluarga dari DKI Jakarta, 23 di antaranya tergolong ‘mampu’
dan 200 keluarga dari Kodya Bogor dengan yang tergolong ‘mampu’
berjumlah 12 keluarga dan hendak dihitung estimasi interval selisih
proporsinya dengan tingkat keyakinan 99%, maka:
23 12
( p1 − p2 ) = − = 0.17
100 200
p1q1 p2 q2
SEˆ ( p1 − p2 ) = +
n1 n2
=
( 0.23 ( 0.77 ) + ( 0.06 )( 0.94 ) = 0.045
100 200
94
Interval konfidensi 99% selisih proporsi keluarga ‘mampu’ antara
DKI Jakarta dan Kodya Bogor adalah:
( p1 − p2 ) ± Z a / 2 .SEˆ ( p1 − p2 )
yaitu: 0.17 ± ( 2.58)( 0.045 )
atau: [0.053;0.287]
1 1 + P2 Q2
PQ
yaitu: I = Z a /2 .
n
dengan asumsi n1 = n2 = n ; Q1 = 1 − P1 ; Q2 = 1 − P2 ; sehingga:
2
( Z ) [ P1 Q1 + P2 Q2 ]
n = a/2 (3.36)
I2
95
LAMPIRAN 3A: IKHTISAR UJI HIPOTESIS UNTUK RERATA DUA POPULASI
96
Matriks III.1. Uji hipotesis untuk rerata dua populasi pada populasi
normal dan sebarang
*) Jika :
- Populasi Y1 dan Y2 berdistribusi normal,
- Ukuran sampel kecil ( n1 < 30 dan / atau n2 < 30 ) ,
- Variansi kedua populasi tak diketahui dan tidak sama (σ 1 2 ≠ σ 2 2 ) , maka
digunakan uji t dengan SEˆ ( y1 − y2 ) :
s1 2 s2 2
σˆ = +
( y1 − y2 ) n1 n2
dengan derajat bebas efektif menurut Satterthwaite:
2
s1 2 s2 2
n + n
db efektif = 1 2
(dibulatkan atau diinterpolasikan)
2
( 1 1)+( 2 2)
s 2
/ n s 2
/ n
n1 − 1 n2 − 1
97
Matriks III.2 SE ( y1 - y2 ) atau estimatornya pada uji hipotesis untuk
rerata dua populasi
a. Populasi normal
n1 ≥ 30 dan n2 ≥ 30 n2 < 30 dan/atau n2 < 30
σ 1 dan σ1 σ 2 2 σ 12 σ22
σ = + σ = +
σ2 ( y1− y2 ) n1 n2 ( y1 − y2 ) n1 n2
diketahui
σ 1 dan s12 s2 2 Asumsi: σ 1 2 = σ 2 2 = σ 2
σˆ = +
σ 2 tak ( y1− y2 ) n1 n2 1 1
diketahui σˆ = σˆ2 +
( y1 − y2 ) n 1 n2
σˆ 2 = s 2 pooled =
( n1 − 1) s12 + ( n1 − 1) s1 2
( n1 − 1) + ( n1 − 1)
b. Populasi sebarang
n1 ≥ 30 dan n2 ≥ 30 n1 < 30 dan/atau
n2 < 30
σ 1 dan σ 2 σ1 σ 2 2
σ = +
diketahui ( y1− y2 ) n1 n2
σ 1 dan σ 2 tak s12 s2 2 ?
σˆ = +
diketahui ( y1− y2 ) n1 n2
98
LAMPIRAN 3B: RANGKUMAN UJI Z DAN UJI t
99
LAMPIRAN 3C: INFERENSI STATISTIK DATA PROPORSI
Matriks III.5 Estimasi Interval 1 Proporsi: p ± Z a /2 .SE ( p )
SE (p) SEˆ ( p )
Data [P dan Q diketahui] [P dan Q diketahui]
PQ P (1 − P ) PQ P (1 − P )
Proporsi: 0 < P < 1 = =
n n n n
PQ P (100 − P ) pq p (100 − p )
Persentase: 0 < P < 100 = =
n n n n
Matriks III.6 Estimasi Interval 2 Proporsi: ( p1 - p2 ) ± Z a / 2 .SE ( p1 - p2 )
SE ( p1 - p2 ) SEˆ ( p1 - p2 )
Data
[ P1 dan P2 diketahui] [ P1 dan P2 tak diketahui]
P1 (1 − P1 ) P2 (1 − P2 ) p1 (1 − p1 ) p2 (1 − p2 )
Proporsi: 0 < P < 1 + +
n n n n
P1 (100 − P1 ) P2 (100 − P2 ) p1 (100 − p1 ) p2 (100 − p2 )
Persentase: 0 < P < 100 + +
n n n n
Perhatikan:
1. Nilai persentase 100× lebih besar daripada nilai proporsi, misalnya proporsi 0.25 sama dengan persentase 25%.
2. Angka 1 pada rumus proporsi diganti dengan angka 100 pada rumus persentase.
100
p - P0
Matriks III.7 Uji hipotesis 1 proporsi ( H 0 : P = P0 ) : Zuji =
SE ( p )
SE (p)
Data SEˆ ( p )
[ P0 dan Q0 selalu diketahui dari H 0 ]
P0 Q0 P0 (1 − P0 )
Proporsi: 0 < P < 1 = −
n n
P0 Q0 P0 (100 − P0 )
Persentase: 0 < P < 100 = −
n n
p1 - p2
Matriks III.8 Uji hipotesis 2 proporsi ( H 0 : P1 = P2 ) : Zuji =
SE ( p1 - p2 )
SE ( p1 - p2 ) SEˆ ( p1 - p2 )
Data
[ P1 dan P2 diketahui] [ P1 dan P2 tak diketahui]
P1 (1 − P1 ) P2 (1 − P2 ) p1 (1 − p1 ) p2 (1 − p2 )
Proporsi: 0 < P < 1 + +
n n n n
P1 (100 − P1 ) P2 (100 − P2 ) p1 (100 − p1 ) p2 (100 − p2 )
Persentase: 0 < P < 100 + +
n n n n
101
LAMPIRAN 3D: RANDOMISASI LENGKAP DAN RANDOMISASI
BLOK
Randomisasi lengkap
Contoh III.1:
102
nomor terpilih untuk kelompok A dari tabel
Tabel III.1 Nomor-nomor
bilangan acak dengan randomisasi lengkap
103
Randomisasi Blok
Pada studi eksperimental dengan 2 kelompok perlakuan, umumnya
digunakan ukuran sampel yang sama pada kedua kelompok, yaitu n A = nB = n.
Ukuran kelompok yang sama (balans; seimbang) ini akan menghasilkan
kekuatan uji (power) maksimum sebagaimana yang dispesifikasikan pada
perhitungan ukuran sampel minimum yang dibutuhkan untuk uji hipotesis.
Dalam keadaan tertentu, walaupun ukuran sampel kelompok menurut
rancangan studi adalah balans, ketidakseimbangan ukuran yang akan
menurunkan kekuatan uji dapat terjadi misalnya karena:
- Perekrutan subjek berakhir sebelum ukuran sampel yang direncanakan
tercapai (waktu penelitian berakhir, keterbatasan sumber daya, dan
sebagainya). Pada contoh 1 di atas, seandainya anggota sampel yang
diperoleh hanya 60, kelompok A akan terdiri atas 28 subjek dan
kelompok B terdiri atas 32 subjek.
Contoh III.2:
104
Penggunaan randomisasi blok, misalnya dengan blok berukuran 8
menjamin agar perbedaan ukuran antar kelompok tidak lebih daripdaripada 4
(setengah ukuran blok). Untuk pelaksanaan
pelaksanaan, 64 anggota sampel yang akan
direkrut
rekrut dibagi atas 8 blok berukuran 8.
Dengan titik awal yang sama pada tabel bilangan acak seperti pada
contoh 1 (lihat tabel III.3).
105
Tabel III.4. Alokasi akhir 64 anggota sampel dengan randomisasi blok
berukuran 8 untuk kelompok perlakuan A dan B
106
LATIHAN 3
Bagian Pertama
2. Pada uji kesamaan rerata 2 sampel yang berasal dari populasi normal,
masing-masing dengan berukuran sampel n1 < 30 dan n2 < 30, serta
diasumsikan memiliki variansi yang sama, estimator bagi variansi
populasi bersama (common population variance) adalah variansi
sampel gabungan ( s 2 pooled ) , yang dihitung sebagai:
A. Rerata hitung (arithmetic mean) kedua variansi sampel.
B. Rerata geometrik (geometric mean) kedua variansi sampel
C. Rerata tertimbang (weighted mean) kedua variansi sampel
dengan ukuran sampel masing-masing sebagai penimbang.
D. Rerata tertimbang (weighted mean) kedua variansi sampel
dengan derajat bebas masing-masing sampel sebagai
penimbang.
107
4. Untuk mempelajari pengaruh lingkungan terhadap perilaku
dikumpulkan anggota sampel berupa 10 pasangan anak kembar
homozigot yang anggota pasangannya masing-masing dibesarkan
secara terpisah dalam lingkungan perkotaan dan pedesaan. Untuk
membandingkan hasil tes perilaku anggota pasangan kembar yang
dibesarkan lingkungan perkotaan dan pedesaan digunakan analisis
statistik:
A. Uji t independen dengan variansi sama
B. Uji t independen dengan variansi tidak sama
C. Uji t berpasangan
D. Uji Z
108
7. Uji statistik yang relevan untuk menilai ada tidaknya perbedaan
rerata nilai IQ mahasiswa Fakultas Ekonomi Universitas Gunadarma
adalah:
A. Uji Z C. Uji t berpasangan
B. Uji t independen D. Semuanya salah
109
13. Interval konfidensi 95% untuk rerata selisih nilai tes adalah:
A. [ −0.14; 2.81] C. [ −0.43;3.09]
B. [ −0.34;3.00] D. [ −0.74;3.40]
14. Diperoleh sampel acak terdiri dari 500 orang pria dan 500 orang
wanita. Pada kelompok pria didapatkan 12 orang buta warna,
sedangkan pada kelompok wanita hanya 5 orang yang buta warna.
Hitunglah interval konfidensi 90% selisih proporsi penderita buta
warna pria dan wanita ( P1 menyatakan persentase buta pada pria dan
P2 pada wanita).
A. −0.70% < P1 − P2 < 3.50% C. −0.19% < P1 − P2 < 2.99%
B. −0.20% < P1 − P2 < 3.00% D. −0.06% < P1 − P2 < 2.74%
Bagian Kedua
1. Uji statistik yang relevan untuk menilai ada tidak perbedaan antara
gaji guru pria dan wanita adalah:
A. Uji Z C. Uji t berpasangan
B. Uji t independen D. Semuanya salah
110
4. Dengan tingkat signifikansi α = 0.05, daerah kritis (daerah
penolakan hipotesis nol ) untuk uji 2-sisi adalah:
A. Z > 1.28 C. Z > 1.96
B. Z > 1.64 D. Z > 2.57
2 2
6. Dengan asumsi σ 1 ≠ σ 2 , interval konfidensi 95% selisih rerata gaji
guru pria dan wanita adalah:
A Rp. 5.136 < µ < Rp. 20.420 C. Rp. 7.902 < µ < Rp. 17.654
B. Rp. 6.950 < µ < Rp. 18.606 D. Rp. 8.972 < µ < Rp. 16.484
111
9. s 2 pooled adalah:
A. 8.36 C. 69.91
B. 63.97 D. 76.39
11. Interval konfidensi 95% selisih rerata pertambahan berat badan tikus
antara yang diberikan diet A dengan yang diberikan diet B (dalam
gram) adalah:
A. [ −2.61;8.41] C. [ −3.66;9.46]
B. [ −2.84;8.64] D. [ −4.02;9.82]
Untuk soal No. 12 s.d. 17:
Untuk membandingkan efektivitas 2 metode pengajaran Statistika,
100 orang diajar dengan cara lama dan 150 orang dengan cara baru. Di
antara peserta cara lama, yang lulus adalah 63 orang, sedangkan peserta cara
baru yang lulus berjumlah 107 orang.
12. Hipotesis nol yang perlu diuji untuk membuktikan efektivitas metode
pengajaran dengan cara baru itu ialah ( P1 menyatakan proporsi yang
lulus dengan cara baru dan P2 dengan cara lama):
A. H 0 : P1 > P2 C. H 0 : P1 = P2
B. H 0 : P1 ≥ P2 D. H 0 : P1 ≤ P2
112
15. Statistik penguji untuk uji hipotesis tersebut adalah:
A. Z uji = 1.37 C. Z uji = 2.24
B. Z uji = 1.58 D. Z uji = 4.33
17. Interval konfidensi 95% selisih proporsi yang lulus di antara kedua
metode adalah:
A. −0.073 < P1 − P2 < 0.240 C. −0.017 < P1 − P2 < 0.183
B. −0.036 < P1 − P2 < 0.202 D. −0.005 < P1 − P2 < 0.161
Bagian Ketiga
Perkotaan Pedesaan
Ukuran sampel 100 90
Rerata 81.2 76.4
SD 7.6 8.2
113
1. Uji statistik yang relevan untuk menilai ada tidaknya perbedaan
keterampilan bermain musik siswa perkotaan dan pedesaan adalah:
A. Uji Z C. Uji t berpasangan
B. Uji t independen D. Semuanya salah
i 1 2 3 4 5 6
Y1i 12.2 11.3 14.7 11.4 11.5 12.7
Y2i 13.0 13.4 16.0 13.6 14.0 13.8
114
7. Hipotesis nol yang sesuai untuk uji di atas adalah:
A. µ 2 ≤ µ1
B. µ2 − µ1 ≤ 0
C. δ ≤ 0; dengan δˆ = d dan d i = Y2i − Y1i
D. A) dan B) benar.
115
BAB 4
ANALISIS REGRESI LINEAR 1
4.1 DATA BIVARIAT
Contoh 4.1:
Pada pengambilan sampel acak 48 orang mahasiswa Fakultas Ilmu
Komputer Universitas Gunadarma, 2002, diperoleh data tinggi dan berat
badan mereka, yang disajikan dalam bentuk dataset (database; basis data)
seperti terlihat pada tabel 4.1 di bawah ini.
116
Tabel 4.1. Tinggi dan berat badan 48 orang mahasiswa Fakultas Ilmu
Komputer Universitas Gunadarma, 2002
No TB BB No TB BB No TB BB No TB BB
1 174 84 13 171 65 25 176 70 37 160 52
2 159 55 14 177 95 26 158 60 38 155 48
3 156 72 15 168 50 27 157 55 39 172 49
4 154 44 16 151 44 28 158 50 40 167 59
5 159 64 17 154 47 29 175 89 41 163 47
6 155 53 18 160 49 30 173 70 42 176 54
7 160 45 19 164 42 31 155 50 43 156 53
8 160 61 20 171 55 32 161 51 44 160 50
9 155 64 21 171 54 33 169 80 45 168 71
10 158 62 22 173 80 34 145 43 46 159 46
11 174 53 23 171 68 35 154 45 47 171 54
12 162 54 24 170 64 36 158 51 48 170 55
TB: tinggi badan (dalam cm); BB: berat badan (dalam kg)
Contoh 4.2:
Lihat kembali data tinggi dan berat badan 48 orang mahasiswa
Gunadarma pada contoh 4.1. Kategorisasi data bivariat tersebut
menghasilkan distribusi frekuensi bivariat dalam bentuk tabel silang 3×3
seperti terlihat pada tabel 4.2 di bawah ini.
117
Tabel 4.2. Distribusi mahasiswa menurut tinggi dan berat badan ,
Fakultas Ilmu Komputer, Universitas Gunadarma , 2002 (N = 48)
Contoh 4.3:
Contoh lain untuk distribusi frekuensi bivariat tampak pada tabel 4.3,
yang menunjukkan distribusi hipotetis karyawan sebuah perusahaan menurut
lama masa kerja dan besar gaji bulanannya.
118
4.2. ANALISIS KORELASI
Diagram Tebar
Analisis korelasi adalah analisis statistik yang ditujukan untuk
mengukur keeratan hubungan antara dua variabel yang terikat dalam
struktur data bivariat. Dua variabel demikian dapat disajikan secara grafik
dengan ‘diagram tebar’ (scatter diagram), dengan tiap titik menyatakan satu
pasangan nilai, yaitu nilai pada sumbu X (merepresentasikan variabel
pertama) dan nilai pada sumbu Y (merepresentasikan variabel kedua).
Manfaat diagram tebar adalah untuk memperkirakan besar (tingkat
keeratan) dan arah hubungan antar dua variabel tersebut. Besar dan dua arah
hubungan itu dinyatakan secara kuantitatif dengan koefisien korelasi
(sampel) r:
1) Arah hubungan:
Hubungan positif ( r > 0 ) : jika X membesar, maka Y juga
membesar.
Hubungan negatif ( r < 0 ) : jika X membesar, maka Y mengecil,
dan sebaliknya.
2) Besar hubungan:
−1 ≤ r ≤ 1 (4.1)
Hubungan kuat: r mendekati 1
Hubungan lemah: r mendekati 0
Perhatikan bahwa:
- Perhitungan korelasi dapat dilakukan dengan dan tanpa melalui analisis
regresi
- Tingkat korelasi yang kuat (‘bermakna’ secara statistik) belum tentu
menunjukkan hubungan kausal (sebab-akibat)
119
Diagram 4.1. Diagram tebar beberapa contoh data bivariat dengan
berbagai niali korelasi
120
Koefisien korelasi r bernilai + 1 jika:
a. Setiap titik pada diagram tebar, yaitu tiap pasangan nilai ( X i ; Yi )
terletak pada satu garis lurus, yaitu garis regresi Yˆ = b0 + b1 X dengan
b1 > 0.
b. Garis lurus tersebut membentuk sudut lancip dengan sumbu horizontal
X : 00 < ϕ < 900 dengan b1 = tg ϕ
Rumus definisi:
r=
∑( X i − X )(Yi − Y )
(4.2)
∑ ( X i − X )2 ∑ (Yi − Y )
2
Rumus operasional:
∑X Y − ∑ n∑
( X )( Y ) i i
i i
r= (4.3)
(∑ X ) (∑Y )
2
2
∑ ∑ Y −
2 i 2 i
X − 1 1
n n
121
∑ X i ∑ Yi
S xy = ∑ ( X i − X )(Yi − Y ) = ∑ X i Yi − i i
(4.4.c)
i i n
serta S x dan S y :
∑i ( X i − X )
2
S x = S xx = (4.5.a)
∑i (Yi − Y )
2
S y = S yy = (4.5.b)
2 2
Siswa Xi Yi ( Xi − X ) ( Xi − X ) (Yi − Y ) (Yi − Y ) ( X i − X )(Yi − Y )
A 90 94 10 100 17 289 170
B 82 66 2 4 −11 121 −22
C 66 69 −14 196 −8 64 112
D 70 86 −10 100 9 81 −90
E 95 72 15 225 −5 25 −75
F 97 88 17 289 11 121 187
G 60 64 −20 400 −13 169 260
Jumlah 560 539 1,314 870 542
122
560 539
X= = 80 Y= = 77
7 7
r=
∑ ( X i − X )(Yi − Y )
( X − X )2 (Y − Y )2
∑ i ∑ i
542
= = 0.51
(1,314 )(870 )
Siswa Xi Yi X i2 Yi 2 X i Yi
A 90 94 8,100 8,836 8,460
B 82 66 6,724 4,356 5,412
C 66 69 4,356 4,761 4,554
D 70 86 4,900 7,396 6,020
E 95 72 9,025 5,184 6,840
F 97 88 9,409 7,744 8,536
G 60 64 3,600 4,096 3,840
Jumlah 560 539 46,114 42,373 43,662
X i : Nilai tes 1; Yi : Nilai tes 2
( ∑ X )( ∑ Y )
∑X Y −
i i
i i
r= n
Xi ) Yi )
∑ ∑
2 2
∑ X i −
2 ( ∑ Yi −2 (
n n
43, 662 −
( 560 )( 539 )
= 7 = 0.51
560
2
5392
46,114 − 7 42,373 − 7
atau:
123
2
∑ Xi 2
S xx = ∑ X i 2 − i = 46,114 − 560 = 1,314
i n 7
2
2
∑ Yi 2
S yy = ∑ Yi 2 − i = 42,373 − 539 = 870
i n 7
∑ X 1 ∑ Yi
S xy = ∑ X i Yi − i i = 43, 662 − ( 560 )( 539 ) = 542
i n 7
S xy 542
r= = = 0.51
Sx Sy (1,314 )( 870 )
124
Diagram 4.2. Contoh diagram tebar data bivariat dan garis regresinya
dengan ε i = Yi − Yˆi
dengan ei = Yi − Yˆi
125
Persamaan garis regresi juga berlaku bagi pasangan nilai rerata X
dan rerata Y :
Y = b0 + b1 X (4.9)
Asumsi yang harus dipenuhi pada model regresi linear ini antara lain
yaitu:
Nilai-nilai Yi independen satu sama lain (asumsi independensi).
Himpunan nilai-nilai Yi untuk tiap nilai X i tertentu [distribusi (Y | X)]
berdistribusi normal dengan variansi yang sama (asumsi
homoskedastitas; lihat diagram 4.3).
b1 =
S xy
=
∑ ( X − X )(Y − Y )
i i
(4.10)
∑( X − X )
2
S xx i
126
b1 = ∑ X iYi −
( ∑ X )( ∑ Y )
i i
n (4.11)
(∑ X )
2
∑X 2 i
1 −
n
dengan:
b0 = Y − b1 X (4.9.a)
Contoh 4.6:
Misalkan dimiliki data hipotetis bagi 8 orang tenaga penjual
(salesman), yang menyatakan lama bekerja sebagai tenaga penjual dalam
tahun dan jumlah penjualan mingguannya dalam ribuan rupiah. Misalkan
hubungan antara lama bekerja (variabel X ) dan jumlah penjualan (variabel
Y ) dinyatakan dalam model regresi linear:
Yi = β0 + β1 X i + ε i
Estimator β0 dan β1 adalah b0 dan b1 , yang perhitungannya
disajikan dengan menggunakan tabel 4.6 di bawah ini.
Penjual Xi Yi X i Yi X i2 Yi 2
A 6 90 540 36 8,100
B 5 60 300 25 3,600
C 3 40 120 9 1,600
D 1 30 30 1 900
E 4 30 120 16 900
F 3 50 150 9 2,500
G 6 80 480 36 6,400
H 2 20 40 4 400
Jumlah 30 400 1,780 136 24,400
Xi : Lama berjualan (dalam tahun)
Yi : Jumlah penjualan (dalam ribuan rupiah)
30 400
X= = 3.75 Y= = 50
8 8
127
2
∑ Xi 2
S XX = ∑ Xi2 − i = 136 − 30 = 23.5
i n 8
∑ X i ∑ Yi
S xy = ∑ X iYi − i i = 1, 780 − ( 30 )( 400 ) = 280
i n 8
S xy 280
b1 = = = 11.91
S xx 23.5
b0 = Y − b1 X = 50 − (11.91)( 3.75 ) = 5.32
∑ (Y − Y )
2
b1 i Sy
= = (4.12)
∑( X − X )
2
r i
Sx
(Y − Y ) = (Yˆ − Y ) + (Y
i i i
2
− Yˆi )
128
Diagram 4.4. Dasar Penguraian variansi pada model regresi linear
∑ (Y − Y )
2 2 2
i = ∑ (Yˆ − Y )
i + ∑ (Y − Yˆ )
i i
Rumus definisi:
∑ (Y − Y )
2
JKT = S yy = i (4.14)
2
∑ ( X i − X )(Yi − Y )
2
JKR = b1 . S yy =
( S xy ) = (4.15)
∑( Xi − X )
2
S xx
Rumus operasional:
2
∑ Yi
= ∑Yi −
2 i
JKT = S yy ; db = n – 1 (4.16)
i n
129
2
2
∑ X iYi −
∑ X i ∑ Yi
JKR =
( S xy ) =
n ; db = 1 (4.17)
(∑ Xi )
2
S xx
∑ X i2 − n
JKG = JKT – JKR ; db = n – 2 (4.13.a)
Kuadrat Rerata
Jumlah Kuadrat
Kuadrat Rerata ( mean square) =
derajat bebas
JKR
KRR = (4.18)
1
Contoh 4.7:
Lihat kembali data pada contoh 4.6:
S xx = 23.5 S xy = 280
2
∑ Yi 400 2
S yy = ∑ Yi −
2 i = 24, 400 − = 4, 400
i n 8
JKT = S yy = 4, 400
2
JKR =
(S ) xy280 2
=
= 3, 336.17
S xx 2 23.5
280
atau JKR = b1 .S xy = ( 280 ) = 3,336.17
23.5
130
JKG = JKT − JKR = 4, 400 − 3,336.17 = 1.063.83
Koefisien Determinasi
Koefisien determinasi adalah proporsi variansi yang dapat dijelaskan
oleh model regresi.
JKR JKT − JKG JKG
R2 = = = 1− (4.20)
JKT JKT JKT
2 2
R2 =
∑ (Yˆ − Y ) =1−
∑ (Yi − Yˆi ) (4.20.a)
∑ (Yi − Y ) ∑ (Yi − Y )
2 2
R 2
=
(S )
xy
=
n
(4.22)
X i ) Yi )
∑ ∑
2 2
Sxx S yy
∑ Xi −2 ( ∑ Yi −
2 (
n n
Contoh 4.8:
Lihat kembali data pada contoh 4.6 dan 4.7.
JKR = 3, 336.17 JKT = 4, 400
Koefisien determinasi adalah:
JKR 3,336.17
R2 = = = 0.76
JKT 4, 400
R= R2 = 0.76 = 0.87
131
280
= = 0.87
( 23.5 )( 4, 400 )
Tampak bahwa: R=r
Koefisien korelasi r juga dapat dihitung sebagai berikut:
b1 = 11.91 (contoh 4.6)
S xx = 23.5 (contoh 4.6)
S yy = JKT = 4, 400 (contoh 4.7)
Dengan menggunakan rumus:
∑ (Y − Y )
2
b1 i Sy
= =
∑( X − X )
2
r i
Sx
11.91 4, 400
diperoleh: =
r 23.5
r = 0.87
132
Hasil perhitungan disajikan dalam bentuk tabel ANOVA (analisis
variansi) seperti terlihat pada tabel 4.7 di bawah ini.
Sumber Fuji
JK db KR Ftabel
variansi
JKR
Regresi JKR 1 KRR =
1 KRR F1;
Fuji = ( n−2 );α
JKG KRG
Galat JKG n–2 KRG =
n−2
Total JKT n–1
Contoh 4.9:
Lihat kembali data penjualan pada contoh 4.6. Pada contoh 4.7 telah
dihitung nilai-nilai JKT, JKR, dan JKG-nya ( n = 8 ) :
JKT = 4, 400 JKR = 3, 336.17 JKG = 1, 063.83
Diperoleh:
JKR 3,336.17
KRR = = = 3,336.17
1 1
JKG 1,063.83
KRG = = = 177.30
n−2 6
Untuk uji hipotesis H 0 : β1 = 0 dengan uji F dan tingkat signifikansi
a = 0.05, disusun tabel analisis variansi berikut:
Sumber Fuji
JK db KR Ftabel
variansi
Regresi 3,336.17 1 3,336.17 3,336.17
Fuji = F1; 6; 0.05
Galat 1,063.83 6 177.30 177.30
= 5.99
= 18.82
Total 4,400 7
133
Nilai Fuji = 18.82 lebih besar daripada nilai titik kritis F(1;6;0.05) = 5.99,
sehingga H 0 : β1 = 0 ditolak pada tingkat signifikansi a = 0.05.
Distribusi F
Statistik penguji pada uji ANOVA untuk model regresi linear
berdistribusi F, yang cuplikan nilai-nilainya diperlihatkan pada tabel 4.9 di
bawah ini (tabel lengkap nilai kritis distribusi F terdapat pada Addendum C).
Distribusi F memiliki derajat bebas pembilang (numerator; baris teratas pada
tabel) dan derajat bebas penyebut (denominator; kolom terkiri pada tabel).
Bentuk distribusinya dapat berbeda-beda, tergantung pada derajat bebas
pembilang dan derajat bebas penyebut., tetapi nilai-nilai F seluruhnya adalah
positif (di sisi kanan sumbu vertikal), sehingga uji hipotesis dengan statistik
penguji yang berdistribusi F selalu adalah uji 1-ekor, namun merupakan uji
2-sisi.
134
Tabel 4.9. Cuplikan tabel F untuk α = 0.05 [α = P (F > F( n; d ; α ) ]
- Hipotesis: H 0 : β1 = 0 (4.26.a)
H1 : β1 ≠ 0 (4.26.b)
- Statistik pengujinya adalah:
b1 b
tuji = = 1 (4.27)
SEˆ ( b1 ) s S x
yang berdistribusi t dengan db ( n − 2 ) .
2
s2 =
JKG
=
∑ (Yi − Yˆi ) = KRG (4.28)
( n − 2) (n − 2)
- Daerah kritis (daerah penolakan) adalah:
t > t( n−2);α 2 (4.29)
135
Interval konfidensi (1 − a ) untuk β1 adalah:
b1 + t( n−2);α 2 . SEˆ ( b1 )
s
yaitu: b1 + t( n−2);α 2 . (4.30)
Sx
Contoh 4.10:
Lihat kembali data penjualan pada contoh 4.6. Dalam contoh tersebut
telah diperoleh estimasi persamaan regresi:
Yˆ = 5.32 +11.91X
Untuk menguji hipotesis H 0 : β1 = 0, statistik pengujinya adalah:
b1 b
tuji = = 1
SEˆ ( b1 ) s / Sx
yang berdistribusi t dengan db ( n − 2 ) .
JKG
s2 = = KRG = 177.30 S xx = 23.5
( n − 2)
s 177.30
SEˆ ( b1 ) = = = 2.747
Sx 23.5
b1 1191
tuji = = = 4.34
SEˆ ( b ) 2.747
1
136
Uji Hipotesis untuk Koefisien Korelasi r
- Hipotesis: H 0 : ρ = 0 (4.31.a)
H1 : ρ ≠ 0 (4.31.b)
- Statistik pengujinya adalah:
r
tuji = (4.32)
(1 − r ) ( n − 2 )
2
Contoh 4.11:
Lihat kembali data penjualan pada contoh 4.6. Pada contoh 4.8 telah
dihitung:
r = 0.87
Untuk menilai apakah koefisien korelasi ini berbeda secara bermakna
dengan nol (tidak ada korelasi), maka dilakukan uji hipotesis H 0 : ρ = 0 .
Statistik pengujinya adalah:
r 0.87
tuji = = = 4.34
( ) ( )
1 − r 2
/ n − 2 1 − ( )
0.87 2
/ 6
yang berdistribusi t dengan db ( n − 2 ) .
Dengan a = 0.05, daerah kritis adalah |t|> t( n − 2 );a/ 2 , yaitu |t|> t( 6;0.025) atau
|t|>2.447, sehingga H 0 ditolak.
137
LAMPIRAN 4A: UKURAN SAMPEL MINIMUM UNTUK
UJI HIPOTESIS PADA MODEL REGRESI DAN MODEL
KORELASI
Contoh IV.1:
Misalkan akan ditentukan ukuran sampel minimum yang dibutuhkan
untuk melakukan uji hipotesis terhadap model regresi linear
Yi = β0 + β1 X i + ε i . Misalkan pula dipilih tingkat signifikansi a = 0.05,
kekuatan uji (1 − β ) = 0.80, dan diketahui dari penelitian terdahulu bahwa
SD ( X ) = 1. Dengan memasukkan nilai-nilai spesifikasi ini pada progam
komputer PASS 2000, diperoleh ukuran sampel minimum yang dibutuhkan
pada berbagai nilai minimum koefisien regresi β1 yang diharapkan untuk
dideteksi serta berbagai tingkat korelasi antara variabel X dan Y (tabel IV.1).
β1
ρ
1 3 5 7 9
0.2 191 191 191 191 191
0.4 44 44 44 44 44
0.6 17 17 17 17 17
0.8 7 7 7 7 7
*) α = 0.05, (1 – β) = 0.80, dan SD (X) = 1
138
Ukuran Sampel untuk Model Korelasi
Pada uji hipotesis H 0 : ρ = 0 vs H1 : ρ > 0 , misalkan besar korelasi
minimum yang diharapkan untuk dideteksi adalah R, sehingga untuk
perhitungan ukuran sampel minimum yang dibutuhkan, hipotesisnya dapat
dituliskan sebagai H 0 : ρ = ρ0 = 0 dan H A : ρ = ρ1 = R .
Transformasi koefisien korelasi sampel r berdistribusi normal
standar:
1+ r
z = 0.5 In
1− r
dengan standard error:
1
SE ( z ) =
n −3
Misalkan c menyatakan titik kritis pada uji hipotesisis, dan
diasumsikan bahwa standard error kedua distribusi sampling menurut H 0
dan H A adalah sama, maka dengan merujuk pada distribusi sampling H 0
diperoleh:
1
c = 0 + Zα
n−3
sedangkan dengam merujuk pada distribusi H A diperoleh:
1+ R 1
c = 0.5 ln − Zβ
1− R n−3
1 1+ R 1
Selanjutnya: 0 + Z α = 0.5 ln − Zβ
n−3 1− R n−3
1+ R
0.5ln
1 1− R
=
n−3 Zα + Z β
139
LAMPIRAN 4B: CONTOH ANALISIS REGRESI LINEAR
SEDERHANA DENGAN PROGAM KOMPUTER
Regression
Variables Entered/Removed(b)
Variables Variables
Model Entered Removed Method
1 USIA(a) . Enter
a All requested variables entered
b Dependent Variable: TENSI
Model Summary
ANOVA(b)
Sum of
Model Squares df Mean Square F Sig.
1 Regression 368.825 1 368.825 .556 .497(a)
Residual 2652.009 4 663.002
Total 3020.833 5
a Predictors: (Constant), USIA
b Dependent Variable: TENSI
Coefficient(a)
Unstandardized Standardized
Model Coefficients Coefficients t Sig.
B Std. Error Beta
1 (Constant) 92.897 62.920 1.476 .214
USIA .887 1.189 .349 .746 .497
a Dependent Variable: TENSI
140
MINITAB RELEASE 14
Analysis of Variance
Source DF SS MS F P
Regression 1 368.8 368.8 0.56 0.497
Residual Error 4 2652.0 663.0
Total 5 3020.8
141
------+-----------------------------------------------------
TENSI | Coef. Std.Err. t P>|t| [95%Conf.Interval]
------|-----------------------------------------------------
USIA | .8869534 1.189182 0.75 0.497 -2.414744 4.188651
_cons | 92.89726 62.91996 1.48 0.214 -81.79656 267.5911
------+-----------------------------------------------------
142
LATIHAN 4
Bagian Pertama
∑( X
2
1. i −X) =
A. 8 C. 136
B. 27 D. 328
∑ (Y − Y )
2
2. i =
A. 8 C. 136
B. 27 D. 328
∑( X ∑ (Y − Y )
2 2
3. i −X) i =
A. 8 C. 136
B. 27 D. 328
143
7. Jika r menyatakan koefisien Pearson antara variabel X dan Y dan
diketahui r < 0, maka:
A. Untuk nilai X yang besar, nilai Y juga cenderung besar.
B. Untuk nilai X yang besar, nilai Y cenderung kecil.
C. Untuk nilai X yang kecil, nilai Y cenderung besar
D. B) dan C) benar.
11.
144
Kedua gambar di atas menunjukkan diagram tebar dan garis regresi 2
sampel data bivariat, masing-masing dengan estimasi garis regresi
Yˆ = a1 + b1 X dan koefisien korelasi r1 serta garis regresi Yˆ = a2 + b2 X
dan koefisien korelasi r2 . Jika kedua diagram dibuat dengan skala
pengukuran yang sama, maka:
A. b1 > b2 dan r1 > r2 C. b1 < b2 dan r1 > r2
B. b1 > b2 dan r1 < r2 D. b1 < b2 dan r1 < r2
145
16. Koefisien determinasi pada analisis regresi linear menyatakan:
A. Proporsi variansi variabel dependen yang dapat ‘dijelaskan’
oleh model regresi.
B. Proporsi variansi variabel dependen yang tidak dapat
‘dijelaskan’ oleh model regresi.
C. Proporsi variansi variabel independen yang dapat ‘dijelaskan’
oleh model regresi.
D. Proporsi variansi variabel independen yang tidak dapat
‘dijelaskan’ oleh model regresi.
18. Pada model regresi linear sederhana, nilai kuadrat rerata regresinya
(regression mean square):
A. Lebih besar daripada nilai jumlah kuadrat regresi (regression
sum of squares)
B. Sama dengan nilai jumlah kuadrat regresi.
C. Lebih kecil daripada nilai jumlah kuadrat regresi.
D. Semuanya mungkin benar.
Bagian Kedua
Pilihlah satu jawaban yang paling benar!
Dimiliki data usia (dalam tahun) dan tekanan darah sistolik (dalam
mm Hg) kelompok subjek yang terdiri dari enam orang dewasa sebagai
berikut:
Subjek (i) 1 2 3 4 5 6
Usia ( X i ) 47 52 37 53 65 59
Tekanan darah (Yi ) 135 110 140 120 150 180
146
2. Nilai harapan tekanan darah sistolik mereka (dalam mm Hg) adalah:
A. 122 C. 139
B. 128 D. 145
4. Estimasi β1 adalah:
A. 0.887 C. 36.453
B. 12.757 D. 92.897
147
11. ( )
Estimasi standard error β1 [ SEˆ βˆ1 ] adalah:
A. KRG / S x = 30.62 C. KRG / S x = 1.19
B. KRG / S xx = 1.41 D. KRG / S xx = 0.05
13. Dengan tingkat signifikansi α = 0.05, nilai kritis bagi uji hipotesis
pada soal No. 12 di atas adalah:
A. t = 2.776 C. Keduanya benar.
B. F = 7.709 D. Keduanya salah.
Bagian Ketiga
Pilihlah satu jawaban yang paling benar!
Data berikut menyatakan nilai tes keterampilan (X) dan produktivitas
kerja per minggu (Y) 8 orang karyawan.
Siswa (i) 1 2 3 4 5 6 7 8
Tes keterampilan ( X i ) 6 9 3 8 7 5 8 10
Produktivitas kerja (Yi ) 30 49 18 42 39 25 41 52
148
1. Jika garis regresi produktivitas kerja terhadap nilai tes keterampilan
dinyatakan sebagai Yˆ = β 0 + β1 X dengan variabel Y menyatakan
produktivitas kerja dan variabel X menyatakan nilai tes keterampilan,
maka estimasi β 0 adalah:
A. 0.982 C. 1.028
B. 0.991 D. 5.139
2. Estimasi β1 adalah:
A. 0.982 C. 1.028
B. 0.991 D. 5.139
3. Koefisien korelasi antara nilai tes masuk dengan nilai ujian akhir
siswa adalah:
A. 0.982 C. 1.028
B. 0.991 D. 5.139
149
9. ( )
Estimasi standard error β1 [ SEˆ βˆ1 ] adalah:
A. KRG / S x = 0.48 C. KRG / S x = 0.28
B. KRG / S xx = 0.08 D. KRG / S xx = 0.05
12. Berdasarkan nilai statistik penguji, tersebut maka pada uji F terhadap
H 0 : β1 = 0 disimpulkan bahwa H 0 :
A. Ditolak pada α = 0.01 dan pada α = 0.05
B. Ditolak pada α = 0.01; tidak ditolak pada α = 0.05
C. Tidak ditolak pada α = 0.01; ditolak pada α = 0.05
D. Tidak ditolak pada α = 0.01 dan pada α = 0.05
150
BAB 5
ANALISIS REGRESI LINEAR II
Contoh 5.1:
Contoh model dengan 2 variabel independen yaitu:
Yi = β 0 + β1 X1i + β 2 X 2i + ε i
Persamaan garis regresi-nya adalah:
Yˆi = β 0 + β1 X1i + β 2 X 2i
Catatan:
Dalam aljabar matriks diperhitungkan adanya p variabel independen,
yaitu dengan menggunakan variabel X 0 yang nilainya selalu sama dengan 1,
sehingga model yang digunakan dapat dituliskan sebagai:
151
Yi = β 0 X 0 + β1 X1i + . . . + β p −1 X + εi
( p −1);i
152
b. Regresi linear ganda dengan 2 variabel independen (p = 3)
Misalkan dimiliki estimasi model dan garis regresi:
Yi = b0 + b1 X1i + b2 X 2i + ei (5.5.a)
n b0 + b1 ∑ X1i + b2 ∑ X 2i − ∑ Yi = 0 (I)
∂Q
= 2 ∑ (Yi − b0 − b1 X1i − b2 X 2i )( − X1i )
∂b1
= −2 ∑ ( X1i )(Yi − b0 − b1 X1i − b2 X 2i ) = 0
153
c. Regresi linear ganda dengan 3 variabel independen (p = 4)
Misalkan dimiliki estimasi model dan garis regresi:
Yi = b0 + b1 X1i + b2 X 2i + b3 X 3i + ei (5.7.a)
Metode Eliminasi
Contoh 5.2:
Misalkan dimiliki data seperti pada tabel 5.1 berikut:
Tabel 5.1. Contoh data untuk peragaan metode eliminasi pada analisis
regresi linear ganda
i 1 2 3 4 5 6
Yi 26 31 26 38 18 27
X1i 2 6 6 11 1 1
X 2i 5 5 8 5 12 6
154
i 7 8 9 10 11 12
Yi 26 26 32 25 40 26
X1i 4 6 4 4 10 2
X 2i 7 9 4 8 5 3
n = 12 ∑ X1i = 57 ∑ X 2i = 77
∑ Yi = 341 2
∑ X 1i = 387
2
∑ X 2i = 563
∑ X1i X 2i = 347 ∑ X1iYi = 1,797 ∑ X 2iYi = 2,083
Dengan menyelesaikan:
n b0 + b1 ∑ X1i + b2 ∑ X 2i − ∑Y = 0 i (I)
b0 ∑ X1i + b1 ∑ X 1i2 + b2 ∑ X1i X 2i − ∑ X1iYi = 0 (II)
b0 ∑ X 2i + b1 ∑ X1i X 2i + b2 ∑ X 2i2 − ∑ X 2iYi = 0 (III)
yaitu:
12 b0 + 57 b1 + 77 b2 − 341 = 0 (I)
57 b0 + 387 b1 + 347 b2 − 1,797 = 0 (II)
77 b0 + 947 b1 + 563 b2 − 2,083 = 0 (III)
Diperoleh penyelesaian:
(I) ×19 ⇒ 228 b0 + 1,083 b1 + 1,463 b2 − 6,479 = 0
(II) × 4 ⇒ 228 b0 + 1,548 b1 + 1,388 b2 − 7,188 = 0
−465 b1 + 75 b2 + 709 = 0 (IV)
(I) ×77 ⇒ 924 b0 + 4,389 b1 + 5,929 b2 − 26,257 = 0
(III) × 12 ⇒ 924 b0 + 4,164 b1 + 6,756 b2 − 24,996 = 0
225 b1 − 827 b2 − 1,261 = 0 (V)
(IV) × −15 ⇒ 6,975 b1 − 1,125 b2 − 10,635 = 0
(V) × 31 ⇒ 6,975 b1 −25,637 b2 −39,091 = 0
24,512 b2 +28,456 = 0
b2 = −1.161
(V) ⇒ 225 b1 − (827)(−1.161) – 1.261 = 0
225 b1 + 960.065 – 1.261 = 0
b1 = 1.337
155
(I) ⇒ 12 b0 + (57)(1.337) + (77)(−1.161) − 341 = 0
12 b0 + 76.237 – 89.389 − 341 = 0
b0 = 29.513
Estimasi persamaan garis regresi adalah:
Yˆi = 29.513 + 1.337 X1i − 1.161 X 2i
156
db = n – p
3. Jumlah Kuadrat Regresi:
JKR = JKT − JKG ; db = p – 1 (5.10)
B. Uji hipotesis
Untuk menguji hipotesis H 0 : β1 = β 2 = . . . = β p −1 = 0 digunakan
uji F dengan statistik penguji:
JKR ( p − 1)
Fuji = (5.11)
JKG ( n − p )
βˆ j
tuji = (5.12)
( )
SEˆ βˆ j
Contoh 5.3:
Lihat kembali data pada contoh 5.2. Perhitungan jumlah kuadrat dan
kuadrat rerata-nya adalah:
157
2
2 ( ∑ Yi )
JKT = ∑ Yi −
n
3412
= 10,087 − = 396.917
12
JKG = ∑ Yi 2 − b0 ∑ Yi − b1 ∑ X1iYi − b2 ∑ X 2iYi
= 10,087 – (29.513)(341) – (1.337)(1,797) – (−1.161)(2,083)
= 37.885
JKR = JKT – JKG
= 396.917 – 37.885 = 359.061
JKR
dan: KRR =
p −1
359.061
= = 179.531
2
JKG
KRG =
n− p
37.855
= = 4.206
9
Tabel ANOVA-nya dan uji F untuk hipotesis H 0 : β1 = β 2 = 0
dengan tingkat signifikansi α = 0.05 diperlihatkan pada tabel 5.3.
Sumber Fuji
JK db KR Ftabel
variasi
179.531 F( 2,9;0.05) =
Regresi 359.061 2 179.531 Fuji =
4.206
Galat 37.855 9 4.206 = 42.68 4.26
Total 396.917 11
158
Bagan 5.2. Contoh keluaran program komputer untuk analisis regresi
linear ganda: tabel ANOVA
Source DF SS MS F P
Regression 2 359.06 179.53 42.68 0.000
Residual Error 9 37.86 4.21
Total 11 396.92
Source DF Seq SS
X1 1 270.26
X2 1 88.80
Contoh 5.4:
Lihat kembali data pada contoh 5.2. Pada contoh 5.3 telah dihitung
nilai-nilai jumlah kuadrat-nya:
JKR = 359.061 JKT =396.917
JKR
R2 =
JKT
359.061
= = 0.905
396.917
(pada keluaran program komputer di bagian akhir contoh 5.2, nilai koefisien
determinasi R 2 adalah 90.5%)
159
5.2 VARIABEL INDIKATOR
160
b. Dengan empat kategori
Variabel indikator
Kategori X1 X2 X3
I 0 0 0
II 1 0 0
III 1 1 0
IV 1 1 1
Contoh 5.5:
Dimiliki data skala L (Lie; Kebohongan) MMPI-2, usia, jenis
kelamin, dan fakultas 8 orang mahasiswa Gunadarma seperti terlihat pada
tabel 5.5. Dari data tersebut hendak diestimasi model regresi linear dengan
skala L sebagai variabel dependen; serta usia, jenis kelamin, dan fakultas
sebagai variabel independen.
161
Tabel 5.6. Representasi fakultas mahasiswa Gunadarma dalam bentuk
variabel indikator
Variabel indikator
Fakultas X3 X4 X5
Ilmu Komputer 0 0 0
Ekonomi 1 0 0
Teknik Industri 1 1 0
Psikologi 1 1 1
162
- Korelasi antara variabel independen Y dengan prediksi Y yang
dihasilkan oleh model regresi ganda dengan (p – 1) variabel
independen, yaitu Y dengan Yˆ .
rYYˆ = ry 1, 2, . . . ,( p −1) =
(
∑ (Yi − Y ) Yˆi − Yˆ ) (5.14.a)
2 2
∑ (Yi − Y ) ∑ Yi − Y
ˆ ˆ
( )
∑ YiYˆi −
∑ Yi ∑ Yˆi ( )
atau: rYYˆ = n (5.14.b)
2 ∑ Yˆi ( ) 2
2 ( ∑ Yi )
∑ Yi − ∑ Yˆi 2 −
n n
Contoh 5.6:
Lihat kembali data pada contoh 5.2 dan estimasi persamaan garis
regresinya Yˆi = 29.513 + 1.337 X1i − 1.161 X 2i . Untuk menghitung koefisien
korelasi gandanya terlebih dahulu dihitung nilai-nilai prediksi Yˆ dengan i
menggunakan persamaan garis regresi estimasi tersebut dan hasilnya
diperlihatkan pada tabel 5.8. serta diagram 5.1.
i 7 8 9 10 11 12
Yi 26 26 32 25 40 26
Yˆ
i 26.74 27.09 30.22 25.58 37.08 28.70
163
Diagram 5.1. Diagram tebar variabel dependen Y dan nilai-nilai
prediksinya Yˆ
= 0.95112 = 0.905
Atau sebaliknya, koefisien korelasi ganda dapat dihitung sebagai akar positif
koefisien determinasi ganda. Pada contoh 5.4 telah dihitung nilai koefisien
determinasi ganda:
R 2 = 0.905
rYYˆ = R2
164
= 0.905 = 0.9511
165
Contoh 5.7:
Misalkan dari persamaan regresi Yˆi = b0 + b1 X1i + b2 X 2i + b3 X 3i
diketahui matriks korelasi Y, X1 , X 2 , dan X 3 :
Y X1 X2 X3
Y 1.00
X1 0.64 1.00
X2 0.51 0.27 1.00
X3 0.74 0.56 0.28 1.00
Maka:
ry1 − ry 2 . r12 r13 − r12 . r23
ry1 2 = r13 2 =
(1 − r ) (1 − r )
2
y2
2
12 (1 − r122 )(1 − r232 )
0.64 − ( 0.51)( 0.27 ) 0.56 − ( 0.27 )( 0.28 )
=
(1 − 0.51 )(1 − 0.27 )
2 2 =
(1 − 0.27 )(1 − 0.28 )
2 2
= 0.61 = 0.52
ry1 − ry 3 . r13 ry 3 − ry 2 . r23
ry13 = ry 3 2 =
(1 − r 23 ) (1 − r132 )
y (1 − r 22 ) (1 − r232 )
y
= 0.40 = 0.72
ry12 − ry 3 2 . r13 2
ry1 23 =
(1 − r )(1 − r )
2
y3 2
2
13 2
166
LAMPIRAN 5A: MODEL REGRESI LOGISTIK
P (Y )
logit P (Y ) = ln = β 0 + β1 X (5.17)
1 − P ( Y )
1
atau: P (Y ) = (5.17.a)
1 + exp − ( β 0 + β1 X )
P (Y )
logit P (Y ) = ln = β 0 + β1 X1 + . . . + β p −1 X p −1
1 − P ( Y )
1
atau: P (Y ) = (5.18.a)
(
1 + exp − β0 + β1 X1 + ... + β p −1 X p −1 )
167
Jika variabel dependen Y berskala politomi, digunakan model regresi
politomi yang dibedakan atas:
- Model regresi logistik multinomial: digunakan jika variabel dependen Y
berskala politomi nominal.
- Model regresi logistik ordinal: digunakan jika variabel dependen Y
berskala politomi ordinal.
Contoh V.I:
Dimiliki data nyeri kepala pada 218 orang mahasiswa Gunadarma
dengan variabel dependen NKTT (nyeri kepala ada / NKTT = 1; nyeri kepala
tidak ada / NKTT = 0). Sebagai variabel independen digunakan variabel
Usia (dalam tahun), Sex (jenis kelamin pria / Sex = 1; jenis kelamin wanita
/ Sex = 0), dan BMI (indeks massa tubuh; dalam kg/m2). Hasil pengolahan
data yang menggunakan model regresi logistik ganda dengan program Stata
8.0 diperlihatkan pada bagan V.1 di bawah ini.
168
Bagan V.I Contoh keluaran progam komputer untuk analisis regresi
logistik ganda dengan program komputer Stata 8.0
169
LATIHAN 5
Bagian Pertama
Pilihlah satu jawaban yang paling benar !
1. Estimasi koefisien regresi pada model regresi linear dilakukan
dengan:
A. Meminimumkan kuadrat jumlah residual
B. Meminimumkan jumlah kuadrat residual
C. Memaksimumkann kuadrat jumlah residual
D. Memaksimumkan jumlah kuadrat residual
170
6. Untuk menguji hipotesis H 0 : β1 = β 2 = ... = β p −1 = 0 pada model
regresi linear ganda digunakan:
A. Uji t C. Uji F
B. Uji Wald D. Semuanya benar
10. Korelasi antara variabel dependen pada model regresi linear ganda
dengan himpunan keseluruhan variabel independen yang ada dalam
model secara bersama dinamakan :
A. Koefisien korelasi biserial C. Koefisien korelasi ganda
B. Koefisien korelasi parsial D. Korelasi determinasi ganda
12. Korelasi antara variabel dependen pada model regresi linear ganda
dengan salah satu variabel independen dengan memperhitungkan
keberadaan variabel independen lain dalam model dinamakan:
A. Koefisien korelasi biserial C. Koefisien korelasi ganda
B. Koefisien korelasi parsial D. Korelasi determinasi ganda
171
Bagian Kedua
Model Summary
ANOVA(b)
Sum of
Model Squares df Mean Square F Sig.
1 Regression 17298.096 3 5766.032 60.963 .000(a)
Residual 7566.607 80 94.583
Total 24864.702 83
a Predictors: (Constant), PHP, POLA, LOCUS
b Dependent Variable: KEPUASAN
Coefficients(a)
Unstandardized Standardized
Model Coefficients Coefficients t Sig.
B Std. Error Beta
1 (Constant) -21.340 14.297 -1.493 .139
LOCUS 1.052 .278 .284 3.780 .000
POLA 1.909 .416 .298 4.588 .000
PHP 1.430 .219 .493 6.534 .000
a Dependent Variable: KEPUASAN
172
1. Jumlah karyawan yang menjadi anggota sampel adalah:
A. 60 orang C. 84 orang
B. 80 orang D. 85 orang
173
10. Dengan tingkat signifikansi α = 0.01, maka kesimpulan bagi uji
hipotesis H 0 : β1 = β 2 = β3 = 0 adalah:
A. H 0 ditolak
B. H 0 tidak ditolak
C. A) dan B) keduanya mungkin benar
D. Tak dapat dibuat kesimpulan
174
BAB 6
ANALISIS VARIANSI
Contoh 6.1:
Beberapa contoh analisis variansi 1-arah yaitu:
a. Misalkan dimiliki lima (k = 5) metode pengajaran dan sejumlah siswa,
maka terdapat lima populasi hipotetis, masing-masing terdiri atas siswa
yang diajar dengan satu metode pengajaran tertentu. Dengan ANOVA
hendak dibandingkan rerata nilai ujian kelima kelompok siswa.
b. Misalkan terdapat tiga (k = 3) kota, hendak dibandingkan rerata
penghasilan bulanan keluarga di tiga kota tersebut.
c. Misalkan dimiliki empat (k = 4) varietas padi, hendak dibandingkan
rerata produksi per ha sawah yang ditanami dengan empat varietas padi
tersebut.
175
Variansi Dalam-Kelompok dan Variansi Antar-Kelompok
Misalkan dimiliki tiga kelompok data Y1 , Y2 , dan Y3 , ketiganya
berasal dari populasi normal dengan rerata µ1 , µ2 , dan µ3 dan variansi yang
sama σ 2 (diasumsikan σ 12 = σ 22 = σ 32 = σ 2 ). Misalkan pula hendak diuji
apakah ketiga kelompok data Y1 , Y2 , dan Y3 ‘dapat dianggap’ berasal dari
satu populasi yang sama atau berasal dari dua atau lebih populasi yang
berbeda.
176
Diagram 6.1. Tiga kelompok data yang dapat berasal dari satu populasi
yang sama atau dua/lebih populasi yang berbeda.
Atas: ketiganya berasal dari populasi yang sama, variansi dalam-kelompok
yang besar dan atau variansi antar-kelompok yang kecil.
Bawah: ketiganya berasal dari populasi berbeda, variansi dalam kelompok
kecil dan /atau variansi antar kelompok besar.
Jika yang hendak diuji adalah hipotesis H0 : µ1 = µ2 = µ3 maka H0
akan ditolak ( Y1 , Y2 , dan Y3 dianggap berasal dari populasi berbeda) jika
va riansi antar-kelompok
nilai -nya melebihi nilai tertentu yang ada pada
variansi dalam-kelompok
tabel nilai distribusi sampling.
Pada pembahasan selanjutnya dalam analisis variansi, Y merupakan
satu variabel (variabel dependen) dengan subskrip 1, 2, dan 3 menyatakan
kelompok-kelompok (taraf-taraf perlakuan).
177
Matriks 6.1. Struktur data pada analisis variansi 1-arah
Kategori Kategori (taraf) perlakuan
(taraf) Total
1 2 ... k
perlakuan
y11 y21 yk1
y12 y22 yk 2
Data
... ... ... ...
y1n y2 n yk n
1 2 k
Jumlah
y1 . y2 . yk . y. .
kolom
Ukuran n1 n2 nk
... n
sampel
Rerata y1 y2 yk y
...
sampel
Rerata µ
µ1 µ2 ... µk
populasi
Variansi
s12 s22 ... sk2 s2
sampel
µ : rerata populasi
τ1 : efek perlakuan ke-i
ε ij : galat pada subjek ke-j dalam kelompok perlakuan ke-i
178
Penguraian dan Perhitungan Jumlah Kuadrat
Estimasi untuk model pada analisis variansi 1-arah dapat dituliskan
sebagai:
yij − y = ( yi − y ) + ( yij − yi )
∑∑
2 i =1 j =1
JKT =
i =1 j =1
( yij − y ) i =1 j =1 n
ni 2
k
( y. . )
JKT = ∑∑
i =1 j =1
yij2 −
n
; db = n – 1 (6.4)
i =1 i= j n n
2
k
( yi . )2 ( y. . )
JKP = ∑
i =1 ni
−
n
; db = k – 1 (6.5)
179
Kuadrat Rerata
Kuadrat rerata adalah jumlah kuadrat dibagi derajat bebasnya:
jumlah kuadrat
Kuadrat rerata (mean square) =
derajat bebas
Kuadrat rerata pada analisis variansi merupakan estimator untuk
variansi:
- Kuadrat rerata perlakuan merupakan estimator bagi variansi antar-
kelompok (between-groups variance).
- Kuadrat rerata galat merupakan estimator bagi variansi dalam
kelompok (within-group variance).
180
Tabel 6.1. Tabel ANOVA 1-arah
Sumber Fuji
JK db KR Ftabel
variasi
KRP Fuji
Perlakuan JKP k−1 JKP KRP F( k −1);( n −k );α
= =
k -1 KRG
KRG
Galat JKG n–k JKG
=
n-k
Total JKT n−1
Contoh 6.2:
Untuk membandingkan penghasilan tahunan keluarga (dalam jutaan
rupiah) di tiga kota A, B, dan C, diambil sampel acak masing
masing-masing empat
keluarga dari kota A, kota B, dan kota
ota C. Hasil pengamatan adalah sebagai
berikut:
182
Tabel 6.2. Data penghasilan tahunan keluarga di kota A, B, dan C
Perlakuan Total
1 2 3
19 16 13
18 11 16
21 13 18
18 14 11
yi . 76 54 58 188
∑j yij2 1,450 742 870 3,062
ni 2
k
( y. . )
JKT = ∑∑
i =1 j =1
yij2 −
n
Uji hipotesis:
1. Jenis uji statistik: analisis variansi 1-arah
2. Hipotesis: H 0 : µ1 = µ2 = µ3
H1 : Tidak semua nilai rerata sama
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis: F > F2; 9; 0.05 yaitu F > 4.26
5. Statistik penguji:
KRP JKP ( k − 1)
Fuji = =
KRG JKG ( n − k )
183
yang berdistribusi F dengan derajat bebas pembilang (k – 1) = 3 – 1 = 2
dan derajat bebas penyebut (n – k) = 12 – 3 = 9.
Perhitungan: lihat tabel
Catatan:
Pada keputusan untuk menolak H 0 dengan ANOVA hanya dapat
disimpulkan bahwa tidak semua nilai rerata sama, namun untuk mengetahui
nilai rerata mana saja yang berbeda dengan yang lainnya, ataupun nilai rerata
mana yang lebih besar / lebih kecil, harus dilakukan analisis lebih lanjut,
yaitu dengan perbandingan ganda (multiple comparisons; lihat lampiran 6E).
Contoh 6.3:
Beberapa contoh analisis variansi 2-arah yaitu:
a. Misalkan dimiliki siswa pada tiga sekolah (r = 3) dan empat metode
pengajaran (c = 4) untuk diteliti. Hendak dibandingkan ketiga sekolah,
keempat metode pengajaran, dan dapat pula diteliti kemungkinan efek
interaksi antara sekolah dengan metode pengajaran.
b. Misalkan terdapat tiga kota (r = 3). Pekerja di ketiga kota tersebut
dibedakan menurut jenis kelaminnya (c = 2). Hendak dibandingkan
penghasilan rata-rata pekerja pria dan wanita, penghasilan rata-rata
pekerja di ketiga kota, dan kemungkinan efek interaksi antara kota
dengan jenis kelamin.
184
c. Misalkan dimiliki empat varietas padi (r = 4) dan tiga jenis pupuk (c =
3). Hendak dibandingkan produksi rata-rata per ha sawah yang
ditanami keempat varietas padi, menggunakan ketiga jenis pupuk, serta
kemungkinan interaksi varietas padi dengan jenis pupuk.
Nilai-nilai populasi untuk tiap sel (tiap subkelompok) menurut taraf-
taraf kedua perlakuan secara skematis diperlihatkan pada matriks 6.2 di
bawah ini.
Matriks 6.2. Nilai populasi untuk tiap sel menurut taraf-taraf perlakuan
pada analisis variansi 2-arah
Variabel Variabel kedua
pertama 1 2 ... c
1 µ 11 µ 12 ... µ 1c µ1 .
2 µ 21 µ 22 . µ 2c µ2.
... . . . ... .
r µ r1 µr2 ... µ rc µr .
µ .1 µ .2 ... µ .c µ
µ ij : Rerata bagi anggota populasi yang tergolong dalam taraf ke-i variabel
pertama dan taraf ke-j variabel kedua; i = 1, 2, . . . , r ; j = 1, 2, . . . , c
185
Matriks 6.3. Struktur data pada analisis variansi 2-arah dengan
rancangan faktorial
Variabel Variabel kedua
pertama 1 2 ... c
y111 , y112 , . . y121 , y122 , . . y1c1 , y1c 2 , . .
1 ...
. , y11h . , y12h . , y1ch
y211 , y212 , . . y221 , y222 , . . y2c1 , y2c 2 , . .
2 .
. , y21h . , y22h . , y2ch
... ... . . ...
yr11 , yr12 , . . yr 21 , yr 22 , . . yrc1 , yrc 2 , . .
r ...
. , yr1h . , yr 2h . , yrch
2 2
+ ∑∑
i j
( yij − yi − y j + y ) + ∑∑∑
i j k
( yijk − yij )
186
atau:
Jumlah Kuadrat Total = Jumlah Kuadrat A + Jumlah Kuadrat B
+ Jumlah Kuadrat Interaksi + Jumlah Kuadrat Galat
(6.13)
Didefinisikan:
1) Tij = ∑k yijk : Jumlah observasi pada sel (i; j) (6.14.a)
c
2) yi . = ∑
j =1
Tij : Jumlah observasi baris ke-i variabel A (6.14.b)
r
3) y. j = ∑
i =1
Tij : Jumlah observasi kolom ke-j variabel B (6.14.c)
r c
4) y. . = ∑∑
i =1 j =1
Tij : Jumlah semua observasi (6.14.d)
2
( y.. )
5) C = (6.14.e)
rch
187
Selanjutnya dapat dihitung:
1) Jumlah Kuadrat Total:
JKT = ∑∑∑
i j k
2
yijk −C ; db = rch − 1 (6.15)
2) Jumlah Kuadrat A:
2
( yi . )
JKA = ∑i ch
−C ; db = r – 1 (6.16)
3) Jumlah Kuadrat B:
2
( y.j )
JKB = ∑j rh
−C; db = c – 1 (6.17)
188
Tabel ANOVA untuk Analisis Variansi 2-Arah Dengan Interaksi
189
Contoh 6.4:
Misalkan terhadap 12 ekor tikus percobaan diberikan dua macam diet
(A1 dan A2) serta tiga macam stressor (B1, B2, dan B3), lalu diukur
pertambahan berat badannya (dalam gram) setelah lama periode tertentu.
Diperoleh data sebagai berikut:
Tabel 6.5. Data kenaikan berat badan tikus percobaan untuk variabel A
dan variabel B
Variabel B
Variabel A
1 2 3
1 11, 19, 16 38, 12, 21 37, 53, 53
2 20, 11, 2 27, 20, 26 62, 59, 48
Tabel 6.6 Tabel nilai Tij dan ∑k yijk2 untuk variabel A dan variabel B
Variabel A
Variabel B
yi . ∑∑ 2
yijk ∑j Tij2
1 2 3 j k
Hipotesis nol: H A : α 1 = α 2 = 0
HB : β 1 = β 2 = β 3 = 0
H AB : (αβ )11 = (αβ )12 = (αβ )13 = (αβ )21 = (αβ )22 =
(αβ )23 = 0
190
Perhitungan:
112 192 482 5352
JKT = + +...+ −
1 1 1 18
5352
= 21,713 − = 5,811.61 (db = 17)
18
260 2 2752 5352
JKA = + − = 12.50 (db = 1)
9 9 18
192 1442 312 2 5352
JKB = + + −
6 6 6 18
= 4,818.78 (db = 2)
JK Sel = JKA + JKB + JKAB
46 2 332 1692 5352
= + + . . . + −
3 3 3 18
= 4,960.28 (db = 5)
JKAB = 4,960.28 – (12.50 +4,818.78)
= 129 (db = 2)
JKG = JKT – JK Sel
= JKT – (JKA + JKB + JKAB)
= 5,811.61 – 4,960.28 = 851.33 (db = 12)
191
6.3. ANALISIS VARIANSI 2-ARAH TANPA INTERAKSI
Model:
Yij = µ + α i + β j + ε ij (6.20)
yij − y = ( yi − y ) + ( y j − y ) + ( yij − yi − y j + y )
192
2 2
∑∑ ( yij − y ) ∑∑ ( yi − y ) ∑∑ ( yj − y)
2
= +
i j i j i j
2
+ ∑∑
i j
( yij − yi − y j + y )
atau:
Jumlah Kuadrat Total = Jumlah Kuadrat A + Jumlah Kuadrat B
+ Jumlah Kuadrat Galat (6.22)
Didefinisikan:
c
1) yi . = ∑
j =1
yij : Jumlah observasi baris ke-i variabel A (6.23.a)
r
2) y. j = ∑
i =1
yij : Jumlah observasi kolom ke-j variabel B (6.23.b)
r c
3) y. . = ∑∑
i =1 j =1
yij : Jumlah semua observasi (6.23.c)
2
( y. . )
4) C= (6.23.d)
rc
Diperoleh:
Jumlah Kuadrat Total:
JKT = ∑∑
i j
yij2 −C ; db = rc – 1 (6.24)
Jumlah Kuadrat A:
2
( yi )
JKA = ∑i c
−C ; db = r – 1 (6.25)
Jumlah Kuadrat B:
2
( yj )
JKB = ∑j r
−C ; db = c – 1 (6.26)
193
Tabel ANOVA untuk Analisis Variansi 2-Arah Tanpa Interaksi
Sumber Fuji
JK db KR Ftabel
variasi
JKA KRA F r −1 ;
A JKA r–1 KRA = FA = ( ) ( r −1)( c −1); α
r −1 KRAB
JKB KRB F c −1 ;
B JKB c–1 KRB = FB = ( ) ( r −1)( c −1); α
c −1 KRAB
JKAB
Galat JKAB (r – 1)(c – 1) KRAB =
( r − 1)( c − 1)
Total JKT rc – 1
194
Contoh 6.5:
Misalkan terhadap residivis pengguna narkotika mantan penghuni
empat rumah tahanan (blok B1, B2, B3, dan B4) yang telah menjalani salah
satu di antara tiga program rehabilitasi (perlakuan A1, A2, atau A3),
dilakukan pengamatan untuk menentukan lamanya periode remisi (jumlah
hari mereka terbebas dari penggunaan ulang narkotika). Data hasil
pengamatan disajikan pada tabel 6.9 berikut.
Hipotesis nol: H A : α 1 = α 2 = α 3 = 0
HB : β 1 = β 2 = β 3 = β 4 = 0
Perhitungan:
352 24 2 142 240 2
JKT = + +...+ −
1 1 1 12
240 2
= 5,282 − = 482 (db = 11)
12
1082 60 2 72 2 240 2
JKA = + + −
4 4 4 12
= 312 (db = 2)
195
Tabel 6.10. Tabel ANOVA untuk data hipotetis variabel A dan variabel
B
196
LAMPIRAN 6A: IKHTISAR METODE STATISTIKA PARAMETRIK UNTUK
ANALISIS HUBUNGAN ANTAR DUA VARIABEL
Analisis statistik yang lazim digunakan dalam Metode Statistika Parametrik untuk menguji hubungan antar dua
variabel (satu variabel independen dan satu variabel dependen ialah uji t / uji Z, analisis variansi, analisis regresi linear,
analisis regresi logistik, dan uji khi-kuadrat . Ikhtisar penggunaannya diperlihatkan pada matrik VI.1 di bawah ini.
Matriks VI.1. Ikhtisar metode statistika parametrik untuk analisis hubungan antar 1 variabel independen dengan
1 variabel dependen
Variabel dependen
Variabel independen Numerik Kategorik
Dikotomi Politomi
Analisis Regresi Analisis Regresi Analisis Regresi
Numerik
Linear Logistik Logistik Politomi
Dikotomi Uji t / uji Z
Kategorik Uji khi-kuadrat
Politomi Analisis Variansi
Selain itu masih didapatkan berbagai analisis statistik lain yang relatif lebih jarang digunakan untuk menguji
hubungan antar 1 variabel independen dengan satu 1 variabel dependen, namun dalam keadaan tertentu mungkin saja
dijadikan pilihan utama untuk menganalisis data yang tersedia
197
LAMPIRAN 6B: ANALISIS VARIANSI MODEL
TETAP DAN MODEL ACAK
Dalam analisis variansi dikenal dua model, yaitu model tetap (fixed
model; model I) dan model acak (random model; model II). Pada model
tetap, taraf-taraf perlakuan yang diuji dalam analisis variansi mencakup
seluruh taraf yang mungkin ada, sedangkan pada model acak, taraf-taraf
yang diuji hanya merupakan sampel dari keseluruhan taraf yang ada dalam
populasi.
Contoh VI.1:
a. Sebuah pabrik memproduksi dan menjual makanan kaleng berisi
kaleng ikan tuna dalam bentuk empat kemasan, yang masing-masing
dinamakan kemasan I, II, III, dan IV. Untuk dapat meningkatkan
pemasaran, manajer peruasahaan melakukan riset pasar dengan
mengumpulkan data penjualan keempat bentuk kemasan dan
melakukan analisis variansi dengan hipotesis H 0 : µ 1 = µ 2 = µ 3 =
µ 4 ; µ i menyatakan rerata penjualan dengan kemasan ke-i per bulan di
masing-masing toko.
Analisis variansi di sini termasuk dalam model tetap (model I), karena
hanya ada empat kemasan di pabrik tersebut dan keempatnya diuji
dalam analisis.
b. Sebuah perusahaan hipermarket yang memiliki ratusan karyawan di
bagian pelayanan konsumen memilih lima orang di antaranya secara
acak, masing-masing untuk dinilai oleh sekelompok konsumen.
Hipotesis yang hendak diuji ialah H 0 : µ 1 = µ 2 = µ 3 = µ 4 = µ 5 ; µ j
menyatakan rerata penilaian konsumen bagi karyawan ke-j.
Analisis variansi di sini termasuk dalam model acak (model II), karena
jumlah karyawan tidak hanya lima, melainkan ratusan dan kelima
orang tersebut dipilih secara acak dari populasi karyawan. Tujuan
penelitian sebenarnya adalah untuk menilai seberapa besar variasi
pelayanan yang diberikan oleh karyawan terhadap konsumen, karena
198
itu hasil yang diperoleh akan digeneralisasikan terhadap seluruh
populasi karyawan.
Pada ANOVA 2-arah, salah satu variabel independennya
(perlakuannya) mungkin tergolong dalam model I, dan variabel independen
lainnya tergolong dalam model II. Model ANOVA demikian dinamakan
model campuran (mixed model; model III).
Pada ANOVA 2-arah dengan interaksi, terdapat perbedaan statistik
penguji untuk ketiga model tersebut (lihat matriks VI.2). Seluruh
pembahasan mengenai ANOVA 2-arah dan contoh-contohnya pada bab 8
menggunakan model tetap.
Matriks IV.2. Statistik penguji untuk model tetap, model acak, dan
model campuran pada ANOVA 2-arah dengan interaksi
199
LAMPIRAN 6C: INTERAKSI PADA ANOVA DAN
MODEL REGRESI
B1 B2
A1 µ 11 µ 12
A2 µ 21 µ 22
Dengan model:
200
Dalam keadaan tanpa interaksi (diagram VI.1 kiri), maka:
µ 12 − µ 11 = µ 22 − µ 21 (6.29)
Contoh VI.2:
Misalkan dimiliki data hipotetis untuk penjualan biskuit merek
tertentu. Biskuit ini dibuat dalam 2 bentuk, bundar dan persegi, serta 2
warna, coklat dan kuning. Contoh data penjualan hipotetis untuk kombinasi
masing-masing bentuk dan warna, dengan dan tanpa interaksi diperlihatkan
pada tabel VI.2.
201
LAMPIRAN 6D: UKURAN SAMPEL MINIMUM
UNTUK UJI HIPOTESIS PADA ANALISIS
VARIANSI
n = (k – 1) nt + nc (6.32)
202
Perbandingan ukuran satu kelompok uji nt dengan ukuran kelompok
kontrol nc dinamakan ‘rasio alokasi uji-kontrol’ (test-control allocation
ratio):
nt
λ = (6.33)
nc
n=
(
2 Zα + Z β )2 σ 2
( µ1 − µ2 )2
Untuk k kelompok perbandingan dengan uji 2-sisi, ukuran kelompok
kontrol adalah:
λ +1
(
Zα + Z β )σ
2 2
nc = λ (6.34)
(
µ c − µt
2
)
µc : rerata populasi kontrol
nt = λ nc (6.33.a)
203
nc =
(
2 Zα + Z β )σ
2 2
(6.35)
( µ c − µt ) 2
dan: nt = nc (6.36)
Contoh VI.3:
d= ( µc − µt ) = 6
α = 0.05 Zα 2
= 1.96
1 – β = 0.80 Z β = 0.84
σ̂ = 5
λ +1
( )σ
2 2
Zα 2 + Z β
nc = λ
(
µ c − µt
2
)
204
1+1 2 2
(1.96 + 0.84 ) 5
=
1
= 10.90 ≈ 11
62
nt = λ nc = (1)(11) = 11
n = (k – 1) nt + nc
= (2)(11) + 11 = 33
205
LAMPIRAN 6E: PERBANDINGAN GANDA
(MULTIPLE COMPARISONS)
( ) ( )
Lˆ h − B . s Lˆ h < Lh < Lˆ h + B . s Lˆ h (6.38)
Contoh VI.4:
Lihat data pada contoh 6.2. Akan dihitung interval konfidensi
perbandingan ganda (interval konfidensi simultan) 100(1 – α)% untuk
( µ1 − µ2 ) , ( µ1 − µ3 ) , dan ( µ3 − µ2 ) sekaligus.
Pada contoh 6.2, m = 3, h = 1, 2, 3; dan dengan memisalkan:
L1 = ( µ1 − µ2 )
L 2 = ( µ1 − µ3 )
L 3 = ( µ3 − µ2 )
maka interval konfidensi perbandingan ganda 95% untuk L1 , L 2 , dan L 3
adalah:
206
( )
L̂1 − B . s Lˆ1 < L1 < L̂1 + B . s Lˆ1 ( )
L̂ 2 − B . s ( Lˆ 2 ) < L 2 < L̂ 2 + B . s ( Lˆ 2 )
L̂ 3 − B . s ( Lˆ 3 ) < L 3 < L̂ 3 + B . s ( Lˆ 3 )
k=3 (k menyatakan jumlah taraf perlakuan / jumlah populasi yang
diperbandingkan)
n = 12
B = t n −k ; α 2 m = t 12−3 ; 0.05 2 3 = t 9; 0.0083 = 2.93
( ) ( ) ( ) ( )( ) ( )
L̂1 = ( y1 − y2 )
L̂ 2 = ( y1 − y3 )
L̂ 3 = ( y3 − y2 )
76 54 58
y1 = = 19 y2 = = 13.5 y3 = = 14.5
4 4 4
L̂1 = 19 – 13.5 = 5.5
L̂ 2 = 19 – 14.5 = 4.5
L̂ 3 = 14.5 – 13.5 = 1
1 1 1 1
( )
s Lˆ h = s +
ni n j
= KRG +
ni n j
JKG
karena: s 2 = KRG =
n−k
ni = n j = 4 dan KRG = 5.33, sehingga:
1 1
( )
s Lˆ h = 5.33 + = 1.63
4 4
5.5 – (2.93) . (1.63) < L1 < 5.5 + (2.93) . (1.63)
4.5 – (2.93) . (1.63) < L 2 < 4.5 + (2.93) . (1.63)
1 – (2.93) . (1.63) < L 3 < 1 + (2.93) . (1.63)
yaitu: 0.71 < L1 < 10.29
−0.29 < L 2 < 9.29
207
−3.79 < L 3 < 5.79
208
LATIHAN 6
Bagian Pertama
209
sama. Untuk memeriksanya, diambil sampel acak masing-masing 6 potong
benang dari hasil produksi tiap mesin. Pemeriksaan kekuatannya
menghasilkan data sebagai berikut:
Mesin
A B C D E
4.2 3.9 4.1 3.6 3.8
4.1 3.8 4.0 3.9 3.6
4.2 3.7 4.2 3.5 3.9
4.3 3.8 4.0 4.0 3.5
4.4 3.6 4.1 4.1 3.7
4.0 3.5 3.8 3.8 3.6
210
9. Nilai statistik penguji Fuji sama dengan:
A. 10.768 C. 18.213
B. 13.182 D. 31.281
211
14. Untuk uji hipotesis H 0 : µ1 = µ2 = µ3 , statistik pengujinya adalah:
A. 0.37 C. 1.68
B. 0.60 D. 2.69
Bagian Kedua
B: Dosis pemupukan
1 kg 2 kg
P 17, 16, 15, 18 13, 13, 14, 12
A: Jenis pupuk
Q 21, 20, 19, 18 14, 16, 16, 14
212
3. JKAB sama dengan:
A. 1 C. 3
B. 2.5 D. 6.4
9. FA sama dengan:
A. 1.875 C. 18.750
B. 7.815 D. 48.000
213
12. Dengan tingkat signifikansi α = 5% disimpulkan:
A. H A tidak ditolak
B. H B ditolak
C. H AB ditolak
D. Ketiga hipotesis semuanya ditolak
Bagian Ketiga
B: Pekerja
B1 B2 B3 B4
A1 44 46 34 43
A: Tipe mesin A2 38 40 36 38
A3 47 52 44 46
214
4. JKG ( jumlah kuadrat galat)
A. 29.5 C. 173.17
B. 98 D. 300.67
8. FA sama dengan:
A. 3.58 C. 17.61
B. 6.64 D. 32.29
9. FB sama dengan:
A. 3.58 C. 17.61
B. 6.64 D. 32.29
215
BAB 7
ANALISIS DATA KATEGORIK
7.1. PENYAJIAN DATA KATEGORIK
a. Tabel 1 × c (c > 2)
O1 O2 ... Oc
b. Tabel 2 × 2
O11 O12
O21 O22
c. Tabel 2 × c (c > 2)
216
d. Tabel r × c (r > 2 dan c > 2)
Contoh 7.1:
- Misalkan diambil sampel acak 350 orang lulusan SMU (1 sampel),
dicatat jenis kelaminnya dan ditanyai keinginannya untuk melanjutkan
sekolah. Hasil yang diperoleh diperlihatkan pada tabel 2×2 di bawah
ini:
217
b. Tabel proporsi
Kerutan wajah
Perokok
Nyata Tidak Jumlah
Berat 0.635 0.365 1.000
Ringan/tidak 0.295 0.705 1.000
218
Tabel 7.5. Bentuk umum tabel 2×2 dengan frekuensi observasi (‘tabel
observasi’)
Variabel B
Variabel A
B1 B2 Jumlah
A1 a = O11 b = O12 n1 = a + b
A2 c = O21 d = O22 n2 = c + d
Jumlah m1 = a + c m2 = b + d n
Tabel 7.6. Bentuk umum tabel 2×2 dengan frekuensi harapan (‘tabel
harapan’)
Variabel B
Variabel A
B1 B2 Jumlah
A1 E11 E12 n1 = E11 + E12
A2 E21 E22 n2 = E21 + E22
Jumlah m1 = E11 + E21 m2 = E12 + E22 n
219
n1 m1 n1 m 2
E11 = E12 = )
n n
n 2 m1 n2 m 2
E21 = E22 = ) (7.1.a)
n n
Perhatikan bahwa frekuensi marginal (jumlah baris dan jumlah
kolom) pada tabel harapan selalu bernilai sama dengan frekuensi marginal
pada tabel observasi.
Contoh 7.2:
Lihat kembali data tentang jenis kelamin dan keinginan melanjutkan
pendidikan pada contoh 7.1. Data pada tabel 7.2 adalah tabel observasi, dan
frekuensi harapan masing-masing sel adalah (lihat tabel 7.7):
E11 =
n1 m1
=
( 243)( 209 ) = 145.1
n 350
E12 =
n1 m 2
=
( 243)(141) = 97.91
n 350
E21 =
n 2 m1
=
(107 )( 209 ) = 63.9
n 350
E22 =
n2 m 2
=
(107 )(141) = 43.1
n 350
Tabel 7.7. Tabel harapan untuk data jenis kelamin dan keinginan
melanjutkan pendidikan
Melanjutkan sekolah
Jenis kelamin
Ingin Tidak Jumlah
Pria 145.1 97.9 243
Wanita 63.9 43.1 107
Jumlah 209 141 350
220
Uji Hipotesis untuk Tabulasi Silang dengan Data
Kategorik
Uji statistik untuk data kategorik yang disajikan dalam bentuk
tabulasi silang umumnya dilakukan dengan membandingkan data frekuensi
pengamatan (observed; Oij ) dengan data frekuensi harapan (expected; Eij ).
Beberapa uji statistik untuk data kategorik tersebut yaitu:
Distribusi Khi-kuadrat
Kecuali uji eksak Fisher , seluruh uji hipotesis untuk data kategorik
yang disebutkan di atas menggunakan statistik penguji yang ber-distribusi
khi-kuadrat, yang cuplikan distribusinya diperlihatkan pada tabel 7.8 di
bawah ini (tabel lengkap nilai kritis distribusi khi-kuadrat dapat dilihat pada
Addendum D).
Bentuk distribusi khi-kuadrat berbeda-beda, tergantung pada derajat
bebasnya, namun seluruhnya bernilai positif (terletak di kanan sumbu
vertikal), sehingga seperti pada uji F, uji hipotesis dengan statistik penguji
yang berdistribusi khi-kuadrat selalu adalah uji 2-sisi, walaupun dengan
memperhatikan gambaran distribusinya, uji tersebut adalah uji 1-ekor (one-
tail test).
221
Tabel 7.8. Cuplikan tabel distribusi khi-kuadrat [P ( χ 2 > χ α2 )]
α
db
0.100 0.050 0.025 0.010
1 2.71 3.84 5.02 6.63
2 4.61 5.99 7.38 0.21
. . . . .
. . . . .
. . . . .
9 14.7 16.9 19.0 21.7
10 16.0 18.3 20.5 23.2
. . . . .
. . . . .
. . . . .
19 27.2 30.1 32.9 36.2
20 28.4 31.4 34.2 37.6
. . . . .
. . . . .
. . . . .
29 39.1 42.6 45.7 49.6
30 40.3 43.8 47.0 50.9
40 51.8 55.8 59.3 63.7
50 63.2 67.5 71.4 76.2
60 74.4 79.1 83.3 88.4
222
7.2. UJI HOMOGENITAS
Tabel 2×2
Misalkan dimiliki data kategorik yang paparannya disajikan dalam
bentuk umum tabel 2×2 berikut:
Tabel 7.9. Bentuk umum paparan data pada tabel 2×2
Variabel B
Variabel A
B BC Jumlah
A a b n1 = a + b
AC c d n2 = c + d
Jumlah m1 = a + c m2 = b + d n
223
n ( ad − bc )2
Wuji = (7.5)
n1n2 m1m2
Contoh 7.3:
Anggota 2 sampel acak yang masing-masing terdiri atas 100 orang
pria dan 100 orang wanita ditanyai pendapatnya terhadap pernyataan:
‘Wanita mempunyai hak dan kewajiban yang sama dengan pria’. Diperoleh
jawaban sebagai berikut:
Tabel 7.10. Pendapat tentang hak dan kewajiban menurut reponden
wanita pria dan wanita
Sikap
Jenis kelamin
Setuju Tidak setuju Jumlah
Pria 30 70 100
Wanita 45 55 100
Jumlah 75 125 200
Uji hipotesis:
1. Jenis uji statistik: uji khi-kuadrat (uji homogenitas).
2. Hipotesis: H 0 : P1 = P2
H1 : P1 ≠ P2
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis: W > χ1;2 05 atau W > 3.84.
5. Statistik penguji:
2 n ( ad − bc )2
Wuji = χ uji =
n1n2 m1m2
224
( 200 ) ( 30 )( 55) − ( 70 )( 45) 2
= = 4.80
(100 )(100 )( 75)(125)
yang berdistribusi χ 2 dengan derajat bebas 1.
Tabel r×2
Bentuk umum paparan data untuk tabel r×2 dapat disajikan
sebagaimana terlihat pada tabel 7.11 di bawah ini.
b. Tabel proporsi
Variabel B
Variabel A
B BC Jumlah
A1 p1 q1 1
A2 p2 q2 1
... ... ... ...
Ar pr qr 1
Jumlah m1 m2 1
225
Hipotesis yang diuji adalah:
H 0 : P1 = P2 = . . . = Pr (7.6)
a1 a a
dengan: P̂1 = p1 = , P̂2 = p2 = 2 , . . . , Pˆr = pr = r .
n1 n2 nr
Frekuensi di atas merupakan frekuensi pengamatan (observed), sedangkan
untuk uji statistik harus dihitung pula frekuensi harapannya (expected)
dengan rumus:
ni m j
Eij =
n
Statistik pengujinya adalah:
2
Wuji = 2
χuji = ∑∑
( Oij − Eij ) (7.7)
i j Eij
yang berdistribusi khi- kuadrat dengan derajat bebas (r – 1)(c – 1) dan daerah
kritis:
W > χ 2r −1 (7.8)
( )( c −1); α
Untuk tabel kontijensi dengan r > 2 dan/atau c > 2, rumus statistik
penguji ini tidak dapat dijabarkan lebih lanjut seperti pada rumus 7.5 untuk
tabel 2×2.
Contoh 7.4:
Untuk membandingkan proporsi perokok di antara berbagai tingkatan
jabatan akademik dosen di DKI Jakarta, dilakukan wawancara terhadap
sampel acak 50 orang guru besar, 70 lektor kepala, 100 lektor, dan 100
asisten ahli dengan hasil sebagai berikut ( Oij ):
226
Tabel 7.12. Kebiasaan merokok pada beberapa tingkatan jabatan
akademik
a. Tabel observasi
Kebiasaan merokok
Jabatan akademik
Ya Tidak Jumlah
Guru besar 6 44 50
Lektor kepala 18 52 70
Lektor 26 74 100
Asisten ahli 35 65 100
Jumlah 85 235 320
b. Tabel harapan
Jabatan Kebiasaan merokok
akademik Ya Tidak Jumlah
Guru besar
( 50 )( 85 ) = 13.28 ( 50 )( 235 ) = 36.72 50
320 320
Lektor ( 70 )(85) = 18.59 ( 70 )( 235 ) = 51.41 70
kepala 320 320
Lektor
(100 )( 85 ) = 26.56 (100 )( 235 ) = 73.44 100
320 320
Asisten ahli
(100 )( 85 ) = 26.56 (100 )( 235 ) = 73.44 100
320 320
Jumlah 85 235 320
Uji hipotesis:
1. Jenis uji statistik: uji khi-kuadrat (uji homogenitas).
2. Hipotesis: H 0 : P1 = P2 = P3 = P4
H1 : Pi ≠ Pj untuk paling sedikit salah satu pasangan nilai
i, j.
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis: W > χ 3;2 05 , yaitu W > 7.815
5. Statistik penguji:
227
2
2
Wuji = χ uji = ∑∑
r 2 ( Oij − Eij ) =
i =1 j =1 Eij
=
( 6 − 13.28 )2 +
( 44 − 36.72 )2 +
(18 − 18.59 )2 +
13.28 36.72 18.59
( 52 − 51.41)2 +
( 26 − 26.56 )2 +
( 74 − 73.44 ) 2 +
51.41 26.56 73.44
( 35 − 26.56 )2 +
( 65 − 73.44 )2 = 9.127
26.56 73.44
yang berdistribusi χ 2 dengan derajat bebas (r − 1)(c – 1) = (3)(1) = 3.
Tabel r×c
Bentuk umum paparan data untuk tabel r×c dapat diperlihatkan pada
tabel 7.13 di bawah ini.
Variabel B
Variabel A Jumlah
B1 B2 ... Bc
A1 O11 O12 ... O1c n1
A2 O21 O22 ... O2c n2
... ... ... ... ... ...
Ar Or1 Or 2 ... Orc nr
Jumlah m1 m2 ... mc n
Contoh 7.5:
Dari empat jurusan pada Akademi KLM diambil sampel acak yang
terdiri atas 100 orang mahasiswa untuk tiap jurusan. Tiap mahasiswa
ditanyai pendapatnya terhadap pernyataan “Aplikasi komputer sangat perlu
228
dipelajari oleh semua mahasiswa akademi ini”. Pendapat mahasiswa
diklasifikasikan berupa: Setuju, netral, dan tidak setuju.
Hasil pengumpulan pendapat mahasiswa tersebut disajikan pada tabel
7.14.a, sedangkan frekuensi harapannya pada tabel 7.14.b dihitung dengan
ni m j
menggunakan rumus Eij = .
n
Tabel 7.14. Pendapat mahasiswa mengenai keperluan untuk
mempelajari aplikasi komputer
a. Tabel observasi
Pendapat
Jurusan Jumlah
Setuju Netral Tidak setuju
A 47 18 35 100
B 60 12 28 100
C 68 11 21 100
D 73 7 20 100
Jumlah 248 48 104 100
b. Tabel harapan
Pendapat
Jurusan Jumlah
Setuju Netral Tidak setuju
A 62 12 26 100
B 62 12 26 100
C 62 12 26 100
D 62 12 26 100
Jumlah 248 48 104 100
Uji hipotesis:
1. Jenis uji statistik: Uji khi-kuadrat (uji homogenitas).
2. Hipotesis: H 0 : Pi1 = P1 ; Pi 2 = P2 ; . . . ; i = 1, 2, . . . , r
H1 : H 0 tidak benar
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis: W > χ (26; 0.05) , yaitu W > 12.592.
5. Statistik penguji:
229
2
2
Wuji = χ uji = ∑∑
r c ( Oij − Eij ) =
i =1 j =1 Eij
=
( 47 − 62 )2 +
(18 − 12 )2 +
( 35 − 26 )2 +...+
62 12 26
( 7 − 12 )2 +
( 20 − 26 )2 = 17.01
12 26
yang berdistribusi χ 2 dengan derajat bebas (r – 1)(c – 1) = (3)(2) = 6.
230
7.3. UJI INDEPENDENSI
Tabel 2×2
Pada uji indepedensi yang hendak diuji ialah apakah peristiwa A dan
B merupakan kejadian yang saling berkaitan (dependen) / memiliki asosiasi
dengan hipotesis:
( )
H 0 : P ( A B ) = P A BC = P ( A) ) (7.9.a)
atau: H : P ( B A) = P ( B A ) = P ( B )
0
C
) (7.9.b)
atau: H 0 : P ( A ∩ B ) = P ( A) P ( B ) ) (7.9.c)
Contoh 7.6:
Pemeriksaan untuk penyakit gula (diabetes mellitus; DM) dan
jantung koroner (PJK) terhadap sampel acak 200 orang pria berusia 50-65
tahun memberikan hasil sebagai berikut:
Tabel 7.15. Diabetes mellitus dan penyakit jantung koroner pada pria
usia lanjut
PJK
DM
Ada: B Tidak ada: BC Jumlah
Ada: A 16 20 36
Tidak ada: AC 32 132 164
Jumlah 48 152 200
231
Uji hipotesis:
1. Jenis uji statistik: uji khi-kuadrat (uji independensi).
( )
H 0 : P ( A B ) = P A BC = P ( A)
atau: H : P ( B A) = P ( B A ) = P ( B )
0
C
atau: H 0 : P ( A ∩ B ) = P ( A) P ( B )
H1 : H 0 tidak benar, atau A dan B tidak independen.
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis: W > χ (21; 0.05) atau W > 3.84.
5. Statistik penguji:
2 n ( ad − bc )2
Wuji = χ uji =
n1n2 m1m2
Tabel r×c
Bentuk hipotesis yang diuji di sini sama seperti untuk tabel 2×2,
yaitu:
( )
H 0 : P ( A B ) = P A BC = P ( A) ) (7.10.a)
atau: H : P ( B A) = P ( B A ) = P ( B )
0
C
) (7.10.b)
atau: H 0 : P ( A ∩ B ) = P ( A) P ( B ) ) (7.10.c)
232
sedangkan statistik penguji dan daerah kritisnya sama seperti pada uji
homogenetis untuk tabel r×c.
Contoh 7.7:
Sampel acak yang terdiri atas 1,000 orang responden diklasifikasi-
silangkan menurut kebiasaan merokok (berat, sedang, tidak merokok) dan
tinggi badan (tinggi, sedang, pendek). Frekuensi pengamatan beserta
frekuensi harapannya (dalam kurung) adalah sebagai berikut:
Uji hipotesis:
1. Jenis uji statistik: uji khi-kuadrat (uji indepedensi).
5. Statistik penguji:
2
3 3 ( Oij − Eij )
2
Wuji = χ uji = ∑∑
i =1 j =1 Eij
=
(102 − 127 )2 +
( 290 − 282 )2 +
(132 − 114 )2 +...+
127 282 114
233
( 67 − 69 )2 +
( 22 − 28 )2 = 16.93
69 28
234
LAMPIRAN 7A: UKURAN ASOSIASI PADA
TABEL KONTIJENSI
Dalam pembahasan terdahulu telah ditunjukkan bahwa keeratan
hubungan antara dua variabel yang berskala kontinu / numerik dapat diukur
dengan koefisien korelasi Pearson. Untuk dua variabel berskala kategorik
yang datanya disajikan dalam bentuk tabel kontijensi, terdapat berbagai
ukuran untuk menyatakan keeratan hubungan antara kedua variabel tersebut,
namun tidak ada satupun di antaranya yang diterima sebagai ukuran tunggal
asosiasi terbaik, walaupun ada satu atau beberapa di antaranya yang lebih
banyak digunakan daripada yang lain. Di sini hanya akan dibahas beberapa
ukuran asosiasi (measures of association; ukuran ketergantungan; measures
of dependence), terutama untuk kontijensi 2×2.
Koefisien phi:
2
χuji
φ= (7.11)
n
2
χuji
C= (7.13)
n ( q − 1)
235
dengan: q = min (r ; c)
( ) 1a + b1 + 1c + d1
1 2
Var ( )
ˆ Qˆ =
4
1 − Qˆ 2 (7.15)
ad
ORˆ = (7.16)
bc
1 1 1 1
ˆ (ln ORˆ ) = + + +
Var (7.17)
a b c d
sehingga dapat dihitung interval konfidensi 100(1 − α)%-nya.
Nilai rasio imbangan berkisar antara nol sampai dengan tak berhingga.
Tidak adanya asosiasi antara variabel baris dengan variabel kolom
dinyatakan dengan nilai rasio imbangan sama dengan satu.
Contoh VII.1:
Lihat kembali data pria berpenyakit DM dan PJK pada contoh 7.6,
yang disajikan kembali di bawah ini:
Tabel 7.15. Diabetes melitus dan penyakit jantung koroner pada pria
usia lanjut
PJK
DM
Ada: B Tidak ada: BC Jumlah
Ada: A a = 16 b = 20 36
Tidak ada: AC c = 32 d = 132 164
Jumlah 48 152 n = 200
236
2
Pada contoh 7.6 telah dihitung nilai statistik penguji χ uji = 10.06.
=
(16 )(132 ) − ( 20 )( 32 ) = 0.535
(16 )(132 ) + ( 20 )( 32 )
Standard error Q̂ adalah:
( ) a1 + b1 + 1c + d1
1 2
( )
SEˆ Qˆ =
4
1 − Qˆ 2
=
(16 )(132 ) = 3.3
( 20 )( 32 )
Transformasi logaritma ORˆ adalah:
ln ORˆ = ln 3.3 = 1.194
238
LAMPIRAN 7B: UKURAN SAMPEL MINIMUM
UNTUK UJI KESAMAAN BEBERAPA PROPORSI
Pada bab 3, subbab 3.4 telah dibahas cara penentuan ukuran sampel
minimum untuk uji kesamaan 2 proporsi, sedangkan dalam lampiran 6D
pada pembahasan mengenai ukuran sampel minimum untuk uji kesamaan
beberapa nilai rerata telah dijelaskan mengenai kelompok kontrol serta
alokasi rasio uji-kontrol. Konsep-konsep dalam pembahasan terdahulu
tersebut akan digunakan kembali pada penentuan ukuran sampel minimum
untuk uji kesamaan beberapa proporsi pada tabel kontijensi r×2 di sini.
Misalkan hendak dilakukan uji homogenitas khi-kuadrat untuk
mengkaji kesamaan proporsi pada k kelompok perbandingan dengan sampel
berukuran minimum yang dibutuhkan, yang terdiri atas:
a. Satu kelompok kontrol (control group), dengan ukuran kelompok nc .
b. (k – 1) kelompok uji (test groups), masing-masing dengan ukuran
kelompok nt .
Ukuran sampel seluruhnya adalah:
n = (k – 1) nt + nc (7.18)
239
Qc = 1 − Pc Qt = 1 − Pt (7.21)
Pc + λ Pt
P = Q =1− P (7.22)
1+ λ
d = ( Pc − Pt ) : perbedaan minimum yang hendak dideteksi antara
proporsi pada populasi kontrol dan populasi uji.
Ukuran satu kelompok uji adalah:
nt = λ nc (7.19.a)
Contoh VII.2:
Lihat kembali data tentang insomnia pada 3 kelompok usia pada
contoh 7.1, tabel 7.4. Misalkan sebelum penelitian terlebih dahulu dilakukan
perhitungan ukuran sampel minimum untuk mendeteksi adanya perbedaan
proporsi penderita insomnia sebesar 0.10 pada 2 kelompok usia 18-34 tahun
dan 35-54 tahun, dibandingkan dengan proporsi penderita insomnia pada
kelompok usia 55-74 tahun sebagai kelompok kontrol. Hasil penelitian
pendahuluan menunjukkan estimasi proporsi penderita insomnia pada
kelompok kontrol sebesar 50%. Dengan tingkat signifikansi 5% dan
kekuatan uji 80%, maka:
k=3 d = 0.10
Pˆc = pc = 0.50
Pˆ = p = p − d = 0.50 – 0.10 = 0.40
t t c
qc = 1 − pc = 1 – 0.50 = 0.50
qt = 1 − pt = 1 – 0.40 = 0.60
α = 0.05 Zα 2 = 1.96
1 – β = 0.80 Z β = 0.84
240
pc + pt s 0.50 + 0.40
p = = = 0.45
2 2
q = 1 − p = 1 – 0.45 = 0.55
Ukuran minimum kelompok kontrol adalah:
2
Z ( 2PQ ) + Z β PcQc + PQ
α t t
nc =
2
( Pc − Pt )2
2
1.96 ( 2 )( 0.45 )( 0.55) + 0.84 ( 0.50 )( 0.50 ) + ( 0.40 )( 0.60 )
=
0.102
= 387.35 ≈ 388
Ukuran minimum satu kelompok uji adalah:
nt = nc = 388
Ukuran sampel seluruhnya adalah:
n = (k – 1) nt + nc
= (2)(388) + 388 = 1,164
241
LATIHAN 7
Bagian Pertama
Pilihlah satu jawaban yang paling benar !
242
6. Pada sampel 100 orang mahasiswa wanita teradapat 25 orang
penderita nyeri kepala kronis, sedangkan pada sampel 100 orang
mahasiswa pria hanya pada 14 penderita kelainan yang sama. Untuk
mengkaji ada tidaknya perbedaan proporsi penderita nyeri kepala
diantara mahasiswa pria dan wanita secara statistik digunakan:
A. Uji Z untuk kesamaan proporsi
B. Uji khi-kuadrat
C. Keduanya dapat digunakan
D. Keduanya tidak dapat digunakan
243
Bagian Kedua
Pilihlah satu jawaban yang paling benar !
244
6. Kesimpulan yang diperoleh:
A. Pada tingkat signifikansi 5%, terdapat perbedaan proporsi
individu yang tidur lebih sedikit yang bermakna secara statistik di
antara kelompok usia muda dan kelompok usia lanjut.
B. Pada tingkat signifikansi 5%, tidak terdapat perbedaan proporsi
individu yang tidur lebih sedikit yang bermakna secara statistik di
antara kelompok usia muda dan kelompok usia lanjut.
C. Pada tingkat signifikansi 10%, tidak terdapat perbedaan proporsi
individu yang tidur lebih sedikit yang bermakna secara statistik di
antara kelompok usia muda dan kelompok usia lanjut.
D. Semuanya salah.
Jenis sayuran
Kerusakan daun
Kubis Bayam Tomat
Parah 32 28 19
Sedikit/tidak rusak 8 12 21
9. Nilai ( Oij − Eij ) untuk tanaman tomat yang sedikit / tidak rusak
adalah:
A. −5.33 C. 5.33
B. −7.33 D. 7.33
2
10. Nilai ( Oij − Eij ) untuk tanaman kubis yang sedikit / tidak rusak
adalah:
A. 2.78 C. 205.44
B. 32.11 D. 336.11
245
2
11. Nilai ( Oij − Eij ) / Eij untuk tanaman tomat yang rusak parah adalah:
A. 1.08 C. 2.08
B. 2.04 D. 3.39
Bagian Ketiga
246
4. Kesimpulan yang diperoleh yaitu:
A. Pada tingkat signifikansi 5%, terdapat perbedaan proporsi
kematian ternak yang bermakna secara signifikansi di antara
kelompok dengan vaksinasi dan kelompok tanpa vaksinasi.
B. Pada tingkat signifikansi 5%, tidak terdapat perbedaan proporsi
kematian ternak yang bermakna secara statistik di antara
kelompok dengan vaksinasi dan kelompok tanpa vaksinasi.
C. Pada tingkat signifikansi 10%, terdapat perbedaan proporsi
kematian ternak yang bermakna secara statistik di antara
kelompok dengan vaksinasi dan kelompok tanpa vaksinasi.
D. Semuanya salah.
247
7. Kesimpulan yang diperoleh yaitu:
A. Pada tingkat signifikansi 1%, terdapat asosiasi yang bermakna
secara statistik antara masa penjajagan pra-nikah dengan usia
perkawainan.
B. Pada tingkat signifikansi 5%, terdapat asosiasi yang bermakna
secara statistik antara masa penjajagan pra-nikah dengan usia
perkawinan.
C. Pada tingkat signifikansi 10%, terdapat asosiasi yang bermakna
secara statistik penjajagan pra-nikah dengan usia perkawinan.
D. Semuanya salah.
248
BAB 8
ANALISIS DATA KATEGORIK II
8.1. UJI EKSAK FISHER
Dalam pengambilan sampel di lapangan yang umumnya selalu
dilakukan dalam bentuk tanpa pengembalian, penggunaan distribusi binomial
sebagai dasar perhitungan probabilitas dianggap valid apabila sampel
berukuran cukup besar. Pada uji khi-kuadrat Pearson yang didasarkan atas
selisih 2 proporsi binomial, dibutuhkan ukuran sampel yang cukup besar
yang dinyatakan dalam bentuk persyaratan bahwa tidak ada sel dengan
frekuensi harapan lebih kecil daripada lima.
Adanya frekuensi harapan yang lebih kecil daripada lima pada salah
satu sel dalam tabel 2×2 mengindikasikan ukuran sampel yang terlalu kecil
untuk dianalisis dengan menggunakan distribusi binomial dan uji khi-kuadrat
Pearson, dan dalam keadaan tersebut perhitungan probabilitas didasarkan
atas distribusi hipergeometrik, yaitu dengan uji eksak Fisher.
Pada uji eksak Fisher tidak ada statistik penguji, dan uji hipotesis
dilakukan dengan menghitung secara langsung nilai p-nya.
Contoh 8.1:
Misalkan dimiliki data keinginan bunuh diri pada 20 penderita
psikokis dan 20 penderita neurosis sebagai berikut:
Tabel 8.1. Keinginan bunuh diri pada pasien psikokis dan neurosis
Keinginan bunuh diri
Tipe pasien
Ada Tidak ada Jumlah
Psikosis a = 2 (4) b = 18 (16) n1 = 20
Neurosis c = 6 (4) d = 14 (16) n2 = 20
Jumlah m1 = 8 m2 = 32 n = 40
Keterangan: Angka dalam kurung menyatakan frekuensi harapan
Nilai p mencakup probabilitas komposisi data yang sama dengan dan
lebih ekstrim daripada data sampel. Data sampel menunjukkan nilai O11 = a
= 2.
249
Misalkan P1 menyatakan proporsi yang berkeinginan bunuh diri dari
pada populasi penderita psikosis dan P2 menyatakan proporsi serupa pada
populasi penderita neurosis. Pada pengujian hipotesis H 0 : P1 > P2
,
komposisi data yang lebih ekstrim daripada a = 2 mencakup nilai-nilai a = 1
dan a = 0 (lihat tabel 8.2.a dan 8.2.b).
Tabel 8.2. Tabel dengan frekuensi sel yang lebih ekstrim daripada
pengamatan
(a) (b)
1 19 20 0 20 20
7 13 20 8 12 20
8 32 40 8 32 40
250
Dengan tingkat signifikansi α = 0.05, nilai p yang diperoleh lebih
besar daripada α, sehingga hipotesis nol yang menyatakan tidak ada
hubungan antara tipe kelainan jiwa pasien dengan keinginan bunuh diri tidak
ditolak.
Dikenal tiga versi uji eksak Fisher:
1. Uji eksak Fisher 1-sisi: Merupakan bentuk yang lazim digunakan,
seperti pada contoh 8.1 diatas.
2. Uji eksak Fisher-Irwin 2-sisi: Nilai p 2-sisi diperoleh sebagai hasil
penjumlahan nilai p 1-sisi pada uji eksak Fisher 1-sisi ditambah dengan
probabilitas di pihak yang berseberangan pada distribusi probabilitas a
(lihat contoh 8.2).
3. Uji eksak Fisher 2-sisi: Nilai p diperoleh dengan mengali-duakan nilai
p 1-sisi pada uji eksak Fisher 1-sisi. Pada contoh 8.1 , nilai p 1-sisi
adalah 0.1176, sehingga p 2-sisi adalah (2)(0.1176) = 0.2352.
Contoh 8.2:
Lihat kembali data pada soal 8.1 (tabel 8.1). Secara teoretis, rentang
nilai a berkisar antara 0 s.d. 2. Pada uji eksak Fisher 1-sisi (soal 8.1) telah
dihitung nilai p 1-sisi sebagai penjumlahan probabilitas P (a = 2) + P (a = 1)
+ P (a = 0) = 0.1176.
Pada pihak yang ‘berseberangan’ akan dihitung nilai p sebagai
penjumlahan probabilitas P (a = 6) + P (a = 7) + P (a = 8). Penyajian
datanya diperlihatkan pada tabel 8.4, sedangkan perhitungan pada tabel 8.5.
Tabel 8.4. Tabel dengan frekuensi sel yang lebih ekstrim daripada
pengamatan
(a) (b)
6 14 20 7 13 20
2 18 20 1 19 20
8 32 40 8 32 40
(c)
8 12 20
0 20 20
8 32 40
251
Tabel 8.5. Perhitungan nilai p 1-sisi
a P (a )
20! 20! 8! 32!
6 = 0.0958
6! 14! 2! 18! 40!
20! 20! 8! 32!
7 = 0.0202
7! 13! 1! 19! 40!
20! 20! 8! 32!
8 = 0.0016
8! 12! 0! 20! 40!
p P (6) + P (7) + P (8) = 0.1176
252
8.2. UJI KEBAIKAN-SUAI (UJI GOODNESS-OF-FIT)
Uji kebaikan-suai (goodness-of-fit) adalah uji statistik untuk menilai
sejauh mana kesesuaian data sampel yang ada dengan bentuk distribusi yang
dispesifikasikan dalam hipotesis nol. Bentuk distribusi menurut hipotesis nol
tersebut dapat berupa:
a. Distribusi data lampau (tanpa disertai spesifikasi bentuk
distribusinya).
b. Distribusi tertentu, misalnya distribusi normal, distribusi Poisson, dan
sebagainya.
Uji Normalitas
Yang akan dibahas di sini hanya uji kebaikan-suai yang terbanyak
digunakan dalam praktik, yaitu uji normalitas (uji goodness-of-fit distribusi
normal). Uji ini digunakan untuk menilai apakah data sampel yang diperoleh
dapat dianggap berasal dari populasi normal. Selain uji normalitas khi-
kuadrat yang dibahas di sini masih ada beberapa uji normalitas lain, misalnya
uji Kolmogorov-Smirnov (uji Lilliefors), uji Shapiro-Wilk, dan sebagainya.
Uji normalitas khi-kuadrat sebenarnya bukanlah diperuntukkan bagi
analisis data kategorik murni, karena data sampel akan diuji berskala kontinu
atau sekurang-kurangnya numerik, yang untuk pengujiannya terlebih dahulu
harus dikategorisasikan. Distribusi frekuensi yang diperoleh sebagai hasil
kategorisasi ini disajikan sebagai tabel observasi dalam bentuk tabel 1×c
(lihat tabel 7.1.a) atau dapat pula dalam bentuk tabel r×1.
Uji khi-kuadrat untuk normalitas data terdiri atas 2 tahap, yaitu
perhitungan frekuensi harapan dan uji hipotesis.
Contoh 8.3:
Misalkan dimiliki data usia hidup 40 aki merek PQR dengan
distribusi frekuensi seperti terlihat tabel 8.6 (jika data yang ada berskala
253
kontinu harus terlebih dahulu dikategorisasikan, lihat buku teks Metode
Statistika I, bab 2: Peringkasan Data). Tabel distribusi frekuensi ini
merupakan tabel observasi untuk uji normalitas khi-kuadrat.
Tabel 8.7. Perhitungan rerata dan standar deviasi distribusi usia hidup
40 aki merek PQR
Interval kelas fj Xj fj X j f j X 2j
1.45-1.95 2 1.7 3.4 5.78
1.95-2.45 1 2.2 2.2 4.84
2.45-2.95 4 2.7 10.8 29.16
2.95-3.45 15 3.2 48.0 153.60
3.45-3.95 10 3.7 37.0 136.90
3.95-4.45 5 4.2 21.0 88.20
4.45-4.95 3 4.7 14.1 66.27
∑ fj
j
∑ fjX j
j
∑ f j X 2j
j
254
∑j f j X j
x = (8.2)
∑j f j
136.5
= = 3.4125
40
2
fj
∑j f j X j − ∑ f j X j
2
j ∑j
s= (8.3)
∑ f j − 1
j
484.75 − 136.52 40
= = 0.6969
40 − 1
2. Transformasi batas kelas menjadi nilai Z:
Dengan menggunakan transformasi:
Xj −µ
Zj =
σ
batas-batas kelas ditransformasikan ke dalam distribusi normal standar
(distribusi Z), nilai µ dan σ yang tidak diketahui disubstitusikan dengan
estimatornya x dan s:
Xj −x
Zj = (8.4)
s
255
Tabel 8.8. Transformasi batas kelas distribusi normal menjadi batas
kelas distribusi Z
Batas kelas Xj −x
distribusi normal: X j Batas kelas distribusi Z: Z j =
s
1.95 − 3.4125
1.95 = −2.10
0.6969
2.45 − 3.4125
2.45 = −1.38
0.6969
2.95 − 3.4125
2.95 = −0.66
0.6969
3.45 − 3.4125
3.45 = 0.05
0.6969
3.95 − 3.4125
3.95 = 0.77
0.6969
4.45 − 3.4125
4.45 = 1.49
0.6969
256
Tabel 8.10. Perhitungan frekuensi harapan untuk tiap kelas pada
distribusi Z
Tabel 8.11. Tabel harapan untuk distribusi frekuensi 40 aki merek PQR
No Kelas interval Frekuensi harapan
1 < 2.95 10.19
2 2.95 − 3.45 10.61
3 3.45 − 3.95 10.38
4 > 3.95 8.82
Jumlah 40
Uji Hipotesis
Setelah tabel observasi diperoleh dan tabel harapannya disusun, dapat
dilakukan uji normalitas khi-kuadrat dengan langkah-langkah sebagai
berikut:
1. Jenis uji statistik: uji kebaikan-suai (uji khi-kuadrat).
2. Hipotesis:
H 0 : Sampel acak berasal dari populasi normal ) (8.5.a)
H1 : Distribusi populasi tidak normal ) (8.5.b)
257
4. Daerah kritis: W > χ k2; α (8.6)
5. Statistik penguji:
2
c (O j − E j )
2
Wuji = χ uji = ∑
j =1 Ej
(8.7)
Contoh 8.4:
Lihat data pada contoh 8.3. Hendak diuji apakah data sampel tersebut
berasal dari populasi normal.
Tabel 8.12. Distribusi frekuensi observasi dan harapan usia hidup 40 aki
merek PQR
No kelas 1 2 3 4
Oj 7 15 10 8
Ej 10.19 10.61 10.38 8.82
Uji hipotesis:
1. Jenis uji statistik: uji kebaikan-suai (uji khi-kuadrat).
2. Hipotesis:
H 0 : Sampel acak berasal dari populasi normal
H1 : Sampel acak berasal dari populasi tidak normal
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis: W > χ1;2 0.05 , yaitu W > 3.84.
258
5. Statistik penguji:
2
4 (O j − E j )
2
Wuji = χ uji = ∑
j =1 Ej
=
( 7 − 10.19 )2 +
(15 − 10.61)2 +
(10 − 10.38)2 +
10.19 10.61 10.38
(8 − 8.82 )2 = 2.91
8.82
yang berdistribusi χ 2 dengan derajat bebas k.
Digunakan 3 kuantitas sampel pada perhitungan frekuensi harapan,
yaitu ukuran sampel n, rerata sampel x , dan standar deviasi s, sehingga
k = c – 3 = 4 – 3 = 1.
6. Kesimpulan: Karena W > 3.84, Wuji tidak terletak pada daerah kritis
dan H 0 tidak ditolak, sehingga data sampel dapat dianggap berasal dari
populasi normal.
259
8.3. UJI MCNEMAR
Uji McNemar digunakan untuk data kategorik dikotomi berpasangan.
Pengertian data ‘berpasangan’ di sini adalah sama seperti pada uji t
berpasangan, yaitu data untuk dua variabel yang sama, yang berasal dari:
- Subjek yang sama pada bagian yang berbeda, misalnya bagian kiri dan
kanan tubuh.
- Subjek yang sama pada waktu yang berlainan, misalnya sebelum dan
sesudah ‘perlakuan’.
- Subjek berpasangan, misalnya pasangan anak kembar, pasangan subjek
yang ‘dipadankan’ (di-matched), dan sebagainya.
Bentuk umum paparan data kategorik berpasangan ‘sebelum’ dan
‘sesudah’ perlakuan diperlihatkan pada tabel 8.13. Pada uji McNemar yang
dipentingkan hanyalah frekuensi f dan g, yaitu jumlah subjek yang
mengalami perubahan ‘sebelum’ dan ‘sesudah’ perlakuan.
5. Statistik penguji:
(f − g )2
Wuji = (8.10)
f +g
260
yang berdistribusi khi-kuadrat dengan derajat bebas 1.
Jika hipotesis nol ditolak, disimpulkan bahwa ada perubahan yang
terkait dengan perlakuan yang telah diberikan, dengan kata lain perlakuan
dianggap efektif untuk menghasilkan perubahan.
Contoh 8.5:
Misalkan dilakukan pengumpulan pendapat dari 100 responden yang
dipilih secara acak, apakah akan memilih calon presiden dari Partai
Demokrat atau Partai Republik. Pengumpulan pendapat dilakukan sebelum
dan sesudah debat calon.
Yi = Sesudah
X i = Sebelum
Demokrat Republik
Demokrat e = 63 f = 21
Republik g=4 h = 12
Uji hipotesis:
1. Jenis uji statistik: Uji McNemar
2. Hipotesis: H 0 : P (f) = P (g) = 0.5
H1 : P (f) ≠ P (g)
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis: W > χ (21; 0.05) , yaitu W > 3.84.
5. Statistik penguji:
(f − g )2
Wuji =
f +g
( 21 − 4 )2
= = 11.56
21 + 4
yang berdistribusi khi-kuadrat dengan derajat bebas 1.
6. Kesimpulan: Karena W > 3.84, H 0 ditolak, sehingga disimpulkan
bahwa pada tingkat signifikansi 0.05 ada perubahan pilihan responden
yang bermakna secara statistik sebagai hasil menyaksikan debat.
261
Uji McNemar digunakan untuk sampel berukuran besar. Untuk data
berpasangan kategorik yang berskala dikotomi, jika sampel berukuran kecil
digunakan uji tanda, yang akan diuraikan dalam pembahasan Metode
Statistika Non-Parametrik.
262
LAMPIRAN 8A: UKURAN KESEPAKATAN
Tabel VIII.1. Tabel observasi untuk paparan data berpasangan dari dua
pengamat berbeda pada tabel 2×2
Pengamat B
Pengamat A Jumlah
YB = 1 YB = 0
YA = 1 e f n11
YA = 0 g h n10
Jumlah n21 n20 n
263
Tabel VIII.2. Tabel proporsi untuk paparan data berpasangan dari dua
pengamat berbeda pada tabel 2×2
Pengamat B
Pengamat A Jumlah
YB = 1 YB = 0
YA = 1 pe pf p1
YA = 0 pg ph q1
Jumlah p2 q2 1
e f
pe = pf =
n n
g h
pg = ph =
n n
n11
p1 = pe + p f = q1 = pg + ph = 1 − p1
n
n
p2 = pe + pg = 21 q2 = p f + ph = 1 − p2
n
Estimasi ukuran kesepakatan berdasarkan data sampel adalah:
κ̂ =
(
2 pe ph − p f pg ) (8.11)
p1q2 + p2 q1
Contoh VIII.1:
Dua orang dokter spesialis paru, A dan B, secara terpisah memeriksa
100 foto Röntgen paru pengunjung rumah sakit untuk menilai ada tidaknya
gambaran tuberkulosis paru. Hasil pemeriksaan adalah sebagai berikut:
264
b. Tabel proporsi
Dokter B
Dokter A Jumlah
Tb paru (+) Tb paru (−)
Tb paru (+) pe = 0.20 p f = 0.04 p1 = 0.24
Tb paru (−) pg = 0.10 ph = 0.66 q1 = 0.76
Jumlah p2 = 0.30 q2 = 0.70 1
κ̂ =
(
2 pe ph − p f pg )
p1q2 + p2 q1
2 ( 0.20 )( 0.66 ) − ( 0.04 )( 0.10 )
= = 0.646
( 0.24 )( 0.70 ) + ( 0.30 )( 0.76 )
265
LAMPIRAN 8B: KOREKSI KONTINUITAS YATES
UNTUK UJI DATA KATEGORIK
Matriks VIII.1. Statistik penguji pada uji khi-kuadrat Pearson dan uji
Mc Nemar dengan dan tanpa koreksi kontinuitas
Statistik penguji
Uji Statistik
Tanpa koreksi Dengan koreksi
2
n ( ad − bc )2 n ( ad − bc − 0.5n )
Tabel 2×2
Uji khi- n1n2 m1m2 n1n2 m1m2
kuadrat 2 2
Pearson
∑∑
( Oij − Eij ) (Oij − Eij − 0.5 )
Tabel r×c
i j Eij ∑∑
i j Eij
266
LATIHAN 8
Bagian Pertama
Pilihlah satu jawaban yang paling benar !
B1 B2
A1 a b n1
A2 c d n2
m1 m2 n
A.
( a )( b )( c )( d ) C.
a !b !c ! d !
n1n2 m2 m2 n n1 ! n2 ! m2 ! m2 ! n !
n1n2 m2 m2 n !n !m !m !
B. D. 1 2 2 2
( a )( b )( c )( d )( n ) a !b !c ! d ! n !
267
5. Jika diketahui untuk tabel di atas: n = 30; n 1 = 15; m1 = 10; dan c =
3; maka probabilitas untuk mendapatkan komposisi data tersebut
adalah:
A. 0.0001 C. 0.0225
B. 0.0025 D. 0.0975
7. Pada uji eksak Fisher 1-sisi untuk data soal No. 5, nilai p adalah:
A. 0.0001 C. 0.0251
B. 0.0026 D. 0.1225
Bagian Kedua
Pilihlah satu jawaban yang paling benar !
Dimiliki data penghasilan bulanan 160 keluarga di sebuah desa
(dalam ribuan rupiah):
Penghasilan bulanan Banyak keluarga
129.5-139.5 9
139.5-149.5 18
149.5-159.5 23
159.5-169.5 23
169.5-179.5 26
179.5-189.5 22
189.5-199.5 18
199.5-205.5 15
209.5-219.5 6
268
1. Rerata dan standar deviasi sampel di atas adalah:
A. 165.75 dan 18.260 C. 175.000 dan 22.740
B. 172.50 dan 21.568 D. 183.50 dan 24.680
3. Frekuensi harapan kelas interval keenam (179.5 < X < 189.5 ) adalah:
A. 10.08 C. 17.47
B. 12.69 D. 25.55
2
6. Nilai ( O8 − E8 ) / E8 adalah:
A. 0.171 C. 2.222
B. 0.308 D. 2.426
269
Bagian Ketiga
Pilihlah satu jawaban yang paling benar !
Misalkan dua orang psikiater secara terpisah memeriksa 85 orang
pengunjung yang sama disebuah rumah sakit jiwa dengan hasil penelitian
sebagai berikut:
Psikiater B
Psikiater A Jumlah
Psikosis Neurosis
Psikosis 4 5 9
Neurosis 1 75 76
Jumlah 5 80 85
A. P ( a ) = P ( b ) C. P ( a ) = P ( d )
B. P ( c ) = P ( d ) D. P ( b ) = P ( c )
270
4. Dengan uji statistik yang relevan menurut jawaban soal No. 1, nilai
statistik penguji-nya adalah:
A. 0.32 C. 2.67
B. 0.67 D. 27.04
271
BAB 9
STATISTIKA NON-PARAMETRIK I
9.1. PENGERTIAN STATISTIKA NON-PARAMETRIK
Distribusi populasi
Ukuran sampel
Normal Sebarang
Besar Parametrik Parametrik
272
Keunggulan Metode Statistika Non-Parametrik
Keunggulan Metode Statistika Non-Parametrik antara lain yaitu:
1) Dapat digunakan tanpa tergantung pada bentuk distribusi populasi
sumber data (distribution-free statistics) / memerlukan lebih sedikit
asumsi mengenai populasi sumber data.
2) Dapat digunakan pada sampel ukuran kecil ataupun untuk data yang
berskala lebih rendah daripada interval / dapat diaplikasikan dalam
situasi yang tidak memungkinkan penggunaan prosedur teori normal.
3) Umumnya mudah untuk dipahami.
4) Hanya sedikit kurang efisien dibandingkan metode statistika parametrik
jika populasinya normal, namun dapat lebih efisien daripada metode
statistika parametrik jika populasinya tidak normal.
273
Matriks 9.2. Beberapa uji parametrik dan counter-part non-parametrik-
nya
Metode
Metode non-parametrik
parametrik
Dua sampel Uji jumlah rank Wilcoxon
Uji t
independen (uji Mann-Whitney)
274
9.2. UJI TANDA (SIGN TEST)
Uji tanda merupakan counterpart non-parametrik bagi uji t
berpasangan, namun selain untuk pasangan data kontinu atau numerik seperti
pada uji t berpasangan, uji tanda juga dapat digunakan untuk himpunan
pasangan data ordinal.
Persyaratan:
275
4. Daerah kritis untuk n < 20:
(n = banyaknya ‘+’ dan ‘−‘ dalam sampel = n’ − banyaknya ‘nol’)
a. H1 : P (+) ≠ P (−)
Cari t, yaitu nilai y yang sesuai dengan α1 ≈ α/2 pada tabel
probabilitas binomial kumulatif (dengan n yang sesuai dan p =
0.50; buku Metode Statistika I, Addendum B2). Daerah kritis
adalah:
T < t atau T > n – t (9.4.a)
b. H1 : P (+) > P (−)
Cari t, yaitu nilai y yang sesuai dengan α1 ≈ α pada tabel
binomial kumulatif (dengan n yang sesuai dan p = ½). Daerah
kritis:
T > n’ − t (9.4.b)
c. H1 : P (+) < P (−)
Cari t, yaitu nilai y yang sesuai dengan α1 ≈ α pada tabel
binomial kumulatif (dengan n yang sesuai dan p = ½). Daerah
kritis:
T<t (9.4.c)
5. Statistik penguji:
Tuji = banyaknya ‘+’ dalam sampel (9.5)
Contoh 9.1:
Misalkan hendak ditentukan daerah kritis untuk uji tanda jika jumlah
‘plus’ dan ‘minus’ dalam sampel adalah 17, dan akan dilakukan uji hipotesis
2-sisi dengan tingkat signifikansi α = 0.005.
n = 17 α / 2 = 0.025
Pada tabel probabilitas binomial kumulatif (buku teks metode
Statistika I, Addendum B2) untuk n = 17 dan p = 0.05, tampak bahwa nilai
α1 yang paling mendekati α/2 = 0.025 adalah α1 = 0.0245. Nilai t = x yang
276
bersesuaian dengan α1 = 0.0245 adalah t = x = 4, sehingga area penolakan
pada sisi kiri adalah T < t, yaitu:
T < 4,
sedangkan area penolakan pada sisi kanan adalah T > n – t, yaitu:
T > 13
(lihat diagram 9.1)
Diagram 9.1. Daerah kritis pada uji tanda dua-sisi dengan n = 17 dan α
= 0.05
Contoh 9.2:
Sebuah pabrik sabun hendak membuat kemasan baru yang
diharapkan lebih menarik daripada kemasan lama. Untuk itu dilakukan
survei terhadap sampel acak konsumen, yang dimimta memilih kemasan
baru (B) atau lama (A). Jika seseorang memilih B diberi tanda ‘+’, jika yang
dipilih A diberi tanda ‘−‘. Dari 16 orang konsumen, 10 orang lebih suka B.
Uji hipotesis:
1. Jenis uji statistik: Uji tanda
2. Hipotesis: H 0 : P (+) < P (−)
H1 : P (+) > P (−)
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis (n = 16):
Pada tabel binomial kumulatif dengan n = 16 dan p = ½ diperoleh t = y
= 4 untuk α1 = 0.038 (paling dekat dengan α = 0.05).
277
Daerah kritis adalah T > n – t atau T > 12.
5. Statistik penguji:
Tuji = 10
6. Kesimpulan: Statistik penguji Tuji tidak terletak pada daerah kritis,
sehingga H 0 tidak ditolak dan disimpulkan pada tingkat signifikansi α
= 0.05, tidak terdapat perbedaan preferensi yang bermakna antara
kemasan sabun baru dengan kemasan lama.
278
9.3. UJI RANK BERTANDA WILCOXON (WILCOXON
SIGNED RANK TEST)
Uji rank bertanda Wilcoxon (Wilcoxon signed rank test) juga
merupakan counter-part non-parametrik bagi uji t berpasangan seperti uji
tanda, tetapi berbeda dengan uji tanda, uji rank bertanda Wilcoxon hanya
dapat digunakan untuk pasangan data kontinu atau numerik (tidak dapat
untuk pasangan data ordinal).
Persyaratan:
Data berpasangan ( X1 ; Y1 ), ( X 2 ; Y 2 ), . . . , ( X n ; Yn ); X i dan Yi tidak
independen.
Skala pengukuran sekurang-kurangnya interval dalam tiap pasangan,
sehingga untuk tiap pasangan dapat dihitung:
Di = Yi − X i (9.6)
dan ditentukan nilai Ri , yaitu:
Ri = rank Di jika Di > 0 ) (9.7.a)
Dua atau lebih Di yang sama disebut ties, dan diberikan peringkat
rata-ratanya.
Contoh 9.3:
Misalkan dimiliki 10 pasangan nilai data berikut (tabel 9.1).
Perhatikan cara menentukan Ri :
279
Tabel 9.1. Sepuluh pasangan nilai data dan penentuan Ri −nya
No Xi Yi Di = Yi − X i Di Rank Di Ri
1 5 7 2 2 2.5 2.5
2 4 4 0 0 − −
3 6 2 −4 4 5.5 −5.5
4 9 7 −2 2 2.5 −2.5
5 6 6 0 0 − −
6 3 8 5 5 7 7
7 5 6 1 1 1 1
8 7 3 −4 4 5.5 −5.5
9 2 9 7 7 8 8
10 4 7 3 3 4 4
No 1 2 3 4 5 6 7 8 9 10
Di 2 0 4 2 0 5 1 4 7 3
Tanda Di + − − + + − + +
Di 1 2 2 3 4 4 5 7
Rank Di 1 2.5 2.5 4 5.5 5.5 7 8
Tanda Di + + − + − − + +
Ri 1 2.5 −2.5 4 −5.5 −5.5 7 8
280
Langkah-langkah uji hipotesis:
Setelah nilai-nilai Ri ditentukan, dapat dilakukan uji hipotesis
dengan langkah-langkah sebagai berikut:
1. Jenis uji statistik: Uji rank bertanda Wilcoxon.
2 Hipotesis:
a. H 0 : E ( Di ) = 0 vs H1 : E ( Di ) ≠ 0 ) (9.8.a)
b. H 0 : E ( Di ) < 0 vs H1 : E ( Di ) > 0 ) (9.8.b)
c. H 0 : E ( Di ) > 0 vs H1 : E ( Di ) < 0 ) (9.8.c)
Jika terdapat banyak ties atau n > 50, digunakan pendekatan normal
dengan statistik penguji:
281
n
∑
i =1
Ri
Zuji = (9.12)
n
∑ Ri2
i =1
Contoh 9.4:
Misalkan hendak diteliti apakah anak yang lahir lebih dahulu pada
pasangan kembar memiliki skor agresivitas yang lebih tinggi dibandingkan
dengan adik kembarnya. Diperoleh hasil pengamatan sebagai berikut (tabel
9.4):
282
Uji hipotesis untuk data di atas yaitu:
1. Jenis uji statistik: Uji rank bertanda Wilcoxon.
2. Hipotesis: H 0 : E ( Di ) > 0
H1 : E ( Di ) < 0
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis:
Karena didapatkan beberapa ties, akan digunakan statistik penguji
dengan pendekatan normal dengan daerah kritis untuk H1 : E ( Di ) < 0
adalah:
Z < Z 0.05 , yaitu Z < −1.64.
Jika digunakan rumus 9.11, maka daerah kritis adalah:
T < w 0.05 atau T < 14.
5. Statistik penguji:
Statistik penguji dengan pendekatan normal adalah:
n
∑
i =1
Ri = 3 + 7 + . . . – 11 = −17
n
∑ Ri2 = 32 + 7 2 + . . . − (11)2 = 505
i =1
n
∑
i =1
Ri
−17
Zuji = = = −0.76
n 505
∑ Ri2
i =1
283
LAMPIRAN 9A: INTERVAL KONFIDIENSI
BOOTSTRAP
Bootstrapping tergolong dalam salah satu metode non-parametrik
untuk memperoleh inferensi statistik, yang sebagaimana metode non-
parametrik lainnya, menunjukkan manfaat terbesar apabila distribusi
sampling tidak diketahui.
Dasar metode bootstrapping ialah dengan menganggap sampel
sebagai suatu populasi, dan menerapkan proses ‘resampling’ (sampling
dengan pengembalian) untuk menghasilkan estimasi distribusi sampling
statistik secara empiris.
Misalkan dimiliki sampel awal berukuran n yang dalam metode
bootstrapping dianggap sebagai populasi dan hendak dilakukan estimasi
interval terhadap rerata populasi sesungguhnya µ. Terhadap sampel awal ini
diterapkan proses resampling, yaitu pengambilan subsampel berukuran n
dengan pengembalian. Dari sampel awal berukuran n dapat diperoleh
n
sebanyak n subsampel, namun yang dianjurkan ialah mengambil sekurang-
kurangnya 1,000 subsampel untuk melakukan pengestimasian interval
terhadap rerata populasi µ.
Contoh IX.1:
Misalkan dimiliki data sampel dengan n = 4:
X1 = 3 X2 = 7 X3 = 5 X4 = 8
Dari sampel berukuran n = 4 ini, dilakukan proses resampling dengan ukuran
subsampel n = 4 untuk menghitung interval konfidensi bootstrap 95% bagi
rerata populasi µ (dari sampel berukuran 4 dengan proses resampling
4
berukuran 4 hanya akan diperoleh 4 = 256 subsampel, tetapi tujuannya di
sini adalah untuk menjelaskan prosedur perhitungan interval konfidensi
bootstrap).
Diperoleh 256 subsampel dengan rerata masing-masing seperti
terlihat pada tabel IX.1.
284
Tabel IX.1. Contoh daftar hasil proses resampling untuk metode
bootstrapping
285
Diagram IX.1. Contoh distribusi sampling nilai rerata subsampel
286
Tabel IX.2. Nilai-nilai rerata subsampel yang telah diurutkan menurut
besarnya
287
LATIHAN 9
Bagian Pertama
Pilihlah satu jawaban yang paling benar !
3. Yang merupakan padanan yang sesuai bagi uji parametrik dan uji
non-parametrik di antara pasangan berikut yaitu:
A. Uji t independen dan uji jumlah rank (rank sum) Wilcoxon.
B. Uji t berpasangan dan uji rank bertanda (sign rank) Wilcoxon,
C. ANOVA 1-arah dan uji Kruskal Wallis.
D. Semuanya benar.
288
5. Seandainya diketahui data di atas berasal dari populasi normal, maka
uji parametrik yang relevan menilai efektivitas diet adalah:
A. Uji t C. Uji t berpasangan
B. Uji Z D. Uji khi-kuadrat
8. Pada uji tanda, dengan tingkat signifikansi 5%, nilai t yang sesuai
adalah:
A. 0 C. 2
B. 1 D. 3
289
Bagian Kedua
Pilihlah satu jawaban yang paling benar !
2
3. Nilai ∑ R i dan ∑R i
adalah:
A. 4 dan 10 C. 20 dan 138
B. −4 dan 10 D. −20 dan 138
290
7. Kesimpulan yang diperoleh pada uji hipotesis ialah:
A. Dengan uji tanda, H 0 ditolak.
B. Dengan uji rank bertanda Wilcoxon (pendekatan normal), H 0
ditolak.
.
C. Dengan uji rank bertanda Wilcoxon (tanpa pendekatan normal),
H 0 ditolak.
D. Semuanya salah.
291
BAB 10
STATISTIKA NON-PARAMETRIK II
Persyaratan:
Data dua kelompok X1 , X 2 , . . . , X n ; dan Y1 , Y 2 , . . . , Yn ; yang
saling independen.
Skala pengukuran sekurang-kurangnya ordinal, sehingga dapat
ditentukan nilai R ( X i ) dan R ( Yi ) (ranking) untuk tiap nilai data X i
dan Yi pada kelompok gabungan yang telah diurutkan.
Dua atau lebih data yang sama disebut ties, dan diberikan peringkat
rata-ratanya.
Contoh 10.1:
Misalkan dimiliki data berikut yang hendak ditentukan rank-nya (tabel
10.1):
292
Tabel 10.1. Contoh data untuk penentuan Ri pada uji jumlah rank
Wilcoxon
X Y
7.3 6.3 4.2 12.6 11.8 16.0
12.5 11.4 2.7 5.6 8.3 1.0
9.1 3.2 15.3 5.9 14.8 4.0
Tabel 10.2. Penentuan rank pada uji jumlah rank Wilcoxon untuk data
pada tabel 10.1
X Y Rank X Y Rank
1.0 1 8.3 10
2.7 2 9.1 11
3.2 3 11.4 12
4.0 4 11.8 13
4.2 5 12.5 14
5.6 6 12.6 15
6.3 7.5 14.8 16
6.3 7.5 15.3 17
7.3 9 16.0 18
293
α adalah tingkat signifikansi, sedangkan nilai wα diperoleh dari tabel
statistik uji Wilcoxon (lihat Addendum F). Nilai w 1−α diperoleh
dengan rumus:
w 1−α = n (N + 1) − wα (10.3)
Jika banyak ties, dan akan digunakan statistik penguji Tuji yang
berdistribusi normal standar, daerah kritis untuk ketiga hipotesis di atas
masing-masing adalah:
a. T ′ < − Zα 2 atau T ′ > Zα 2
b. T ′ > Zα
c. T ′ < − Zα
5. Statistik penguji:
n
Tuji = ∑
i =1
Ri (10.4)
Jika banyak ties, Tuji dikurangi dengan reratanya dan dibagi dengan
standar deviasinya:
N +1
Tuji − n
Tuji' = 2 (10.5.a)
2
nm N nm ( N + 1)
∑
N ( N − 1) i =1
Ri2 −
4 ( N − 1)
yang berdistribusi normal standar dengan N menyatakan ukuran sampel
N
seluruhnya dan ∑
i =1
Ri2 menyatakan penjumlahan seluruh kuadrat nilai-
nilai rank:
N=n+m (10.5.b)
{ ( )}
N n m 2
∑∑
2
dan: ∑ Ri2 = {R ( X i )} + R Yj
i =1 i =1 j =1
N n m 2
∑
2
∑ Ri2 =
i =1
∑ R ( X i ) +
i =1 j =1
R Yj
( )
(10.5.c)
294
6. Kesimpulan: H 0 ditolak jika statistik penguji terletak pada daerah
kritis dan H 0 tidak ditolak jika statistik penguji tidak terletak pada
daerah kritis.
Contoh 10.2:
Lihat kembali data pada contoh 10.1. Misalkan X menyatakan nilai tes
kebugaran fisik anak desa dan Y adalah nilai tes kebugaran fisik anak kota.
Hendak diuji kebenaran dugaan bahwa kebugaran fisik anak desa lebih baik
daripada kebugaran fisik anak kota.
Uji hipotesis:
1. Jenis uji statistik: Uji jumlah rank Wilcoxon (uji Mann-Whitney).
2. Hipotesis: H 0 : E (X) < E (Y)
H1 : E (X) > E (Y)
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis:
Pada tabel statistik uji jumlah rank Wilcoxon untuk n = 6 dan m = 12
diperoleh w 0.05 = 39. Dengan rumus w 1−α = n (N + 1) − wα ,
diperoleh:
w 0.95 = n (N + 1) − w 0.05
= (6)(18 + 1) – 39 = 75
Daerah kritis adalah T > w 0.95 atau T > 75.
5. Statistik penguji:
n
Tuji = ∑
i =1
Ri
= 2 + 5 + 7.5 + 9 + 12 + 14 = 49.5
6. Kesimpulan: statistik penguji T = 49.5 tidak terletak pada daerah kritis,
sehingga H 0 tidak ditolak dan disimpulkan pada tingkat signifikansi α
= 0.05, tidak terdapat perbedaan yang bermakna antara kebugaran fisik
anak desa dengan anak kota.
295
10.2 KOEFISIEN KORELASI SPEARMAN
Misalkan dimiliki data bivariat ( X1 ; Y1 ), ( X 2 ; Y 2 ), . . . , ( X n ; Yn ),
maka koefisien korelasi Pearson (koefisien korelasi produk momen) antara
variabel X dan Y adalah:
S xy
rP =
S xx S yy
n
∑
i =1
( X i − X )(Yi − Y )
=
n 2 n 2
∑ i ( X − X ) ∑ (Yi − Y )
i =1 i =1
dengan syarat X i dan Yi sekurang-kurangnya berskala interval.
Pada Statistika Non-Parametrik, untuk data skala ordinal diperlukan
ukuran korelasi lain, namun dengan persyaratan umum yang serupa seperti
pada koefisien korelasi Pearson:
1. Nilai ukuran berkisar antara −1 dan +1.
2. Jika nilai-nilai X yang lebih besar cenderung berpasangan dengan nilai-
nilai Y yang lebih besar, ukuran korelasi haruslah positif, dan jika
kecenderungannya kuat maka nilai ukuran korelasi mendekati +1.
3. Jika nilai-nilai X yang lebih besar cenderung berpasangan dengan nilai-
nilai Y yang lebih kecil, ukuran korelasi haruslah negatif, dan jika
kecenderungannya kuat maka nilai ukuran korelasi mendekati −1.
4. Jika nilai-nilai X berpasangan secara acak dengan nilai-nilai Y, maka
nilai ukuran korelasi mendekati nol.
Jika nilai-nilai X i dan Yi pada rumus koefisien korelasi Pearson
diganti dengan nilai-nilai rank-nya [R ( X i ) dan R ( Yi )], diperoleh ukuran
koefisien korelasi rank Spearman yang dapat digunakan untuk data berskala
ordinal:
n 2
n +1
∑i =1
R ( X i ) R (Yi ) − n
2
rS = (10.6)
n n + 1 2 n n + 1
2
∑ R ( X i ) − n ∑ i 2
R ( Y ) − n
i =1 2
i =1
Jika tidak ada tie, dapat digunakan rumus yang lebih sederhana:
296
n
6∑ R ( X i ) − R (Yi )
2
rS = 1 − i =1 (10.7)
( )
n n −12
6T
atau: rS = 1 − (10.7.a)
(
n n −1 2
)
n
∑
2
dengan: T= R ( X i ) − R (Yi ) (10.7.b)
i =1
Contoh 10.3:
Misalkan hendak dinilai kebenaran dugaan adanya korelasi
agresivitas antar anggota pasangan kembar ganda. Untuk itu dilakukan tes
psikologi pada 12 pasangan kembar dengan hasil skala agresivitas sebagai
berikut:
Tabel 10.3. Skor agresivitas anak lahir pertama dan anak lahir kedua
pada 12 pasangan anak kembar
i 1 2 3 4 5 6 7 8 9 10 11 12
Xi 86 71 77 68 91 72 77 91 70 71 88 87
Yi 88 77 76 64 96 72 65 90 65 80 81 72
297
n n
∑ R ( Xi ) = 8 ∑
2
R ( Xi ) = 648.5
i =1 i =1
n n
∑ ∑
2
R (Yi ) = 78 R (Yi ) = 649
i =1 i =1
n 2 2
n +1 12 + 1
∑ R ( X i ) R (Yi ) = 611.25
i =1
n
2
= 12
2
= 507
2
Tabel 10.5 Perhitungan nilai R ( X i ) - R (Yi ) untuk skor agresivitas
12 pasangan anak kembar
2
i R ( Xi ) R ( Yi ) R ( X i ) − R (Yi )
1 8 10 4
2 3.5 7 12.25
3 6.5 s 6 0.25
4 1 1 0
5 11.5 12 0.25
6 5 4.5 0.25
7 6.5 2.5 16
8 11.5 11 0.25
9 2 2.5 0.25
10 3.5 8 20.25
11 10 9 1
12 9 4.5 20.25
T = 75
298
Koefisien korelasi Spearman dengan rumus penyederhanaan adalah:
6T
rS = 1 −
(
n n2 − 1 )
=1−
( 6 )( 75) = 0.738
(
12 122 − 1 )
Diperoleh hasil yang praktis hampir sama dengan hasil terdahulu
(perbedaan disebabkan adanya satu tie).
Dengan menggunakan nilai-nilai sesungguhnya (bukan rank),
diperoleh nilai koefisien korelasi Pearson sebesar 0.735.
299
10.3. UJI KORELASI RANK SPEARMAN
Terhadap nilai koefisien korelasi Spearman yang diperoleh dapat pula
dilakukan uji hipotesis untuk menguji apakah korelasi yang ditemukan
memiliki kemaknaan statistik. Hipotesis yang diuji yaitu:
Uji satu-sisi:
A. H 0 : X dan Y independen
H1 : Nilai-nilai X yang besar cenderung berpasangan dengan
nilai-nilai Y yang besar; atau:
H0 : ρ = 0 vs H1 : ρ > 0 (10.8.a)
B. H0 : X dan Y independen
H1 : Nilai-nilai X yang kecil cenderung berpasangan dengan
nilai-nilai Y yang besar; atau:
H0 : ρ = 0 vs H1 : ρ < 0 (10.8.b)
Uji dua-sisi:
H 0 : X dan Y independen
H1 : Nilai-nilai X yang besar cenderung berpasangan dengan
nilai-nilai Y yang besar, atau nilai-nilai X yang kecil
cenderung berpasangan dengan nilai-nilai Y yang besar;
atau:
H0 : ρ = 0 vs H1 : ρ ≠ 0 (10.8.c)
Nilai-nilai kritisnya untuk uji satu arah dan n < 30 dapat dilihat pada
tabel nilai kritis koefisien korelasi rank Spearman (Addendum G).
Contoh 10.4:
Lihat kembali data pada contoh 10.3. Hendak diuji, apakah terdapat
korelasi yang bermakna secara statistik antara skala agresivitas anak pertama
dengan anak kedua pada pasangan kembar ganda.
300
Uji hipotesis:
1. Jenis uji statistik: Uji korelasi rank Spearman.
2. Hipotesis:
H 0 : X dan Y independen
H1 : Nilai-nilai X yang besar cenderung berpasangan dengan nilai-
nilai Y yang besar.
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis:
Pada tabel nilai kritis koefisien korelasi rank Spearman, daerah kritis
untuk n = 12 dan tingkat signifikansi α = 0.05 adalah r > 0.4965.
5. Statistik penguji:
Statistik penguji adalah nilai koefisien korelasi itu sendiri (rumus 10.6),
yaitu:
rS = 0.736
301
LAMPIRAN 10A: STATISTIK U MANN-
WHITNEY
Dalam subbab 10.1 telah disebutkan bahwa uji Mann-Whitney dan
uji jumlah rank Wilcoxon pada hakekatnya adalah sama, walaupun keduanya
memiliki rumus perhitungan statistik penguji yang berbeda. Statistik penguji
uji Mann-Whitney, yang dikenal juga sebagai stastistik U Mann-Whitney
adalah:
n m
U uji = ∑∑
i =1 j =1
φ ( X i ;Y j ) (10.8)
1 jika b < a
dengan: φ ( a; b ) =
0 untuk lainnya
m
Secara sederhana dapat dijelaskan bahwa ∑
j =1
φ ( X i ;Y j ) menyatakan
banyaknya nilai Yj yang lebih kecil daripada suatu nilai X i tertentu. Telah
dinyatakan pula dalam pembahasan subbab 10.1 bahwa statistik penguji pada
uji Mann-Whitney dan uji jumlah rank Wilcoxon adalah sama secara
matematis, dan pada contoh berikut diperlihatkan bahwa besar keduanya
adalah sama.
Contoh X.1:
Lihat kembali contoh data nilai tes kebugaran fisik anak kota dan
anak desa pada contoh 10.1. Pada contoh 10.2 telah dihitung nilai statistik
penguji untuk uji jumlah rank Wilcoxon, yaitu Tuji = 49.5.
302
Tabel X.1. Contoh perhitungan statistik U Mann-Whitney
m
X Y ∑
j =1
φ ( X i ;Y j )
1.0
2.7 1
3.2
4.0
4.2 3
5.6
6.3
6.3 4.5
7.3 5
8.3
9.1
11.4 7
11.8
12.5 8
12.6
14.8
15.3
16.0
n m
∑∑
i =1 j =1
φ ( X i ;Y j ) 28.5
Perhatikan bahwa:
- Ada 1 nilai Y yang lebih kecil daripada X1 = 2.7, sehingga
m
∑
j =1
φ ( X i ; Y j ) = 1.
- Ada 4 nilai Y yang lebih kecil daripada X 3 = 6.3 dan 1 nilai Y yang
m
sama dengan X 3 = 6.3, sehingga ∑
j =1
φ ( X i ; Y j ) = 4.5.
- Dan seterusnya.
303
Statistik penguji untuk uji jumlah rank Wilcoxon dapat dihitung dari
statistik U Mann-Whitney:
n ( n + 1)
Tuji = U +
2
6 ( 6 + 1)
= 28.5 + = 49.5
2
Jika dibandingkan dengan statistik penguji pada uji rank Wilcoxon,
statistik U Mann-Whitney lebih mudah untuk dijelaskan dan juga lebih
mudah untuk dihitung pada sampel berukuran kecil, namun untuk sampel
besar, statistik penguji pada uji jumlah rank Wilcoxon lebih praktis untuk
digunakan.
304
LATIHAN 10
Bagian Pertama
Pilihlah satu jawaban yang paling benar !
2. Seandainya distribusi suhu ruang yang paling nyaman bagi pria dan
wanita tidak diketahui, uji yang paling relevan bagi data di atas ialah:
A. Uji t
B. Uji t berpasangan
C. Uji rank bertanda Wilcoxon
D. Uji jumlah rank bertanda Wilcoxon
3. Jika X menyatakan suhu ruang yang paling nyaman bagi pria dan Y
suhu ruang yang paling nyaman bagi wanita, maka dengan uji
Wilcoxon, hipotesis nol yang sesuai bagi tujuan uji diatas ialah:
A. H 0 : E ( X ) = E (Y ) C. H 0 : E ( X ) ≥ E (Y )
B. H 0 : E ( X ) ≤ E (Y ) D. Semuanya salah
305
n
4. Nilai ∑
i =1
R ( X i ) adalah:
A. 61 C. 144
B. 66 D. 149
306
9. Uji non parametrik yang paling relevan bagi di atas ialah:
A. Uji rank bertanda Wilcoxon
B. Uji jumlah rank Wilcoxon (uji Mann-Whitney)
C. Keduanya benar
D. Keduanya salah
10. Jika X menyatakan kadar nikotin pada rokok merek A dan Y kadar
nikotin pada rokok merek B, maka dengan uji Mann-Whitney,
hipotesis nol yang sesuai bagi tujuan uji di atas ialah:
A. H 0 : E ( X ) = E (Y ) C. H 0 : E ( X ) ≥ E (Y )
B. H 0 : E ( X ) ≤ E (Y ) D. Semuanya salah
n
11. Nilai R1 = ∑
i =1
R ( X i ) adalah:
A. 58 C. 78
B. 66 D. 136
m
12. Nilai R2 = ∑ R Y j adalah:
( )
j =1
A. 58 C. 78
B. 66 D. 136
14. Untuk uji 1-sisi, nilai p 1-sisi yang bersesuaian dengan nilai statistik
U di atas adalah:
A. p < 0.05 C. p > 0.10
B. 0.05 < p < 0.10 D. Semuanya salah
307
Bagian Kedua
Pilihlah satu jawaban yang paling benar !
Siswa 1 2 3 4 5 6 7 8
X 76 67 93 70 68 89 65 82
Y 84 57 88 62 76 65 63 74
X : Hasil tes psikologi
Y : Hasil tes akademik
n
Nilai T = ∑ R ( X i ) − R (Yi ) adalah:
2
2.
i =1
A. 0 C. 14
B. 7 D. 32
4. Untuk menguji ada tidaknya korelasi hasil tes psikologi dengan hasil
tes akademik adalah:
A. Uji satu-sisi untuk korelasi positif
B. Uji satu-sisi untuk korelasi negatif
C. Uji dua-sisi
D. Semuanya salah
5. Dengan tingkat signifikansi 5%, daerah kritis uji korelasi rank di sini
adalah:
A. r > 0.463 C. r > 0.619
B. r > 0.591 D. r > 0.786
308
6. Kesimpulan yang paling tepat uji korelasi rank ini adalah:
A. Ada korelasi yang bermakna secara statistik antara hasil tes
psikologi dengan hasil tes akademik.
B. Ada korelasi positif yang bermakna secara statistik antara
hasil tes psikologi dengan hasil tes akademik.
C. Ada korelasi negatif yang bermakna secara statistiok antara
hasil tes psikologi dengan hasil tes akademik.
D. Tidak ada korelasi yang bermakna secara statistik antara hasil
tes psikologi dengan hasil tes akademik.
309
KEPUSTAKAAN
310
Sanders DH. Statistics: A First Course, Fifth Edition. New York: McGraw-
Hill, Inc, 1995.
Siegel S. Statistik Nonparametrik untuk Ilmu-ilmu Sosial (terjemahan Z
Suyuti). Jakarta: PT Gramedia, 1986.
Snedecor GW, WG Cochran. Statistical Methods, Seventh Edition. Ames,
Iowa: The Iowa State University Press, 1982.
Steel RGD, JH Torrie. Principles and Procedures of Statistics: A Biometrical
Approach, Second Edition. Auckland: The McGraw-Hill International
Book Company, 1981.
Subiyakto H. Statistika 2. Jakarta: Penerbit Gunadarma, 1994.
Upton GJG. The Analysis of Cross-tabulated Data. Chichester: John Wiley
& Sons, 1980.
311
Addendum A: Distribusi Z
ADDENDUM A: DISTRIBUSI Z
P ( Z > Zα ) = α
Sumber: GEP Box, et al, Statistics for Experimenters, John Wiley & Sons, 1978.
313
Addendum B: Nilai Kritis Distribusi t
α = P ( t > tα )
314
ADDENDUM C: NILAI KRITIS DISTRIBUSI F
P ( F > Fα ) = α
Nilai Kritis Distribusi F (Lanjutan)
Nilai Kritis Distribusi F (Lanjutan)
db1 : derajat bebas pembilang (numerator); db2 : derajat bebas penyebut (denominator)
Sumber: M Merrington & CM Thompson, Tables of Percentage of the Inverted Beta (F)-Distribution, Biometrika 33 (1943) pp 73-88.
ADDENDUM D: NILAI KRITIS DISTRIBUSI χ 2
(
P χ 2 > χα2 ) =α
2
Sumber: CM Thompson, Tables of Percentage Points of the χ -Distribution, Biometrika 32
(1941) pp 188-89.
318
ADDENDUM E: KUANTIL STATISTIK PENGUJI RANK BERTANDA WILCOXON
α n( n+1)
n
.005 .01 .025 .05 .10 .20 .30 .40 .50 2
4 0 0 0 0 1 3 3 4 5 10
5 0 0 0 1 3 4 5 6 7.5 15
6 0 0 1 3 4 6 8 9 10.5 21
7 0 1 3 4 6 9 11 12 14 28
8 1 2 4 6 9 12 14 16 18 36
9 2 4 6 9 11 15 18 20 22.5 45
10 4 6 9 11 15 19 22 25 27.5 55
11 6 8 11 14 18 23 27 30 33 66
12 8 10 14 18 22 28 32 36 39 78
13 10 13 18 22 27 33 38 42 45.5 91
14 13 16 22 26 32 39 44 48 52.5 105
15 16 20 26 31 37 45 51 55 60 120
16 20 24 30 36 43 51 58 63 68 136
17 24 28 35 42 49 58 65 71 76.5 153
18 28 33 41 48 56 66 73 80 85.5 171
19 33 38 47 54 63 74 82 89 95 190
20 38 44 53 61 70 83 91 98 105 210
21 44 50 59 68 78 91 100 108 115.5 231
22 49 56 67 76 87 100 110 119 126.5 253
23 55 63 74 84 95 110 120 130 138 276
24 62 70 82 92 105 120 131 141 150 300
25 69 77 90 101 114 131 143 153 162.5 325
31 119 131 148 164 182 205 221 235 248 496
32 129 141 160 176 195 219 236 250 264 528
33 139 152 171 188 208 233 251 266 280.5 561
34 149 163 183 201 222 248 266 282 297.5 595
35 160 175 196 214 236 263 283 299 315 630
36 172 187 209 228 251 279 299 317 333 666
37 184 199 222 242 266 295 316 335 351.5 703
38 196 212 236 257 282 312 334 353 370.5 741
39 208 225 250 272 298 329 352 372 390 780
40 221 239 265 287 314 347 371 391 410 820
41 235 253 280 303 331 365 390 411 430.5 861
42 248 267 295 320 349 384 409 431 451.5 903
43 263 282 311 337 366 403 429 452 473 946
44 277 297 328 354 385 422 450 473 495 990
45 292 313 344 372 403 442 471 495 517.5 1035
46 308 329 362 390 423 463 492 517 540.5 1081
47 324 346 379 408 442 484 514 540 564 1128
48 340 363 397 428 463 505 536 563 588 1176
49 357 381 416 447 483 527 559 587 612.5 1225
50 374 398 435 467 504 550 583 611 637.5 1275
Sumber: HL Harter & DB Owen, Selected Tables in Mathematical Statistics, Vol. 1 (1970).
n( n+1)
Untuk α > 0.50: wα = ‒ w 1−α
2
319
ADDENDUM F: KUANTIL STATISTIK PENGUJI JUMLAH RANK WILCOXON
P (T < wα ) < α
m
n ∝
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
2 0.001 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
0.005 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4
0.01 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 5 5
0.025 3 3 3 3 3 3 4 4 4 5 5 5 5 5 5 6 6 6 6
0.05 3 3 3 4 4 4 5 5 5 5 6 6 7 7 7 7 8 8 8
0.10 3 4 4 5 5 5 6 6 7 7 8 8 8 9 9 10 10 11 11
3 0.001 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 7 7 7 7
0.005 6 6 6 6 6 6 6 7 7 7 8 8 8 9 9 9 9 9 10
0.01 6 6 6 6 6 7 7 8 8 8 9 9 9 10 10 11 11 11 12
0.025 6 6 6 7 8 8 9 9 10 10 11 11 12 12 13 13 14 14 15
0.05 6 7 7 8 9 9 10 11 11 12 12 13 14 14 15 16 16 17 18
0.10 7 8 8 9 10 11 12 12 13 14 15 16 17 17 18 19 20 21 22
4 0.001 10 10 10 10 10 10 10 10 11 11 11 12 12 12 13 13 14 14 14
0.005 10 10 10 10 11 11 12 12 13 13 14 14 15 16 16 17 17 18 19
0.01 10 10 10 11 12 12 13 14 14 15 16 16 17 18 18 19 20 20 21
0.025 10 10 11 12 13 14 15 15 16 17 18 19 20 21 22 22 23 24 25
0.05 10 11 12 13 14 15 16 17 18 19 20 21 22 23 25 26 27 38 29
0.10 11 12 14 15 16 17 18 20 21 22 23 24 26 27 28 29 31 32 33
5 0.001 15 15 15 15 15 15 16 17 17 18 18 19 19 20 21 21 22 23 23
0.005 15 15 15 16 17 17 18 19 20 21 22 23 23 24 25 26 27 28 29
0.01 15 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
0.025 15 16 17 18 19 21 22 23 24 25 27 28 29 30 31 33 34 35 36
0.05 16 17 18 20 21 22 24 25 27 28 29 31 32 34 35 36 38 39 41
0.10 17 18 20 21 23 24 26 28 29 31 33 34 36 38 39 41 43 44 46
320
KUANTIL STATISTIK PENGUJI JUMLAH RANK WILCOXON (Lanjutan)
m
n ∝
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
6 0.001 21 21 21 21 21 21 23 24 25 26 26 27 28 29 30 31 32 33 34
0.005 21 21 22 23 24 25 26 27 28 29 31 32 33 34 35 37 38 39 40
0.01 21 21 23 24 25 26 28 29 20 31 33 34 35 37 38 40 41 42 44
0.025 21 23 24 25 27 28 30 32 33 35 36 38 39 41 43 44 46 47 49
0.05 22 24 25 27 29 30 32 34 36 38 39 41 43 45 47 48 50 52 54
0.10 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 56 58 60
7 0.001 28 28 28 28 29 30 31 32 34 35 36 37 38 39 40 42 43 44 45
0.005 28 28 29 30 32 33 35 36 38 39 41 42 44 45 47 48 50 51 53
0.01 28 29 30 32 33 35 36 38 40 41 43 45 46 48 50 52 53 55 57
0.025 29 31 33 35 37 40 42 44 46 48 50 53 55 57 59 62 64 66 68
0.05 29 31 33 35 37 40 42 44 46 48 50 53 55 57 59 62 64 66 68
0.10 30 33 35 37 40 42 45 47 50 52 55 57 60 62 65 67 70 72 75
8 0.001 36 36 36 37 38 39 41 42 43 45 46 48 49 51 52 54 55 57 56
0.005 36 36 38 39 41 43 44 46 48 50 52 54 55 57 59 61 63 65 67
0.01 36 37 39 41 43 44 46 48 50 52 54 56 59 61 63 65 67 69 71
0.025 37 39 41 43 45 47 50 52 54 56 59 61 63 66 68 71 73 75 78
0.05 38 40 42 45 47 50 52 55 57 60 63 65 68 70 73 76 78 81 84
0.10 39 42 44 47 50 53 56 59 61 64 67 70 73 76 79 82 85 88 91
9 0.001 45 45 45 47 48 49 51 53 54 56 58 60 61 63 65 67 69 71 72
0.005 45 46 47 49 51 53 55 57 59 62 64 66 68 70 73 75 77 79 82
0.01 45 47 49 51 53 55 57 60 62 64 67 69 72 74 77 79 82 84 86
0.025 46 48 50 53 56 58 61 63 66 69 72 74 77 80 83 85 88 91 94
0.05 47 50 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 97 100
0.10 48 51 55 58 61 64 78 71 74 77 81 84 87 91 94 98 101 104 108
10 0.001 55 55 56 57 59 61 62 64 66 68 70 73 75 77 79 81 83 85 88
0.005 55 56 58 60 62 65 67 69 72 74 77 80 82 85 87 90 93 95 98
0.01 55 57 59 62 64 67 69 72 75 78 80 83 86 89 92 94 97 100 103
0.025 59 62 66 69 73 77 80 84 88 92 95 99 103 107 110 114 118 122 126
0.05 57 60 63 67 70 73 76 80 83 87 90 93 97 100 104 107 111 114 118
0.10 59 62 66 69 73 77 80 84 88 92 95 99 103 107 110 114 118 122 126
321
KUANTIL STATISTIK PENGUJI JUMLAH RANK WILCOXON
(Lanjutan)
m
n ∝
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
11 0.001 66 66 67 69 71 73 75 77 79 82 84 87 89 91 94 96 99 101 104
0.005 66 67 69 72 74 77 80 83 85 88 91 94 97 100 103 106 109 112 115
0.01 66 68 71 74 76 79 82 85 89 92 95 98 101 104 108 111 114 117 120
0.025 67 70 73 76 80 83 86 90 93 97 100 104 107 111 114 118 122 125 129
0.05 68 72 75 79 83 86 90 94 98 101 105 109 113 117 121 124 128 132 136
0.10 70 74 78 82 86 90 94 98 103 107 111 115 119 124 128 132 136 140 145
12 0.001 78 78 79 81 83 86 88 91 93 96 98 102 104 106 110 113 116 118 121
0.005 78 80 82 85 88 91 94 97 100 103 106 110 113 116 120 123 126 130 133
0.01 78 81 84 87 90 93 86 100 103 107 110 114 117 121 125 128 132 135 139
0.025 80 83 86 90 93 97 101 105 108 112 16 120 124 128 132 136 140 144 148
0.05 81 84 88 92 96 100 105 109 111 117 121 126 130 134 139 143 147 151 156
0.10 83 87 91 96 100 105 109 114 118 123 128 132 137 142 146 151 156 160 165
13 0.001 91 91 93 95 97 100 103 106 109 112 115 118 121 124 127 130 134 137 140
0.005 91 93 95 99 102 105 109 112 116 119 123 126 130 134 137 141 145 149 152
0.01 92 94 97 101 104 108 112 115 119 123 127 131 135 149 143 147 151 155 159
0.025 93 96 100 104 108 112 116 120 125 129 133 137 142 146 151 155 159 164 168
0.05 94 98 102 107 111 116 120 125 129 134 139 143 148 153 157 162 167 172 176
0.10 96 101 105 110 115 120 125 130 135 140 145 150 455 160 166 171 176 181 186
14 0.001 105 105 104 109 112 115 118 121 125 128 131 135 138 142 145 149 152 156 160
0.005 105 107 110 113 117 121 124 128 132 136 140 144 148 152 156 160 164 169 173
0.01 106 111 115 119 123 128 132 137 142 146 151 156 161 165 170 175 181 184 189
0.025 107 111 115 119 123 128 132 137 142 146 151 156 161 168 170 175 180 184 189
0.05 109 113 117 122 127 132 137 145 147 152 157 162 167 172 177 183 188 193 198
0.10 110 116 121 126 131 137 142 147 153 158 164 169 175 180 186 191 197 203 208
15 0.001 120 120 122 125 128 133 135 158 142 145 149 153 157 161 164 168 172 176 180
0.005 120 123 126 129 133 137 141 145 150 154 158 163 167 172 176 181 185 190 194
0.01 121 124 128 132 136 140 145 149 154 158 163 168 175 177 182 187 191 196 201
0.025 122 126 131 135 140 145 150 155 160 498 170 175 181 185 194 496 201 206 211
0.05 124 128 133 139 155 159 154 160 165 171 176 182 187 193 198 204 209 215 221
0.10 126 131 137 143 148 154 160 166 172 178 184 189 195 201 207 213 219 225 231
322
KUANTIL STATISTIK PENGUJI JUMLAH RANK WILCOXON (Lanjutan)
m
n ∝
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
16 0.001 136 136 139 142 145 148 152 156 160 164 168 172 176 180 195 189 193 197 202
0.005 136 139 142 146 150 155 159 164 168 173 178 182 187 192 197 101 107 211 216
0.01 137 140 144 149 153 158 163 168 173 178 183 188 193 198 203 208 213 219 224
0.025 138 143 148 152 158 163 168 174 179 184 190 196 201 207 212 218 223 229 235
0.05 140 145 151 156 162 167 173 179 185 191 197 202 208 214 220 226 232 238 244
0.10 142 148 154 160 166 173 179 185 191 198 204 211 217 223 130 136 243 149 256
17 0.001 153 154 156 159 163 167 171 175 179 183 188 192 197 201 206 211 215 220 224
0.005 153 156 160 164 169 179 179 183 188 193 198 203 208 214 219 224 229 235 240
0.01 154 158 162 167 172 177 182 187 192 198 203 109 214 220 225 231 236 242 247
0.025 156 160 165 171 176 182 188 193 199 205 211 217 223 229 235 241 247 253 259
0.05 157 163 169 174 180 187 193 199 205 211 218 224 231 237 243 250 256 263 269
0.10 160 166 172 179 185 192 199 206 212 219 226 233 239 246 253 260 167 274 281
18 0.001 171 172 175 178 182 186 190 195 199 204 209 214 218 223 228 233 238 243 243
0.005 171 174 178 183 188 193 193 203 204 214 219 225 230 236 242 247 253 259 264
0.01 172 176 181 186 191 196 202 208 213 219 225 231 237 242 248 254 260 266 272
0.025 174 179 184 190 196 202 208 214 220 227 233 239 246 252 258 265 271 278 284
0.05 176 181 188 194 200 207 213 220 227 233 240 247 254 260 267 274 281 288 295
0.10 178 185 192 199 206 213 220 227 234 241 249 256 263 270 278 285 292 300 307
19 0.001 190 191 194 198 202 206 211 216 220 225 231 236 241 246 251 257 262 268 273
0.005 191 194 198 203 208 213 219 224 230 236 242 248 254 260 265 272 278 284 290
0.01 192 195 200 206 211 217 223 229 235 241 247 254 260 266 273 279 285 195 298
0.025 193 198 204 210 216 223 229 236 243 249 256 263 269 276 283 290 297 304 310
0.05 195 201 208 214 221 228 235 242 249 256 263 271 278 285 292 300 307 314 321
0.10 198 205 242 249 227 234 242 249 257 264 272 280 288 295 303 300 319 326 334
20 0.001 210 211 214 218 223 227 232 237 243 248 253 259 265 270 276 281 287 293 299
0.005 211 214 219 224 229 235 241 247 253 259 265 271 278 284 290 297 303 310 216
0.01 212 216 221 227 233 239 245 251 258 264 271 278 284 291 298 304 311 318 325
0.025 213 219 225 231 238 245 251 250 266 273 280 287 294 301 309 316 323 330 338
0.05 215 222 229 236 243 250 258 265 273 280 288 295 303 311 318 326 334 341 349
0.10 218 226 233 241 249 257 265 273 281 289 297 305 313 321 330 338 346 354 362
Sumber: WJ Conover, Practical Nonparametric Statistics,3rd Ed, John Wiley & Sons, 1999.
323
ADDENDUM G: NILAI KRITIS KOEFISIEN KORELASI SPEARMAN
α
n
0.10 0.05 0.025 0.01 0.005 0.001
4 0.8000 0.8000
5 0.7000 0.8000 0.9000 0.9000
Sumber GJ Glasser &RF Winter, Critical Values of The Coefficient of Rank Correlation for
Testing the Hypothesis of Independence, Biometrika 48 (1961) pp 444-448 (Appendix).