100%(1)100% menganggap dokumen ini bermanfaat (1 suara) 548 tayangan136 halamanStatistika Probabilitas PDF
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda,
ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF atau baca online di Scribd
DAFTAR ISI
Educa ules
1.1, PENDAHULUAN
12 KONSEP DASAR TEKNIK PENARIKAN SAMPEL
1.3. SAMPEL ACAK SEDERHANA 7 7 3
LATIHAN SOAL 2 — 11
14 SAMPELACAKBERSTRATA _ aw
_LATIHAN SOAL _ - Z 20
7\8. SAMPEL ACAK BERKELOMPOK 7
LATIHAN SOAL _ 8
1.6. SAMPEL ACAK SISTEMATIK — a 2
ee ATHANS on eee 88
SOAL-SOAL MULTIPLE CHOICE == a
PCP M ecu aok Luka eka eacOL)
PENDAHULUAN
22. METODE KUADRAT MINIMUM (LEAST SQUARE) = a7
2.3. STANDARD ERROR OF ESTIMASI a an)
2.4. INFERENS! MENGENAl KEMIRINGAN (8) DARI SUATU GARIS 5
25. KORELASI DAN KOEFISIEN KORELAS! _ = 54
26 GARIS REGRESI X, TERHADAP Y LL 88
LATIHAN SOAL DAN MULTIPLE CHOICE — 5
ECRSiecusk uke eeenceurL
PENDAHULUAN
3.2. PERSAMAAN GAAIS LINIER REGRES! 60
33. COEFFICIENTS ESTIMATE a Ca
3.4. STANDARD DEVIASI GARIS REGRESI BERGANDA 66
35. KOEFISIEN KORELASI BERGANDA LINIER 7
26. PENDUGA PARAMETER KOEFISIEN REGRES! BERGANDA
3.7 PENGUJIAN PARAMETER KOEFISIEN REGRES| BERGANDA
LATIHAN SOAL DAN MULTIPLE CHOICEBAB 4. ANALISIS VARIANS
‘4.1, PENDAHULUAN, 74
42 ANALISIS VARIANS SATU ARAH (ANOVA SEDERHANA) 5
4.3, ANALISIS VARIANS DUA ARAH (RANCANGAN BLOK ACAK) 84
LATIHAN SOAL DAN MULTIPLE CHOICE 30,
PERI u Laas
5.1, PENDAHULUAN
52, Ul TANDA (SIGN TEST) 96
LATIHAN SOAL - - 101
5.3._ UJI MANNEWHITNEY (Usegr) 104
5.4. UJI KRUSKAL WALLIS (Kessnsrid 109
“LATIHAN SOAL 112
55. Udi SPEARMAN (r,) _ : 2 173
LATIHAN SOAL 118
SOAL-SOAL MULTIPLE CHOICE 119
DAFTAR PUSTAKA 122
- 123
LAMPIRAN TABEL
civiliana
civil engineering blogTEKNIK PENARIKAN SAMPEL
ST
1.1. PENDAHULUAN
Tujuan kita mengetahui teknik penarikan sampel adalah untuk memperoleh keterangan
mengenai populasi dengan mengamati hanya sebagian saja dari populasi.
Setiap penelitian statistik, yang selalu dituju adalah sekelompok populasi yang ingin
diketahui ciri-cirinya, seperti rata-rata hitung (1), standard deviasi (0), proporsi (P), dan
sebagainya, Namun karena keterbatasan dana, waktu, teknologi, dsb, maka hanya sampel
yang diperiksa, seperti rata-rata hitung penduga (x), standard deviasi penduga (8), proporsi
penduga (p), dsb.
Penarikan sampel adalah suatu cara pengumpulan data kalau hanya sebagian
dari elemen populasi (=sampel) yang diselidiki.
‘Tujuan utama dari setiap rancangan sampling adalah memberikan pedoman untuk memilih
sampel yang mewakili populasi dengan biaya minimum, Jika populasi yang mendasarinya
memiliki ciri-ciri yang seragam, hampir setiap sampel akan memberikan hasil yang dapat
diterima. Satu-satunya cara untuk menjamin bahwa himpunan data eksperimen kita sungguh-
sungguh mewakili populasi adalah dengan melakukan sensus, yaitu mencatat setiap unsur
1yang terdapat dalam populasi. Namun, dari segi ckonomis dan kepraktisannya, hampir setiap
penelitian melakukan penarikan sampel untuk menduga keadaan populasi yang sebenamya.
Nah, bagaimana dan pada kondisi yang bagaimanakah sampel dapat dipakai guna menarik
kesimpulan mengenai ciri-ciri populasinya secara cukup meyakinkan? Penarikan kesimpulan
dari sampel secara cukup meyakinkan, membutuhkan prosedur pemilihan (penarikan) sampel
secara random serta metode inferens yang baik dan tepat.
Prosedur pemilihan (penarikan) sampel secara random, merupakan metode guna
memilih sampel dari populasi dimana setiap unsur di dalam populasi selalu memili
kesempatan (peluang) yang sama untuk terpilih.
Dengan menggunakan penarikan sampel sacara random (acak), kita dapat mengetahui
peluang dari berbagai pengamatan yang termasuk di dalam sampel. Karena itu kita dapat
membuat pernyataan probabilitas tentang populasi yang mendasarinya. Jika sampel dipilih
dengan cara detemministik (tidak acak), probabilitas bahwa kita akan mengamati berbagai
pengukuran sampel tidak diketahui dan kita hanya dapat membuat pemyataan deskriptip
tentang sampel itv
1.2. KONSEP DASAR TEKNIK PENARIKAN SAMPEL
Dua konsep dasar teori penarikan sampel untuk mempelajari populasi (semesta) adalah
kerangka (frame) dan unit sampling.
Populasi didefinisikan sebagai kumpulan unit dasar. Bila berhadapan dengan masalah
penarikan sampel, pertama-tama harus ditetapkan unit dasar, populasi, karakteristik yang
diukur, dan peubah, Pada statistika, n unit dasar dipilih dari populasi N unit dasar dan unit
dasar adalah unit yang terpilih sebagai sampel. Pada teknik penarikan sampel, suatu unit
khusus dinamakan unit sampling.
Misalkan ingin diketahui sewa rataan suatu kamar pada kota K. Misalnya X = Rp
200.000 merupakan total sewa yang dibayarkan dan Y = 20 jumlah kamar sewa yang ada.
Biasanya X dan Y tidak diketahui, karena X dan Y merupakan karakteristik populasi. Di
sini sebagai unit dasar adalah kamar dan populasi adalah kumpulan kamar sewa di kota K.
Sebagai unit sampling adalah kamar sewa, jadi bisa terdiri dari satu atau beberapa unit dasar.
Kerangka terdiri atas unit sampling dan mewakili populasi dan merupakan alat untuk
mempelajari populasi. Dalam pembahasan selanjutnya, yang dimaksud dengan
— parameter populasi adalah nilai-nilai yang diperoleh terhadap kerangka bukan semesta,
Selanjutnya, yang dimaksud dengan sampel adalah sampel dari kerangka.
— Parameter populasi @ adalah nilai parameter yang diperoleh dari kerangka. Parameter
sebenamya 0, adalah nilai parameter yang diperoleh dari semesta. Nilai 0 dapat berbeda
dengan 6,.ee
— Galat sampling (GS) 6 didefinisikan sebagai :
cs=6-0
dengan 6 sebagai penaksir/penduga @
Presisi taksiran sampel 6 didefinisikan sebagai :
6-6
dengan 6 adalah penaksit/penduga © dan memenuhi :
P(16-61 untuk populasi tak hingga.
1.3. SAMPEL ACAK SEDERHANA
Penarikan sampel yang paling mendasar, adalah sampel acak sederhana.
Sampel Acak Sederhana
adalah pengambilan sejumlah n sampel dari populasi hingga N, dimana setiap
kemungkinan sampel yang berukuran n mempunyai probabilitas yang sama untuk
diseleksi
Jika populasi tidak terlalu besar, masing-masing dari N pengukuran dapat ditulis pada
selembar kertas atau pada kepingan poker dan kemudian ditempatkan dalam sebuah cawan.
Sampel acak dengan 1 ukuran kemudian dapat ditarik dari cawan tersebut.
Cara terbaik untuk memastikan bahwa kita menerapkan penarikan sampel acak adalah
dengan menggunakan tabel bilangan acak. Tabel bilangan acak dibuat sedemikian rupa schingga
imteger dari 0 sampai 9 muncul secara acak dan dengan frekuensi yang sama.
Contoh LI:
Dari suatu analisis tentang posisi kas dari sebuah toserba, sebuah Kantor akuntan publik
‘memutuskan untuk memilih sampel acak sederhana berukuran n = 15 piutang pembeli eceran
bulanan dari antara N = 1000 pembeli eceran bulanan yang ada di toserba untuk menghitung
atotal semua piutang. Gunakan tabel bilangan acak untuk menentukan mana yang akan
dimasukkan ke dalam sampel yang berukuran n = 15.
Penyelesaian :
Bayangkan bahwa N = 1000 kita beri nomor 001, 002, . . . , 999, 000. Di sini didapat
1000 bilangan yang terdiri dari tiga digit, dengan 001 mewakili piutang pertama, 999 piutang
yang ke 999, dan 000 yang ke 1000.
Langkah pertama kita tentukan sebuah titik awal pada tabel bilangan acak, Misalkan titik
awal adalah angka pertama dalam kolom kelima. Jika dibuang dua digit terakhir dari setiap
angka yang terdiri dari lima digit, maka angka pertama berdigit tiga yang terbentuk adalah
816, yang kedua 309, dan ketiga adalah 763, dan seterusnya, Jika suatu bilangan acak muncul
dua kali, kemunculannya yang kedua dihapus dan dipilih bilangan lain sebagai pengganti.
Dengan mengambil sampel acak yang terdiri dari 15 bilangan pertama yang terdiri dari tiga
digit yang tidak berulang mulai dari kolom 5, diperoleh bilangan-bilangan :
816 277 709 309 988
496 763 188, 889 078
174 482 061 530 7722
Jika piutang sudah diberi nomor, tinggal dipilih piuteng dengan nomor yang bersesuaian.
Jika tidak diberi nomor, dapat mengacu pada daftar perkiraan piutang dan memilih yang ke-
61, 78, 174, dan seterusnya sehingga diperoleh jumlah sampel n = 15.
‘Setelah mengumpulkan hasil-hasil pengamatan terhadap sampel, tujuan selanjutnya adalah
menghitung beberapa parameter populasi tertentu. Paling sering kita tertarik untuk mengetahui
rerata populasi (j1), total populasi (t), ataupun proporsi populasi (P). Rumus perhitungan
untuk mengestimasi rerata populasi 1, total populasi t, dan proporsi populasi P, untuk
sampling acak sederhana ditunjukkan dalam kotak. Namun, perlu diingat bahwa penduga
seperti fl, ®, dan p tidak memberikan kebaikan pendugaan (estimasi). Oleh karena itu, rumusan
varians diberikan agar kita dapat menempatkan batas-batas kesalahan atas pendugaan pi, 7,
dan P.
Pendugaan Rerata Populasi untuk Sampel Acak Sederhana
Rerata
Varianso s
Sampling dengan pengembalian : 67 = — = ——
n a
Batas kesalahan penduga x + 2 6,
N-o N-n
jan
dinamakan koreksi populasi hingga (fpc) untuk variansi.
N N-1
Faktor koreksi digunakan jika sampel ditarik dari sebuah populasi yang kecil (n/N > 5%).
fetapi bila N jauh lebih besar, atau n/N mendekati nol, maka fpc mendekati satu, Bila n/N
< 5%, maka fpe dapat diabaikan.
Karena o% tergantung dari S? atau 0? yang mana tidak kita ketahui, maka masalah
menentukan taksiran o2 menjadi menentukan taksiran S? atau 6, Untuk itu digunakan variansi
sampel (s?) untuk penaksir tak bias untuk S*. Maka penaksir variansi mean populasi 63 dapat
diambil dari :
tanpa pengembalian
- dengan pengembalian
n % we (Exy
n(n-1)
dimana :
Contoh 1.2. :
Lihat audit piutang pada Tabel 2.1. Misalkan sampel acak sederhana n = 15 akan
memberikan 15 saldo piutang yang tercantum dalam Tabel 1.1
Tabel 1.1. Saldo piutang 15 sampel dalam Rp 10.000.
14,50 23,40 42,00 30,20 15,50
13,30 17,80 27,50 23,70 10,00
6,90 18,40 8,50 19,50 12,10
Dugalah rerata pt untuk semua N = 1000 piutang dari sebuah tosetba, dan tentukan batas-
batas kesalahan penduga.Penyelesaian :
— Penduga rerata saldo piutang 1 adalah :
x,
fel" 28330
& =—__ = ——___ = 1889
n 15
Tabel 1.2. Perhitungan untuk data Tabel 1.1.
a
x 2
14,50
30,20
17,80
10,00
8,50
23,40
15,50
27,50
6,90
19,50
42,00
13,30
23,70
18,40
12,10
Ix=283,30 Ix? =6.570,85
Untuk mencari batas kesalahan penduga 1, pertama-tama harus menghitung vanrians
dan galat baku.
nde —( Ex)
ae)
15 (6.570,85) — (283,30)
“Us=)
= 87,16
Untuk menghitung varians, umumnya digunakan rumus dengan tanpa pengembalian,
jadi menggunakan faktor koreksi.87.16 1000 - 15
— = —_ —___. = 5,2
n N 15 1000
— maka nilai batas kesalahan dari rerata saldo piutang adalah :
R250 atau 18,89 +2 5,72 atau 18,89 + 4,78
Selang Kepercayaan dan Ukuran Sampel
(1a) 100% selang kepercayaan untuk mean populasi adalah :
R — Zan 5 yy dimana d* dengan pengembalian
N Zap 8?
a= —_ tanpa pengembalian
N&+ Zp
Contoh 1.3.:
Untuk menaksir rerata tingkat kecerdasan siswa diambil sampel acak berukuran n = 100.
Dari sampel yang terpilih diperoleh X = 110 dan s = 12. Tentukan selang kepercayaan untuk
mean populasi (jt) dengan Z,,, = 3 dan dengan pengembalian.
Penyeles
maka selang kepercayaan adalah : X + 3 (1,2) atau 110 + 3,6.
Contoh 1.4. :
Dari suatu populasi diperoleh nilai taksiran variansi populasi s” = 600. Ingin ditaksir mean
populasi dengan presisi + 5 untuk Z,,,
Bila ukuran populasi sangat besar sehingga pengambilan sampel dapat dianggap
sampling tanpa pengembalian, tentukan ukuran sampel yang diperlukan.Penyelesaian :
Dengan rumus n = ( Z,,, s/d )®, diperoleh n = 3 (60/5) = 216.
Misalkan N = 2000, untuk sampling tanpa pengembalian diperoleh ukuran sampel :
N (Zs)
N@+Z
(2000)(9)(600)
n=——___—____ = 195
2000(25) + 9 (600)
Pendugaan Total Populasi
Penduga ss: R=aN
Varians penduga
tanpa pengembalian
dengan pengembalian
Batas kesalahan :
Contoh 1.5. :
Dari populasi dengan N = 1000 dipilih n = 50 sampel acak. Tentukan taksiran total 4,
andaikan x = 12,
Penyelesaian :
%=N X= 1000 (12) = 12.000.
Contoh 1.6. :
Diketahui populasi berukuran N = 1000. Dengan sampling acak berukuran n = 50
diperoleh s’ = 10. Tentukan galat standar dari 2 dengan sampling tanpa pengembalian.
Penyelesaian :
g=N
10 1000 - 50
= 1000? —— ————— = 190,000
50 1000ee
maka galat standar dari 4 : % = 190.000 = 436.
Batas kesalahan pendugaan :
N&+2s atau 12.0002 (436) atau 12,000 + 872
Pendugaan Proporsi Populasi
Penduga :
Varians : tanpa pengembalian
dengan pengembalian
dimana: q=
Batas kesalahan penduga : p#26? atau p+2s,
Contoh 1.7. :
Pabrik-pabrik sering mengusahakan potongan harga jengka pendek untuk mendorong
para pelanggan menaikkan jumlah pesanan mereka dan membeli di muka, sehingga dengan
demikian mempertinggi posisi kas pabrik. Konsisten dengan maksud dasar ini, sebuah pabrik
dan grosir produk-produk makanan beku mempertimbangkan memberikan potongan harga
20 % kepada pembeli yang menggandakan pesanan mereka per bulannya. Karena makanan
beku memerlukan tempat penyimpanan yang mahal, belum tentu para pembeli akan
menggunakan tawaran potongan harga tersebut. Suatu sampel acak n = 50 dari N = 430 pembeli
dihubungi, dengan 15 dari 0 memberikan indikasi bahwa akan menerima tawaran potongan
harga dan menggandakan pesanan bulanan mereka, Hitung proporsi dari semua N = 430
pembeli yang akan menggunakan tawaran tersebut, dan tentukan batas kesalahan penduganya.
Penyelesaian :
Suam pendugaan atas proporsi p dari semua pembeli yang akan menggunakan potongan
harga tersebut
x 15
— =—__ = 0,30
n 50
Untuk menentukan batas kesalahan pendugaan (error of estimation), kita pertama-tama
menghitung varians (digunakan tanpa pengembalian), sebagai berikut :(0,30)(0,70), , 430 ~ 50
49 430
) =I )
021
= — (0.88) = 0,003771
49
Maka batas kesalahan penduga :
p£2s, atau 0,30 +2 V0.003771 atau 0,30 + 0,12
Artinya, kita menduga bahwa proporsi semua pembeli yang akan mengambil
keuntungan dari potongan harga adalah 0,30 dengan batas kesalahan penduga 0,12.v
LATIHAN SOAL
Dari populasi N = 600, pilihlah sampel acak berukuran nomor = 20 dengan menggunakan
tabel bilangan acak.
Diketahui populasi X, = X,, + 3. X, = 2; i= 2345. Tentukan X bila dilakukan
sampling acak dengan n = 2 tanpa pengembalian
Diketahui populasi dengan X, = X,
a) Tentukan o° dan S? dengan menggunakan rumus
1
3 LF
$= 556-9
b) Andaikan dipilin sampel berukuran n=2. Tentukan 6? bila sampling tanpa
pengembalian !
c) Sama dengan b. tetapi sampling dengan pengembalian !
‘Suatu sampel acak n=400 dipilih dari populasi N=4000 untuk menaksir mean populasi
X, Dari sampel diperoleh X=140 dan S: . Tentukan 95% (Z=2) selang kepercayaan
untuk X !
Misalkan suatu sampel acak dipilih dari kumpulan keluarga untuk menaksir pengeluaran
rataan per minggu. Diinginkan presisi d=4 dengan koefisien reliabilitas Z=3, Dari survei
pendahuluan diperoleh S=12 dan total unit sampling N=2000.
Tentukan ukuran sampel yang diperlukan.
PETUNJUK.
Ukuran sampel n dapat dihitung dengan rumus :
@ n= N (ZSp(N@ +(ZS)*) atau
(i) n =n, ((4+nJN) dengan n, =(ZS/dy
Pada soal no 5, jika diketahui N=10.000, apakah n dapat dianggap sama dengan
n, = (ZS/dy ?PETUNJUK.
() Hitung n, =(ZS/ay
(ii) Periksa nisbah n/N
Gi) Bila n/N < 5%, maka n=n, bila tidak n=n,/(14n/N)
Andaikan N=500. Suatu sampel acak pendahuluan n=30 diperoleh nilai berikut :
23.514; 38; 1157;3159; 16; 12; 25;
1:15 336; 24:10; 16; 26; 12:25; 28;
3452551157595 335 255954519;
(i) Tentukan taksiran mean X = X
(ii) Tentukan § = 5, St = 5,
(iii) Dari hasil (ii) tentukan ukuran sampel yang diperlukan bila d=4 dan Z=2
‘Suatu sampel acak n=10 dari populasi N=50 (tanpa pengembalian) diperoleh nilai : 12
105458575 113559; 10:7
Tentukan :
@ %
(ii) Taksiran total x, &
(iii) Taksiran $2, yaitu 8°
(iv) Varians &
Dari populasi N=1500 ingin ditaksir total X.Diinginkan presisi d=500 dan koefisien
reliabilitas Z=2. Dari sampel pendahuluan diperoleh $=3.Tentukan ukuran sampel yang
diperlukan. Andaikan sampling tanpa pengembalian.
). Misalkan dari N=4000 mahasiswa,SO mahasiswa memperoleh beasiswa. Diketahui
proporsi populasi P=0,5 (tanpa pengembalian). Tentukan:
(_ Varians proporsi populasi
(ii) Selang kepercayaan untuk P bila koefisien reliabilitas Z = Z.,,
. Seorang auditor perusahaan tertarik untuk menduga total bukti pembayaran perjalanan
yang disimpan dalam arsip secara tidak benar. Dalam sampel acak sederhana berukuran
n= 50 bukti pembayaran yang diambil dari sekelompok N = 250, dua puluh ditemukan
tersimpan dalam arsip secara tidak benar. Dugalah total bukti pembayaran N = 250 yang
disimpan dalam arsip secara tidak benar, dan tentukan batas kesalahan pendugaannya!1.4. SAMPLING ACAK BERLAPIS (Stratified Random Sampling)
‘Tipe kedua penarikan sampel yang sering memberikan sejumlah tertentu informasi dengan
biaya yang lebih murah daripada penarikan sampel acak sederhana, dinamakan sampel acak
berlapis.
Rancangan ini direkomendasikan jika populasi terdiri sehimpunan kelompok heterogen
(yang tidak serupa). Misalnya, pendapatan karyawan suatu perusahaan, bisa distrata sebagai
pekerja dan laboratorium, mandor dan manajer menengah, dan eksekutif yang tingkatannya
lebih tinggi
Sampel acak berstrata (berlapis)
adalah sampel acak yang diperoleh dengan mamisahkan unsur-unsur populasi ke
dalam kelompok yang tidak tumpang tindih, yang disebut strata (lapisan), dan kemudian
memilih sampel acak di dalam setiap strata.
Beberapa alasan penggunaan sampling acak stratifikasi adalah :
1. Meningkatkan presisi.
2. Diperoleh informasi selain tentang populasi, juga mengenai masing-masing strata.
3. Dengan alasan administrasi atau pisik, informasi lebih mudah dikumpulkan.
Langkah pertama dalam memilih sampel acak berlapis adalah menetapkan secara jelas
strata-stratanya, yaitu mengasosiasikan setiap unsur populasi dengan satu dan hanya satu
strata (lapisan), Dalam beberapa kasus, tugas ini mungkin mudah. Dalam contoh penelitian
pendapat umum, apakah kita akan mengklasifikasikan mereka yang tinggal di kota berpenduduk
1000, sebagai bagian dari kota atau desa? Dalam contoh penggunaan tenaga listrik, apakah
tempat kediaman seorang akuntan yang kantomya berada di rumahnya ditempatkan dalam
lapisan pemukiman atau komersil? Pemecahan terhadap pertentangan tersebut tidak
mempengaruhi hasil kita scjauh ia selalu dikerjakan secara konsisten. Sebagai contoh, kita
dapat mengatakan bahwa kota-kota yang populasinya di bawah 2500 akan selalu dianggap
desa, yang lebih besar adalah kota; kombinasi satuan bisnis pemukiman akan diklasifikasikan
menurut pemakaian terbanyak ruang lantai tempat tersebut.
Setelah strata-strata ditetapkan, gunakan sampel acak sederhana dalam memilih sampel
dalam setiap strata. Ukuran keseluruhan sampel n bergantung pada anggaran yang tersedia
untuk sampling dan pada tingkat ketelitian dan ketepatan nilai duga yang diinginkan.Rumus Alokasi Sampel Antar Strata-strata :
n=n+n+...+n, atau n=
dimana :
jumtah sampel yang diinginkan
—n, = jumlah sampel dalam strata ke-i
—L = jumlah strata
maka untuk menentukan jumlah sampel dalam masing-masing strata :
Ukuran populasi
N,
nen(
if
N=X.N
isl '
Secara diagram dapat dinyatakan dengan :
si=12,...,L
N, = jumlah unsur dalam strata i.
1 2 L
N, N, N,
T i
<—— sampling acak —>
| n ny m,
N, +N, +..40
n+n+...+m=n
Dari informasi yang diperoleh dari unsur sampel, dapat dihitung rerata dugaan %, dan
varians s
Rumus Pendugaan (Mean) dan Varians dari Setiap Strata :
2, dari peng:matan di dalam setiap strata seperti di bawah ini :
Varians s*, adalah suatu nilai duga dari varians strata yang benar 0°,Penduga Rerata Populasi untuk Sampel Acak Berlapis
L
Rerata x, DN, xX,
1
N
1
Varians —
Nw
'_) tanpa pengembalian
1k s,
> EM (—) dengan pengembalian
= 1,
Batas kesalahan pedugaan : %, +2 6; ,
Contoh 18.
Pimpinan suatu perusahaan memutuskan snmk melakukan suatu survai tentang kebiasaan
menabung karyawan-karyawannya untuk menilai keci'-tifan kampanye menabung. Diinginkan
untuk menghitung rata-rata jumlah yang diinvestasikan dalam tabungan oleh karyawan-
karyawan dari pendapatan mereka bulan lalu, Usulkan rancangan survai untuk masalah ini.
Penyelesaian
Karyawan perusahaan dapat dikategorikan sebagai pekerja kerikal dan laboratorium,
mandor dan manajer menengah, dan eksekutif yang tingkatannya lebih tinggi. Sampel acak
berstrata dengan L = 3 strata nampaknya dapat menjadi rancangan sampel survei yang tepat.
Di dalam setiap strata (lapisan) kebiasaan berbelanja dan menginvestasi cukup homogen.
Sampling acak sederhana harus digunakan untuk memilih sampel karyawan-karyawan dari
setiap strata untuk menanyakan tentang investasi tabungan mereka dari pendapatan mereka
bulan Jalu
Misalkan perusahaan tersebut mempekerjakan 5000 orang, diantaranya 3500 pekerja
kerikal atau laboratorium, 1000 adalah mandor atau manajer menengzh, dan 500 adalah
eksekutif, Kemudian diambil sampel sebanyak 50 karyawan. Dengan menggunakan alokasi
yang proporsional, dapat disekat ukuran n = 50 sebagai berikut :
N 3500,
n, =n—+ = 50 (——— ) = 35
n 5000
1000
n, = 50 (——— ) = 10 dann, = 5
: 5000
Kemudian kita pilih sampel secara acak dengan menggunakan Tabel bilangan acak,
sesuai dengan proporsi masing-masing strata. Berdasarkan observasi di dalam setiap strata,
diperoleh X, dan s*
15Tabel 1.3. Perhitungan Contoh 1.8.
L
= —— [(3500)(10,16) 1000)(25,50) 500)(21,80)
xO [(3500)(10.16) + (1000)(25.50) + (500)(21.80)]
1
ie 71,960) = $ 14,39
S000) ¢ ) = $ 143!
Varians yang diduga (dilakukan tanpa pengembalian) adalah :
1, , (3500) (0,99) (16,81) (1000)? (0,99)(22,09)
= + oo
(5000) 35
(500) (0.99) (125.44) ]
5
= 0,5688
Maka batas kesalahan penduga adalah :
Kt2s., alu $ 14,39 +2 ¥05688
atau $ 14,39 + $ 1,50
16ee
Pendugaan Total Populasi
Penduga : %,=Ni,
Varians
dimana —:__nillai s2, tergantung dengan cara pengembalian atau tanpa pengembalian.
Batas kesalahan penduga : 4,42 6¢ atau 4, +2 s3
Contoh 1.9. :
Lihat contoh 1.8. Dugalah total pendapatan bulan lalu yang diinvestasikan ke dalam
tabungan oleh para karyawan. Tentukan batas kesalahan pendugaan (dilakukan tanpa
pengembalian).
Penyelesaian :
Dari perhitungan kita sebelumnya %,.= $ 14,39 dan s,7, = 0,5688, maka :
Total tabungan:t = NX,
= (5,000) ($ 14,39) = $ 71.950,
Untuk mencari batas kesalahan penduga , pertama-tama kita hitung varians yang diduga :
sé= N82,
= (5000)? (0,5688) = 14.220.000
Nilai duga dari total tabungan, dengan batas kesalahan penduga :
42% atau $ 71.950 + 2 -¥14.220.000
atau $ 71.950 + 2 (3.771)
atau $ 71.950 + $ 7.542
Oleh karena itu, dalam selang + 95 % kita merasa pasti bahwa total investasi ke dalam
tabungan oleh para karyawan berada dalam selang dari $ 64.410 hingga $ 79.490.
7Pendugaan Proporsi Populasi Sampel Acak Berstrata
Penduga : p,=
‘Varians
tanpa pengembalian :
Jengan pengembalian :
“gatas kesalahan penduga : p, +2 s
Contoh 1.10. :
Dari contoh 1.8, dari n= 50 karyawan yang diwawancarai dalam studi investasi tabungan,
jumlalt yang menunjukkan bahwa mereka sebenamya berpartisipasi dicantumkan dalam Tabel,
4.4. Dugalah proporsi semua karyawan yang berpartisipasi dalam program tabungan, dan
tentukan batas kesalahan penduganya,
Tabel 1.4. Data untuk contoh 1.10
Strata Ukuran sampel Jumlah yang berpartisipasi P,
I 21 0,60
2 7 0.70
3 4 0.80
Penyelesaian : Nilai dugaan yang diinginkan diperoleh dari P,, dengan
P,
i
TT : (3.500)0,60)+(1.000)(0,70)+(500)(0,80) = 0.64
000 \ ( \( (0,80)
Batas kesalahan penduga dapat dicari dengan pertama-tama mencari varians terlebih
dahulu. Varians dapat dicari dengan :3.500 - 35 (0,60)(0,4)
ee ———-- 1,000
“6.0007 won | 3.500 ( 3.500 dC 34 ye
1,000 - 10 . me 30) 500-5 (0,8)(0,2)
(AO SO + 900 FYI
= 0,004744
Maka nilai dugaan proporsi karyawan yang berpartisipasi dalam program tabungan,
dengan batas kesalahan penduga sebesar :
p,£2s,, atau 0,64 + 2-¥0,004744
pat
atau
0,64 + 2 (0,069) atau 0,64 + 0,1420
LATIHAN SOAL
Dalam kondisi bagaimana kita dapat melakukan suatu penarikan sampel dengan sampel
acak berstrata?
Bagaimana prosedur pemilihan sampel dengan sampel acak berstrata?
Apakah yang dimaksud dengan prosedur pemilihan sampel acak berstrata dengan alokasi
yang proporsional ?
Jika dari 2500 siswa SLTA diantaranya terdapat 750 siswa kelas I, 1250 siswa kelas II,
dan 500 siswa kelas III, berapkah sampel yang dapat diambil dari masing-masing kelas
bila diinginkan jumlah seluruh sampel adalah 50? Tentukan batas kesalahan
pendugaan !
Diketahui populasi (L = 2) dengan x, diberikan oleh :
Stratal : 2; 4; 6; 8; 10
Strata I: 9; 12; 13; 21; 25; 31
diambil secara acak sejumlah 5 sampel dari kedua strata. Maka, tentukan : N,; N,;
x4
Ingin ditaksir Iuas lantai pusat perbelanjaan di kota A. dan dengan sampel acak berstrata,
diperoleh data berikut :
Stratum N n, :
Kecil 110 20 4.000
Sedang 60 15 10.500
Besar 30 10 60.000
Tentukan taksiran :
(1) &: Xs X,; %, dengan batas kesalahan penduganya !
2) 4; 4,34: %, dengan batas kes:
an penduganya !
Seorang auditor untuk Kantor Akuntansi Pemerintah dibebani tanggung jawab menghitung
kelebihan biaya dalam pelaksanaan kontrak pertahanan pemerintah, Untuk mudahnya,
auditor tersebut membuat tahapan-tahapan dalam studinya menurut cabang pelayanan
militer yang spesifik yang masing-masing tercantum dalam sebuah kontrak. Dalam suatu
analisis terhadap 270 kontrak pertahanan yang dibuat dalam tahun 1980, auditor memilih
45 secara acak dan menemukan hasilnya seperti yang diperlihatkan dalam tabel
berikut :Angkatan Darat ‘Angkatan Darat Angkatan Laut
N 120 90 60
n 20 15 10
x $71,468 $68.709 $89.918
s, $16,095 $18,452 21.065 |
a. Dugalah rata-rata kelebil.an biaya pelaksanaan semua 60 kontrak pertahanan yang
diatur oleh Angkatan Laut dalam tahun 1980 !
b. Dugalah rata-rata kelebihan biaya pelaksanaan untuk semua 270 kontrak pertahanan
dalam tahun 1980, dan tentukan batas kesalahan pendugaan !
c. Dugalah total kelebihan biaya pelaksanaan untuk semua 270 kontrak pertahanan
dalam tahun 1980, dan tentukan batas kesalahan pendugaan !
Biaya penyusutan memberikan kepada perusahaan kesempatan untuk menciptakan
cadangan uang untuk mengganti peralatan yang lama dan barang-barang modal lainnya.
Pengauditan dilakukan terhadap tiga cabang dari sebuah pabrik untuk menghitung proporsi
barang-barang peralatan modal yang sudah digunakan selama sepuluh tahun atau lebih,
Dari catatan yang tersedia auditor menggunakan alokasi yang proporsional untuk memilih
sampel acak berstrata n = 60 barang-barang peralatan modal dari antara N = 7.200
barang-barang yang terdaftar pada daftar persediaan. Diperoleh hasil sebagai berikut :
‘Cabang pabrik
1 2 3
Jumlah Barang-barang Peralatan Modal. N, 3.600 | 2.400 | 1.200
Ukuran Sampel. n, 30 20 10
Jumlah yang digunakan selama 10 tahun atau lebih, x,] 7 4 3
Dugalah proporsi p dari barang-barang perlatan modal pada tiga cabang yang sudah
digunakan selama sepuluh tahun atau lebih, dan tentukan batas kesalahan pendugaan !
‘Toko-toko berangkai dan sebagian besar usaha perbankan memproses semua pelanggan
Kredit melalui kantor pusat atau wilayah, bukan terpisah-pisah melalui setiap cabang.
Teknik ini memungkinkan pengendalian terpusat yang lebih efisien terhadap kegiatan
manajemen cabang. Manager kredit dari grosir kembang gula dengan 4 cabang merasa
Khawatir dengan meningkatnya pelanggan yang macet yang jumlahnya cukup besar
sekarang ini, Untuk mengurangi biaya sampling, manager itu menggunakan sampel acak
2122
berstrata dengan setiap toko sebagai satu strata yang terpisah. Dari catatan yang tersedia
di kantomya, manager kredit memutuskan untuk menggunakan alokasi yang proporsional
untuk memilih sampel acak berstrata n = 50 pelanggan dari semua N = 200 piutang.
Pada waktu mengerjakannya, ia mencatat hasilnya dalam tabel berikut *
Toko
v
we
a
Jumlah Piutang
Ukuran Sampel
Jumlah Pelanggan yang Macet
a. Dugalah proporsi p dari pelanggan yang macet untuk toko (grosir) tersebut, dan
tentukan batas kesalahan pendugaan !
b. Ada alasan untuk mempercayai bahwa manager toko yang ke-3 terlalu lunak dalam
mengabulkan permohonan kredit pelanggannya, Hitunglah proporsi p, dari pelanggan
yang macet untuk toko yang ke-3, dan tentukan batas kesalahan pendugaannya !1.5. SAMPEL ACAK BERKELOMPOK (Cluster Random Sampling)
Tipe ketiga penarikan sampel adalah penarikan sampel acak berkelompok. Sering lebih
mudah menarik sampel berkelompok daripada individu sampel itu sendiri-sendiri..
Sampel Acak Berkelompok
adalah pengambilan sampel dari populasi yang terdiri M kelompok dan dilakukan
pemilihan secarak acak m kelompok dan tiap kelompok yang terpilih, diambil secara
acak sebesar n sampel.
Sampel Acak Berkelompok biasanya akan memberikan sejumlah informasi tertentu dengan
biaya minimum, jika
a. Sebuah kerangka yang mencantumkan daftar unsur-unsur populasi tidak ada atau akan
sangat mahal untuk mendapatkannya.
b. Populasinya besar dan tersebar pada suatu daerah yang luas.
Sebagai ilustrasi, perhatikan seorang ekonom yang ingin menghitung rata-rata pengeluaran.
mingguan untuk keperluan makanan per rumah tanga di sebuah kota. Baik dengan
menggunakan sampel sederhana maupun sampel berstrata, ekonom tersebut harus mempunyai
daftar anggota-anggota sampel (rumah tangga) yang dapat dipilih, Namun, semua daftar
tentang semua rumah tangga di kota dapat menjadi sangat mahal atau bahkan tidak mungkin_
untuk mendapatkannya. Bahkan jika daftar tersebut tersedia, biaya survai tetap akan menjadi
mahal karena dengan sampel sederhana atau sampel berstrata, rumah tangga yang dipilih
dalam sampel mungkin akan terpencar-pencar di suatu daerah yang luas, Akibatnya, biaya
penyelenggaraan survai antar rumah tangga yang terpencar-pencar akan mahal karena waktu
perjalanan pewawancara dan pengeluaran-pengeluaran lain yang berkaitan dengannya.
Ketimbang memilih sampel rumah tangga yang terpencar-pencar di seluruh kota, ekonom
itu dapat menggunakan sampel berkelompok dan membagai kota menjadi kelompok
masyarakat, dapat berupa dacrah pemungutan suara. Ini mudah dicapai karena daftar daerah
sudah tersedia, Setiap rumah tangga di dalam setiap daerah yang terpilih lalu disurvai, Dengan
begitu total biaya survai dapat dihemat.
Langkah pertama dalam memilih sampel acak berkelompok adalah membagi populasi
dalam beberapa gerombol/kelompok. Kita dapat mengurangi kesalahan sampling dengan
memilih berbagai macam kelompok kecil dan bukan dengan sedikit kelompok besar. Semakin
kecil ukuran kelompok, semakin kecil kemungkinannya bahwa kita akan menyatakan kelas-
kelas dari anggota-anggota tertentu dari sampel. Oleh karena itu, lebih banyak lagi informasi
tentang populasi dapat diperolch dengan memilih jumlah yang lebih besar dari kelompok-
kelompok yang berukuran lebih kecil
Setclah kelompok-kelompok ditetapkan, sebuah daftar yang berisi semua gerombol harus
disiapkan. Sampling acak sederhana dapat digunakan untuk memilih sampel acak berukuran
m kelompok dari M kelompok dalam populasi.
231 Qo eeiiec cece eve e eee e ees M
1 2 m
N Np IN: Nit Not... + Na =N
m my Da M+ Met. My =D
Tiap kelompok dari M kelompok dinamakan unit sampling primer (USP). Dan tiap
unit dasar dinamakan unit sampling sekunder (USS).
Kelompok yang terdiri atas n,, n, .....n., unit dinamakan kelompok terakhir (ultimate
clusters). Jadi dapat disimpulkan bahwa tahapan sampling berkelompok terdiri atas dua
tahap. Pertama, pemilihan secara acak m unit sampling primer dari M unit sampling primer.
Kedua, pemilihan secara
cak n, (i= 1, 2, ..., m) unit sampling sekunder dari unit sampling
primer yang ke-i terpilih.
Misalkan ingin ditaksir total populasi X dari sampel yang diambil dengan sampling
gerombol. Dari prosedur pengambilan sampel, penaksir total X terdiri atas dua tahap. Pertama,
menaksir total dari m kelompok/gerombol. Kedua, menaksir total untuk M kelompok.
Contoh 1.11. :
Misalkan populasi dikelompokkan atas M = 10 kelompok penghasilan orang tva. Ingin
ditaksir total buku yang dimiliki siswa SMTA. Andaikan dipilih m = 2 kelompok penghasilan
orang tua dengan N, = N, = 40 siswa dan diadakan sampling acak berukuran n, = n, = 10
siswa. Misalkan diperoleh x, = 5, x,
7. Berapa taksiran total untuk M = 10 kelompok?
Penyelesaian :
Taksiran total untuk N, = 40 adalah : 40 x 5
‘Taksiran total untuk N, = 40 adalah : 40 x 7 =
200 + 280
Rerata dari dua kelas = ———— = 240
2
Maka taksiran total untuk M=10 kelompok adalah :
= 240 x 10 = 2400.Misalkan populasi terdiri atas M kelompok masing-masing berisi N,, N,... .N, unit
sampling. Dipilih m kelompok dan diambil sub sampel n,, n,. ... . n,,. Banyaknya sampel
kelompok yang mungkin diberikan adalah
CONC) )
dengan anggapan N, =
Contoh 1.12. :
Misalkan populasi terdiri atas anak-anak dan dikelompokkan menurut kelompok umur
atas M = 3 (namakan A. B, dan C). Andaikan X, menyatakan banyaknya buku yang dipunyai
anak ke-j pada kelompok ke-i, Pilih secara acak m = 2 kelompok, kemudian pilih secara acak
n, =n, = 2 anak (n= n, +n, = 4). Tentukan taksiran total buku dari N = 9 anak.
Penyelesaian :
Tabel 1.5. Daftar nilai x,, total kelompok x, dan rataan kelompok x, pada populasi
Kelompok x, x,
A 9
B 15 i
c 21 a
x =45
(® Banyaknya sampel yang mungkin (tanpa pengembalian) :
= Banyaknya kombinasi usp :
(M) = (3 )=301 620
2 yang mungkin dari m = 2 usp
— Banyaknya sampel n, =
3 3
(74) = C5 )=3.329
~ Total banyaknya sampel yang mungkin :
QQ Q)-x
25Tabel 1.6. Daftar semua sampel yang mungkin
A BX A c x B c x
1;3 ca) 7 1,3 57 36 3:5 S57 45
37 315 59 40,5 5:9 49,5
5:7 36 79 45 79 54
1,5 3:5 a aa aa 40,5 ae eee ee
37 36 59 45 59 54
5:7 40,5 79 49,5 79 58,5
3,5 3:5 36 aoa a 45 3:5 oo
37 405 495 5:9 58.5
S745 54 79 63
324 405 486
Pendugaan Total Populasi untuk sampel Acak Berkelompok
,.Mm@N a
Populi =: = t= —— } — x,
m ist mn jel”
M-m
Varians =: If) ME
M
ee
63 = 83 = a b
Ma
2 + DN?
a
b
dimana (1) adalah varians total dengan tanpa pengembalian dan (2) varians dengan
pengembalian, Terdapat dua sumber variasi, (a) variasi terhadap sampling usp dan dinamakan
variasi antar usp, dan (b) variasi intra usp
Batas kesalahan : %,+26), atau 4,425,
26dimana :
Sh=
-1E t-m( ZR yy
i=l m
(ii) Dengan cara lain bisa dihitung taksiran total populasi X berdasarkan sampel (1;3;3;5)
dari Tabel 1.6, yaitu :
eo e ns fe
m f1 on jl
a 3 N a ge
t= [ky he)
> 3,3
t= [5 - Git xd +— On +m]
3. 3 3
t-—- [= 0+5+4—@+5)
3
R= 5 (6 + 12) = 27
‘Adapun taksiran varians populasi dari contoh Tabel 1.6 di atas (tanpa pengembalian)
adalah :
M-m sy s
M
M pg N
+—2ZN
M m m N n
‘Varians
Namun, terlebih dahulu harus dapat kita ketahui nilai s’, dan s*.
Kelompok xy x, x, x, N/n, % a,
A 13 10 4 2 3p 6 36
B 35 4 8 4 aR 2 14
TOTAL 13). 180
2785577 0-2 @ J= [10-8
1 au 7
ana Ce 0.8]
1
= 5 [4-2 06 ] = [34-32 ]=2
. 1 3
Maka : $=3GB-I—+5—-O ()
=274+9=34
standart error: sp = V34 = 5,8309
Batas kesalahan : t+2 6:4 atau ti +2 sea
27 + 2 (58309) = 27 + 11,6618
Penduga Rerata Populasi untuk sampel Acak Berkelompok
1 oM N,
Reta: Ga POE,
N om él nm I
1 M-m s; M N-m
Variang —: 1p — (m@——_ + Fy, )
N M mm Nt
1 Ss OM sy
2 Oe + Em)
N nm ny
dimana (1) adalah varians rerata dengan tanpa pengembalian dan (2) varians dengan
pengembalian.
Batas kesalahan : Kut2Giq atau Rt2 Sa
28dimana :
Contoh 1.12. :
‘Sesuai dengan contoh 1.11. Carilah nilai penduga rata-rata untuk sampel acak berkelompok
dan tentukan batas kesalahan pendugaannya,
Penyelesaian :
Ingat bahwa diketahui :
- N=9danM=3
N Noa
~ Boxy + =e
9 2 2 es
3
— 6+12)=3
2
29Untuk menentukan batas kesalahan pendugaan, terlebih dahulu kita cari nilai varians
(tanpa pengembalian) dengan rumus :
1 M-m
[we ——
N M
Varians
1 Lt,
[E e-m(—"y]
i=l m ”
Sy
m-1 i=!
1 Bo
=r! W0-2(—- P= 18
1
0, -
[XY x3-@ 49]
fl
n-1
1
2, i:
(E x2- 0,5) |
=1 j=
[10-2 (4)]=[10-8]=2
[2 x?- 8) ]
jel
— [34-2 (16) ]=[34-32]=2
3
Varians : s,2, oOo
1 4
Varians : 52, = —— 34 =—— = 042
81 81
Batas kesalahan : Xyt2G,, alan % +25, ,
3 +2 (0,42) atau 3+ 0,84
Seringkali seorang pelaksana eksperimen ingin menggunakan sampel acak bergerombol
untuk menduga proporsi populasi p. Misalnya dalam survai sebelum pra pemilihan, barangkali
diinginkan untuk menduga proporsi penduduk suatu masyarakat yang menyukai ukuran kotak
30pemungutan suara tertentu: atau barar-zka!i dimaksudkan untuk menduga mobil-mobil di kota
yang tidak lolos dari standar pengotoran yang terakhir, proporsi anggota serikat buruh di
selumuh pzopinsi yang menyukai penyesuaian gaji melalui negosiasi. Untuk menghitung p
pada wakt menggunakan sampel acak bergerombol, pertama-tama kita cari a, yaita banyaknya
anggota dalam gerombol ke-i yang memiliki ciri-ciri yang diminati, untuk setiap gerombol
i=1,2,....m. Kemudian nilai dugaan proporsi anggota dalam populasi yang memiliki ciri-
ciri dapat diveroleh melalui rumus yang ada dalam kotak.
Pendugaan Proporsi Populasi untuk Sampel Acak Bergerombol
Penduga :
Varians penduga :
Q
@-pny)
—_——— ]
dimana :
Batas kesalahan pendugaan: p+2 6%, atu p+2s\,,
31wp
32
LATIHAN SOA
Dalam keadaan apa kita dapat menggunakan sampel acak berkelompok ? Apakah
kelebihan dan kekurangannya ?
Diketahui populasi :
kelompok A,
A
B
Cc
Dipilih m = 2 kelompok
Hitunglah varians 7 !
Diketahui populasi :
kelompok x,
A 13:5
B 3: 6:6
dipilih m = 1 kelompok secara acak dan subsampel n, = 2 secara acak.
(1) Tuliskan semua sampel kelompok yang mungkin !
(2) Ambillah sampel yang pertama dan hitunglah varians total populasi !
Seorang pemeriksa mutu pada rantai produksi perangkat keras ingin menghitung proporsi
bola lampu yang cacat yang dikirimkan ke gudang oleh pabrik. Bola lampu dikirimkan
dalam karton yang berisi 12 kotak, dengan setiap Kotak berisi 6 bola lampu. Buat
rancangan percobaan sampel acak bergerombol untuk pemeriksa tersebut. Manakah yang
harus digunakan, karton-karton bola lampu atau kotak-kotak bola lampu sebagai gerombol
? Jelaskan !
Lihat latihan soal no.4. Misalkan pemeriksa tersebut memutuskan untuk menggunakan
kotak bola Jampu sebagai gerombol dan secara acak memilih m = 20 kotak dari antara
100 karton yang diterima dalam pengiriman. Banyaknya bola lampu yang cacat yang
ditemukan dalam setiap kotak bola lampu adalah sebagai berikut : 0, 2.0, 3. 1, 1.0. 1.
2,1,0, 2,0, 1, 1,0, 3,0, 2. 1.
Dugalah proporsi p bola lampu yang cacat dalam pengiriman, dan tentukan batas kesalahan
pendugaan !1.6. SAMPEL ACAK SISTEMATIK
Rancangan yang menghindari persyaratan pengumpulan data yang tidak prakus dari
sampel acak sederhana adalah sampel acak sistematik.
Sampel Acak Sistematik
adalah suatu cara pemilihan sampel secara acak satu anggota (unsur) dari k anggota
pertama dalam kerangka dan kemudian memilih setiap anggota yang ke-k selanjutnya.
Karena lebih mudah dan lebih sedikit memakan waktu untuk melaksanakannya ketimbang,
sampel acak sedcrhana, sampel acak sistematik dapat menghasilkan lebih banyak informasi
per rupiah sampel. Terutama bermanfaat dalam audit, bila informasi yang relevan dicatat
dalam bentuk yang berurutan, misalnya, menyimpan dalam komputer atau pada kartu arsip.
Dengan memilih pelanggan kredit, catatan pemeliharaan peralatan, atau data tenaga penjualan
dari catatan perusahaan yang disimpan dalam komputer dapat dilaksanakan dengan mudah,
murah, dan efisien dengan menggunakan sampel acak sistematik.
Ada beberapa keadaan tertentu dimana sampel acak sistematik tidak seharusnya digunakan,
yaitu jika terdapat periodisitas tersembunyi yang muncul pada jangka waktu tertentu dalam
populasi, dan juga bila ukuran sampel tidak diketahui.
Adapun cara pemilihan sampel dengan sampling sistematik, terdapat dua metode, metode
A dan metode B.
(1) Metode A
Misalkan populast berukuran N= 12
Kye Xp Xe Xe Xe Kee Xp Xe Kye Kor Kee Xe
Dengan metode A. dilakukan pemilihan satu unit sampling dari tiga unit sampling pertama
(misalkan terpilih X,) selanjutnya dipilih tiap unit kedua kelompok sampling berikutnya.
Jadi :
Populasi : Xj. Xj. X, 1 Xp Xq Xp pp Kye Xo Xpye Nye XZ
Sampel: -X, X, x, ee
Dengan metode A populasi dikelompokkan dalam
N 12
n= == 4 kelompok
N = nk, jadi jumlah populasi merupakan kelipatan dari k. Bilangan k menyatakan
banyaknya sampel gkin, dan n menyatakan ukuran sampel,
Bila N + nk, misalkan untuk N = 12 akan dipilih sampel sistematik dengan k = 5,
maka
33,k 5
Dalam hal ini, ukuran sampel adalah 2 atau 3. Prosedur pemilihan sampel adalah memilih
secara acak | unit dari 5 unit pertama, selanjutnya dipilih satu unit dari setiap 5 unit
berikutnya mulai dari sampel awal yang terpilih.
(2) Metode B
Untuk menjelaskan metode B, akan diberikan suatu ilustrasi. Andaikan N = nk = 12.
Ingin diadakan sampling sistematik dengan k = 3. Dipilih suatu unit sampling secara
acak (namakan unit ke-j). Andaikan j=8, diperoleh :
J
k
Karena k = 3, maka.nilai r yang mungkin adalah 01,2. Pada metode B,pemilihan titik
awal (sampel awal) didasarkan atas nilai r. Bila r= 1, pilih X,, bila r = 2; pilih X,, bila
r= 0, pilih X, sebagai titik awal selanjumya pilih setiap unit sampling ke-k = 3 dari titik
awal. Begitu juga berlaku untuk sampling dimana N + k. Andaikan N = 11 dan k = 3,
diperoteh :
8
= —— = 2 dengan sisa r = 2
8
ae = dengan sisa t= 2
a
Untuk r = 2 dipilih X, sebagai titik awal. Selanjutnya pilih setiap unit sampling ke-k =
3, Dalam hal N + nk, ukuran sampel sistematik tidak sama. Sampel sistematik ketiga
hanya mempunyai tiga unit sampling, sedangkan yang lainnya 4.
Karakteristik prosedur pemilihan B adalah peluang terpilihnya sampel sistematik sama
dengan n/N. Sedangkan pada metode A, peluang terpilihnya sampel sistematik sama dengan
Uk.
Penduga Rerata Populasi untuk Sampel Acak Sistematik
Rerata x, eee eee
dimana
Varians
dimana
Batas kesalahan : X,
34Contoh 1.13 =
Diketahui data tentang banyaknya buku ajar yang dimiliki oleh N=9 mahasiswa : 1; 2;
3 4; 5; 6: 7; 8: 9.
Dari populasi tersebut pilihlah sampling sistematik 1 — 3 dan dari sampel yang terpilih
dihitung taksiran mean populasi !
Penyelesaian :
N=9=3x3=nk—>n=3
Jadi ada 3 sampling sistematik 1 — 3 yang mungkin, yaitu :
Bila sampel yang terpilih adalah sampling sistematik nomor 1, maka :
hewe4
Bila yang terpilih sampling sistematik nomor 2, maka X,, = § dan bila yang terpilih adalah
yang oy 1?
sampling sistematik nomor tiga, maka %,, = 6.
Dari daftar semua sampel yang mungkin, diperoleh nilai ekspetasi x,
1
EQ,) = > (4+5 + 6) =5 =x (metode A)
3
BG) = (4+ 5 + 6) = 5 =x (metode B)
Contoh 1.14:
Dikctahui populasi sebagai berikut :
1 314; 5,617 8:9
Dari populasi tersebut diadakan sampling stratifikasi dengan k
Carilah varians dari rata-rata sistematik !
aPenyelesaian :
berarti terdapat k = 3 sampel sistematik yang mungkin seperti pada Tabel 1.9.
Tabel 1.9. Jumlah sampel sistematik yang mungkin
1 2 3
Xy *y Xy xy a} *y
1 I 2 4 9
4 16 5 25 6 36
49 8 64 9 81
12 66 15 93 18 126
Langkah pertama, tentukan nilai $?
n n oa
=—[2o@,-0+20,-9 +2 O-v ]
O41 jel jel” j=l
1 ge? 60
=—— (21+ 18 +21) =—
8 : 8
Varians S? merupakan varians populasi secara keseluruhan.
Selanjunya dibitung suku kedua, yaitu :
1 koa
—— YY (x,- x)
N isl j=l
loo - n
=—[E «@,-xP+ Yo, ]
al jel
1 54
= — (18 + 18 + 18 ) = ——
9 Cy
36Maka, varians rerata populasi dari sampel sistematik adalah :
Varians :
Namun perlu diketahui untuk dapat menentukan varians seperti rumus tersebut, perlu
diketahui semua sampel sistematik yang mungkin. Hal ini menyebabkan varians tidak dapat
digunakan untuk keperluan praktis, karena biasanya hanya tersedia sampel. Jadi pertu ditentukan
penaksir nilai varians didasarkan atas satu sampel. Karena sifat dari nilai varians, penaksir tak
bias untuk nilai varians tidak dapat ditentukan berdasarkan satu sampel sistematik, Tetapi
dengan kondisi tertentu, sampling sistematik dapat dianggap sama dengan sampling acak.
Dengan demikian taksiran varians random dapat digunakan untuk menaksir varians sistematik.
Suatu ukuran yang menyatakan derajat keseragaman suatu sampel sistematik adalah koefisien
korelasi p antar pasangan unit di dalam sampel sistematik yang sama. Koefisien korelasi p
didefinisikan sebagai
E (x, — &) (x, ~ X)
p=
dengan menggunakan p. varians rerata dapat ditulis sebagai :
Varians :
Sl
Pe, =—— | +n- Ip |
n oN
kon - |
dengan YL. =x) &,-¥) =
ne elici N-1 $
p dinamakan koefisien Korelasi intra kelas. Koefisien korelasi intra kelas p mengukur
Keseragaman suatu sampel sistematik. Koefisien korelasi intra kelas bertambah besar bila
sampel sistematik bertambah seragam.
37LATIHAN SOAL
Mengapa orang melakukan pemilihan sampel dengan sampel acak sistematik ?
Dalam keadaan apa penarikan sampel dengan sampel acak sistematik tidak dapat di-
lakukan ?
Diberikan populasi
2 4 8
v
(1) Dengan metode A, pilih semua sampel sistematik yang mungkin
(2) Dengan metode B, pilihlah semua sampel sistematik 1-6 yang mungkin,
(3) Tentukan peluang untuk sampel yang dipilih pada (1).
Misalkan suatu buku terdiri 555 halaman. Ingin ditaksir banyaknya perkataan “adalah”
muncul di dalam buku tersebut.
Akan dipilih sampel sistematik 1 ~ 20.
(1) Berapa ukuran sampel, menurut metode A? Menurut metode B ?
(2) Tentukan peluang terpilihnya suaty sampel yang dipilin dengan metode A? Juga
metode B ?
Petunjuk :
(1) ingat N = nk ——> n= Nik
(2) Peluang terpilitmya suatu sampel :
metode A. 1/k
metode B : n/N
Diketahui populasi :
1s 2 35 4; 5; 6; 7% 8: 9% 10; Mts 12
Misalkan dipilih sampel sistematik 1 ~ 4. Tentukan
(1) koefisien korelasi intra kelas p
(2) variansi rerata dengan faktor koreksi dari koefisien korelasi intra kelas p.v
SOAL-SOAL MULTIPLE CHOICE
Di bawah ini termasuk teknik pengambilan sampling dengan jumlah sampel terbatas,
kecuali :
a. Stratified Random Sampling
b. Systematic Random Sampling
c. Cluster Sampling
d. Tidak ada jawaban yang benar
Suatu sampel random sederhana bersifat :
a. Secara relatif situasi dalam sampel sama dengan situasi populasi, karena penarikan
dilakukan menurut suatu proses probabilitas
b. Untuk setiap penelitian, sampel ini yang paling baik
cc. Sampel ini selalu yang paling mudah diambil
d. Karena penarikan sampel ini dilakukan menurut suatu proses probabilitas, situasi
dalam sampel mungkin berbeda dari situasi dalam populasi
Sampel dikatakan sampel random bila :
a. Setiap unsur dalam populasi memiliki kesempatan yang sama
b. Setiap unsur memiliki peluang
cc. Sampel yang dipilih dengan prosedur random
d. Semua jawaban di atas benar semua
Manfaat penarikan sampel :
a. efisiensi biaya cc. agar random
c.-hemat waktu d.adanc benar
Sejumlah n sampel ditarik dari sebuah populasi yang besar ( n/N < 5% ) dimana pemilihan
sampel dilakukan dengan pemulihan, maka standar error dari harga rala-rata hitung
sampel adalah :
3910.
Lt.
40
Jika sebuah sampel random sebesar n = 250 dipilih tanpa pemulihan dari populasi
normal sebesar N = 3500 dengan qt = 27.5 dan o = 10, maka standar deviasi distribusi
sampelnya ;
a, 0,632 c. 0,945
b. 0,609 4. 0921
Sejumlah n sampel mempunyai rata-rata 9.82 dengan standar deviasi o, = 2,3. Dengan
uji kepercayaan 95 % dari distribusi nommalnya, diperoleh nilai interval rata-rata populasi
(m):
a. 95,
b, 312 = 0,95
c. 0,95
d. -14,328 Sp $ 5,312 = 095
Sejumlah N populasi yang memiliki distribust normal mempunyai nilai rata-rata (U) =
1200 dengan 6 = 300. Dengan interval keyakinan sebesar 95 %, maka jumlah sampet
yang dapat diambil secara random dan dengan pemulihan dant populasi tersebut bila
diharapkan rata-rata sampel X = 1258.8 adalah :
a. 100 30
b 10 900
Presisi penaksir (°) dipengaruhi oleh ukuran sampel, bila presisi semakin besat, make
ukuran sampel
a. berbanding lurus c. tetap
b. _berbanding terballik d. tidak ada yang benar
Andaikan 2,5 % pelanggan telepon di Jakarta memiliki tunggakan, maka rata-rata propots)
pelanggan telepon yang memiliki tunggakan pada sampel acak yang terdin ary 10"
orang adalah
a. 0,025 % 0028
b. 0.25 % d
b. Distribusi rata-rata sampel kecil akan normal jika sampel ditarik dart poputass
sembarang
¢. Pendekatan distribusi rata-rata sampel kecil dengan distribust | sangat mendekats
distribusi nomal
4. Distribusi rata-rata sampel akan menyerupai distribusi normal jika besar sampel (ny
bertambah tanpa batasfp
13.
15,
lo
Diantara 250 karyawan kantor cabang sebuah perusahaan asuransi intemasional, 182
orang berkebangsaan Inggris, 5 orang berkebangsaan AS, dan 17 orang Asia. Bila kita
gunakan alokasi sebanding untuk mengambil sebuah contoh acak berlapis 15 karyawan,
maka jumlah karyawan yang harus diambil dari setiap golongan tersebut secara berturut-
turut adalah
a tb 3.t ec. 1 tL
bo T 3d ad 1113
Dari suatu populasi mahasiswa tak terbata dan terdistribusi normal diambil sampel ran-
dom yang terdiri dari 64 orang. Penarikan sampel ditakukan tanpa pemulihan dengan
rata-rata IQ sampel 115.5 dengan standard deviasi sampel sebesar 16. Batas atas IQ
populasi mahasiswa tersebut pada interval keyakinan 95 % adalah
a 1914 ce. 1194
b. 1149 d 1419
Jika diinginkan selisih rata-rata sampel dengan rata-rata populasi (x — jt, ) = V5 dengan
standard devrasi populasi (6,) = 10, maka ukuran sampel yang ditarik pada selang
kepercayaan 95 % adalah
a 16 c. 236
boo a7
Gunakan soal no. 14, Jika diinginkan selisih rata-rata sampel dengan rata-rata populasi
= 2. maka ukuran sampel pada selang kepereayaan 99 % menjadi :
ead © 97
b. 167 a. 9224
Suatu sampel acak sederhana bersitat
4 secara relatif situasi dalam sampel sama dengan situasi dalam populasi, karena
penarikan dilakukanmenurut suatu proses probabilitas
b. untuk setiap penelitian, sampel ini yang paling baik
Sampel ini selalu yang paling mudah diambil
dé. karena penarikan sampel ini dilakukan menurut suatu proses probabilitas, situasi
dalam sampel mungkin berbeda dari situasi dalam populasi
e
Dari suatu populasi satu sampel acak sederhana ditarik tanpa pemulihan. Populasi terdiri
dar’ 4500 unsur dan sampel tersebut terdiri dari 15 unsur, Untuk penarikan itu tabel
angka random digunakan. Lihat pada tabel bilangan random. Pada tabel 0 angka dalam
baris 05 dan kolom litusuk” sebagai angka pertama, yaitu angka Kemudian
diambil dant kisi ke kanan setiap angka dalam baris 05, baris 06, baris 07, dan seterusnya.
Dalam sampel ini, antara lain ditarik unsur bemomor :
a. Ol «107
b. $467 d. 739
4l18. Dari suatu populasi satu sampel acak sederhana ditarik tanpa pemulihan, Populasi terdiri
dari 6700 unsur dan sampel tersebut terdiri dari 20 unsur. Untuk penarikan itu tabel
angka random digunakan, Lihat pada tabel bilangan random. Pada tabel ini angka dalam
baris 10 dan kolom 00 “ditusuk” sebagai angka pertama, yaitu angk: Kemudian
diambil dari kiri ke kanan setiap angka dalam baris 10, baris 11, baris 12, dan. seterusnya.
Dalam sampel ini, antara lain ditarik unsur bemomor :
a 2211 c. 84
b. 20 d. 8484
19. Suatu populasi terdiri dari dua lapisan
1. _lapisan pertama terdiri dari 4000 keluarga tani
2. lapisan kedua terdiri dari 800 keluarga buruh
4000 keluarga tani ini terdiri dari 24,000 orang dan 800 keluarga buruh ini terdiri dari
4000 orang. Dari populasi ditarik suatu sampel berlapis terdiri dari 42 keluarga.
Pembagian unsur sampel menurut lapisan, sebanding dengan besamya lapisan (pro-
portional allocation). Kalau ditarik secara demikian, sampel berlapis ini teidiri dari:
a. 36 keluarga tani dan 6 keluarga buruh
b. 210 orang dari keluarga tani dan 35 orang dari keluarga buruh
c. 7 keluarga tani dan 35 keluarga buruh
d. 35 Keluarga tani dan 7 keluarga buruh
20. Sejenis benang diproduksi dengan kekuatan tarik rata-rata = 78,3 kg dengan standar
deviasi = 56, Jika ukuran sampel dinaikkan dari 64 menjadi 196, maka galat baku/
standard error menjadi
a. 0,20 c. 0.40
c. 0,70 4. 0,03
21. Gunakan soal no. 20 untuk memperoleh standard error = 0,2, maka ukuran sampel yang
harus diambil adalah :
a. 180 c. 196
ce. 184 d. 28
22. Sampling sistematik dapat digunakan, jika :
a. persyaratan pengumpulan data tidak praktis dari sampling acak sederhana
b. _terdapat periodisitas tersembunyi yang muncul pada jangka waktu tertentu dalam
populasi
c. ukuran sampel tidak diketahui
d. semua jawaban di atas benar
23, Misalkan dari suatu populasi berukuran N = 5 diambil sampel acak sederhana berukuran
2. Maka untuk sampel tanpa pengembalian berlaku
a 386 c. 3/0 S?
b. 8208? d. 320 S?Diketahui populasi X, =
6 dan x, = -2, mak
4 ce X=3
8 x
4: X, =-2. Dengan sampel acak sederhana diperoleh
a Xx
bes
now
Diketahui suatu populasi : X,= i, i= 1,2,
Dari populasi ini diadakan sampling sistematik 1 - 6, maka :
a. ada 6 sampel sistematik yang mungkin
b. tiap sampel ssitematik berukuran 6
c. salah satu sampel sistematik adalah : 1; 7
dd. adanc benar
Diketahui populasi :
X, XX, X, XX, XX,
Dari populasi ini diadakan sampling sistematik 1 - 3, maka :
a, ada 3 sampel sistematik yang mungkin
b. taksiran mean populasi adalah %, = 1/2 (Xt X,)
cc. peluang terpilihnya sampel X,, X, adalah 2/8 bila pemilihan sampel dilakukan dengan
metode B
d. a danc benar
. Diketahui populasi :
13:5: 8:10; 12 1618
Diadakan sampling sistematik 1 - 3, maka
jah salu sanpel sistematik adalah 16; 18
b. peluang tempilihnya suatu sampel sistematik adalah 1/3 bila pemilihan sampel
dilakukan dengan metode A
cc. peluang terpilihnya suatu sampel sistematik adalah 1/3 bila pemilihan sampel
dilakukan dengan metode B
4d. peluang terpilihnya sampel 5; 12 adalah 2/3 bila pemilihan sampel dilakukan dengan
metode B
. Dari 10,000 karyawan pabrik terdapat 50 lulusan sarjana, 150 lulusan D-3, 500 lulusan
SMA, dan selebihnya adalah yang tidak tamat sampi SMA maupun yang tidak bersekolah.
Pimpinan perusahaan ingin melihat tingkat kerajinan karyawannya dengan mengambil
secara acak 200 karyawannya untuk diteliti. Pimpinan akan melakukan penarikan sampel
acak berstrata. Pimpinan mengambil sampel secara alokasi dengan jumlah sampel sama.
Berapa sampel yang diambil dari karyawan lulusan SMA ?
a 10 cr 50)
bi 25 a5
4329.
30.
31.
Apabila pada soal 28, pimpinan mengambil sampel dengan cara alokasi secara
Proporsional, maka jumlah sampel yang diambil dari karyawan yang tidak lulus SMA
atau tidak bersekolah adalah :
a 50 c. 8
b. 186 d. 145
Diketahui populasi dengan X, ~ 1+ j- 1, i= 1,2, 3. Maka
a. Varians antar total sampel berkelompok S = 9
b. Varians taksiran total t adalah 30
c. Rata-rata penduga sampel berkelompok %, = 5
d. a dan b benar
Diketahui populasi yang telah dikelompokkan :
Kelompok rs
Ot
A 123
B 4 5: 6
c 7&O
Dipilih m = 2 kelompok dan n, = n,
a. terdapat 27 sampel yang mungkin
b. salah satu sampel kelompok adalah A: 1:2 B:4: 5.
c. total populasi X = 45
d. b dan c benar
2 subsampel. Maka :REGRESI DAN KORELASI
SEDERHANA
2.1. PENDAHULUAN
Analisa pasangan variabel membutuhkan data yang terdiri dari 2 kelompok hasil
observasi atau pengukuran. Data yang dapat‘diperoleh dari pelbagai bidang kegiatan yang
menghasilkan pasangan observasi sebanyak n, dinyatakan sebagai (x; y,)-
Di dalam penelitian ilmiah, selain ingin menunjukkan hubungan antara dua variabel atau
lebih dan mengukur hubungan itu, juga ingin dapat meramalkan sesuatu, yaitu menentukan
nilai suatu variabel sesudah mengetahui nilai-nilai variabel yang lain. Untuk dapat meramal,
harus diketahui dulu hubungan antara variabel-variabel itu. Yang berhubungan dengan
peramalan dan kesalahan peramalan, dinamakan proses regresi. Sedangkan pengukuran
hubungan antara variabel, dinamakan proses korelasi.
Definisi :
Regresi dan korelasi sederhana adalah svatu cara untuk mengetahui hubungan antara
satu variabel dengan satu variabel yang lain.
Jika pasangan observasi pengukuran (x; y) digambarkan di atas kertas berskala hitung,
| akan diperoleh serangkaian titik-titik Koordinat yang menghubungkan kedua hasil observasi.
45Penggambaran demikian dinamakan diagram pencar (scatter diagram).
Dari diagram pencar dapat ditarik suatu garis yang menggambarkan nilai rata-rata y
terhadap x, sehingga diperoleh persamaan garis regresi.
y y
nilal-nilal observast .
= 1 (ample points) . nilai-nilai observasi
. “ (sample points)
0 x 0 x
Gb.L.1. Scatter Diagram Gb.1.2. $.D. dengan Garis Lengkung
7
| a (sample a
ial observasi
0 x
| Gb.L.3. Scatter Diagram dengan garis linear
Biasanya yang sering digunakan dan mudah untuk perhitungan, digunakan persamaan
garis linear dari Scatter Diagram dengan garis lurus seperti di atas.
Persamaan garis linear :
Hy, = A+ BX
dimana : 1,, = rata-rata populasi y terhadap x
A’ = jarak antara 0 dengan sumbu Y
B= koefisien regresi / kemiringan
462.2. METODE KUADRAT MINIMUM ( Least Squares )
Prosedur statistik untuk memperoleh garis lurus dengan “kesesuaian terbaik” (best
fitting) untuk serangkaian titik dari pasangan data bisa kita peroleh dengan meminimumkan
penyimpangan (deviasi) titik-titik dari garis yang akan kita buat.“
Rata-rata populasi y terhadap x biasanya tidak diketahui, sehingga digunakan suatu garis
penduga (garis regresi).
Persamaan garis penduga :
f=atbx
dimana: § = penduga untuk 1,
a = penduga untuk nilai A
b= penduga untuk nilai B
Yeas Bx
Gb.1.5. Persamaan Garis Linear
Dengan prinsip kuadrat minimum (principle of least squares), dapat dibuat suaww garis
lurus yang memiliki “kesesuaian terbaik”, yaitu pilih sebuah garis dengan “kesesuaian terbaik””
yang meminimumkan jumlah kuadrat penyimpangan nilai yang diamati dengan yang
diramalkan. Atau meminimumkan
sse= 3 W,-9F
i=l
Istilah SSE menyatakan jumlah kuadrat penyimpangan, yang biasa disebut jumlah kuadrat
Kesalahan (sum of squares for error). Kalau disubstitusikan ramus persamaan garis regresi
dalam rumus SSE, maka
SSE = 2 [y,- (a+ bx) P
isl
47Rumus Kuadrat Terkecil untuk a dan b
SS, Pe
b= danas yb
SS,
dimana :
a
(Xd xy
pn , Fl
ss,= 2-9 = Pe -
1 i=l n
_ Eo, =2y,- 9)
a a
(2 xd y)
ao el
a1 n
Contoh 2.1:
Tabel 2.1. Pengeluaran iklan dan volume penjualan untuk suatu perusahaan selama 10
bulan yang dipilih secara random
Pengeluaran untuk iklan Volume pengeluaran
Bulan x (x Rp 10,000,000) ¥ (x Rp 10.000.000)
1 12 101
2 08 2
3 1,0 110
4 1,3 120
5 07 90
6 08 82
7 10 93
8 06 75
9 09 a1
10 Ll 105
Buatlah persamaan garis regresi dari data di alas
48Penyelesaian :
Langkah pertama adalah membuat tabel data perhitungan yang dibutuhkan untuk mencari
nilai-nilai a dan b, seperti pada tabel di bawah ini.
Tabel 2.2. Perhitungan dari data Tabel 2.1.
v x x, xy y
101 aa 1,44 121,1 10,201
aa 08 0,64 73,6 8.464
110 1,0 1,00 110,0 12,100
120 a 1,69 156,0 14,400
90 0,7 0,49 63,0 8,100,
82 08 0,64 65,6 6,724
93, 10 1,00 93,0 8,649
75 0,6 0,36 45,0 5,625
91 09 0,81 881,9 8,281
102 il 1,21 115.5 11,025
Jumlah 959 94 9,28 924,8 93,569
Rata-Rata sli) 0,94 0,928 92,48 9,3569
ay
SS, = 9,28 — 0,44
a 10
[ a
a fe OE, 9.4959)
ss. =% xy-— = 924g - = 23,34
se" n 10
= 0,94
Jadi :
23,34
SS, 0.444
= 52,5676 = 52,57dan :
a = ¥ — bx = 95,9 — (52,5676)(0,94) = 46,49
maka persamaan regresi adalah :
J=atbdx atau ¥ = 46,49 + 52,57x
Misalkan perusahaan menganggarkan Rp 10,000,000 untuk pengeluaran iklan pada satu
bulan, maka volume penjualan yang diramalkan adalah :
J =a + bx = 46,49 + (52,57)(1,0) = 99.06
atau kalau dalam rupiah, volume penjualan = Rp 990.600.000.
2.3. STANDARD ERROR OF ESTIMATE
Kalau sampel memiliki jumlah n yang cukup besar, pengukuran dispersi titik-titik koordinat
dari garis duga regresinya dapat dicari dari :
ss
: dimana (n-2) adalah derajat kebebasan (degrees of freedom)
n2
Rumus Menghitung SSE
SSE = SS, — bSS,,
dimana :
a
(2 yy
n _ on
SS, = 2% ~yed ” =
= i=
Contoh 2.2.:
Untuk data pada Tabel 2.1. hitung dan taksirlah standard error populasinya.
50Penyelesaian :
Dalam contoh 2.1, telah kita peroleh nilai SS,, = 23,34 dan nilai koefisien regresi (b) =
52,57. Sckarang kita hitung dulu nilai SS, dan SSE seperti rumus di atas.
(959)*
ua = 1.600,9
SS, = 93,569 —
SSE = SS, - bSS,,
= 1,600.9 ~ (52,5676)(23,34) = 373,97
SSE _ 373,97
= = 46.76
maka
n2
s= V46.76 = 6.84
dan s, merupakan taksiran untuk 6? dan 6.
2.4. INFERENSI MENGENAI KEMIRINGAN (B) DARI SUATU
GARIS
Inferensi awal yang dikehendai dalam mempelajari hubungan antara y dz x adalah
mengenai adanya eksistensi hubungan kedua variabel. Yaitu, apakah data itu menyajikan
bukti yang cukup untuk menunjukkan bahwa x menyumbangkan (memberikan) informasi
untuk peramalan y dalam lingkup pengamatan? atau cukup besarkah kemungkinan bahwa
kalau y dan x sama sekali tidak mempunyai hubungan.
Diasumsikan berkenaan dengan distribusi kemungkinan (probabilistik) y untuk suatu
nilai x tertentu, dapat ditunjukkan bahwa baik a maupun b keduanya disdistribusikan secara
normal dalam pengambilan sampel secara berulang dan bahwa nilai yang diharapkan (nilai
rerata) dan varian dari b adalah :
oe
SS,
E®)=B dan
Karena nilai o? yang sebenamya tidak diketahui, dapat diganti dengan varians yang
diperkirakan untuk nilai b, yaitu s.
= 8
35 BS,
Dengan mensubstitusikan (mengganti) s untuk o dalam statistik normal, maka pendugaan
dan pengujian hipotesis dapat menggunakan distribusi t,..
aePengujian Hipotesis Mengenai Kemiringan suatu Garis
Hipotesis Nol : HL: B=0
Hipotesis Altematif : ditentukan oleh peneliti, tergantung pada nilai b yang diinginkan
untuk dideteksi
b-B,
Statistik Tes (Uji): t=
dengan db =
Interval nilai B :
POD — bana: $< B< D+ Capen + 8)
Bila t,, atau t,,.,, 2 t.,... ——> koefisien regresi nyata.
Contoh 2.3. :
Dengan menggunakan data pada Tabel 2.1., buatlah uji hipotesis untuk menunjukkan
bahwa b tidak sama dengan nol dengan a. = 0,05
Penyelesaian :
Pertama-tama kita tentukan bentuk uji hipotesisnya. Karena disini kita diarahkan ke
dalam suatu bentuk statement tertentu, digunakan uji hipotesis altemnatif dua arah (B # 0).
Kalau uji hipotesis satu arah, pengujian diarahkan untuk membuktikan (B > 0) atau
B<0).
~ Hipotesis nol H, : B= 0
ee Seal
52re
|4——— Daerah Penerimaan ———>,
2,306 2,306 5,12
Karena t,,, > t,s,; maka kita tolak hipotesis nol : B = 0 dan menyimpulkan bahwa ada
bukti yang menunjukkan bahwa pengeluaran biaya iklan memberikan informasi untuk
digunakan dalam peramalan volume penjualan bruto bulanan (hipotesis alt. diterima : B + 0).
Contoh 2.4.
Hitunglah interval nilai B dengan selang keyakinan 95 % dengan menggunakan data
pada Tabel 2.1.
Penyelesaian :
B= tapas) $< B0 —: derajat hubungan antara dua variabel menunjukkan hal yang sejajar atau paralel
koefisien korelasi positip). Pada grafik, garis regresinya miring ke bawah
kanan.
*r=0 : tidak ada hubungan sama sekali antara dua variabel. Pada gratik, tidak ada
korelasi linear.
Rumus Koefisien Korelasi
V SS,SS,
Contoh 2.5. :
Hitunglah koefisien korelasi untuk data pengeluaran iklan dan volume penjualan pada
Tabel 2.1. :
Penyelesaian :
Telah kita ketahui bahwa nilai-nilai :
SS, = 23,34 SS, = 0,444 SS, = 1.6009
Maka nilai koefisien korelasi :
no
Ini berarti koefisien korelasinya positip, atau dengan kata lain hubungan antara pengeluaran
iklan berjalan paralel dengan volume penjualan. Jadi, semakin tinggi dana yang dikeluarkan
untuk iklan, semakin besar pula volume penjualan
54re
2.6. GARIS REGRESI X TERHADAP Y
| Kita bisa membuat suatu garis linear rata-rata X terhadap Y (i,,) dengan membuat suatu
garis penduga (garis regresi) rata-rata x terhadap y :
Qeaeby
dimana
,_ @x-bTy)
as
n
dan
55v
yy
56
LATIHAN SOAL
Apa yang dimaksud dengan analisis regresi sederhana ?
Jelaskan kenapa dan bagaimana kita membuat suatu diagram titik (Scarter diagram) ?
Apa kegunaan dari analisis korelasi ?
Apa yang dimaksud dengan metode least square ?
Diketahui sehimpunan data :
X 13 16 4 Ht 17 9 13) 17 1B 12
Y 62 86 72 45 90 35 65 93 95 57
a, Tentukan persamaan garis regresinya !
b. Dugalah nilai Y untuk X = 10, 15, dan 20.
Diketahui sehimpunan data :
56 48 42 58 40 3 50
45 385 345 46,1 333 321 404
Carilah persamaan garis regresinya !
Hitung standart error dari analisis anda !
Carilah interval perkiraan Y dengan 0 = 0,05 untuk X = 44.
ese ax
Jika dari suatu data diketahui nilai SS, = 15: SS, = 0.4; dan SS, = 1500. Carilah nilai
koefisien korelasi. Apa yang dapat saudara simpulkan dari hasil perhitungan saudara !
Dari sehimpunan data :
xX 3°97 4 2 0 4 1 2
You woo4 7 6 3 8
a. Buatlah suatu uji hipotesis untuk menunjukkan bahwa koefisien regresi (b) lebih
besar dari nol dengan 0 = 0,05.
b. Apa yang dapat saudara simpulkan dari hasil analisis saudara.w
SOAL-SOAL MULTIPLE CHOICE
Analisis untuk melihat keeratan hubungan antar variabel :
a. time series c. regresi
b. ANOVA d. korelasi
Prinsip pendugaan persamaan regresi adalah :
a. meminimalkan jumlah kuadrat error
b. meminimalkan jumlah kuadrat variabel
c. meminimalkan kemiringan persamaan regresi
Variabel dalam suatu eksperimen yang mudah dikendalikan dikenal sebagai variabel :
a. respon c. dependen
b. independen 4. addan b benar
Jika B = 0, maka garis regresi populasi dimana Y = A + B X akan :
a. membentuk sudut 45° ¢.sejajar sumbu X
b. sejaiar sumbu Y 4. berhimpit sumbu Y
Dari hasil analisis variabel dimana X adalah harga barang (dalam rupiah) dan Y adalah
jumlah penawaran (unit), diperoleh nilai koefisien korelasi r = 0,893. Hubungan kedua
variabel dapat disimpulkan sebagai berikut :
a. kenaikan harga barang akan diikuti ole penurunan penawaran
b. penurunan harga akan diikuti oleh peningkatan penawaran
c. kenaikan harga akan diikuti oleh peningkatan penawaran
d. tidak ada hubungan antara kenaikan harga dengan jumlah penawaran
Gunakan soal no. 5. Jika hubungan X dan Y dinyatakan dalam persamaan garis ¢ = 55
+ 1,25X, maka penawaran 180 unit barang dicapai pada harga
a. Rp. 100 c. Rp 280
b. Rp. 100.000 d. Rp 280,000
Nilai mid-test (X) dan ujian akhir (Y) dari 9 mahasiswa adalah :
X 77 50 71 72 81 94 9 67
e162) 00) 18.04 ee47,2 85 00 = GH
maka persamaan regresinya adalah :
a ¥=21+087X
12 + 0,78X 4
B
°
1 + 0,87X
+ 0,78X
¥
y
s713,
58
Gunakan soal no. 7. Dugaan nilai akhir bagi mahasiswa yang mendapat nilai mid-test
= 85 adalah :
a 8 c. 68
b. 76 d. 94
Bila koefisien korelasi suatu persamaan regresi mendekati nilai +1, maka
a. garis regresi turun dari kanan ke kiri
b. kedua variabel mempunyai hubungan kausal
c. garis regresi naik dari kiri ke kanan
d. ban c benar
). Dua variabel X dan Y diukur pada skala interval. untuk 60 pasang data (x,y,) diperoleh
hasil sebagai berikut ;
x= 10 y= 20 SS, = 6 SS, = 144
Kalau nilai Y = 22, maka nilai X yang diramalkan menurut garis regresi X terhadap Y
sama dengan :
a 10,5 ice G2
b. 18,0 d. 28
. Untuk 25 pasangan data (x;y,) berlaku :
x=10 yas SS, =2 SS, = 6 b=03
Jadi, untuk data ini koefisien korelasi X terhadap Y adalah :
a 03 c 09
b Ol d. salah semua
.. Variabel X dan variabel Y kedua-duanya diukur pada skala interval. Untuk 200 pasangan
data (x;y,) berlaku :
x=20 y= 30 SS, = 10 SS, =5
Kalau X = 15, maka nilai Y yang diramalkan menurut garis regresi Y terhadap X sama
dengan :
a. -20 c 25
b. ~40 d. 10
(Data di bawah ini digunakan untuk soal no.13 sid no. 17)
Diketahui data sebagai berikut :
Ree 2S
Y: 1 1 eee seanese eee
Koefisien regresi (b) X dan Y adalah
a. 0,6 c. 0,1
b. 02 d 0415.
19.
20.
. Koefisien korelasi (r) data tersebut adalah :
eee c. 0,55
b. 0.95 aot
Rata-rata X adalah :
a 3 C3)
ease d. 5,55
. Rata-rata Y adalah :
a 0.2 ce 2
b. 1,2 da 2.2
. Standar deviasi X adalah :
a 1,76 c. 158
b. 12 d. 0,98
. Standard deviasi Y adalah :
a 1,76 ce 12
bo1 d. 0.98
Diketahui varians regresi sebesar (s) 93.1864 digunakan untuk menguji apakah ada
hubungan linear antara besamya pendapatan (Y) dengan banyaknya konsumsi yang
dikeluarkan (X). Diketahui pula jumlah kuadarat untuk variabel X sebesar 10.378.461.18.
Maka dapat kita tentukan
a. s, = 0.005 c
b. 0,67 d.
S,
Berdasakan soal no. 19, tindak lanjut dilakukan pengujian hipotesis dengan a = 5 %,
maka bisa disimpulkan :
a. tidak terdapat hubungan linear antara kedua variabel
b. ada hubungan linear antara kedua variabel
c. Hipotesis nol H, : B = 0 diterima
d.adan ¢ benar
59REGRESI DAN KORELASI
BERGANDA
3.1. PENDAHULUAN
Metode ini merupakan perluasan dari metode regresi sederhana, Tujuan dari mempelajari
regresi dan korelasi berganda (Multiple Regression and Correlation) adalah untuk mencari
hubungan antara variabel dependen Y dengan dua atau lebih variabel independen (X,: X,:
2d XD
3.2. PERSAMAAN GARIS LINEAR REGRESI
Untuk garis linear terhadap rata-rata Y terhadap X,; X,:
dalam persamaan garis linear regresi berganda :
.. X, dari populasi dijabarkan
MYX), X2, 0... Xq_ = A + BiX1 + BoX +... + BaXn
dan penduga garis regresi rata-rata Y tethadap beberapa X variabel bebas, dapat diduga
dengan garis regresi sampel seperti dalam persamaan sebagai berikut :
60Yeatbdx,+bx, +... +x,
3.3. COEFFICIENTS ESTIMATE
Untuk mencari nilai-nilai a. b,. dan b, dalam linear regresi berganda untuk dua variabel
independen X, dan X,, dapat kita gunakan kuadrat minimum (by least squares). Karena
persamaan garis regresi berganda seperti di atas, tidaklah sesederhana itu. Setiap observasi
dati beberapa variabel selalu mengandung random error atau selisih antara nilai observasi
dengan nilai penduganya. Atau dengan kata lain, dengan mode! kuadrat minimum, kita'duga
nilai a, b,, dan b, dengan meminimumkan nilai :
a, a
SSE = 2 = 2(Y,- vy
a Om
Lalu kita substitusikan nilai § ke dalam persamaan di atas, menjadi :
Q
| See
Pada keadaan ckstrim — dimana kondisi minimum adalah salah satu keadaannya —
turunan pertama dari SSE berturut-turut terhadap a, b,. dan b, bemilai nol, schingga diperoleh
tiga persamaan berikut:
a n
DY,=na +by xX, +d xX,
i isl ist”
n n a
EXy, =a XM, + 2M, +b 2B XX
is =
Bxynak X, +b, zx, X, +b, es
Dari tiga persamaan di atas, bisa kita mencari nilai b, dan b,.
Untuk nilai a bisa dicari dengan rumus :
61Contoh 3.1. :
Internal Revenue Service mencoba menduga pajak aktual yang tertunda setiap bulan dari
divisi auditingnya. Diduga dua faktor yang mempengaruhi adalah jumlah jam kerja pegawai
| dan jumlah jam kerja mesin (komputer). Untuk menganalisis seberapa besar kedua faktor
tersebut mempengaruhi besamya pajak aktual yang tertunda (yang tidak dibayar) setiap bulan,
dicatat pajak setiap variabel sclama 10 bulan. Hasilnya terlampir pada Tabel 3.1.
Tabel 3.1. Data dari IRS Auditing Records selama 10 bulan terakhir
x, x, Y(Rp. 1000)
Bulan Jam kerja Pegawai Komputer Pajak Aktual
(am) yang tidak dibayar
Januari 45 16 2»
Februari 42 14 24
Maret 4 15 7
April 45 13 25
Mei 43 13 26
| Juni 46 \4 28
Juli 44 16 30
Agustus 45 16 28
‘September 44 15 28
Oktober 43 15 2
Penyelesaian :
1) Kita susun Tabel 3.1. berdasarkan kuadrat minimum dengan n = 10 seperti pada
Tabel 3.2.Tabel 3.2. Hasil kesesuaian kuadrat minimum dengan n = 10
Y x, x, | xy | XY | Xy, | x Y, y
Ww (2) (3) | @)x) | Bx) | @)x(3) |? By ay
29 45 16 | 1305 | 464 720 | 2.025 | 256 | 841
4 a2 14 | 1.008 | 336 588 | 1.764 | 196 | 576
21 44 15 | 1.188 | 405 660 | 1.936 | 225 | 729
25 45 13 | 1.125 | 325 585 | 2.025 | 169 | 625
26 43 13 | 1118 | 338 559 | 1849 | 169 | 676
28 46 14 | 1.288 | 392 644 | 2.116 | 196 | 784
30 44 16 | 1.320 | 480 704 | 1.936 | 256 | 900
28 45 16 | 1.260 | 448 720 | 2025 | 256 | 784
28 44 15 | 1.232 | 420 660 | 1936 | 225 | 784
21 43 15 | 1.161 | 405 45 | 1.849 | 225 | 729
272 | 441 | 147 | 12.005 | 4.013 | 6.485 | 19.461 | 2.173 | 7.483
2)
3)
X= 272 X, = 441 X,= 147
Dalam 3 persamaan normal :
22= Wat 441, + 147d,
12.005 = 441 a+ 19.461 b, + 6.485 b,
4.013 = 147 a+ 6485 b, + 2.173 b,
Menghilangkan nilai a dengan menjumlahkan persamaan (1) dengan
(2). Persamaan (1) x -441 dan persamaan (2) x 10 :
(1) x (441): 119.952 = -4410 a — 194.481 b, — 64.827 b,
(2) x (10) : 120.050= 4410 a + 194.610 b, + 64.850 b,
@: 8= 1290,+ 236,
Persamaan (1) kalikan dengan —147 dan persamaan (3) dengan 10. Jumlahkan persamaan_
(1) dan (3) :
(1) x (147): -39.984 = -1470 a - 64.827 b, — 21.609 b,
@)x(10) : 40.130= 1470a+ 64.850 b, + 21.730 b,
phe ae
©: Me= 23b,+ 1216,
634)
Kalikan persamaan (4) dengan -23 dan (5) dengan 129, Jumlahkan
(4) dan (5) untuk menduga nilai b :
(4) x (23) : ~2.254 = -2967b, - 529d,
(5) x (129) : 18.834 = 2.967 b, + 15.609 b,
© : 16580 = 15.080 b,
Maka, b, = 1,099
5) Cari nilai penduga b, dari persamaan (4) :
© A): 98 = 129d, + 23d,
98 = 129 b, + (23) (1,099)
98 = 129 b, + 25,277
Maka, b, = 0,564
7) Cari nilai a dari persamaan :
a=¥-bX, bx,
= 27.2 ~ (0,564) (44,1) ~ (1,099) (14.7)
= 27.2 ~ (24,8724) ~ (16,1553)
= + 138277 13,828
Maka, persamaan garis regresi berganda :
Y=a+d, X+d,X,
= 13.828 + 0,564 X, + 1.099 0
8)
43 (4300 jam pegawai)
Jika X, = 16 (1600) jam dari waktu kompuier
Maka : ¥ = -13.828 + 0,564 X, + 1,099 X,
= ~13,828 + (0,564)(43) + (1,099) (16)
13,828 + 24,252 + 17584
“°8 atau Rp. 28.008
‘Tiga persamaan linear tersebut sebelumnya dapat pula disederhanakan. Jika deviasi antara
+, dan X, dinyatakan sebagai x, = X,— X, atau deviasi antara Y dan ¥ dinyatakan sebagai
y = Y — Y, maka ketiga persamaan linear dapat 4 hanakan menjadi :
64re
1 0=0
ul D yx, =b, Dx +b, Dx, x,
Mt Lyx, =b, Dxx, +b Ex,
dimana :
Syn 2B YX -nXy
Lax, = Lxx,-n XX,
Maka, bese contoh 3.1. bisa dicari nilai koefisien korelasi dengan cara lain
2.173 — (1014,
-n y = 7.483 — (1027,2 = 84.6
© YX, - 0 X,¥ = 12.005 - (10)(44,1)(27.2) = 98
x 485 — (10)(44, 114.7) = 2.3
.013 — (10(14.27.2) = 14.6
Setelah itu dimasukkan ke dalam dua persamaan yang telah disederhanakan
Lyx, =b, Lx, +b, Dx, a, a)
Lyx, = b, LXx, +b Tw, Q)
Maka :
9,8 = 12,9 b, + 2,3 b, cp)
14.6 = 2.3 b, + 12.1 b, @)
(1) Persmaan pertama kita kalikan dengan 2.3 dan persamaan ketlua kita kalikan dengan
12,9 untuk menghilangkan faktor b,
22.54 = 29.67, + 5.29 b,
188,34 29,67 b, + 156,09 b,
165.8 = -150,8 b,
maka nilai b, = 1,099
659,67 b, + 5,29 (1,099)
29,67 b, + 5.81371
maka : . = 0,564
Atau bisa dicari nilai koefisien regresi dengan rumus sebagai berikut :
Lyx, Lyx, Dx,x,
(Zxx, F
Lyx, Dx, - Lyx, Dx,
3.4. STANDART DEVIASI GARIS REGRESI BERGANDA
Seperti halnya pada regresi sederhana, kalau sampel memiliki jumlah n yang cukup besar,
pengukuran dispersi titik-titik koordinat dari garis regresi berganda dapat dicari dari :
SSE
mk
dimana : — k = banyaknya parameter dalam model (variabel bebas)
Ingat bahwa untuk model linear sederhana (yang mengandung satu parameter bebas (b).
standard erromya adalah SSE dibagi dengan (n ~ 1 — 1). Dalam kasus umum s* sama dengan
| SSE dibagi dengan n, yaitu banyaknya titik data, dikurangi satu derajat kebebasan untuk
setiap parameter yang muncul dalam model
Rumus Menghitung SSE
SSE,
Toa
= SS- SSR
dimana :
Q
ssp = (§ ~ 9)? = jumlah kuadrat akibat regresi
&
‘ Day lg
= (b, L yx,) + DE yx) - —
Zy,P
Sut = £0,-wF= By —
1
66BO
Ly? - , Z yx,) + LZ yx)
n-k-1
Standart deviasi regresi berganda :
s= Ve
Contoh 3.2. :
Untuk data pada Tabel 3.1. hitung dan taksirlah standard error populasinya.
Penyelesaian :
Dalam contoh 3.1, telah kita peroleh nilai Syx, = 9,8; Lyx
: b, = 1,099; n= 10; dan m = jumlah parameter (b, dan b,) = 3. Maka bisa kita langsung
menghitung varians sesuai dengan rumus :
Ly? - (B,D yx,) + (b,D yx,)
n-k-1
84,6 - i (0.564)(9,8) + (1,099)(14,6) é
—
84,6 — (5.4978 + 16,0454)
7
9,0081
Maka, standard error untuk regresi berganda adalah :
s
s = ¥9,0081 = 3,001
3.5. KOEFISIEN KORELASI BERGANDA LINEAR
Seperti halnya pada regresi sederhana, koefisien korelasi digunakan untuk melihat tinggi
rendabnya derajat hubungan antara dua atau lebih variabel. Koefisien korelasi dapat dicari
dari koefisien determinasi yang merupakan variasi yang dapat dijelaskan oleh garis regresi
berganda linear, yaitu
67P= SSR/ Sy,
_ (bE yx,) + (0, E yx,)
zy
Dari sini bisa kita hitung nilai koefisien korelasi berganda linear sebagai berikut :
Rumus Koefisien Korelasi :
{SSR7SS,,.,
"yx,) + 0b,
atau : (02 yx) + (0% Ym)
zy
Contoh 3.3. :
Kita lihat kembali kelanjutan dari contoh 3.1. dan 3.2. Carilah koefisien korelasi berganda
lineamya !
Penyelesaian :
_ DZ yx) + 0, Dyn)
zy
5.4978 + 16,0454
= 02546
84.6
Maka :
r= [r= (0.2546 = 0,5046
3.5. PENDUGA PARAMETER KOEFISIEN REGRESI BERGANDA
Pendugaan parameter koefisien regresi berganda B, dan B, membutubkan hasil ukuran
kesalahan duga standard bagi penduga b, dan b,. Kesalahan duga standard demikian dapat
diartikan sebagai :
1
A
“ "Ee V7,
= So = s
Se
68dimana :
= koefisien korelasi antara X, dan X,
Peo =
masing-masing dengan derajat bebas (n — k — 1). Maka, interval keyakinan bagi pendugaan
parameter B, di atas dapat diberikan sebagai :
DB, = Garnk-t » Sx, < Bi < Bi + Kornt-t - Sb;
Contoh 3.4.:
Dugalah parameter B, dan B, dalam contoh data Tabel 3.2. dengan interval keyakinan
0.95. :
Dari hasil perhitungan contoh-contoh yang lalu, kita peroleh :
n=10 Bx, = 129
Lx, x, =23 r= 05046
Penyelesaian :
Terlebih dahulu kita cari koefisien korelasi antara x, dan x,.
Box, xP
2,3¢ 5,29
“@19A2D 156.09
- = 0,0334
Kemudian kita cari masing-masing kesalahan untuk penduga b, dan b,
dan :
69Interval keyakinan bagi penduga B, adalah :
b, a Cnn “8s B, - b, ha Nona + Soy
0,564 — (2,365)(0,836) < B, < 0,564 + (2,365)(0,836)
— 141314 < B, < 2.54114
Interval keyakinan bagi penduga B, adalah :
Dy = henascy S02 < By 2365 dan 1 <-2,365
0.564
4, Maka untuk Uji B,, t,,..,= ——— = 0.6746
0,836
1,099
5. Maka untuk uji B,. 4, = 1.2735
0,803
Karena 0,6746 dan 12735 < 2.365, maka kita harusmenerima hipotesis nol H, : B, = 0
maupun H, : B, = 0. Hal tersebut berarti bahwa tidak ada hubungan berganda linear antara
variabel X, dan X,,
Demikianlah pembahasan mengenai regresi berganda linear dengan 2 variabel bebas.
Untuk lebih dari 2 variabel bebas, perhitungannya lebih kompleks, sehingga lebih dianjurkan
untuk menggunakan paket-paket program statistik
1Rv
AY
72
LATIHAN SOAL
‘Apa yang dimaksud dengan regresi ?
Apa yang saudara ketahui tentang korelasi ?
Apakah perbedaan antara regresi sederhana dan regresi berganda?
Perhatikan data di bawah ini :
Y X, X,
25 35 5,0
30 67 42
i 1S 85
22 0,3 14
| a 46 3,6
| 19 2.0 13
a. Carilah persamaan garis regresi
b. Dugalah nilai Y bila X, = 3,0 dan nilai X,
Direktur pemasaran minuman dingin SHY COLA ingin mengetahui apakah ada hubungan
antara VOLUME PENJUALAN per tahun (Y) dalam jutaan ribu rupiah, dengan dua
variabel bebas, yaitu HARGA PENYALUR (X,) dalam ratusan rupiah, dan
PENDAPATAN PER KAPITA (X,) dalam ribuan rupiah. Perkiraan direktur tersebut
rempunyai hubungan negatif dengan Y sedangkan X, mempunyai hubungan
f dengan Y. Dari 20 wilayah pemasaran diperoleh data statistik sebagai
721 356
948,95 3643.2
TX, = 6415 © X, X, = -136,67
15,4976374 X,Y = -86,307498
LX, Y= 1710.2
a. Berdasarkan data statistik di atas, ujilah perkiraan direktur di atas (lakukan t-test)
pada level of significance 1 %. Tentukan persamaan regresinya. Kemudian interpretasi
saudara terhadap koefisien regresi tersebut.
b. Tentukan berapa besar variasi Y yang dapat diterangkan oleh persamaan regresi.
Tentukan dan interpretasikan koetisien determinasi.
c. Dengan menggunakan garis regresi yang telah saudara peroleh, tentukan prediksirata-
rata Y pada saat X, = 3,6 (Rp 300) dan X, = 100 (Rp 100.000)v
MULTIPLE CHOICE
Variabel Y akan bebas bila X, dan X, bemilai masing-masing adalah :
a 0 c 0:1
bt a
Bila ada 20 elemen dalam sampel dan 4 variabel bebas digunakan dalam regresi berganda,
sebaiknya digunakan derajat bebas untuk mencari nilai t table :
fai) 15
b 17 d. tidak ada yang benar
Untuk menguji bahwa Y benar-benar tergantung pada hasil X,, maka uji hipotesis yang
paling tepat digunakan
7 BO « Bel
b. By=-1 d. tidak ada yang benar
Pada persamaan ¥ = 5.6 + 2.8 X,~ 3.9 X, + 5.6 X,, kalau X,, X,. dan X, adalah nol,
maka penduga nilai Y adalah :
a 101 c -56
b. 56 a - 101
Penduga standard error mempunyai derajat bebas n- k - 1
Disini k menunjukkan :
a. jumlah elemen dalam sampel cc. Titik tengah dari variabel dependen
b. jumlah variabel independen d. tidak ada satupun yang benar
Persamaan gatis regresi berganda Y = a + b, X, +b, X, digunakan untuk menduga Y
= A+B, X, +B, X, . interval keyakinan untuk B adalah :
a By ty, 3B, + bey Ce bee
b. By-t: B+, a bt b +h,
Dari suatu data diperoleh nilai-nilai sebagai berikut
¥=10 K,=23 X, = 126 b, =04b
Maka persamaan garis regresi berganda yang dapat dibentuk :
a = 10404 X,+15X, c %=10+04 X,- 15 X2
b. $= 19.7404, +15 X, b. ¥ = 197404 X, - 15 x2
oaANALISIS VARIANS
4.1. PENDAHULUAN
Analisis Varians merupakan suatu uji perhitungan yang diterapkan untuk data yang
dihasilkan oleh eksperimen yang dirancang atau pada kasus dimana data dikumpul pada
variabel yang terkontrol
‘Tujuan analisis varians adalah untuk melokalisasi variabel-variabel bebas yang penting
dalam suatu penelitian dan menentukan bagaimana mereka berinteraksi dan mempengaruhi
respons
Keragaman (variabilitas) sehimpunan n pengukuran adalah proposional terhacap jumilah
kuadrat simpangan (square of deviations) :
n
SS, = ¥ (x, ~ > > untuk sampel tunggal
Kuatitas ini digunakan untuk menghitung varians sampel. Analisis varians memecah
keragaman SS, , atau total jumlah kuadrat simpangan, menjadi bagian-bagian, yang masing-
masingnya dikaitkan dengan satu dari variabel-variabel bebas dalam eksperimen (percobaan),
dan sisanya dikaitkan dengan kesalahan random (galat acak = random error).
44.2, ANALISIS VARIANS SATU ARAH (Anova sederhana)
Analisis satu arah untuk menganalisis satu macam karakteristik dari populasi yang diambil
dari sampel.
Membandingkan 2 rerata sampel dari sampel n, dan n,
Uji Hipotesis nol Hy: Hy = Hs
Uji Hipotesis alternatif H,: H, # H,
‘Total jumlah kuadrat simpangan dari semua nilai (n, + n.)x di sekitar rerata umum_
adalah 2
dimana % adalah rata-rata (average) dari semua (n, + n,) pengamatan yang berada dalam dua
sampel itu, Rumus total kuadrat simpangan dapat dijabarkan sbb
75= adalah rata-rata dari pengamatan dalam sampel ke-i, i = 1,
= jumlah kuadrat perlakuan (sum of squares for treatment), berfungsi untuk
mengukur keragaman antara rerata sampel.
~ SSE = jumlah kuadrat kesalahan (sum of squares for error), berfungsi untuk mengukur
keragaman dalam sampel
— CM = = Correction Mean (koreksi untuk nilai rata-rata)
= GT = General Toral (total seluruh nilai observasi).
-k = banyaknya treatment/perlakuan
Rumus SST bisa dibuktikan dengan :
non,
Sst = =. (, -% F
n, +n,
* SSE = SS,,., - SST
SST
MST
Farm 2 pe
“MSE
ssT
Frag tcc
MSE
SSE
* MSE =
(n, +n) —
dibandingkan dengan F,
total Fs saraay
F, thing
Bila F,,.,, 2 Fs. dapat diinterpretasikan bahwa hipotesiss nol ditolak. Ada perbedaan yang
be erp! po
nyata diantara kedua rerata sampel, ada pengaruh terhadap respons.
76Ulangan Treatment
n xX, xe
1 XxX, X,
2 Xy en
n X, X»
Total T T, = GT
SS,
ht
SSE = SS,
Total SST
Contoh 4.1. .
Seorang investor ingin mengetahui apakah ada perbedaan yang nyata antara rata-rata
keuntungan yang diberikan oleh Bank dan industri, Investor tersebut melihat data rata-rata
bunga yang diberikan oleh Bank dan industri sesuai dengan jatuh temponya. Adapun data
yang diperoleh terlihat pada Tabel 4.1
Tabel 4.1. Rata-rata bunga yang diberikan sesuai jatuh tempo
Jatuh tempo | Bank Industri
1 9,14 9.69
2 8.85 394
3 9.52 8,85
4 10,16 9.45
5 8.90 9.15
77Penyelesaian :
Langkah pertama, menentukan uji hipotesisnya, yaitu :
Hipotesis nol, : #t, = l, ——> tidak berbeda nyata
Hipotesis alt. —-H, : |, # hy > ada perbedaan nyata
Langkah kedua, melengkapi Tabel 4.1. dengan total masing-masing dan total
keseluruhannya.
Tabel 4.2. Total rerata yang diberikan sesuai dengan jatuh tempo
Jatuh tempo Bank Industri
1 914 9,69
2 8,85 8,94
3 952 8,85
4 10,16 9.45
5 8,90 915
Total 46,57 46,08 GT = 92,65
2a
S845 =D, 2 x,- CM =
“isl j=l”
= (9,14) + (9,697 +. -
Q 6)
= 860,0953 — 858,40225 = 1.69305
2 cr -
ssp = STE My OT
n kn
(46.57) + (46,.08P @
7 @ ©)
= 858.42626 — 858,40225 = 0.02401
SSE = SS,,,, - SST
1,69305 — 0,02401 = 1,66904
SST 0,02401
MST = —— =—— = 002401
k-1 1
1,66904
MSE =
“345
78<«—— Daerah ——+!
Penerimaan
0,11508 5,32
Nilai kritis dari statistik F untuk © = 0,05 dengan derajad bebas sebesar k-1; (n, + n,)
~ 2, atau F,,,,, = 5.32.
Karena nilai Fyoe < Fay atau 0.11508 < 5,32, maka H, diterima. Dengan demikian rata-
rata bunga yang diberikan oleh Bank maupun industri tidak ada perbedaan nyata. Jadi inves-
tor bisa memilih diantara keduanya yang mana saja.
Membandingkan Lebih 2 Rerata Populasi
Jumlah Sampel sama
|
Ulangan ‘Treatment
n x,
i rr
1 x, x Xy
2 Xy Xy oh
n x, x, x
"
GT
9SSE = SS,
roa)
SST
Uji F untuk membandingkan rerata populasi p
Hipotesis noi He: =u, =H, uy,
Hipotesis altematif H, : satu atau lebih pasangan rerata populasi berbeda.
MST
Statistik uji F = ——, dimana F didasarkan pada derajad bebas k-1; k(n-1).
MSE
Untuk memudahkan, biasanya perhitungan analisis varians ditunjukkan atau disajikan
dalam Tabel ANOVA. Perhatikan Tabel 4.3. yang merupakan Tabel ANOVA untuk lebih
dari 2 rerata dengan jumlah sampel sama
Tabel 4.3, Tabel ANOVA untuk > 2 rerata dengan jumlah sampel sama
Sumber af ss Ms ie
Treatment kl Sst SST/K-1 MST/MSE
Enor kam) SSE SSE/K(n-1)
TOTAL nk-1 ss,
Jumlah sampel tidak sama
Ulangan Treatment
n
: xy Xx
e Xy Xx
3 Xy
n x,
80Gor
CM=> ¥' x, -——
i=l j=l” N
dimana :
k
N = > n = jumlah seluruh sampel
2
SST = ~ pT SSE = SSraa = SSF
Uji F untuk membandingkan rerata populasi p
Hipotesis nol =H, : Hy, = Hy = Hy = By,
Hipotesis altematif H, : satu atau lebih pasangan rerata populasi berbeda.
MST
Statistik uji F = ———. dimana F didasarkan pada derajad bebas k-1; N - k.
MSE
Tabel 4.4. Tabel ANOVA untuk > 2 rerata dengan jumlah sampel tidak sama
———
Sumber at ss MS Fung
Treatment kl Sst SST/K- MST/MSE
Error N-k SSE SSE/N-k
TOTAL N-l SS
Contoh 4.2. :
Empat kelompok karyawan bagian penjualan (salesman) sebuah agen penjualan majalah
diharuskan mengikuti program pelatihan penjualan yang berbeda. Karena ada beberapa yang
keluar (drop-out) selama program pelatihan, jumlah orang yang dilatih berbeda-beda dalam
setiap kelompok. Pada akhir program pelatihan setiap karyawan penjualan secara random
diberi tugas di suatu wilayah penjualan dari sekelompok wilayah penjualan yang dinilai
mempunyai potensi penjualan yang sama, Jumlah penjualan yang dibuat oleh setiap orang
dari empat kelompok karyawan penjualan selama minggu pertama setelah menyelesaikan
program pelatihan dituliskan dalam Tabel 4.5. Apakah data tersebut menyajikan bukti yang
cukup untuk menunjukkan perbedaaan dalam rerata prestasi kerja untuk empat program
pelatihan itu?
81Penyelesaian :
4a 4 cr
SS, = 2 2 x,-CM =¥ z x -—
a1 jel fel jel N
(1779)
= (65) + (87) + (73) + ... + (88% —
= 139.511 — 137.601,8 = 1.909,2
k Tr. GT’
ssf = }——--—_.
i=l n, N
(454) (459) (425" = (351? (1.7799
+ + ——-
6 7 6 4 23
138,314,4 — 137.601,8 = 712,6
SS,,,, — SST = 1.196,6
"
SSE
Tabel 4.5. Banyaknya penjualan yang dibuat oleh setiap orang dari setiap kelompok
pelatihan
Kelompok Pelatihan
1 2 3 4
4
65 B 59 94
87 69 B 89
B 83 67 80
9 81 2 88
81 2 83
69 19 16
90
a
Total 454 549 a5 351
82SST 712.6
MST = = = 2375
kl
SSE 1.96.6
MSE = —— = —— = 630
N-K 19
Maka :
Fee
nent MSE 63.0
+— Daerah ———+ |«— Daerah ———>
Penerimaan
Penolakan
3,13 3,77
Nilai kritis F untuk ct = 0,05, adalah Fyys..iyx = 3.13. Karena nilai F yang dihitung =
3,77, melebihi atau lebih besar dari Foss: = 3.13, maka kita menolak hipotesis nol dan
‘menyimpulkan bahwa bukti tersebut cukup untuk menunjukkan perbedaan dalam rerata prestasi
kerja untuk keempat program pelatihan.
Tabel 4.6. Tabel ANOVA untuk Contoh 4.2.
Sumber af ss Ms | ie
Treatment c 12.6 237.5 3,77
Enror 19 1.1966 630
TOTAL 2 1.9092 |
834.3. ANALISIS VARIANS DUA ARAH (Rancangan Blok Acak)
Analisis Varians Dua Arah, adalah suatu bentuk analisis dengan menggunakan rancangan
Blok teracak. Disini yang akan dianalisis adalah 2 karakter saja dalam populasi yang diambil
dengan cara sampling. Maksud dari rancangan (desain) ini adalah membuat perbandingan
antara sehimpunan perlakuan dalam kelompok (blok) yang mengandung bahan eksperimen
yang relatif homogen, Perbedaan antara rancangan blok teracak dengan rancangan yang
teracak (Analisis satu arah) secara lengkap dapat didemonstrasikan dengan memperhatiken
eksperimen yang membandingkan efek dari peragaan produk (yaitu perlakwan) terhadap
penjualan dalam suatu analisis pemasaran Peragaan produk (product display) dapat didefinisikan
sebagai keragaman pengemasan atau pengaturan di pasar.
‘Misalkan empat rancangan kemasan dipilih sebagai perlakuan (treatment) dan kita ingin
mempelajari efek pengaruh mereka terhadap penjualan dengan menggunakan 12 pasar
swalayan. Setiap pasar swalayan akan memperagakan hanya satu dari empat rancangan
kemasan, Jadi kedua belas pasar swalayan tersebut secara random dapat dianggap sebagai
penyalur, 3 penyalur untuk setiap dari empat rancangan kemasan, seperti yang diperlihatkan
pada tabel di bawah ini, yaitu tabel 4.7
Tabel 4.7. Rancangan eksperimen yang teracak secara lengkap
Perlakuan Pasar Swalayan
I 4.9.1
a 11.3, 5
3 2.6 12)
4 8 7,10
Penetapan random dari pasar swalayan bagi perlakuan (atau sebaliknya) akan menyebarkan
kesalahan secara random karena adanya keragaman dari pasar swalayan terhadap empat
perlakuan dan menghasilkan empat contoh (sampel) yang untuk praktisnya adalah random
dan independen. Ini merupakan rancangan eksperimen yang didesain secara lengkap. Kesalahan
eksperimen random terdiri dari sejumlah Komponen, Beberapa di antaranya disebabkan oleh
perbedaan-perbedaan diantara pasar-pasar swalayan, kegagalan catatan penjualan yang
berturutan untuk produk tersebut dalam satu pasar swalayan agar menjadi identik (disebabkan
oleh keragaman dalam periklanan dan perubahan pola kelakuan membeli dari pelanggan
Pasar swalayan), kegagalan direktur peneliti pemasaran untuk mengatur program secara
konsisten dari suatu pasar swalayan ke pasar swalayan lainnya, dsb.
Keragaman/variasi dari toko ke toko dalam eksperimen dapat dihapus dengan
menggunakan pasar swalayan sebagai blok (kelompok), Jadi sctiap pasar swalayan akan
menerima setiap dari empat rancangan kemasan (perlakuan) yang disusun dalam suatu urutan
random.
84Perhatikan diagram di bawah ini :
1 2 3 4 n
2 4 1 i 2
1 2 3 4 3
4 1 2 3 4
3 4 2 1
Perhatikan bahwa setiap perlakuan hanya muncul satu kali dalam setiap kelompok. Blok
(kelompok) dapat mewakili waktu, lokasi, atau bahan eksperimen. Jika tiga perlakuan akan
dibandingkan dan terdapat kecenderungan dalam rerata respons dengan berjalannya waktu,
bagian terbesar dari keragaman akibat waktu dapat dihilangkan dengan pengelompokkan.
Seluruh tiga perlakuan tersebut dapat diterapkan secara acak (random) pada unit-unit eksperimen
dalam kelompok waktu yang kecil. Prosedur ini dapat diulang dalam kelompok-kelompok
waktu berikutnya sampai jumlah data yang diperlukan terkumpul.
‘Adapun bentuk rancangan blok teracak yang berulang-ulang dapat dilihat pada bentuk
rancangan
——]
Blok ~ — Ulangan Treatment Total
n x, xX, Blok
' 1 xX, Xy B,
2 Xy Xx B,,
7 Xa Xu B,
Total Treatment T,, Ty GT,
in 1 X, X, B,,
2 X,, Xy B,,
a Xn Xu Ba,
Total Treatment Ty T, GT,
85N 1 Xi, xX, Xn By,
: Xy Xy xy Ba
a Xu x. Xu B,
Total Treatment T, T, T,
‘Namun bentuk tabel seperti di at
5. dapat disederhanakan setelah seluruh nilai yang sama
dari hasil pengulangan, kita cari nilai rata-ratanya. Setclah diperoleh nilai rata-rata untuk
seluruh karakteristik, baru dapat disajikan dalam bentuk tabel yang lebih sederhana dan
mudah dibaca untuk tujuan analisis sclanjutnya.
‘Adapun bentuk rancangannya dapat dirubah sebagai berikut :
SS
Treatment Total
Blok x, 2S, x, Blok
z Xi xX, Xy B,
7 Xn Xn Xn B,
N Xy Xe Xx B,
Total Treatment —T, a T, GT
Maka, untuk mencari rumus keragaman masing-masing adalah :
bk or
SSiug =D D x -CM=
lala
k
sstT =>
FI
b Bo GP
SSB = -——
is] k kb
SSE = SS,,,,, - SST - SSB
otal
86Tabel 4.8. Tabel ANOVA untuk Rancangan Blok Teracak (Dua Arah)
SS
Sumber af ss MS Fuso
Treatment kel ssT SST/K-1 MST/MSE
Blok bl SSB SSB/b-1 MSB/MSE
Error k-1Y(b-1) SSE SSEMK-1)(b-1)
TOTAL kn SSrasa
eee eee
Dari Tabel 4.8. tampak jelas perbedaan antara Anova satu arah dan Anova dua arah.
Dalam Anova dua arah, F,,..,, ada dua. MST/MSE adalah untuk melibat pengaruh dari perlakuan
dan MSB/MSE untuk melihat pengaruh dari blok.
Uji F untuk membandingkan rerata populasi p
Hipotesis nol H,: _ rerata perlakuan dan blok populasi adalah sama
Hipotesis altematif H, ; satu atau lebih pasangan rerata perlakuan dan blok dalam
populasi berbeda.
: MST
Statisik ji F =— Fo dimana F.. didasarkan pada derajad bebas k-1; (k-1)(b-1)
MSB . .
Statistik ujiF =———, dimana F,,,, didasarkan pada derajat bebas b-1; (k-1)(b-1).
MSE
Contoh 4.3. :
‘Suatu studi tentang preferensi konsumen yang melibatkan tiga rancangan kemasan yang
berbeda (perlakuan) diatur dalam rancangan blok yang teracak di antara empat pasar swalayan
(blok/kelompok).
Data diperoleh merupakan jumlah unit yang dijual untuk setiap rancangan kemasan
dalam setiap pasar swalayan selama masing-masing tiga minggu yang ditetapkan. Aapakah
data pada Tabel 4.6. menyajikan bukti yang cukup untuk menunjukkan perbedaan dalam
rerata penjualan untuk setiap rancangan kemasan (perlakuan)?
‘Apakah cukup bukti untuk menunjukkan perbedaan dalam rerata penjualan untuk pasar-
pasar swalayan?
87Tabel 4.9. Data Jumlah unit terjuan dari Rancangan Blok Teracak
Kemasan TOTAL
Pasar Swalayan
A B c BLOK
1 17 34 23 74
2 15 26 21 62
3 1 23 32
4 6 22 16 44
Total 39 105 68 212 = GT
Penyelesaian :
Spy = BE e-em SE we,
a x -CM=
Sto ljel ” i=l jel kb
(2122
= (7 + y+... + 16? ~
= 4.686 — 3.745,33 = 940,67
SST =
(39)? + (105) + (68) (212)?
Oa
= 4.2925 - 3.74533 = 547,17
SSB =
. 1)
= (74) + (62) + G2) + 44) —
= 4,093,33 - 3.745,33 = 348,00
SSE = SS,,,,- SST - SSB
88
ot
940.67 - 547,17 - 348,00 = 45,50.Tabel 4.10. Tabel ANOVA untuk Rancangan Blok Teracak (Dua Arah)
Sumber at ss Ms Fisang
Treatment 2 547,17 273,58 36,09
Blok 3 348,00 116,00 15,30
Error 6 45,50 7,58
TOTAL bY 940,67
:
bs Daerah 1»
Penerimaan
hitung
Treatment
5,14 13,30 36,09
Nilai kritis statistik F (0. = 0,05) untuk pertakuan dengan derajad bebas 2;6 adalah 5,14.
Karena Fy, > Faq + terdapat cukup bukti untuk menolak hipotesis nol dan menyimpulkan
bahwa perbedaan yang nyata memang ada dalam penjualan yang diharapkan untuk ketiga
rancangan kemasan tersebut.
Nilai kritis statistik F (oc = 0,05) rerata penjualan untuk pasar-pasar swalayan dengan
derajad bebas 3:6 adalah 4,76, kita menolak hipotesis nol dan menyimpulkan bahwa perbedaan
yang nyata ada dalam penjualan yang diharapkan dalam empat pasar swalayan, yaitu data
tersebut menyajikan bukti yang cukup untuk mendukung keputusan kita untuk
mengelompokkan pasar-pasar swalayan.
89LATIHAN SOA
Dalam kondisi bagaimana kita dapat melakukan suatu analisis varians?
‘Apakah yang dimaksud dengan kata “teracak” pada rancangan teracak lengkap maupun
rancangan blok teracak ?
Sebutkan asumsi yang mendasari model-model rancangan eksperimen betikut
a. Rancangan acak (random)
b. Rancangan blok (kelompok) yang teracak
Pada waktu memilih rancangan eksperimen =
a. Bahas keuntungan dari bloking (pengelompokkan)
b. Apa yang terjadi pada keuntungan tersebut jika anda menambah ukuran kelompok
(banyaknya unit eksperimen per kelompok) !
Ketahuilah, j1, dan y,, melambangkan rerata biaya variabel per km pengoperasian sebuah
tuk merek A dan merek B.
a. Cari selang keyakinan 95 % untuk 11,
b. Cari selang keyakinan 95 % untuk j1,
c. Cari selang keyakinan 95 % untuk (jt, ~ tL, )
d. Apakah tepat untuk mengasumsikan bahwa selang keyakinan yang dihitung dalam
butir c adalah sama dengan perbedaan antara selang-selang keyakinan yang ditemukan
dalam butir a dan b ?
Jelaskan !
‘Sebuah perusahaan transportasi ingin membandingkan tiga merek truk sebelum memesan
satu armada lengkap dari salah satu merek itu, Harga beli masing-masing buatan itu
sama dan dengan demikian diabaikan dalam perbandingan ini. Lima truk dari masing-
masing buatan dijalankan 5.000 km dan rata-rata biaya variabel operasi per km dicatat
per setiap truk. Namun, karena kerusakan ban, kecelakaan dan supir yang sakit, dua tuk
merek B dan dua truk merek C tidak dapat menyelesaikan uji 5.000 km ini, Untuk
mereka yang berhasil menyelesaikan 5.000 km, hasilnya dicatat dalam tabel.
Merek A Merek B Merek C
27,3 25,4
28,3 274
276 27,1
26,8
28,0
a. Lakukan analisis varians untuk eksperimen ini !b. Apakah data ini memberikan bukti yang cukup untuk menunjukkan perbedaan dalam
rata-rata biaya variabel per-km operasi untuk tiga merek tuk tersebut ?
c. Apakah ada keuntungannya dalam menggunakan jumlah pengukuran yang sama
dalam setiap perlakuan dalam rancangan yang teracak secara lengkap ? Jelaskan !
7. Suatu (elaah dilakukan untuk menentukan kecepatan relatif mengetik yang dapat dicapai
dengan menggunakan empat merk mesin tik yang berbeda. Setiap mesin tik diberikan
kepada masing-masing dari delapan sekretaris, urutan pemberian tugas dilakukan secara
random. Kecepatan mengetik, yang diukur dalam kata per-menit untuk 10 menit pengetikan
dicatat untuk setiap kombinasi mesin tik-sekretaris. Data yang diperoleh dicantumkan
dalam tabel di bawah ini :
Mesin Sekretaris
Tik 1 2 3 4 5 6 7 8
A ie) 80 71 75 82 77 8 76
B 74 79 73 70 76 8 72 4
Cc 82 86 80 799 81 80 80 84
D 79 81 182 wt) 82 7 77 78
Identifikasikan rancangan yang digunakan dan jelaskan diagnosa anda!
b. Lakukan analisis varians terhadap data tersebut.
cc. Apakah data tersebut memberikan bukti yang cukup untuk menunjukkan bahwa
rerata kecepatan mengetik seksetaris bervariasi dari merk ke merk mesin tik?
Ujilah dengan menggunakan 0 = 0,10.
8. Suatu komisi penetapan wilayah dibentuk untuk menghitung rata-rata hasil penilaian atas
rumah-rumah di daerah pemukiman luar kota. Komisi ita mempertimbangkan untuk
menggunakan salah satu dari tiga model penilaian yang berbeda dalam upaya itu. Dalam
salah satu uji untuk adanya Konsistensi anatara tiga model penilaian, setiap model
digunakan secara terpisah untuk mendapatkan hasil penilaian dari masing-masing dari
tiga dacrah pemukiman yang berbeda. Hasilnya sebagai berikut :
Model Daerah ( $ 1.000)
Penilaian 1 2 3
A 50 1 68
B 42 6 47
c 39 41 66
Saudara diminta untuk membuat analisis varians (c: = 0,10) dan buatlah kesimpulan
saudara !
91setelah diberikan suatu paket program sadar lingkungan selama lima tahun, Disini tidak bisa
kita dapatkan langsung suatu data yang berupa angka-angka, tetapi mungkin hanya suatu data
yang berisi ya dan tidak, naik turun dan tetap, dan sebagainya yang biasanya digunakan
dengan jawaban berupa kata-kata dari responden, Data kualitatip semacam ini dapat dianalisis
bila data tersebut dirubah ke dalam bentuk data kuantitatip dengan cara memberikan suatu
rangking/urutan, Dengan dimikian akan diperoleh suatu data yang berupa angka-angka
Definisi :
Statistik nonparametrik adalah statistik yang tidak memerlukan pembuatan asumsi
tentang bentuk distribusi dan karena itu merupakan statistik yang bebas distribusi.
5.2. UJI TANDA (Sign Test)
Uji tanda digunakan untuk membandingkan dua populasi apakah dua populasi tersebut
berbeda atau tidak. Uji tanda didasarkan atas tanda-tanda, positip atau negatip, dari perbedaan
antara pasangan pengamatan, Bukan didasarkan atas besamya perbedaan. Uji tanda dapat
dipergunakan untuk mengevaluasi efek dari suatu eksperimen (treatment) tertentu, Efek dati
variabel ekperimen tidak dapat diukur melainkan hanya dapat diberi tanda positip atau negatip
saja. Sebagai contoh : apakah penerangan tentang kebersihan dan kesehatan ada manfaamya
untuk menyadarkan penduduk dalam hal kebersihan dan kesehatan. Untuk ini perlu diamati
sebelum dan sesudah beberapa minggu diadakan penerangan. Efek penerangan terhadap
Kesadaran penduduk tidak dapat diukur, tatapi hanya diberi tanda positip dan negatip saja.
5.2.1, PENGUJIAN DENGAN SAMPEL KECIL
Misalkan X, dan X, merupakan variabel random dan kita mengemukakan sebuah hipotesis
bahwa distribusi populasi X, identik dengan distribusi X,. Guna menguji hipotesis di atas,
kita memilih dua sampel random yang memiliki besaran n yang sama (n, = n, ) masing-masing
dari populasi X, dan X, . Andaikan hipotesis hipotesis nol yang menyatakan bahwa distribusi
Populasi X, dani X, identik memang beriar, maka kita dapat mengharapkan beda antara hasil
Observasi sampel X, dan X, atau X, ~ X, akan memiliki jumlah tanda positip dan negatip
yang sama. Hal tersebut bahwa proporsi tanda + dan — scharusnya sama dan sebesar 0,50 atau
50 %, schingga bisa digunakan pendekatan pengujian proporsi populasi binomial dimana
H, : p= p, atau H, : p = 0.50.
Contoh 5.1:
Pada suatu eksperimen penelitian pasar sebuah perusahaan pengolah pangan melakukan
studiftelaah untuk menentukan mengenai dapat diterimanya bahan pengganti gula pada air
Jeruk dalam kaleng yang diproduksi mereka. Kepada sebelas keluarga diberikan sejumlah
Produk yang sekarang ini ada (X,) dan satunya lagi yang baru (X,) dan meminta mereka untuk
menggunakannya selama periode 4 minggu dan menyatakan preferensi mereka dengan
96menilainya ke dalam bentuk ranking (pada skala | sampai 10). Nilai 10 adalah nilai yang
“paling disukai". Hasilnya ditunjukkan pada Tabel 5.2.1.
Tabel 5.1, Data preferensi dari sebelas keluarga terhadap dua jenis minuman jeruk dalam
jumlah + dan ~.
Produksi
Keluarga Tanda
x x,-X,
2 1
+
eUAwkEN =
ws
aAeorudT ax
9
10. 9
HW 9
Wawrrwadaurans
ee ole
Penyelesaian :
Andaikan jumlahnya memang sama besamya, maka tanda + sama banyak dengan
tanda —. Secara singkal, andaikan p, = probabilitas (proporsi) hipotesis untuk memperoleh
tanda +, maka hipotesi
nol-nya dapat dinyatakan sebagai H, : p = p, atau H, : p = 0,50 dan
hipotesis alternatifnya sebagai H, : p # 0,50.
Scsuai contoh di atas. preferensi masyarakal terhadap produk baru temyata lebih besar,
maka jumlah tanda + diharapkan lebih banyak daripada tanda — schingga H, : p = 0,50
sedangkan hipotesis altematifnya dapat dinyatakan sebagai H, : p > 0,50.
Beye
Proses pengujian langkah demi langkah adalah sebagai berikut :
H, : p= 0.50 H, : p > 0.50
5
Statistik uji 3.
Daerah krtis ditentukan oleh nilai-nilai X yang sesuai dengan luas distribusi binomfal
kumulatif dimana ot = 0,05 dalam uji searah atas bagi n = 10 ( karena terdapat 10 beda
bertanda, angka 0 ditiadakan). Pada tabel binomial kumulatif, luas probabilitas binomial
secara kumulatif dengan n= 10 dan yang mendekati ot = 0,05 searah atas ialah 0 = 0,033.
jumlah tanda positip (+)
97Bagi luas probabilitas binomial kumulatif sebesar 0,055, nilai r kumulatif ialah 2 8 sehingga
daerah kritis ialah r 2 8.
5. Hasil observasi sampel r = 8
Karena 8 > 8 maka H, : p = 0,50 ditolak. Hal tersebut berarti cukup beralasan guna
menerima hipotesis yang menyatakan bahwa preferensi konsumen terhadap produk bana
lebih tinggi dibanding dengan produk yang ada.
5.2.2, PENGUJIAN DENGAN SAMPEL BESAR
Andaikan besaran sampel cukup besar, katakantah lebih besar dari 30, maka cara perkiraan
distribusi binomial dengan distribusi normal dapat digunakan untuk menguji hipotesis proporsi
populasi p. Dalam banyak hal, jika n > 10 dan p = 0.50, penggunaan distribusi normal untuk
memperkirakan distribusi binomial sudah akan memperoleh hasil yang memuaskan
Contoh 5.2:
Suatu telah terhadap keefektifan 2 tipe kelas dalam tes panel : kelas yang besar dengan
seorang profesor yang berupa diskusi umum dan kelas yang kecil dengan tenaga pengajar
asisten senior yang berupa diskusi kelompok terbatas. Pengukuran diukur secara ranking dari
4 sampai 1. Nilai 4 adalah yang terbaik dan 1 adalah nilai yang terjelek. Evaluasi dilakukan
terhadap 40 mahasiswa, Misalkan tanda + berarti kelas besar yang disukai mahasiswa, tanda
— berarti preferensi mahasiswa tethadap Kelas kecil, dan 0 berarti tidak ada yang disukai.
Hasil dari Tabel 5.2.3. adalah :
Jumlah tanda+ = 19
Jumlah tanda~ =
Jumlah nilai0 = = 10
Total sampel - | 40
Jumlah sampel yang digunakan adalah yang bertanda, yaitu 19 ditambah 11 = 30.
pH = 0.5 6 => hipotesis proposi populasi yang merasa bahwa dua tipe kelas tersebut adalah
sama
gH = 0.5 6 = hipotesis proposi populasi yang merasa bahwa dua tipe kelas tersebut adalah
berbeda (gH, = | — pH,)
n = 30 = jumlah sampel
B= 0,633 = proporsi sukses dalam sampel ( 19/30 )
q = 0,367 => proporsi kegagalan dalam sampel ( 11/30 )Tabel 5.2. Evaluasi 40 mahasiswa terhadap 2 tipe kelas
jumlah
mahasiswa
skor kelas
besar (1)
skor kelas
kecil (2)
uji tanda
1-2
Beer aunawna
i
a
13
14
15,
16
iy
18
20
21
22
23
24
25
vas
29
30
31
32
33
34
35
36
oa
38
39
DOE NRNNWAH-WAWAWNUWLAADANNE HR RAR HN EHWEERN
WRK ROU ERENNYE HK RE NNODEEWUNWNYESROYNALENNAWNNY
Ltoootrotteeil +4
lOltett+Oto+Ott1 ol
+1 OF
99Penyelesaian :
Statistik uji diberikan dengan pendekatan kedalam distribusi normal standard, dengan
standar error proporsi :
Pq (0,50) (0,50)
o-=\ =
n 30
= {0.00833 = .091 (standar error proporsi
1
¢— Daerah Penerimaan —> !
Proporsi sampel
0,322 P,,,=05 0,678
Ho
Dengan menggunakan distribusi normal ot = 0,05, diketahui nilai z adalah 1,96 pada avo
tailed test. Maka bisa kita tentukan daerah penerimaan H, yang terletak pada interval pH, +
1,96 6,
*
PH, + 1.96 6 = 0,50 + (1,96) (0,091)
= 0,50 + 0,178
= 0,678 (batas atas)
pH, — 1.96 = 0.50 - (1,96) (0,091)
= 0,50 - 0,178
= 0,322 (batas bawah)
Karena proporsi sampel adalah 0,633, maka masuk daerah penerimaan H,. Hipotesis nol
diterima dengan kata lain tidak ada perbedaan antara dua tipe kelas menurut mahasiswa
tersebut.v
ye Y
It
Pergunakan uji tanda dengan 0. = 0.05.
LATIHAN SOAL
Apakah bedanya statistik parametrik dengan statistik non parametrik ?
Apakah kegunaan dari statistik nonparametrik ?
Apakah yang dimaksud dengan prosedur uji tanda ?
Apakah yang dimaksud dengan hipotesis nol dalam prosedur uji tanda ?
Distribusi probabilitas apa yang digunakan dalam menguji hipotesis pada prosedur uji
tanda, jika jumlah sampel kecil ?
Dan jika sampel besar ?
Sctiap n = 27 ekonom yang terkemuka ditanyai apakah dia percaya pengendalian
pemerintah terhadap perusahaan-perusahaan minyak dalam negeri akan membantu
perekonomian Amerika. Empat belas ekonom menyatakan bahwa mereka menyetujui
pengendalian terhadap perusahaan minyak. 11 menentang adanya pengendalian, dan dua
‘orang mengatakan tidak menentukan sikap. Apakah respons tersebut menunjukkan bahwa
para ekonom secara umum menyetujui adanya pengendalian pemerintah terhadap
perusahaan demi membantu perekonomian Amerika ? Ujilah dengan menggunakan taraf
nyata sedekat mungkin dengan 5 % !
Dari data di bawah ini ujilah hipotesis nihil bahwa periode liburan tidak mempunyai efek
yang favorable atas produktivitas kerja.
Output Mingguan
Pekerja Sebelum liburan Sesudah liburan
A 83 9
B 85 87
Cc 75 70
D 91 93
E 80 85
F ae: 7S
G 90 80
H 65 1
1 B 80
J 85 88
K 83 n
ib 15 75
M B 85
N 80 86
1018. Di suatu daerah pedalaman telah diadakan kampanye tentang makanan bergizi. Untuk
meneliti apakah kampanye tersebut mempunyai efek positip, diadakan pengamatan
terhadap 20 keluarga yang dipilih secara acak. Penilaian sebelum dan sesudah kampanye
memberikan informasi sebagai berikut :
Keluarga Nilai Sebelum Nilai Sesudah
SRREBRB TS ewer UM AHAUnH
S
DOwKBNUAARKBONN ER AWWHAR
BAN NKOAUYNHE HRY NNW
2
s
Pergunakan uji tanda dengan 0 = 0.01.
9. Kita ingin menentukan efektivitas suatu diet yang dinamakan diet harimau. Tujuh belas
orang dicoba untuk melaksanakan diet tersebut. Berat badan mereka sebelum dan sesudah
menjalankan diet adalah :
102Berat Berat Berat Berat
Orang Sebelum Sesudah Orang, Sebelum Sesudah
A 110 108 J 95 85
B 97 96 K 54 50
Cc 103 95 L 719 3
D 75 75 M 143 135
i 134 129 N 95 104
ig 78 70 0 98 93
G 152, 142 P 69 69
H 130. 121 Q 117 110
I 90 113
Ujilah hipotesis nihil bahwa diet tersebut tidak efektif (P = 0.5) lawan hipotesis
alternatip bahwa diet tersebut efektip (P > 0.5) dengan menggunakan uji tanda pada
a= 001
Seperti pertanyaan a, tetapi pergunakan metode pendekatan kurva normal.
1035.3. UJI MANN
- WHITNEY ( U,,)
Ini merupakan uji nonparametrik yang digunakan untuk membandingkan dua populasi
didasarkan pada sampel acak yang bebas dengan menggunakan jumlah peringkat dari kedua
sampel tersebut, Asumsikan bahwa kita mempunyai sampel acak yang independen berukuran
n, dan n, dari dua populasi, A dan B. Langkah pertama untuk mencari statistik Mann-
Whitney (U,,,). adalah membuat peringkat (menjenjang) semua (n, + n,) pengamatan sesuai
dengan urutan besarannya. Peringkat ke-L untuk pengamatan yang terkecil, 2 untuk yang
kedua, dan seterusnya, Kemudian hitunglah jumlah dari peringkat R, dan R, untuk kedua
sampel.
Uji Mann-Whitney : Untuk uji dua arah gunakan U,.. mana yang lebih kecil dari
n(n, +1)
Oh inn eee
dan
n(n, #1)
U,snn,+——— RR,
dimana :
n, = jumlah observasi dalam sampel |
jumlah observasi dalam sampel 2
jumlah seluruh ranking dalam sampel 1
jumlah seluruh ranking dalam sampel 2
Contoh 5.3. :
Tabel 5.3. merupakan data jumlah akuntan yang lulus ujian negara dari 8 kantor akuntan
yang masing-masing dipilih 50 akuntan yunior. Para akuntan dari 4 kantor dilatih dengan
program A dan akuntan dari 4 kantor Jainnya dilatih dengan program B.
Tabel 5.3. Jumlah akuntan yang lulus ujian negara
A B
28 33
31 29
27 35
25 30Untuk memberikan cukup bukti bahwa ada perbedaan dalam distribusi populasi latihan
program A dan B, digunakan uji Mann-Whitney dengan melakukan peringkat setiap nilai
observasi dengan mengurut data dari yang terkecil sampai yang terbesar.
Tabel 5.4. Data dan peringkat untuk contoh 5.3
Penyelesaian :
Peringkal (rank) ditunjukkan pada Tabel 5.4. bersama-sama dengan (n, + n,) = 8
pengukuran. Jumlah peringkat untuk kedua sampel juga diperlihatkan.
Maka :
4 G+)
= -
U,=@) 4) + 12=14
U, = np, - U, = 16 - 14 =2
Misalkan kita menginginkan suatu nilai c yang dekat dengan 0,05, maka pada Tabel
Mann-Whitney untuk n, = n, = 4, kita peroleh nilai U,,,. sebesar 1. Temyata nilai U,, lebih
besar dari nilai U,,,, maka dapat dikatakan bahwa ada kecenderungan perbedaan dalam
distribusi populasi antara latihan program A dan program B.
Uji Mann-Whitney (U,,)
Hipotesis nol H,: yu, =p, —> Tidak ada perbedaan antara kedua populasi, dan
memiliki rata-rata yang sama
Hipotesis altematif H,: 1, #4, —> Ada perbedaan antara kedua populasi, dan
memiliki rata-rata yang berbeda
@=0.15 —> level significance
105Contoh 5.4. :
Kita ambil contoh 5.3. Kita anggap sampel yang digunakan adalah lebih besar dari 10,
sehingga distribusinya mendekati normal. Buktikan apakah benar pendapat yang mengatakan
bahwa kedua program tersebut ada perberbedaan yang nyata, Gunakan significant level sebesar
a= 0.15.
Penyelesaian :
Sebelum melakukan suatu hipotesis, kita cari terlebih dahulu nilai rata-rata U statistic
dan standard error dari U statistic, dengan mencari dari :
men, 444
Rerata
2 2
Tin, (n, +n, + 1)
Standard error: Gy = YW
ive
[@aa+44 1
oy= Ya
Oy = i? = 3.464
Setelah itu, kita lakukan langkah-langkah sebagai berikut :
1. Bentuk uji hipotesis.
Hipotesis nol : H, : M, = tidak ada perbedaan nyata antara kedua
program A dan B.
Hipotesis alt. : H,:m,#m, ada perbedaan nyata antara kedua program
A dan B.
2. a = 0.15 —> level significance
3. Daerah penerimaan H, adalah pt, +Z,, . 6,
atau: 4 £ (1,44) (3,464)
4 -£4,98816 atau 4 + 4.988
106'¢-1,-1.440, >| 1,-146,
0,075
one
4. Harga U,,, tenyata masuk dalam daerah penerimaan H,, Atau kata lain U,_, = 2, terletak
diantara nilai 4 + 4,988. Jadi masuk daerah penerimaan H.,
5. Kesimpulan yang bisa diambil adalah tidaklah benar yang mengatakan bahwa kedua
program A dan B ada perbedaan yang nyata. Kedua program tersebut temyata tidak
berbeda.
107108
LATIHAN SOAL
‘Apakah yang dimaksud dengan uji U atau uji Mann-Whitney ?
Bagaimanakah prosedur menganalisis data dengan uji U ?
Suatu perusahaan akuntansi rubrik yang besar, dengan kantor-kantor cabang pada ibu
kota propinsi, merencanakan dua program lokakarya akuntansi yang berbeda untuk
membimbing akuntan yunior dalam menghadapi ujian ujian negara yang akan datang.
Untuk membandingkan keefektivitasan dari program studi ini, perusahaan memilih 8
kantor cabang utama, dan 50 akuntan yunior dipilih dari setiap kantor, Para akuntan dari
4 yunior dilatih dengan program A. akuntan dari 4 kantor lainnya dengan program B.
Setelah menyelesaikan ujian, jumlah akuntan yang lulus dicatat sebagai berikut :
A B
28 33
31 29
27 35
25 30,
‘Apakah data di atas memberikan cukup bukti untuk menunjukkan adanya perbedaan
dalam distribusi populasi latihan program A dan B ?
Misalkan dari dua sampel 1 dan 1, menunjukkan data sebagai berikut :
Ujilah dengan U,,, !
Sampel I Sampel II
7
15.4, UJI KRUSKAL - WALLIS
Metode nonparametrik ini merupakan kelanjutan dari uji Mann-Whitney, tetapi yang
diuji adalah lebih dari 2 populasi. Atau dengan kata lain, uji Kruskal-Wallis digunakan untuk
melihat apakah 3 atau lebih sampel acak yang independen berasal dari populasi yang sama.
Uji Kruskal-Wallis juga tergantung pada jumlah ranking tiap-tiap sampel, seperti halnya
dengan uji Mann-Whitney.
Rumus yang digunakan :
12 R?
K = —__ > —-_ - 3 + 1)
na+l) 1,
dimana :
=n, = jumlah nilai/unit dalam sampel ke-j
— R, = jumlah ranking dalam sampel ke-j
—1 jumlah seluruh nilai observasi seluruh sampel.
Contoh 5.5.:
Pimpinan sekolah ingin mengevaluasi keefektifan dari 3 metode perkuliahan, yaitu dengan
menggunakan video cassette, Audio cassette, dan metode tatap muka. Untuk itu pimpinan
mengambil secara random nilai ujian akhir semester dari 20 orang mahasiswa yang mewakili
ketiga metode perkuliahan tersebut. Nilai ujian akhir semester dari 20 orang mahasiswa
disajikan dalam Tabel 5.5
Tabel 5.5. Nilai ujian akhir semester 20 mahasiswa dengan perbedaan metode
perkuliahan,
Video cassette 74 88 «982 «93 «550
Audio cassette 7% 80 6 $7 89
Tatap muka 6 83) (50 (Os 84TH BLD
Penyelesaian :
Langkah pertama adalah kita membuat rangking untuk masing-masing nilai sesuai dengan
urutan nilai yang terkecil seperti pada Tabel 5.6.Tabel 5.6. Rangking nilai ujian dari kecil ke besar
Rangking | Nilai Metode | Rangking | Nilai | Metode
7 50 T™ i 81 ™
2 55 4s 12 82 vc
2 57 AC 13 83 ™
4 65 AC 14 84 T™.
5 68 T™ 15 88 VC
6 70 vc 16 89 AC
e 4 ae 17 91 ™
8 77 ™ 18 92 TM
9 7B AC 19 os ae
10 80 AC 20 94 T™.
Langkah kedua adalah mencari jumlah rangking untuk masing-masing metode perkuliahan.
‘Untuk memudahkan bisa kita gunakan Tabel 5.6.
Tabel 5.7. Susunan data dan rangking untuk setiap metode
Video Rangking Audio Rangking Tatap Rangking
cassette cassette muka
74 7 78 9 68 5
88 80 10 83 13
82 65 4 50 1
93, nF) 3 91 17
55 89 16 84 14
70 R,=42 1 8
94 20
81 i
92 18
110Langkah ketiga, mencari nilai Uji Kruskal Wallis (K-statistik) dengan rumus :
12
— 3(n+)
nin+ 1)
2 (107?
_ Y ]- 3004
20 (20+ 1 6 el) 9
K = (0,.2857)(620,2 + 352,8 + 1272.1) - 63
K = 1,143
Uji Hipotesis :
Langkah terakhir, menentukan uji hipotesis sebagai berikut :
1. Hipotesis nol H,: , =, =}, tidak ada perbedaan diantara antara ketiga
populasi, atau ketiganya mempunyai rata-rata
yang sama.
ketiga
Hipotesis alt. H,: 1, # Ht, #H, ada perbedaan nyata antara ketiga populasi. Atau
ketiganya mempunyai rerata yang tidak sama.
= 0,10 —> level sginificance.
4, Daerah kritis dicari pada tabel chi-square (X*) dengan derajat bebas k-1 (dalam hal ini,
k = 3), yaitu X;, = =X = 4,605.
‘oanact 01034
R
‘0402
¢—— Daerah Penerimaan ——>'
0,10
0 K = 1,143 4,605
5. Karena nilai K-statistik < X?,,,, alau'l,143 < 4,605, maka hipotesis nol kita terima.
6. Kesimpulannya, tidak ada perbedaan yang nyata antara ketiga metode perkuliahan yang
diterapkan di sekolah tersebut. Jadi, tidak efektif menerapkan tiga metode perkuliahan
di sekolah tersebut.
iilApakah yang dimaksud dengan uji Kruskal-Wallis? Bagaimana konsep dasar uji statistik
ini!
Empat kelompok A, B, C, dan D dilibatkan dalam suatu eksperimen. Data-data setiap
LATIHAN SOA
kelompok dipilih secara random
Hasil cksperimen adalah seperti di bawah ini
A B Cc D
57 43 87 60
81 él 69 70
67 a2 58 75
64 45 82 nR
96 39 90 Ty
80 OL ol
68
56
Pergunakan uji Kruskal-Wallis untuk menentukan apakah populasi empat kelompok itu
mempunyai mean yang sama pada c= (08
Suatu percobaan untuk membandingkan umur rata-rata tiga merek bola lampu telah
dilakukan serta memberikan data sebagai berikut
Merek X
Merek Y
Merek Z
B
84
82
64
80,
79
67
81
1
a
77
15
70
83
74
68
Dengan 0 = 0,05, ujilah hipotesis nihil bahwa rata-rata umur ketiga merek bola lampu
itu tidak berbeda !
Lima club olah raga A. B. C, D, dan E diteliti rata-rata umur para pemainnya, Pemain
setiap club diambil secara random, Data tentang umur pemainnya adalah :
A 20
B 21
(es 24
D 17
= ea)
18
iB]
23
aan
23
16
We
25
16
26
7
18
20
18
20
29
26
19
24
16.
25
20
25
18
Dengan o. = 0,05 ujilah hipotesis nihil yang mengatakan unur rata-rata pemain lima club
olah raga tersebut sama.5.5. UJI SPEARMAN (Rank Correlation Coefficient)
Uji Spearman digunakan untuk melihat derajat hubungan antara 2 variabel dalam bentuk
ranking. Selain itu juga, uji Spearman banyak digunakan oleh para statistisi, karena lebih
mudah penghitungannya daripada menggunakan analisis korelasi biasa apabila jumlah datanya
sangat besar setiap variabel. Di sini penghitungan berdasarkan ranking, bukan nilai angka
dalam data. Koetisien korelasi berjenjang disimbolkan dengan r,.
Nilai r, terletak antara —1 dan +1 atau dirumuskan sebagai -1 <¥, < +1.
Rumus :
ole
fo
n(n’ - 1)
dimana :
— r, = koefisien korelasi berjenjang
— n= jumlah pasangan observasi
— d= selisih jenjang (ranking) dari pasangan observasi.
Contoh 5.6. :
Misalkan kita ingin mengetahui hubungan ranking dari dua variabel dari $ orang siswa.
Ranking diperolch dari sckolah dan dari perusahaan dimana mereka kerja 10 tahun kemudian.
Data diperoleh pada tabel 5.8.
Tabel 5.8. Perbandingan ranking dari 5 orang siswa
Siswa ranking di sekolah | ranking di perusahaan
John 4 4
Margareth ' 3
Debbie 1 1
Steve 2 2
Lisa 5 5
Penyelesaian :
Data pada tabel 5.8. dapat kita hitung dengan mudah dalam bentuk data tabulasi seperti
pada tabel 5.9.
113Tabel 5.9. Informasi umum perhitungan untuk koefisien korelasi berjenjang
Ranking Ranking di Selisih | Selisih kuadrat
Siswa di sekolah perusahaan | 2 ranking
(1) (2) (1) - Q) i) = (2) 6?
John 4 4 0 0
Margareth 3 3 0 0
Debbie 1 1 0 0
Steve 2 2 0 0
Lisa 5 5 0 0
Le =0
Maka koefisien korelasi berjenjang dapat dicari dengan :
. 6x@
nets n( ay:
6(0)
525-1)
0
120
= | ——> koefisen korelasi berjenjang
1
Koefisien korelasi adalah 1 atau positip, hal ini berarti Korelasinya sempuma, Atau
dengan kata Jain kedua ranking untuk setiap siswa adalah identik.
5.5.1. PENGUJIAN DENGAN SAMPEL KECIL
Untuk jumlah sampel kecil (n < 30), distribusi r, tidak normal. Untuk itu hasil perhitungan
kita bandingkan dengan tabel r, (tabel Spearman). Untuk pengujian kita anggap koefisien
korelasi populasi (p, = rho-sub-s) adalah mendekati 0. Tabel Spearman digunakan untuk
menentukan daerah penerimaan dan penolakan hipotesis nol (H.).
Contoh 5.7 :
Misalkan kita ingin menentukan apakah nilai dalam suatu test tertentu yang diperoleh
pekerja-pekerja mempunyai hubungan dengan hasil pekerjaan yang dinyatakan dengan jumlah
satuan yang diprodusir dalam jangka waktu tertentu. Sepuluh pekerja telah dipilih. Nilai test
dinyatakan dengan X dan jumlah satuan yang diprodusir dinyatakan dengan Y. Hasil penelitian
ditunjukkan dalam tabel 5.10.
114‘Tabel 5.10. Ilustrasi untuk metode korélasi berjenjang
Nilai Test | Satuan yang diprodusir
Pekerja a &
x Jenjang Y Jenjang (X- Y)
A 65 1 30 a -l I
B 70 2 ea) 1 1 1
Cc 76 4 cay 3 I .
D 75 - 40 5 2 4
E 80, 6 38 4 2 4
F 78 5 42 6 -1 1
G 83 7 48 8 -l i
H 84 8 50 9 -l 1
I 85 9 a 10 -l 7
J ei 10, 45 7 3 9
Léa
Dari data di atas koefisien Korelasi Spearman dapat dihitung :
. 6 (24)
nS "000 =
144
990
= 0,855 —> koefisien korelasi berjenjang
=1
a
Uji hipotesis nol H, : p, = 0 —> Tidak ada korelasi dalam data berjenjang dari populasi
Uji hipotesis alt H, : p, #0 —> Ada orelasi dalam data berjenjang dari populasi
© = 0,05
Kemudian kita lihat pada tabel Spearman dengan baris untuk n = 10 dan kolom untuk
ot = 0,05, Pada tabel kita temukan harga r, sebesar + 0.6364. Daerah penerimaan hipotesis
nol terletak antara -0,6364 (batas bawah) can 0,6364 (batas atas). Jadi bisa disimpulkan
bahwa r, hasil perhitungan temyata lebil. cvsar dari batas atas penerimaan H,, maka kita
menolak hipotesis nol yang menyatakan tidak ada korelasi antara dua jenjang dalam populasi.
15Se le 4
0.05 r, hitung
= 0,855
06364 p=0 +0,6364
5.5.2, PENGUJIAN DENGAN SAMPEL BESAR
Jika n > 30 distribusi sampel dari r, akan mendekati normal dengan nilai tengah nol dan
standard deviasi 1/-Yn ~ T. Jadi standard error untuk roa
Uji Hipotesis Uji Korelasi Berjenjang :
H,: p, = 0—> tidak ada korelasi di dalam data berjenjang Spearman.
H,: p, # 0—> ada korelasi nyata dalam data berjenjang Spearman.
Contoh 5.8. :
Kita ambil contoh 5.7, dimana dianggap sampel yang ditarik jumlahnya besar
dengan r, = 0,855. Dengan o = 0,01, ujilah apakah ada korelasi positip antara nilai test
dengan jumlah yang diprodusir dari seluruh pekerja-pekerja.
Penyelesaian :
1. Menentukan bentuk uji hipotes
H,:p, =0 tidak ada korelasi antara nilai test dengan jumlah yang diprodusir
setiap pekerja.
H,:p,>0 ada Korelasi positip antara nilai test dengan jumlah yang diprodusir
setiap pekerja.
(Bentuk uji hipotesis satu arah)
a=0,01
116nv
Meneari standard error dari uji Spearman :
I 1
yn-i Vio-i
0,333
Mencari nilai z pada Tabel Distribusi Normal dengan & = 0,01, yaitu 2.33.
Interval atau batas limit daerah penerimaan H, adalah :
Papp #233 6 = 0+ (2,33) (0,333)
= 0 4 0,77589 = 0 £ 0.776
0,
Karena r, hitung lebih besar dari batas penerimaan H,, atau r, = 0,855 lebih besar dari
batas penerimaan H,, maka hipotesis altematif dapat diterima. Dengan kata lain ada
Korelasi positip antara nilai test dengan jumlah yang diprodusir setiap pekerja. Jac
hipotesis nol kita tolak.
WI7118
Apakah kegunaan daripada uji koefisien korelasi berperingkat ?
‘Tentukan apakah pemyataan-pemyataan berikut ini benar atau salah, jika salah betulkan
pemyataan tersebut !
a. Jika r,= 1, maka r yang dihitung dari data yang sama akan sama dengan 1.
b. Jika r= —1, maka r, yang dihitung dari data yang sama akan sama dengan -1.
c. _Jika suatu analisis terhadap dua variabel memberikan petunjuk bahwa ada hubungan
antara dua variabel pada taraf nyata o = 0,10, hubungan tersebut juga akan terbukti
nyata pada taraf nyata a. = 0,05.
d. Rumus pintas untuk r, dapat digunakan untuk menentukan ada atau tidaknya pasangan
untuk x pengamatan dan y pengamatan.
Pembantu Dekan I Fakultas Ekonomi sebuah universitas swasta di Jakarta ingin menguji
apakah terdapat korelasi positip antara kemampuan matematika di SMA dengan indeks
prestasi (IP) mahasiswa-mahasiswa tingkat persiapan. Untuk itu diambil sebuah sampel
random sebanyak 10 orang mahasiswa tingkat persiapan.
Tabel : Kemampuan Matematika dan IP
Mahasiswa : 1 es = 4 i 6 7 8 9 10
Math : 75 84 8 68 69 88. aa ae aa 74
IP : 1,70 1,81 1,84 2,17 242 245 2,32 341 3.64 3,69
Saudara diminta untuk menguji korelasi antara kedua variabel tersebut dengan metode
spearman (0. = 0,1). Bagaimana kesimpulan suadara ?MULTIPLE CHOICE
Suatu uji Mann-Whitney (U,_,) mempunyai rata-rata U = 15.
: Hi ny (+ I
Hasil perhitungan dari Ua, dengan nin, + 7 = dengan cepat bisa
1 (ny +
; n(n, + D ae
kita hitung nilai nn, + ——"—~ — R, adalah
2
a 10 c. 75
be 25 d. Tidak bisa dihitung
Uji Kruskal Wallis (K,,..,,) bisa dilakukan pendekatan dengan distribusi sampel dari chi
square, bila :
a. Ukuran sampel minimal 5 c.Ukuran sampel tidak ditentukan
b. Ukuran sampel kurang dari 5 4. Tidak ada pemyataan yang benar
Ukuran sampel > 30 distribusi dari koefisien korelasi berperingkat bisa dilakukan
pendekatan dengan distribusi :
at c. chi square
b. binomial d. normal
Suatu uji Kruskal Wallis dari k sampel, nilai derajat bebas adalah :
ak ce n-l
bo ok-1 ad n-k
Jika dibandingkan dengan metode parametrik, metode non parametrik :
a. kurang akurat cc. mudah dihitung
b. kurang efisien d. semua benar
Korelast sempuma apabila keofisien korelasi berperingkat (7,):
a c. sama dengan 0
b. antara 0 dan -1 d. Tidak ada yang benar
Mana dari 3 sampel yang memiliki jumlah rangking paling tinggi bila diurut dari besar
ke kecil (descending) :
SamplA : 1 3 9
SampelBe os 1 8
SampelC : 9 4 2
C dengan jumlah rangking = 15
C dengan jumlah rangking = 20,5
‘A dengan jumlah rangking = 16
B dengan jumlah rangking = 14,5
ae oe
119(Data di bawah ini berlaku untuk soal no.8 sid no. 9)
5 pasien dari bangsal A dan 4 pasien dari bangsal B sebuah rumah sakit swasta diambil
sebagai sampel secara random. Yang diperhatikan adalah lamanya masing-masing sampel
dirawat di rumah sakit tersebut (dalam hari), Data yang diperoleh sebagai berikut
Bangs A: 13 4 2 10 6
Banga B: 10 9 7 8
8. Uji Mann-Whitney dilakukan untuk melihat adanya pengaruh perbedaan lamanya dirawat
di rumah sakit untuk kedua bangsal tersebut. Kalau lamanya hari dirawat dirangking
dari kecil ke besar, berapa rangking untuk sampel yang dirawat selama 13 hari di
bangsal A?
a 9 c 912
oo a 712
9. Berapa hasil dari (R, — R, )?
a -12 c 12
b. 0 a. 212
10. Uji tanda dilakukan dari 800 siswa untuk memberikan penilaian terhadap dua macam
test, yaitu : benar salah dan pilihan berganda. Setelah dirangking temyata ada 138 siswa
memberikan respon kepada dua macam test tersebut sebesar 0. Ini menunjukkan bahwa
138 siswa tersebut :
a, Tidak menyukai kedua macam test tersebut
b. Tidak memberikan penilaian terhadap kedua macam test
c. Rangking untuk kedua macam tipe test sama
4d. Berfikir bahwa salah satu ada yang baik dan ada yang tidak
11, 2 sampel dengan ukuran n, dan n, digunakan dalam perhitungan uji Mann-Whitney.
Distribusi sampel dari U,,.,,, bisa digunakan pendekatan dengan distribusi nomial dimana
ukuran kedua sampel n, dan n, :
a. lebih besar dari 10 c. sama dengan 10
b. lebih kecil dari 10 d. 210
12. Distribusi sampel dari Kruskal Wallis K,
asx 44Pat digunakan pendekatan distribusi chi-
square, jika seluruh ukuran sampel
a. lebih kecil dati 5 c. paling sedikit 5
b. lebih kecil dari 3 d. paling sedikit 3
13, Koefisien korelasi berperingkat = —1, menunjukkan bahwa :
a. Korelasinya sempuma c. Tidak ada korelasi
b. Korelasi tidak sempuma d. Tidak ada yang benar
12014.
Koefisien korelasi berperingkat = 1 menujukkan bahwa
a. Korelasinya sempuma c. Tidak ada korelasi
b. Korelasi tidak sempuma 4. Tidak ada yang benar
(Data di bawah ini berlaku untuk soal no. 15 std no.17)
Data di bawah ini adalah data pendapatan setahun dari 7 eksekutif (A — G) yang dirangking
dari 1 sampai 7 dimana rengking 1 diberikan untuk eksekutif yang memiliki pendapatan
paling tinggi :
A
15.
16.
19.
Be GD Ee EG
2 6 4 1 3 5 7
Mana pemyataan di bawah ini yang benar :
a. E pendapatannya lebih tinggi dari 4 eksekutif lainnya
b. C dar F memperoleh pendapatan yang sama
c. C penaapatannya lebih sedikit dari 4 eksekutif lainnya
d. adan c benar
‘Survai kedua dilakukan untuk melihat hubungan pendapatan dengan kegembiraan yang
dimiliki oleh ketujuh eksekutif tersebut, dimana rangking 1 diberikan untuk perasaan
‘gembira yang lebih tinggi. Apabila korelasi antara pendapatan dan kegembiraan adalah
sempuma, maka rangking kegembiraan untuk eksekutif A bemilai :
al «3
b 2 a 6
|. Namun bila korelasi antara pendapatan dan perasaan gembira adalah tidak sempuma,
maka rangking kegembiraan untuk eksekutif F bernilai :
a 7 « 5
b 2 d 3
. Apabila tak ata perbedaan antara 2 populasi, maka hipotesis nol (nihil) dalam uji tanda
(sign test)
a H,:p=0 c HL: p=05
b. H,:p=0 d. Tidak ada yang benar
Jika n> 30 distribusi sampel r, akan mendekati normal dengan nilai tengah nol dan
a Yn ce Wyn-t
b. VNn-1 a yn-T
|. Bentuk uji hipotesis dari koefisien korelasi berperingkat (r,) untuk menguji apakah ada
korelasi antara dua karakteristik yang ingin diteliti adalah :
a Hi:p,=0 c. HL: p,=05
b. H.:p,>0 a. H.:p+0
aeDAFTAR PUSTAKA
COCHRAN, W.G., Sampling Techniques, John Wiley & Sons, Inc, New York, i977.
DAJAN, ANTO., Pengantar Metode Statistik, Jilid Ul, LP3ES, Jakarta, 1986.
DARWIS, S. Dr., Metode Survey Sampel, Modul 1-5, Penerbit Karunika Universitas Terbuka.
Jakarta, 1986.
DJARWANTO, Ps. Drs., Statistik Nonparamerrik, BPFE, Yogyakarta, 1986
LEVIN, R.L, RUBIN, D.S., Statistics for Management, Prentice Hall, New Jersey, 1991.
MENDENHALL, W., REINMUTH, J.E., Statistics for Management and Economics, PWS
Publishers, Duxbury Press, Boston, 1982.
‘SPIEGEL, M.R., Theory and Problems of : statistics, Mc Graw-Hill International, Singapore,
1981.
SUPRANTO, J., Statistik : Teori dan Aplikasi, Jilid 2, Penerbit Erlangga, Jakarta, 1991,
WALPOLE, R.E., MYERS, R.H., Probability and Statistics for Engineers and Scientists, 2E,
Mac-Millan Co. Inc., New York, 1978.
122LAMPIRAN TABELTABEL 1
Areas Under Standart Normal Probability Distribution Between the Mean Positive Values of z*
EXAMPLE : To find the area under the curve between the mean and point 2.24 standard deviation
to the right of the mean, look up the value opposite 2.2 and under 04 in the table; 4875 of the area
under the curve lies between the mean and a z value of 2.24
———
o1 02 03 04 os 06 O7 08
0040 0080 01200160 «019902390279 0319
(0438 0478 0517-0557 05960636. 06750714
0832 0871 910 0948 0987 1026 1064 1103
12171255 13681406 «1443 «1480
1591-1628 1736 A772.——«1808 «1844
«1950-1985 2088 21 21572190
291.2324 2422 245424862517
2611 2642 273427642794 .2823
2910 2939 3023 3051-3078 3106
3186 3212 3289 331533403365
3438 3461 S531 35581 3517) | 9505)
3665 3686 3749 3770 «379038103830
3869 3888 3044 396239803097 41S
4049 4066 «40824099115. AIS]. 414741624177
4207 4222 423642514265 427942924306 4319
4345 A357 «4370» 4382 ABO 440644184429 44)
44634474 dd84 4495405. 451545254535. ASS.
A564 4573. «458245914599 4608 4616 46254633,
4649 46564664 «= 467146784686 469346994706
ANN9 472% «©4732. AT3RAT44. = A750— 47564761 A767
4718 AT83. «4788. A793.«A798-— 4803 480848124817
482648304834 ABBR BAZ = ARASH 4850 ABSA ABST
A864 4868 «= 48714875 A878 48814884 48874890
4896 4898 4901. «490449064909 4911934916
492049, 4925 492749294931 493249344936
4940 49414943 494549464948 494949514952.
4955 4956 495749594960 A961_- 4962496349
4966 49674968 496949704971 49724973. 4974
4975 4976 «497749774978 «49794979 498004981
4982 4982-4983 HOR 49844985 ADRS AIRS 4ORG
4987 4987 4988 ABR A989 ABD 498D 4990490.
* From Robert D.Mason,
inc, Englewood Cliffs, N.J
ssentials of Statistics, © 1976. p. 307 Reprinted by permission of Prentice-Hall,
124TABEL 2
Areas in Both Tails Combined for Student's t Distribution *
05 of area 08 of area,
aS STD
EXAMPLE : To find the value of ¢ which comesponds to an area of .10 in both tails of the distribution
combined, when there are 19 degrees of freedom, look under the .10 columm, and proceed down to
the 19 degrees of freedom row; the appropriate ¢ value there is 1.729.
Degrees of
freedom
Sige ers URERe
13
4
15
16
7
18
19
20
a1
2
23
4
25
26
27
28
29
30
40
60
120
Normal Distribution
* Taken from Table Ill of Fisher and Yates, Statistical Tables for Biological, Agricultural and Medical
Resarch, published by Longman Group Ltd, London (previously published by Oliver & Boyd, Edinburgh) and
by permission of the authrs and publishers.
125TABEL 3
Area in the Rigt Tail of a Chi-square (X?) Distribution *
20 of area
Values ofx? 141631
EXAMPLE : in a chi-square distribution with 11 degrees of freedom, if we want to find the
appropriate chi-square value for .20 column in the table and proceed down to the 11 degrees of
freedom row; the appropriate chi-square value there is 14.631
Degrees of ‘Area in right tail
Freedom 99 O75 5 0 800
ae 00016, 00098 00398 0158 0642
2 0201 0506 103 211 A465
3 US. 216 352 584 1.005
4 207 484 mM 1.064 1649
5 554 831 1.145 1.610 2343
6 872 1.237 1.635 2.204 3.070
7 1.239 1.690 2.167 2.833 3.822
8 1.646 - 2.180 2.733 3.490 4.594
9 2.088 2.700 3.325 4.168 5.380
10 2.558 3.247 3.940 4.865 6.179
u 3.053 3.816 4375 5578 6.989
12 3571 4.404 5.226 6304 7.807
uk 4.107 5.009 5.892 7.042 8.634
4 4.660 5.629 6571 7.790 9.467
1S 5.229 6.262 7.261 8.547 10.307
16 5.812 6.908 7.962 9312 11.152
7 6.408 7.564 8.672 10.085, 12.002
18 7.015 8.231 9.390 10.865, 12.857
19 7.633 8.907 10.117 11.651 13.716
20 8.260 9591 10.851 12.443, 14.578
2 8.897 10.283 11.591 13.240 15.445,
2 9.542 10.982 12.338 14.041 16.314
23 10.196, 11.689 13.091 14,848, 17.187
m 10.856 12.401 13.848 15.658 18.062
35 11.524 13.120 14.611 16.473 18.940
26 13.844 15.379 17.292 19.820
a 12.879 14.573 16.151 18.114 20.703
2B 13.565 15.308 16.928 18.939 21.588
2 14.256 16.047 17.708 19.768 22.475,
30 14.953 16.791 18.493, 20,599 23.364
+ Taken from Table IV of Fisher and Yates, Statistical Tables for Biological, Agricultural and Medical
Research, published by Longman Group Ltd, London (previously published by Oliver & Boyd, Edinburgh) and
by permission of the authrs and publishers.
126NOTE
TABEL 4
square value leaving a of the area in the right tail. by
if v, the number of degrees of freedom, is greater than 30, we can approximate X?,, the chi-
2 2
yer ov say =
Where Z, is the standard normal value (from Appendix Table 1) that leaves a. of the area in the right
tail,
Area in right tail Degrees of
20 10 0s ms O1 freedom
L642 2.706 3.841 5.024 6.635 1
3219 4.605 5.991 7378 9.210 2
4.642 6251 7815 9348 11.348 3
5.989 7779 9.488 1.143 B27 4
7.289 9.236 11.070 12833 15.086 5
8.558 10.645 12.592 14.449 16812 6
9.803 12017 14.067 16.013 18.475 7
11.030 13.362 15507 20.090 8
12.242 14.684 16919 21,666 9
13442 15.987 18307 23.209 10
14.631 19.675 24.725 ul
15812 21.026 26.217 2
16.985 27.688 B
13,151 29.141 4
19311 30.578 15
20.465 32.000 16
21615 33.409 17
22.760 34.805 18
23.900 36.191 19
25.038 37.566 20
26.171 38.932 21
27301 40.289 2
28.429 41.638 2B
29.553 42.980 2
30.675 44314 25
45.682 26
46.963 27
48.278 28
35.139 39.087 49.588 29
40.256 30
127TABEL 5
Values of for F Distribution with.05 of the Area in the Right Tail*
.08 of area
394
EXAMPLE : For a test at asignificance level of .05 where we have 15 degrees of freedom for the
numerator and 6 degrees of freedom for the denominator, the approppriate F value is found by looking
under the 15 degrees of freedom column and proceeding down to the 6 degrees of freedom row; there
we Find the appropriate F value to be 3.94,
Degrees of freedom for numerator
1 2 3 4 5 6 7 8 9 10
1 | 161 | 200 | 216 230 | 24 | 237 | 230 | 2a
2] 1s | 190 | 192 193 | 193 | 194 | 194] 194
3 | 101 | 955 | 928 | 912 | 901 | 894 | 889 | 885 | 881
4] 771 | 694 | 659 | 639 | 626 | 616 | 609 | 604} 600 |
5 | 661 | 5.79 | sar | sto | sos | 495 | 4g | 482 | 477
6 514} 4.76 | 453 | 439 | 428 | 421 | ais | 410
1 474 | 435 397 | 387 | 379 | 373 | 368
8 446 | 407 369 | 358 | 350 | 344 | 339
& 9 | 512 | 426 | 386 | 363 | 348 | 337 | 329 | 323] 338
B10 | 496 | 410) 371 | 348 | 333) 322 [ey ae
Bu | 484 | 398 | 359 | 336 | 320 | 309 | 301 | 295 | 290
g§ 12 | 475 | 389 | 349 | 3.26 | 311 | 300 | 291 | 285 | 280
313 | 467 | 381 | 341 | 338 | 303 | 292 | 283 | 277 | 271
& 14 { 460 | 374 | 334 | 311 | 296 | 285 | 276 | 270] 265
g 15 | 454 | 368 | 329 | 306 | 290 | 279 | 271 | 264] 259
& |
B ie | 449 | 363) 324 | or | 2a5 | 274 | 2 254 | 249
7 | 445 320 | 296 | 281 | 270 | 2 249 | 245
3 18 | 441 S16) ye 293) [eae |e | 2 246 | 241
g 9 | 438 313 | 290 | 274 | 263 | 2: 242 | 238
B 20 | 435 310 | 287 | 271 | 260 | 2: 239 | 235
a | 432 | 347 | 307 | 284 | 268 2 242 | 237 | 232
m2 | 430 3.05 | 282 | 266 2 240 | 234 | 230
23 | 428 3.03 | 280 | 264 2 237 | 232 | 227
24 | 426 301 | 278 | 262 2. 236 | 230
25 | 424 299 | 276 | 260 2 234 | 228
wo | 4i7 292 | 269 242 | 2 227 | 221 | 2.16
40 | 408 284 | 261 poe 2 218 | 212 | 208
60 | 392 | 3 268 | 2.45 aug) 202 | 196 | 191
120 | 392 | 307 | 268 | 245 218 | 2 202 | 196 } 191
« | 384 | 300 | 260 | 237 210 | 2 194} 188 | 175
128TABEL 5 (Lanjutan)
Values of for F Distribution with.05 of the Area in the Right Tail*
SSS
Degrees of freedom for numerator
nm bs © 4 %®» 4 6 120 ©
1 [oss [246 | me | 29 | 250 | 2sn | 252 ] 253 | 254
2] 194 | 194 | 94 | 195 | 195 | 195 | 195 | 195 | 195
3 | 87 | 870 | 866 | set | go2 | 859 | 857 | 855 | 853
4 | sor | see | s8o | 577 | 575 | 572 | S09 | 5.66 | 5.63
s | aon | 462 | 456 | 453 | 450 | 446 | 443 | 440 | 437
|e oo aot |e str: |eaeee ie cele |ecam7 | 9742 |23710,|.36))
7 | 357 | 351 | 344 | 341 | 338 | 334 | 330 | 327
8 | 328 | 322 | 315 | 312 | 308 | 304 | 301 | 297
= 9 | 307 | 301 | 293 | 290 | 286 | 283 ] 279 | 275
Zw | 291 | 285 | 277 | 274 | 270 | 266 | 262 | 258 | 254
Bu 272 257 245 | 240
gx 262 247 234 | 230
5 13 | 2.62 247 234 | 230
54 246 231 } 2s | 243
g 1S 240 225 zu | 207
3
# 16 219 206 | 201
én 215 201 | 1.96
S18 2 197 | 1.92
g 19 207 193 | 1.88
P 20 204 190 | 184
a 201 | 196 | 192 | 187 | 181
2 198 | 194 | 189 | 184 | 178
2B i96 | 191 | 186 | 181 | 1.76
a rot} 19 | 184 | 179 | 173
25 vez | 187 f 182} 177 | a7
30 Ot 10a) | too) see] iota 7aee| a ueee| [a2
40 v2 | 1a4 | 179 | 174 | 169 | ios | iss} 1st
7) iss | 175 | 170 } Los | 159 | 153} 147) 139
120 175 | 166 | Ver | uss | 150 | 143 | 135) 125
- 167 | 157 | 1sz | 146 | 139 1 132 1.00
* Source : M. Merrington and C.M Thompson, Biometrika, vol. 33 (1943).
129TABEL 6
Values of F for F Distributions With .01 of the Area in the Right Tail
01 of area
ee
105
EXAMPLE : For atest at significance level of .01 Where we have 7 degrees of freedom for the
‘numerator and 5 degrees of freedom for the denominator, the appropriate F value is found by looking
under the 7 degrees of freedom column and proceeding down to the 5 degrees of freedom row; there
we find the appropriate F value to be 10.
Degrees of freedom for numerator
gio | 593 | Sor } 450 | 417 | 394 | 377 | 363 | 3.43
glo | 585 | 494 | 443 | 410 | 387 | 370 | 356 | 3.46
8
1 2 7 4 5 6 7 8 9 10
1 4,052 | 5.000 5.403 5.625 ‘5.764 5.859 5.928 5.982| 6.023! 6.056
2 | 985 | 990 | 992 | 992 | 93 | 94 | 994 | 994 | 994 | 994
a 34.1 | 308 29.5 287 28.2 219 277 275 27.3 | 27.2
4 212 18.0 16.7 16.0 155 15.2 15.0 148 14.7 14.5
5 163 13.3 121 M4 11.0 10.7 10.5 10.3 10.2 10.1
6 13.7 10.9 9.78 915 8.75 8.47 8.26 7.10 7.98 | 7.87
7 | 122 | 955 | 84s | 785 | 746 | 719 | 699 | 684 | 672 | 662
8 2 8.65 159 7.01 6.63 6.37 6.18 6.03 5.91 5.8L
5 9 | 106 | 802 | 699 | 642 | 606 | S80 | S61 | 547 | 535 | 5.26
a 10 10.0 756 6.55 ae 5.64 a) 5.20 5.06 494 | 485
Bu | 965 | 721 | 622 | 567 | 532 | so7 | 489 | 474 | 463 | asa
§ 12 9.33 6.93 5.95 SAL 5.06 482 4.64 4.50 439 | 430
2 B 9.07 6.70 5.74 5.21 486 462 444 430 419 | 4.10
& 4 8.86 651 5.56 5.04 4.70 4.46 428 414 4.03 3.94
zg 15 | 808 | 636 | saz | 489 | 456 | 432 | 414 | 400 3.99 | 380
q 16 8.53 6.23 5.29 477 444 4.20 4.03 3.89 ba pe
S17 8.40 6.11 5.19 4.67 434 4.10 3.93 3.79 3.68 | 3.68
3 18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 31 3.60 | 3.51
$
a 8.02 5.78 4.37 4.04 3.81 3.64 351 3.40
22 7.95 5.72 431 3.99 3.76 3.59 3.45 3.35
2 7.88 5.66 4.26 3.94 371 3.54 341 3.30
24 7.82 5.61 422 3.90 3.67 3.50 3.36 3.26
28 a oe 418 3.86. 3.63 3.46 a 3.22
» 756 ae 451 4,02 3.70 347 3.30 3.17 3.07
40 ch! 5.18 431 3.83 ee Abs — 2.89
60 7.08 498 4.13 3.65 334 3.12 2.95 2.82 2.72
120 6.85 479 3.95 3.48 317 2.96 2.79 2.66 2.56
eo | 663 | 461 | 3.78 o2 | 280 | 264 1 2511 241
331
3.26
321
3.47
3.13
2.98
2.80
2.63
2.47
2.32
130TABEL 6 (Lanjutan)
Values of F for F Distributions With .01 of the Area in the Right Tail
ee
Degrees of freedom for numerator
Degrees of freedom for denominator
wees
Beaua
2 15 20 m4 x 40 oo 120 =.
6.106 | 6.157 | 6.209 | 6,235 | 6,261 | 6287] 6,313 | 6,339] 6.366
994 | 94 | 94 | 995 | 995 | 95 | 995 | 5] 995
271 | 269 | 267 | 266 | 265 | 264 | 263 } 26.2] 26.1
ia | 142 | 140 | 139 | 138 | 13.7 |} 137 | 136] 135
989 | 972 | 955 | 947 | 938 | 929 | 9.20 | 9.11 | 9.02
772 | 156 | 740 | 731 | 723 | 714 | 7.06 | 697 | 6.88
647 | 631 | 616 | 607 | 599 | 591 | 582 | 5.74 | 5.65
567 | 552 | 536 | 528 | 520 | 512 | 503 | 495 | 4.86
sui | 496 | 481 | 473 | 465 | 457 | 448 | 440] 431
am | 456 | 441 | 433 | 425 | 417 | 408 | 400] 391
440 | 425 | 410 | 402 | 394 | 386 ] 3.78 | 369 | 3.60
46 | 401 | 386 | 3.78 | 370 | 362 | 354 | 345] 3.36
3.96 | 382 | 366 | 359 | 351 | 343 | 334 | 3.25 | 317
3.66 | 351 | 343 | 335 | 327 | 318 | 3.09 | 3.00
367 | 352 | 337 | 329 | 321 | 343 | 305 | 296 | 287
355 | 341 | 326 | 318 | 310 | 302 | 293 | 284] 275
346 | 331 | 3416 | 308 | 300 | 292 | 283 | 275 | 265
337 | 323 | 308 | 300 | 292 | 284 | 275 | 266 | 257
330 | 345 | 300 | 292 | 284 | 276 | 267 | 258 | 249
3.23 | 309 | 294 | 286 | 278 | 269 | 261 | 252 | 242
3.17 | 303 | 288 | 280 264 | 255 | 246 | 236
312 | 298 | 283 | 275 258 | 250 | 240} 231
3.07 | 293 | 278 | 270 254 | 245 | 235 | 2.26
3.03 | 289 | 274 | 2.66 249 | 240 | 231 | 221
2.99 | 285 | 270 | 262 DAS) | 2368 |2 227) | 217)
284 | 270 | 255 | 247 230 | 221 | 211 | 201
266 | 252 229 21 | 202 | 192 | 180
250 | 235 212 194) 184 | 173 | 160
234 | 219 195 176 | 166 | 153 | 138
204! tas | 179 isg | 1.47 1.00
131TABEL 7
Values for Spearman's Rank Correlation (r,) for Combined Area in Both Tails *
n = sample size = 12)
10 of area 10 of area
3986 3986
EXAMPLE : FOR A two-tailed test of significance at the .20 level, with » = 12, the appropriate value
for r, can be found by looking under the .20 column and proceeding down to the 12 row: there we
find the appropriate r, value to be 3986.
n 20 10 05 02 OL 002
4 8000 8000
5 7000 -8000 -9000 9000
6 6000 7714 8286 8857 9429
7 5357 6786 7450 8571 8929
8 5000 6190 7143 8095 8571
9 4667 6833 7667 8167
10 4424 6364 7333 7818
ul 4182 6091 7000 7455
12 3986 4965 5804 6713 7273
B 3791 A780 5549) 6429 6978
4 3626 4593 5341 6220 6747
15 3500 4429 5179 6000 6536
16 3382 4265 5000 5824
v7 3260 AlI8 4853 5637
18 3148 3994 ATI6 5480
19 3070 3895 4579 5333
20 2977 3789 4451 5203
21 .2909 3688 A351 5078
22 2829 3597 A241 4963
23 2167 3518 4150 4852
24 2704 3435 4061 A748
25 2646 3362 3977 4654
26 2588 3299 3894 A564
27 2540 3236 3822 A481
28 2490 3175 4401
29 2443 313 4320
30 2400 3059 A251
* Source : W.J. Conover , Pratical Nonparametne Statistics, John Wiley & Sons, Inc , New York, 1971
132,TABEL
8
Bilangan acak
Kolom
Baris} 1 2 3 4 5 6 7 8 9 10
1 10480 15011 01536 0211 81647 91646 69179-14194 6259036207
2 | 22368 46573 25595 85393 30995-89198. -27982 53402 93965 34095
3 | 24130 48360 22527 97265 76393 64809-15179 24830 4934032081
4 | 42167 93243 06243 61680 07856 16376 39440 53537-71341 57004
5 | 37570 39975 81837 16656 0612191782 60468 81305 49684 60672
6 | 77921 06907 11008 42751 27756 © $3498 18602 70659 9065515053
7 | 99562 72905 56420 69994 98872-31016 7119418738 44013 48840
8 | 9630) 91977 05463 07972 18876 20922 94595 56869 69014 60045
9 | 89579 14342 63661 1028117453 18103 57740-84378 2533112566
10 | 85475 36857 53342 53988 5306059533. 38867 6230008158 17983
11 | 28918 69578 88231 33276 70997 79936 5686505859 90106 31595
R 48235 03427 49626 69445-18663 72695 52180 20847
13 52636 92737 88974 33488 36320-17617 3001508272
14 | 10365 61129 87529 85689 48237 52267 67689-93394 O1S11 26358
15 | 07119 97336 71048 08178 77233-13916 47564 81056-97735 85977
16 | 51085 12765 51821 51259 77452 16308 60756 92144 49442 53900
17 | 02368 21382 52404 60268 89368 19885 55322 44819 O11RB 65255
18 | O1011 54092 33362 94904 3127304146 18594 2985271585 85030
19 | 52162 53916 46369 58586 2321614513 83149-98736 2349564350
20 | 07056 97628 33787 09998 42698 06691 7698813602 51851 46104
21 | 48663 91245 85828 14346 09172 30168 90229 04734 59193 22178
22 | 54164 58492 22421 74103 47070 25306-76468 26384 58151 06646
23 | 32639 32363 05597 24200 13363 38005 94342-28728 35806 06912
24 | 29334 27001 87637 87308 58731 00256 45834-15398 4655741135
25 | 02488 33062 28834 07351 19731 92420 60952 61280 S0O01 67658
26 | 81525 04839 96423 2487882651 66566 14778 76797 14780
27 | 29676 20591 68086 26432 46901-20849 8976R_ 81536 86645 12659
28 | 00742 57392 39064 66432-84673. 40027 3283261362 98947 96067
29 | 05366 04213 25669 26422 44407 44048-37937 63904 45766 66134
30 | 91921 26418 64117 94305 26766 25940 39972 22209-71500 64568
31 | 00582 O4711 87917 77341 42206 35126 74087-9547 81817 42607
32 | 00725 69884 62797 56170 86324 88072 76222-36086 84637-93161
33 | 69011 65795 95876 55293 18988 27354 26575 08625 40801 59920
34 | 25976 57948 29888 88604 67917 48708-18912 8227165424 69774
35 | 09763 83473 73577 12908 30883-18317 28290 35797 05998 41688
133TABEL 8 (Lanjutan)
Bilangan acak
Kolom
Baris 1 2 3 4 s 6 7 8 7 10
36 91567 42595 27958 30134 04024 = 86385-29880. BABSS,
37 17955 56349 90999 49127 20044-59931 06115 02008
38 46503 18584-18845 49618 02304 «= 51038-20655 15475
39 92157 89634 9482478171 84610 82834-09922 48413
40 14577 62769 35605 39667 47358 = 56873 56307 49518
4i 98427 07523 33362 64270 01638 92477 66969 (45585
42 34914 63976 = 88720-82765 «= 34476 =—«:17032 87589 70002,
43 70060 28277 39475 46473 23219-53416 = 94970 94884
44 53976 54914 06990 67245 68350-82948 11398 88267
45 76072 29515 40980 07391 58745-25775 22987 96189
46 90725 52210 83974 29992 65831 38857 50490-83765 55657-14361
47 64364 67412 3333931926 © 14883-24413 59744 «92351 «9747389286
48 08962 00358 31662 25388 61642 34072 81249 35648 + S6R91 69352
49 95012 68379 93526 70765 10592 04542-76463 © 54328) 02349): 1L7T
‘50 15664 10493 20492 38391 «91132-21999 $9516 59516 81652 48223
Si 16408 81899 04153 79401 21438 = 83035, 31238,
52 1829-81953 05520 04739 13092-97662 06496
53 TBALS 35101 47498 99016 71060 = 88824 20286
54 57491 16703-23167 45021 33132 12544 45393
55 30405 83946 = 23792 15059 45799-22716 74353
56 16631 35006 85900 98275-32388 «5239016815 38480,
‘S57 96773 20206 «42559-78985 «05300 22164 «24369. 19687
58 38935 64202 14349 82674 66523-44133 00697 19124
59 31624 76384 «17403 53363 44167 64486 61758. 31601
60 78919 19474 23632 27889 «47914 02584 37680. 39339,
61 03931 633309 S7047 74211 63445 17361 62825 91284
62 74426-33278 «10119-89917 eel ipl 88662
63 09066 00903 20795 95452 92648 45454. 51125,
64 42238 «12426 8702514267 20979-4508 29472,
65 16153 08002 26504 41744 «81959 65642. 56302 00033 67107
66 21457 40742 29820-96783 29400 21840 15035 3453733310 06116
67 21581 57802 02050 89728 17937 37621_«= 47075-42080: 97403 48626
68 55612 78095 83197 33732 OS810 24813 86902 60397 16489 03264
69 44657 66999 99324 51281 84463 6056379312 93454 68876 25471
70 91340 84979 46949 81973 37949 61023-43997 15263 80644 43942
134TABEL 8 (Lanjutan)
Bilangan acak
Kolom
Baris L 2 BS 4 5 6 7 8 9 10
mW 91227 21199 31935 27022 84067 05462-35216 «14486 29891 68607
2 50001 38140 66321 19924 72163 09538 12151 06878 91903 18749
= 65390 05224 72958 28609 81406 39147-25549 48542 42627 45233
74 27504 96131 83944 41575 10573. 08619 64482-73923 36152 05184
75 37169 94851 39117 89632 00959 16487 65536 49071 39782 17095
76 11508 70225 S111] 38351 19444 66499 71945 05422-13442 78675
oo 37449 3036206694 54690 04052-53115. 62757-95348 7866211163
8 46515 70331 8592: 57015-15765. 97161 17869 45349 61796
79 30986 81223 42416 58353 21532 30502 32305 86482-05174 07901
80 63798 64995 46583 09785 44160 78128 83991 42865 92520 83531
81 82486 84846 99254 67632 43218 50076-21361 64816 51202 88124
82 21885 32906 92431 09060 51674 64126 © 62570 26123 05155.
83 60336 «98782 07408 53458 13564 © $9089 26445-29789 85205 41001
84 | 43937 46891 24010 25560 86355 33941 25786 54990 7189915475
85 97656 63175 89303 16275 07100 92063 21942 18611 47348 20203
86 03299 01221 05418 38982 $5758 92237 26759-86367 21216-98442
87 79626 06486 03574-17668 +0785 = 76020 79924-25651 83325 88428
88 85636 68335 47539 03129 65651 11977 02510 26113 99447 68645,
89 18039 14367 61337 06177 12143 46609 32989-74014 64708 00533
90, 08362 15656 60627 36478 65648 16764 $3412 09013 0783241574
OL 79556 29068 04142 16268» :15387 12856 66227-38358 22478 73373
92 92608 82674 27072 32534 17075-27698 += 98204. 6386311951 34648
93 23982 25835 40055 67006 »=—-12293. 02753. 1482723235 35071 99704
94 09915 96306 05908 97901 28395 14186 00821-80703 7042675647
95 59037 33300 26695 62247 69927-76123 SO842 43834 86654 70959
96 42488 78077 69882 34136 © 79180-97526 04098 «73571
= 46764 86273 63003 31204 © 36692 40202 57306 55543
98 03237 45430 55417 90816 17349-88298 36600 78406
99 86591 81482 52667 14972 90053 89534. 76036 49199 43716
100 38534 O1715 94964 65680 © 43772--39560-«12918 86537 62738
——
‘Abridged from Handbook of Tables for Probability, 2nd edEdited by William H Beyer Cleveland : The
Chemical Rubber Company.1968) Reproduced by permission of CRC Press.lne.
135
Anda mungkin juga menyukai