Anda di halaman 1dari 243

BUKU AJAR

STATISTIKA
INDUSTRI
Tahun Pembuatan : 2011

Dibuat oleh team dosen Statistika Industri:

Ir. Wiyono MT

Judi Alhilman Drs. MSIE

Ir. Hermita dyah MT.

FAKULTAS REKAYASA INDUSTRI


INSTITUT TEKNOLOGI TELKOM

KATA PENGANTAR
Bismillaahirrohmaanirrohiim,
Assalaamu’alaikum Warohmatulloohi Wabarokaatuh

Dengan ridlaNYA, Alhamdulillah penulis dapat menyelesaikan buku ajar mata


kuliah Statistika Industri ini walaupun masih banyak kekurangan-kekurangannya
yang harus diperbaiki di masa yang akan datang.
Edisi pertama dari buku ajar mata kuliah Statistika Industri ini diperuntukan
digunakan di lingkungan Fakultas Rekayasa Industri Institut Teknologi Telkom di
mana penyusun mengajar.
Buku ajar Statistika Industri pegangan kuliah ini ditujukan agar mahasiswa lebih
dapat berkonsentrasi terhadap apa yang disampaikan dosen di kelas sehingga
mahasiswa diharapkan akan lebih maksimal dalam menerima ilmu yang
disampaikan oleh dosen di kelas.
Buku Ajar ini ditulis dan disusun berdasarkan sumber dari beberapa buku yang
telah ada dan dari pengalaman penulis selama mengajar di beberapa perguruan
tinggi.
Penulis sangat berterima kasih kepada semua pihak yang telah membantu dan
memberi semangat untuk menulis buku ajar ini dan penulis berterima kasih
kepada rekan-rekan sejawat yang telah membantu dalam penulisan buku ini.
Akhirnya, sangat diharapkan adanya masukan dari rekan pembaca sekalian demi
perbaikan Buku Ajar ini ke depannya.

Wassalaamu’alaikum Warohmatulloohi Wabarokaatuh.

Bandung, Agustus 2011,

Penulis

Toshiba | RISET OPERASI II I-2


(team dosen Statistika Industri )

Toshiba | RISET OPERASI II I-3


SATUAN ACARA PENGAJARAN (SAP)

Mata Kuliah : Statistika Industri (3 SKS)

Kode Mata Kuliah : IE2333

Buku Acuan :

1. Walpole, Ronald E., et all: “Probability & Statistics for Engineers & Scientists”, Prentice Hall, 2007
2. Hogg, Robert V., and Elliot A. Tanis: “Probability and Statistical Inference”, Pearson Education, 2006
3. Ledolter. J, Hogg, Robert V. : “ Applied Statistics fot Engineers and Physical Scientists”, Pearson Prentice Hall, 2010.
Pokok Tujuan
Minggu Materi Tujuan Instruksional Kegiatan Evalua
Bahasan Instruksional Acuan
Ke Khusus (TIK) si
Umum (TIU)

(1) (2) (3) (4) (5) (6) (7) (8)

1. Pendahulu Teori Sampling Mahasiswa Mahasiswa mampu Tatap Tanya [1, Bab
an memahami tentang menjelaskan pengertian: muka Jawab 8)
pengertian konsep
dasar metoda 1. sampling Diskusi
2. populasi dan sample
sampling 3. statistik dan parameter
2. Statistika Ukuran pemusatan, Mahasiswa Mahasiswa mampu Tatap Tanya [1, Bab
Deskriptif keragaman dan letak memahami tentang menjelaskan pengertian: muka Jawab 8)
pengertian konsep
dasar Statistika 1. Ukuran pemusatan Diskusi
Deskriptif 2. Ukuran keragaman
3. Ukuran letak
3. Distribusi Distribusi sampling Mahasiswa Mahasiswa mampu: Tatap Tanya [1, Bab
sampling rataan dan proporsi memahami distribusi muka Jawab 8]
rataan dan dari satu populasi sampling rataan dan 1. menjelaskan teorema
“central limit” Diskusi
proporsi dan dua populasi ( Z proporsi dari satu 2. menghitung nilai
dan t) populasi dan dua probabilitas distribusi
populasi sampling rataan dan
proporsi untuk satu dan
dua populasi
4. Distribusi Distribusi sampling Mahasiswa Mahasiswa mampu: Tatap Tanya [1, Bab
sampling variansi ( Chi Square memahami distribusi muka Jawab 8]
variansi dan F) sampling Chi Square 1. menghitung nilai
probabilitas distribusi Diskusi
dan F sampling variansi dari
satu populasi
2. menghitung nilai
probabilitas distribusi
sampling variansi dari
dua populasi
5. Estimasi 1. Pengertian dan Mahasiswa Mahasiswa mampu : Tatap Tanya [1, Bab
dan uji sifat-sifat memahami pengertian muka Jawab 9, 18]
hipotesa estimator dan sifat-sifat umum 1. menjelaskan pegertian
2. Estimasi rataan dan sifat-sifat umum Diskusi [2, Bab
rataan estimator dan estimator
satu populasi 6]
untuk satu 3. Estimasi rataan pengujian hipotesa 2. menjelaskan metoda
dan dua dua populasi khususnya selang untuk menentukan [3, Bab
populasi 4. Pengertian uji rataan dan estimator rataan 9]
hipotesa pengujiannya baik populasi
5. Jenis kesalahan satu populasi maupun 3. menghitung nilai
dalam uji estimasi selang rataan
dua populasi
hipotesis suatu populasi (satu dan
dua populasi).
4. menjelaskan kesalahan
dalam uji hipotesis
5. melakukan uji hipotesis
rataan (satu dan dua
populasi).
6. Estimasi 1. Estimator Mahasiswa Mahasiswa mampu : Tatap Tanya [1, Bab
dan proporsi memahami pengertian muka Jawab 9]
pengujian 2. Pengujian dan dan sifat-sifat umum 1. menjelaskan metoda
Estimasi selang untuk menentukan Diskusi [2, Bab
hipotea estimator dan estimator proporsi
proporsi baik 6]
proporsi satu dan dua Pengujian hipotesa populasi
populasi populasi khususnya proporsi 2. menghitung nilai
baik satu populasi estimasi selang proporsi
maupun dua populasi suatu populasi (satu dan
dua populasi).
3. Menguji proporsi satu
dan dua proporsi
7. Estimasi 1. Estimator Mahasiswa Mahasiswa mampu : Tatap Tanya [1, Bab
dan uji variansi memahami pengertian muka Jawab 9]
hipotesa 2. Estimasi selang dan sifat-sifat umum 1. menjelaskan metoda
variasi baik satu untuk menentukan Diskusi [2, Bab
variansi estimator dan estimator variansi
dan dua populasi 6]
3. Pengujian pengujian hipotesa populasi
hipotesa variansi khususnya untuk 2. menghitung nilai
satu dan dua variansi baik satu estimasi selang variasni
populasi. populasi maupun dua suatu populasi (satu dan
populasi dua populasi).
3. Menguji variansi untuk
satu dan dua populasi
8. UTS
9. Uji 1. Goodness of fit Mahasiswa Mahasiswa mampu : Tatap Tanya [1, Bab
Hipotesis 2. Uji independesi memahami metoda uji
goodness of fit dan uji 1. melakukan uji goodness muka Jawab 10]
independensi of fit
2. melakukan uji Diskusi [2, Bab
independesi 8]
10. Uji 1. Metoda analisis Mahasiswa Mahasiswa mampu : Tatap Tanya [1, Bab
variansi varian memahami metoda uji muka Jawab 13]
satu arah 2. CRD (complety variansi satu arah 1. Menjelaskan metoda uji
randomize variansi Diskusi [2, Bab
design) 2. melakukan uji variansi 10]
3. BRD(Bock satu arah
Random design)
11. Regresi 1. Regresi Mahasiswa Mahasiswa mampu : Tatap Tanya [1, Bab
sederhana sederhana memahami metoda muka Jawab 11]
2. Pengujian regresi regresi sederhana 1. melakukan
perhitungan regresi Diskusi
sederhana dan
pengujiannya.

12. Korelasi 1. Korelasi Mahasiswa Mahasiswa mampu : Tatap Tanya [1, Bab
2. Pengujian memahami konsep muka Jawab 11]
korelasi korelsi dan 1. Menghitung nilai
korelasi dan Diskusi [3, Bab
pengujiannya. pengujiannya. 14, 15]

13. Uji 1. Uji tanda Mahasiswa Mahasiswa mampu : Tatap Tanya [1, Bab
Hipotesis 2. Run test memahami metoda uji 3. melakukan uji tanda muka Jawab 16]
non tanda dan run test 4. melakukan run test
parametrik Diskusi [2, Bab
8]

14. Uji 1. Uji Wilcoxon Mahasiswa Mahasiswa mampu : Tatap Tanya [1, Bab
Hipotesis 2. Uji Kruskal memahami metoda uji muka Jawab 16]
non Wallis Wilcoxon dan Uji 3. melakukan uji Wilcoxon
4. melakukan uji Kruskal Diskusi [2, Bab
parametrik Kruskal Wallis Wallis 8]

15. Tugas Persentasi tugas Mahasiswa mampu Mahasiswa mampu Tatap Tanya
besar mengaplikasikan mengaplikasikan dan muka Jawab
statistika ke dunia merepresantasikan
nyata materi Diskusi

16. UAS

Penilaian :
UTS : 30%
UAS : 30%
QUIS : 25%
TUGAS : 15%
Buku Ajar Statistika Industri FRI

DAFTAR ISI

BAB I TEORI SAMPLING....................................................................................................1


I.1 PENGERTIAN DASAR....................................................................................1
I.1.1 Sampling................................................................................................1
I.1.2 Sample (n) :............................................................................................1
I.1.3 Elemen / unsur........................................................................................2
I.1.4 Populasi (N)...........................................................................................2
I.1.5 Kerangka sampel....................................................................................2
I.2 SYARAT SAMPEL YANG BAIK....................................................................2
I.3 UKURAN SAMPEL..........................................................................................5
I.4 TEKNIK-TEKNIK PENGAMBILAN SAMPEL..............................................7
I.4.1 Sampling dengan Pengembalian............................................................7
I.4.2 Sampling tanpa Pengembalian :.............................................................8
I.4.3 Tipe Sampling menurut Peluang Pemilihannya.....................................8
I.5 TEKNIK PENYAJIAN DATA SAMPEL.......................................................14
I.5.1 Penyajian Data.....................................................................................14
I.5.2 Tabel Distribusi frekuensi....................................................................14
I.5.3 Distribusi Frekuensi Relatif :...............................................................18
I.5.4 Penyajian dalam Bentuk Grafik...........................................................19
BAB II DISTRIBUSI SAMPLING.......................................................................................24
II.1 DISTRIBUSI SAMPLING RATAAN Z.........................................................24
II.2 DISTRIBUSI SAMPLING RATAAN T.........................................................28
II.3 DISTRIBUSI SAMPLING PROPORSI..........................................................31
II.4 DISTRIBUSI SAMPLING PROPORSI 2 POPULASI...................................32
II.5 DISTRIBUSI SAMPLING VARIANSI..........................................................34
BAB III TEORI ESTIMASI....................................................................................................36
III.1 ESTIMASI RATAAN......................................................................................36
III.1.1 Selang kepercayaan mean sampel........................................................36
III.1.2 Selang kepercayaan untuk µ; σ diketahui............................................36
III.1.3 Kesalahan estimasi...............................................................................37
III.1.4 Sampel sedikit......................................................................................38

xi IT TELKOM
Buku Ajar Statistika Industri FRI

III.1.5 Selang kepercayaan untuk µ; σ tidak diketahui...................................39


III.2 ESTIMASI PROPORSI...................................................................................40
III.2.1 Estimasi Selisih Dua Proporsi..............................................................45
III.3 ESTIMASI VARIANSI...................................................................................48
III.3.1 Estimasi Nisbah Dua Variansi.............................................................50
BAB IV UJI HIPOTESIS........................................................................................................54
IV.1 HIPOTESIS STATISTIK.................................................................................54
IV.2 ARAH PENGUJIAN HIPOTESIS..................................................................55
IV.2.1 Uji Ekasisi............................................................................................55
IV.2.2 Uji Dwisisi...........................................................................................57
IV.3 KESALAHAN DALAM PENGUJIAN HIPOTESIS......................................57
IV.4 LANGKAH PENGERJAAN UJI HIPOTESIS...............................................60
IV.5 UJI MENYANGKUT RATAAN.....................................................................60
IV.6 UJI MENYANGKUT PROPORSI..................................................................63
IV.7 UJI MENYANGKUT VARIANSI..................................................................66
BAB V UJI CHI-SQUARE....................................................................................................72
V.1 GOODNESS OF FIT TEST.............................................................................72
V.2 INDEPENDENSI (UJI KEBEBASAN)..........................................................76
BAB VI REGRESI DAN KORELASI....................................................................................81
VI.1 REGRESI.........................................................................................................81
VI.1.1 Regresi Linier Sederhana.....................................................................81
VI.1.2 Regresi Linier Berganda......................................................................87
VI.2 KORELASI......................................................................................................89
VI.2.1 Definisi Korelasi..................................................................................89
VI.2.2 Koefisien Korelasi................................................................................89
VI.2.3 Teknik Korelasi....................................................................................90
VI.2.4 Uji Hipotesis Korelasi..........................................................................95
BAB VIIANOVA....................................................................................................................99
VII.1 ONE WAY ANOVA...........................................................................................99
VII.2 TWO WAY ANOVA........................................................................................102
VII.2.1 Two Way Anova dengan n replikasi..................................................103

xii IT TELKOM
Buku Ajar Statistika Industri FRI

xiii IT TELKOM
BAB I. TEORI SAMPLING

PENDAHULUA
N

Teori sampling didasarkan pada lima kategori sesuai dengan kondisi yang dihadapi yaitu:

a) Pengertian dasar teori sampling


b) Syarat sampel yang baik
c) Ukuran sampel
d) Teknik-teknik pengambilan sampel
e) Teknik penyajian data sampel

TUJUAN INSTRUKSIONAL
UMUM

Setelah mempelajari materi ini mahasiswa mengetahui proses sampling dan dapat
menggambarkan proses dan metode yang digunakan dalam pengumpulan data dan dapat
menjelaskan proses dan metode yang digunakan dalam pengolahan data.

TUJUAN INSTRUKSIONAL KHUSUS

1. Mahasiswa dapat memahami konsep dasar teori sampling

2. Mahasiswa akan dapat memahami apa saja syarat sampel yang baik

3. Mahasiswa dapat memahami ukuran sample yang baik.

4. Mahasiswa diharapkan memahami teknik-teknik pengambilan sample


5. Mahasiswa dapat memahami teknik penyajian data sampel

1………….
2………….
SKENARIO PEMBELAJARAN
3………….
4………….

Kegiatan perkuliahan dilaksanakan dengan skenario sebagai berikut:

1. Perkuliahan
2. Penjelasan tentang concept map (tunjukan di peta konsep dimana posisi materi yang
akan dibahas), pokok bahasan, dan kompetensi yang akan dicapai (TIU dan TIK)
3. Tes pendahuluan
4. Ringkasan materi disampaikan dengan metode ceramah, critical incident, diskusi dan
tanya jawab
5. Tes akhir
6. Evaluasi pencapaian
7. Penutup
RINGKASAN MATERI

I.1 PENGERTIAN DASAR

I.1.1 Sampling
Proses pengambilan atau memilih n buah elemen/objek/unsur dari populasi yang
berukuran N. Misalnya memilih sebagian murid SD Negeri di Kota Bandung, dalam sebuah
penelitian yang bertujuan untuk mengetahui proporsi latar belakang tingkat pendidikan orang
tua dari seluruh murid SD Negeri di Kota Bandung.

I.1.2 Sample (n) :


Merupakan bagian dari populasi. Elemen anggota sampel, merupakan anggota
populasi dimana sampel diambil. Jika N banyaknya elemen populasi, dan n banyaknya
elemen sampel, maka n < N. Artinya tidak akan ada sampel jika tidak ada populasi. Populasi
adalah keseluruhan elemen atau unsur yang akan kita teliti. Penelitian yang dilakukan atas
seluruh elemen dinamakan sensus. Idealnya, agar hasil penelitiannya lebih bisa dipercaya,
seorang peneliti harus melakukan sensus. Namun karena sesuatu hal peneliti bisa tidak
meneliti keseluruhan elemen tadi, maka yang bisa dilakukannya adalah meneliti sebagian dari
keseluruhan elemen atau unsur tadi.

HUBUNGAN SAMPEL DAN POPULASI

Populasi Sampel

Berbagai alasan yang masuk akal mengapa peneliti tidak melakukan sensus antara
lain adalah,(a) populasi demikian banyaknya sehingga dalam prakteknya tidak mungkin
seluruh elemen diteliti; (b) keterbatasan waktu penelitian, biaya, dan sumber daya manusia,
membuat peneliti harus telah puas jika meneliti sebagian dari elemen penelitian; (c) bahkan
kadang, penelitian yang dilakukan terhadap sampel bisa lebih reliabel daripada terhadap
populasi – misalnya, karena elemen sedemikian banyaknya maka akan memunculkan
kelelahan fisik dan mental para pencacahnya sehingga banyak terjadi kekeliruan. (Uma
Sekaran, 1992); (d) demikian pula jika elemen populasi homogen, penelitian terhadap seluruh
elemen dalam populasi menjadi tidak masuk akal, misalnya untuk meneliti kualitas jeruk dari
satu pohon jeruk

Agar hasil penelitian yang dilakukan terhadap sampel masih tetap bisa dipercaya
dalam artian masih bisa mewakili karakteristik populasi, maka cara penarikan sampelnya
harus dilakukan secara seksama. Cara pemilihan sampel dikenal dengan nama teknik
sampling atau teknik pengambilan sampel .

I.1.3 Elemen / unsur


Elemen adalah setiap satuan populasi. Kalau dalam populasi terdapat 30 laporan
keuangan, maka setiap laporan keuangan tersebut adalah unsur atau elemen penelitian.
Artinya dalam populasi tersebut terdapat 30 elemen penelitian. Jika populasinya adalah
pabrik sepatu, dan jumlah pabrik sepatu 500, maka dalam populasi tersebut terdapat 500
elemen penelitian.

I.1.4 Populasi (N)


Kumpulan lengkap dari elemen-elemen yang sejenis akan tetapi dapat dibedakan
berdasarkan karekteristiknya. Misalnya Mahasiswa Indonesia dapat dibedakan berdasarkan
variabel jenis kelamin dengan karakteristik laki-laki dan perempuan, atau variabel IPK
dengan karektaristik indeks antara 0-4.

Atau dapat diartikan sebagai sekelompok orang, kejadian, atau benda, yang dijadikan
obyek penelitian. Jika yang ingin diteliti adalah sikap konsumen terhadap satu produk
tertentu, maka populasinya adalah seluruh konsumen produk tersebut. Jika yang diteliti
adalah laporan keuangan perusahaan “X”, maka populasinya adalah keseluruhan laporan
keuangan perusahaan “X” tersebut, Jika yang diteliti adalah motivasi pegawai di departemen
“A” maka populasinya adalah seluruh pegawai di departemen “A”.
I.1.5 Kerangka sampel
Kerangka sampel adalah daftar yang memuat seluruh elemen/anggota populasi,
sebagai dasar untuk penarikan sampel random Sedangkan sampel adalah suatu himpunan
bagian dari populasi.

I.2 SYARAT SAMPEL YANG BAIK


Secara umum, sampel yang baik adalah yang dapat mewakili sebanyak mungkin
karakteristik populasi. Dalam bahasa pengukuran, artinya sampel harus valid, yaitu bisa
mengukur sesuatu yang seharusnya diukur. Kalau yang ingin diukur adalah masyarakat
Sunda sedangkan yang dijadikan sampel adalah hanya orang Banten saja, maka sampel
tersebut tidak valid, karena tidak mengukur sesuatu yang seharusnya diukur (orang Sunda).
Sampel yang valid ditentukan oleh dua pertimbangan.
Pertama : Akurasi atau ketepatan , yaitu tingkat ketidakadaan “bias” (kekeliruan) dalam
sample. Dengan kata lain makin sedikit tingkat kekeliruan yang ada dalam sampel, makin
akurat sampel tersebut. Tolok ukur adanya “bias” atau kekeliruan adalah populasi.

Cooper dan Emory (1995) menyebutkan bahwa “there is no systematic variance”


yang maksudnya adalah tidak ada keragaman pengukuran yang disebabkan karena pengaruh
yang diketahui atau tidak diketahui, yang menyebabkan skor cenderung mengarah pada satu
titik tertentu. Sebagai contoh, jika ingin mengetahui rata-rata luas tanah suatu perumahan,
lalu yang dijadikan sampel adalah rumah yang terletak di setiap sudut jalan, maka hasil atau
skor yang diperoleh akan bias. Kekeliruan semacam ini bisa terjadi pada sampel yang diambil
secara sistematis

Contoh systematic variance yang banyak ditulis dalam buku-buku metode penelitian
adalah jajak-pendapat (polling) yang dilakukan oleh Literary Digest (sebuah majalah yang
terbit di Amerika tahun 1920-an) pada tahun 1936. (Copper & Emory, 1995, Nan lin, 1976).
Mulai tahun 1920, 1924, 1928, dan tahun 1932 majalah ini berhasil memprediksi siapa yang
akan jadi presiden dari calon-calon presiden yang ada. Sampel diambil berdasarkan petunjuk
dalam buku telepon dan dari daftar pemilik mobil. Namun pada tahun 1936 prediksinya
salah. Berdasarkan jajak pendapat, di antara dua calon presiden (Alfred M. Landon dan
Franklin D. Roosevelt), yang akan menang adalah Landon, namun meleset karena ternyata
Roosevelt yang terpilih menjadi presiden Amerika.

Setelah diperiksa secara seksama, ternyata Literary Digest membuat kesalahan dalam
menentukan sampel penelitiannya . Karena semua sampel yang diambil adalah mereka yang
memiliki telepon dan mobil, akibatnya pemilih yang sebagian besar tidak memiliki telepon
dan mobil (kelas rendah) tidak terwakili, padahal Rosevelt lebih banyak dipilih oleh
masyarakat kelas rendah tersebut. Dari kejadian tersebut ada dua pelajaran yang diperoleh :
(1), keakuratan prediktibilitas dari suatu sampel tidak selalu bisa dijamin dengan banyaknya
jumlah sampel; (2) agar sampel dapat memprediksi dengan baik populasi, sampel harus
mempunyai selengkap mungkin karakteristik populasi (Nan Lin, 1976).

Kedua : Presisi. Kriteria kedua sampel yang baik adalah memiliki tingkat presisi estimasi.
Presisi mengacu pada persoalan sedekat mana estimasi kita dengan karakteristik
populasi. Contoh : Dari 300 pegawai produksi, diambil sampel 50 orang. Setelah diukur
ternyata rata-rata perhari, setiap orang menghasilkan 50 potong produk “X”. Namun
berdasarkan laporan harian, pegawai bisa menghasilkan produk “X” per harinya rata-rata 58
unit. Artinya di antara laporan harian yang dihitung berdasarkan populasi dengan hasil
penelitian yang dihasilkan dari sampel, terdapat perbedaan 8 unit. Makin kecil tingkat
perbedaan di antara rata-rata populasi dengan rata-rata sampel, maka makin tinggi tingkat
presisi sampel tersebut.

Belum pernah ada sampel yang bisa mewakili karakteristik populasi sepenuhnya. Oleh
karena itu dalam setiap penarikan sampel senantiasa melekat keasalahan-kesalahan, yang
dikenal dengan nama “sampling error” Presisi diukur oleh simpangan baku (standard error).
Makin kecil perbedaan di antara simpangan baku yang diperoleh dari sampel (S) dengan
simpangan baku dari populasi (σ), makin tinggi pula tingkat presisinya. Walau tidak
selamanya, tingkat presisi mungkin bisa meningkat dengan cara menambahkan jumlah
sampel, karena kesalahan mungkin bisa berkurang kalau jumlah sampelnya ditambah
( Kerlinger, 1973 ). Dengan contoh di atas tadi, mungkin saja perbedaan rata-rata di antara
populasi dengan sampel bisa lebih sedikit, jika sampel yang ditariknya ditambah. Katakanlah
dari 50 menjadi 75.

Di bawah ini digambarkan hubungan antara jumlah sampel dengan tingkat kesalahan seperti
yang diutarakan oleh Kerlinger

besar
kesalahan

kecil

kecil Besarnya sampel besar

I.3 UKURAN SAMPEL


Pertanyaan yang sering diajukan oleh peneliti ketika akan melakukan penelitian adalah
”berapa besar sampel yang harus diteliti dari sebuah populasi?”, agar hasil (berupa data
perkiraan) penelitian dapat mewakili atau merepresentasikan populasi. Data perkiraan
(statistik) disebut mewakili jika angkanya mendekati parameter. Jika parameter 100, 95
disebut lebih mewakili dibandingkan dengan 90.

Ukuran sampel atau jumlah sampel yang diambil menjadi persoalan yang penting
manakala jenis penelitian yang akan dilakukan adalah penelitian yang menggunakan analisis
kuantitatif. Pada penelitian yang menggunakan analisis kualitatif, ukuran sampel bukan
menjadi nomor satu, karena yang dipentingkan alah kekayaan informasi. Walau jumlahnya
sedikit tetapi jika kaya akan informasi, maka sampelnya lebih bermanfaat.
Dikaitkan dengan besarnya sampel, selain tingkat kesalahan, ada lagi beberapa faktor
lain yang perlu memperoleh pertimbangan yaitu, (1) derajat keseragaman, (2) rencana
analisis, (3) biaya, waktu, dan tenaga yang tersedia . (Singarimbun dan Effendy, 1989).
Makin tidak seragam sifat atau karakter setiap elemen populasi, makin banyak sampel yang
harus diambil. Jika rencana analisisnya mendetail atau rinci maka jumlah sampelnya pun
harus banyak. Misalnya di samping ingin mengetahui sikap konsumen terhadap kebijakan
perusahaan, peneliti juga bermaksud mengetahui hubungan antara sikap dengan tingkat
pendidikan. Agar tujuan ini dapat tercapai maka sampelnya harus terdiri atas berbagai jenjang
pendidikan SD, SLTP. SMU, dan seterusnya.. Makin sedikit waktu, biaya , dan tenaga yang
dimiliki peneliti, makin sedikit pula sampel yang bisa diperoleh. Perlu dipahami bahwa
apapun alasannya, penelitian haruslah dapat dikelola dengan baik (manageable).
Misalnya, jumlah bank yang dijadikan populasi penelitian ada 400 buah.
Pertanyaannya adalah, berapa bank yang harus diambil menjadi sampel agar hasilnya
mewakili populasi?. 30?, 50? 100? 250?. Jawabnya tidak mudah. Ada yang mengatakan, jika
ukuran populasinya di atas 1000, sampel sekitar 10 % sudah cukup, tetapi jika ukuran
populasinya sekitar 100, sampelnya paling sedikit 30%, dan kalau ukuran populasinya 30,
maka sampelnya harus 100%.
Ada pula yang menuliskan, untuk penelitian deskriptif, sampelnya 10% dari populasi,
penelitian korelasional, paling sedikit 30 elemen populasi, penelitian perbandingan kausal, 30
elemen per kelompok, dan untuk penelitian eksperimen 15 elemen per kelompok (Gay dan
Diehl, 1992).
Roscoe (1975) dalam Uma Sekaran (1992) memberikan pedoman penentuan jumlah
sampel sebagai berikut :
1. Sebaiknya ukuran sampel di antara 30 s/d 500 elemen
2. Jika sampel dipecah lagi ke dalam subsampel (laki/perempuan, SD/SLTP/SMU, dsb),
jumlah minimum subsampel harus 30
3. Pada penelitian multivariate (termasuk analisis regresi multivariate) ukuran sampel
harus beberapa kali lebih besar (10 kali) dari jumlah variable yang akan dianalisis.
4. Untuk penelitian eksperimen yang sederhana, dengan pengendalian yang ketat,
ukuran sampel bisa antara 10 s/d 20 elemen.
Krejcie dan Morgan (1970) dalam Uma Sekaran (1992) membuat daftar yang bisa
dipakai untuk menentukan jumlah sampel sebagai berikut (Lihat Tabel)

Tabel I.1 Tabel Penentuan Jumlah Sampel

Populasi (N) Sampel (n) Populasi (N) Sampel (n) Populasi (N) Sampel (n)
10 10 220 140 1200 291
15 14 230 144 1300 297
20 19 240 148 1400 302
25 24 250 152 1500 306
30 28 260 155 1600 310
35 32 270 159 1700 313
40 36 280 162 1800 317
45 40 290 165 1900 320
50 44 300 169 2000 322
55 48 320 175 2200 327
60 52 340 181 2400 331
65 56 360 186 2600 335
70 59 380 191 2800 338
75 63 400 196 3000 341
80 66 420 201 3500 346
85 70 440 205 4000 351
90 73 460 210 4500 354
95 76 480 214 5000 357
100 80 500 217 6000 361
110 86 550 226 7000 364
120 92 600 234 8000 367
130 97 650 242 9000 368
140 103 700 248 10000 370
150 108 750 254 15000 375
160 113 800 260 20000 377
170 118 850 265 30000 379
180 123 900 269 40000 380
190 127 950 274 50000 381
200 132 1000 278 75000 382
210 136 1100 285 1000000 384

Sebagai informasi lainnya, Champion (1981) mengatakan bahwa sebagian besar uji
statistik selalu menyertakan rekomendasi ukuran sampel. Dengan kata lain, uji-uji statistik
yang ada akan sangat efektif jika diterapkan pada sampel yang jumlahnya 30 s/d 60 atau
dari 120 s/d 250. Bahkan jika sampelnya di atas 500, tidak direkomendasikan untuk
menerapkan uji statistik. (Penjelasan tentang ini dapat dibaca di Bab 7 dan 8 buku Basic
Statistics for Social Research, Second Edition)

I.4 TEKNIK-TEKNIK PENGAMBILAN SAMPEL

Ada beberapa teknik pengambilan sampel yang sering digunakan dalam penelitian
diantaranya adalah: Sampling non probabilitas dan sampling probabilitas.

DEFINISI

 Sampel probabilitas
Merupakan suatu sampel yang dipilih sedemikian rupa dari populasi
sehingga masing-masing anggota populasi memiliki probabilitas atau
peluang yang sama untuk dijadikan sampel.

 Sampel nonprobabilitas
Merupakan suatu sampel yang dipilih sedemikian rupa dari populasi
sehingga setiap anggota tidak memiliki probabilitas atau peluang yang
sama untuk dijadikan sampel.

Lebih detailnya dapat dilihat pada gambar dibawah ini:


TEKNIK SAMPLING

Menurut peluang
Menurut proses memilih
pemilihannya

Probability sampling/
Non probability
Sampling dengan Sampling tanpa random sampling
sampling
pengembalian pengembalian

haphazard quota snowball purposive convinience

Simple Stratified
Cluster Systematic Area
random random
sampling sampling sampling
sampling sampling

Gambar I.1 Tipe Sampling menurut Proses Memilih

I.4.1 Sampling dengan Pengembalian


Satuan sampling yang terpilih, “dikembalikan” lagi ke dalam populasi (sebelum
dilakukan kembali proses pemilihan berikutnya). Sebuah satuan sampling bisa terpilih lebih
dari satu kali. Untuk populasi berukuran N=4 dan sampel berukuran n=2, maka sampel yang
mungkin terambil adalah Nn = 42 = 16 buah sampel. Teknik sampling seperti ini bisa
dikatakan tidak pernah digunakan dalam suatu penelitian, hanya untuk keperluan teoritis yang
berkatian dengan pengambilan sampel.

I.4.2 Sampling tanpa Pengembalian :


Satuan sampling yang telah terpilih, “tidak dikembalikan” lagi ke dalam populasi.
Tidak ada kemungkinan suatu satuan sampling terpilih lebih dari sekali. Untuk populasi
berukuran N=4 (misalnya A, B, C, D) dan sampel berukuran n=3, maka sampel yang
mungkin terambil ada 4 buah sampel yaitu ABC, ABD, ACD, dan BCD. Secara umum untuk
menghitung banyaknya macam sampel yang mungkin jika pengambilan sampel tanpa
pengembalian adalah: nCr = n!/(r!(n-r)!)

I.4.3 Tipe Sampling menurut Peluang Pemilihannya

I.4.3.1 Random sampling


Random sampling adalah cara pengambilan sampel yang memberikan kesempatan
yang sama untuk diambil kepada setiap elemen populasi. Artinya jika elemen populasinya
ada 100 dan yang akan dijadikan sampel adalah 25, maka setiap elemen tersebut mempunyai
kemungkinan 25/100 untuk bisa dipilih menjadi sampel.

Syarat pertama yang harus dilakukan untuk mengambil sampel secara acak adalah
memperoleh atau membuat kerangka sampel atau dikenal dengan nama “sampling frame”.
Yang dimaksud dengan kerangka sampling adalah daftar yang berisikan setiap elemen
populasi yang bisa diambil sebagai sampel. Elemen populasi bisa berupa data tentang
orang/binatang, tentang kejadian, tentang tempat, atau juga tentang benda. Jika populasi
penelitian adalah mahasiswa perguruan tinggi “A”, maka peneliti harus bisa memiliki daftar
semua mahasiswa yang terdaftar di perguruan tinggi “A “ tersebut selengkap mungkin.
Nama, NRP, jenis kelamin, alamat, usia, dan informasi lain yang berguna bagi penelitiannya..
Dari daftar ini, peneliti akan bisa secara pasti mengetahui jumlah populasinya (N). Jika
populasinya adalah rumah tangga dalam sebuah kota, maka peneliti harus mempunyai daftar
seluruh rumah tangga kota tersebut. Jika populasinya adalah wilayah Jawa Barat, maka
penelti harus mepunyai peta wilayah Jawa Barat secara lengkap. Kabupaten, Kecamatan,
Desa, Kampung. Lalu setiap tempat tersebut diberi kode (angka atau simbol) yang berbeda
satu sama lainnya.

Di samping sampling frame, peneliti juga harus mempunyai alat yang bisa dijadikan
penentu sampel. Dari sekian elemen populasi, elemen mana saja yang bisa dipilih menjadi
sampel?. Alat yang umumnya digunakan adalah Tabel Angka Random, kalkulator, atau
undian. Pemilihan sampel secara acak bisa dilakukan melalui sistem undian jika elemen
populasinya tidak begitu banyak. Tetapi jika sudah ratusan, cara undian bisa mengganggu
konsep “acak” atau “random” itu sendiri.

1. Simple Random Sampling atau Sampel Acak Sederhana


Cara atau teknik ini dapat dilakukan jika analisis penelitiannya cenderung deskriptif
dan bersifat umum. Perbedaan karakter yang mungkin ada pada setiap unsur atau elemen
populasi tidak merupakan hal yang penting bagi rencana analisisnya. Misalnya, dalam
populasi ada wanita dan pria, atau ada yang kaya dan yang miskin, ada manajer dan
bukan manajer, dan perbedaan-perbedaan lainnya. Selama perbedaan gender, status
kemakmuran, dan kedudukan dalam organisasi, serta perbedaan-perbedaan lain tersebut
bukan merupakan sesuatu hal yang penting dan mempunyai pengaruh yang signifikan
terhadap hasil penelitian, maka peneliti dapat mengambil sampel secara acak sederhana.
Dengan demikian setiap unsur populasi harus mempunyai kesempatan sama untuk bisa
dipilih menjadi sampel. Prosedurnya :

o Susun “sampling frame”

o Tetapkan jumlah sampel yang akan diambil

o Tentukan alat pemilihan sampel

o Pilih sampel sampai dengan jumlah terpenuhi

2. Stratified Random Sampling atau Sampel Acak Distratifikasikan

DEFINISI

Penarikan sampel acak terstruktur:

Penarikan sampel acak terstruktur dilakukan dengan membagi anggota


populasi dalam beberapa sub kelompok yang disebut strata, lalu suatu
sampel dipilih dari masing-masing stratum.

Karena unsur populasi berkarakteristik heterogen, dan heterogenitas tersebut


mempunyai arti yang signifikan pada pencapaian tujuan penelitian, maka peneliti dapat
mengambil sampel dengan cara ini. Misalnya, seorang peneliti ingin mengetahui sikap
manajer terhadap satu kebijakan perusahaan. Dia menduga bahwa manajer tingkat atas
cenderung positif sikapnya terhadap kebijakan perusahaan tadi. Agar dapat menguji
dugaannya tersebut maka sampelnya harus terdiri atas paling tidak para manajer tingkat
atas, menengah, dan bawah. Dengan teknik pemilihan sampel secara random
distratifikasikan, maka dia akan memperoleh manajer di ketiga tingkatan tersebut, yaitu
stratum manajer atas, manajer menengah dan manajer bawah. Dari setiap stratum
tersebut dipilih sampel secara acak. Prosedurnya :

o Siapkan “sampling frame”

o Bagi sampling frame tersebut berdasarkan strata yang dikehendaki

o Tentukan jumlah sampel dalam setiap stratum

o Pilih sampel dari setiap stratum secara acak.


Pada saat menentukan jumlah sampel dalam setiap stratum, peneliti dapat menentukan
secara (a) proposional, (b) tidak proposional. Yang dimaksud dengan proposional
adalah jumlah sampel dalam setiap stratum sebanding dengan jumlah unsur populasi
dalam stratum tersebut. Misalnya, untuk stratum manajer tingkat atas (I) terdapat 15
manajer, tingkat menengah ada 45 manajer (II), dan manajer tingkat bawah (III) ada
100 manajer. Artinya jumlah seluruh manajer adalah 160. Kalau jumlah sampel yang
akan diambil seluruhnya 100 manajer, maka untuk stratum I diambil (15:160)x100 =
9 manajer, stratum II = 28 manajer, dan stratum 3 = 63 manajer.

Jumlah dalam setiap stratum tidak proposional. Hal ini terjadi jika jumlah unsur atau
elemen di salah satu atau beberapa stratum sangat sedikit. Misalnya saja, kalau dalam
stratum manajer kelas atas (I) hanya ada 4 manajer, maka peneliti bisa mengambil
semua manajer dalam stratum tersebut , dan untuk manajer tingkat menengah (II)
ditambah 5, sedangkan manajer tingat bawah (III), tetap 63 orang.

3. Cluster Sampling atau Sampel Gugus


Teknik ini biasa juga diterjemahkan dengan cara pengambilan sampel berdasarkan
gugus. Berbeda dengan teknik pengambilan sampel acak yang distratifikasikan, di mana
setiap unsur dalam satu stratum memiliki karakteristik yang homogen (stratum A : laki-
laki semua, stratum B : perempuan semua), maka dalam sampel gugus, setiap gugus
boleh mengandung unsur yang karakteristiknya berbeda-beda atau heterogen. Misalnya,
dalam satu organisasi terdapat 100 departemen. Dalam setiap departemen terdapat
banyak pegawai dengan karakteristik berbeda pula. Beda jenis kelaminnya, beda tingkat
pendidikannya, beda tingkat pendapatnya, beda tingat manajerialnnya, dan perbedaan-
perbedaan lainnya. Jika peneliti bermaksud mengetahui tingkat penerimaan para pegawai
terhadap suatu strategi yang segera diterapkan perusahaan, maka peneliti dapat
menggunakan cluster sampling untuk mencegah terpilihnya sampel hanya dari satu atau
dua departemen saja. Prosedur :
a. Susun sampling frame berdasarkan gugus
b. Tentukan berapa gugus yang akan diambil sebagai sampel
c. Pilih gugus sebagai sampel dengan cara acak
d. Teliti setiap pegawai yang ada dalam gugus sample

4. Systematic Sampling atau Sampel Sistematis


Jika peneliti dihadapkan pada ukuran populasi yang banyak dan tidak memiliki alat
pengambil data secara random, cara pengambilan sampel sistematis dapat digunakan.
Cara ini menuntut kepada peneliti untuk memilih unsur populasi secara sistematis, yaitu
unsur populasi yang bisa dijadikan sampel adalah yang “keberapa”. Misalnya, setiap
unsur populasi yang keenam, yang bisa dijadikan sampel. Soal “keberapa”-nya satu
unsur populasi bisa dijadikan sampel tergantung pada ukuran populasi dan ukuran
sampel. Misalnya, dalam satu populasi terdapat 5000 rumah. Sampel yang akan diambil
adalah 250 rumah dengan demikian interval di antara sampel kesatu, kedua, dan
seterusnya adalah 25. Prosedurnya :
 Susun sampling frame
 Tetapkan jumlah sampel yang ingin diambil
 Tentukan K (kelas interval)
 Tentukan angka atau nomor awal di antara kelas interval tersebut secara acak atau
random – biasanya melalui cara undian saja.
 Mulailah mengambil sampel dimulai dari angka atau nomor awal yang terpilih.
 Pilihlah sebagai sampel angka atau nomor interval berikutnya
5. Area Sampling atau Sampel Wilayah
Teknik ini dipakai ketika peneliti dihadapkan pada situasi bahwa populasi
penelitiannya tersebar di berbagai wilayah. Misalnya, seorang marketing manajer
sebuah stasiun TV ingin mengetahui tingkat penerimaan masyarakat Jawa Barat atas
sebuah mata tayangan, teknik pengambilan sampel dengan area sampling sangat tepat.
Prosedurnya :
o Susun sampling frame yang menggambarkan peta wilayah (Jawa Barat) –
Kabupaten, Kotamadya, Kecamatan, Desa.
o Tentukan wilayah yang akan dijadikan sampel (Kabupaten ?, Kotamadya?,
Kecamatan?, Desa?)
o Tentukan berapa wilayah yang akan dijadikan sampel penelitiannya.
o Pilih beberapa wilayah untuk dijadikan sampel dengan cara acak atau random.
o Kalau ternyata masih terlampau banyak responden yang harus diambil datanya,
bagi lagi wilayah yang terpilih ke dalam sub wilayah.

I.4.3.2 Non random sampling atau nonprobability sampling


Seperti telah diuraikan sebelumnya, jenis sampel ini tidak dipilih secara acak. Tidak
semua unsur atau elemen populasi mempunyai kesempatan sama untuk bisa dipilih menjadi
sampel. Unsur populasi yang terpilih menjadi sampel bisa disebabkan karena kebetulan atau
karena faktor lain yang sebelumnya sudah direncanakan oleh peneliti.

1. Convenience Sampling atau sampel yang dipilih dengan pertimbangan kemudahan.


Dalam memilih sampel, peneliti tidak mempunyai pertimbangan lain kecuali
berdasarkan kemudahan saja. Seseorang diambil sebagai sampel karena kebetulan orang
tadi ada di situ atau kebetulan dia mengenal orang tersebut. Oleh karena itu ada beberapa
penulis menggunakan istilah accidental sampling – tidak disengaja – atau juga captive
sample (man-on-the-street) Jenis sampel ini sangat baik jika dimanfaatkan untuk
penelitian penjajagan, yang kemudian diikuti oleh penelitian lanjutan yang sampelnya
diambil secara acak (random). Beberapa kasus penelitian yang menggunakan jenis
sampel ini, hasilnya ternyata kurang obyektif.

2. Purposive Sampling
Sesuai dengan namanya, sampel diambil dengan maksud atau tujuan tertentu.
Seseorang atau sesuatu diambil sebagai sampel karena peneliti menganggap bahwa
seseorang atau sesuatu tersebut memiliki informasi yang diperlukan bagi penelitiannya.
Dua jenis sampel ini dikenal dengan nama judgement dan quota sampling.
 Judgment Sampling
Sampel dipilih berdasarkan penilaian peneliti bahwa dia adalah pihak yang
paling baik untuk dijadikan sampel penelitiannya.. Misalnya untuk memperoleh data
tentang bagaimana satu proses produksi direncanakan oleh suatu perusahaan, maka
manajer produksi merupakan orang yang terbaik untuk bisa memberikan informasi.
Jadi, judment sampling umumnya memilih sesuatu atau seseorang menjadi sampel
karena mereka mempunyai “information rich”.
Dalam program pengembangan produk (product development), biasanya yang
dijadikan sampel adalah karyawannya sendiri, dengan pertimbangan bahwa kalau
karyawan sendiri tidak puas terhadap produk baru yang akan dipasarkan, maka jangan
terlalu berharap pasar akan menerima produk itu dengan baik. (Cooper dan Emory,
1992).
 Quota Sampling
Teknik sampel ini adalah bentuk dari sampel distratifikasikan secara
proposional, namun tidak dipilih secara acak melainkan secara kebetulan saja.
Misalnya, di sebuah kantor terdapat pegawai laki-laki 60% dan perempuan 40%. Jika
seorang peneliti ingin mewawancari 30 orang pegawai dari kedua jenis kelamin tadi
maka dia harus mengambil sampel pegawai laki-laki sebanyak 18 orang sedangkan
pegawai perempuan 12 orang. Sekali lagi, teknik pengambilan ketiga puluh sampel
tadi tidak dilakukan secara acak, melainkan secara kebetulan saja.

3. Snowball Sampling – Sampel Bola Salju


Cara ini banyak dipakai ketika peneliti tidak banyak tahu tentang populasi
penelitiannya. Dia hanya tahu satu atau dua orang yang berdasarkan penilaiannya bisa
dijadikan sampel. Karena peneliti menginginkan lebih banyak lagi, lalu dia minta kepada
sampel pertama untuk menunjukan orang lain yang kira-kira bisa dijadikan sampel.
Misalnya, seorang peneliti ingin mengetahui pandangan kaum lesbian terhadap lembaga
perkawinan. Peneliti cukup mencari satu orang wanita lesbian dan kemudian melakukan
wawancara. Setelah selesai, peneliti tadi minta kepada wanita lesbian tersebut untuk bisa
mewawancarai teman lesbian lainnya. Setelah jumlah wanita lesbian yang berhasil
diwawancarainya dirasa cukup, peneliti bisa mengentikan pencarian wanita lesbian
lainnya. . Hal ini bisa juga dilakukan pada pencandu narkotik, para gay, atau kelompok-
kelompok sosial lain yang eksklusif (tertutup).

4. Haphazard Sampling
Satuan sampling dipilih sembarangan atau seadanya, tanpa perhitungan apapun
tentang derajat kerepresentatipannya. Misalnya ketika kita akan melakukan penelitian
mengenai kompetensi dosen di sebuah Universitas, pertanyaan dapat diajukan kepada
siapapun mahasiswa dari universitas tersebut (sebagai sampel) yang kebetulan datang
pada saat kita berada di sana untuk melakukan penelitian.

I.5 TEKNIK PENYAJIAN DATA SAMPEL

I.5.1 Penyajian Data

Penyajian data dilakukan untuk mempermudah dalam pengambilan keputusan. Data-


data yang kita ambil dari populasi atau biasa disebut sebagai data sampel, dapat diperoleh
dengan berbagai cara, antara lain:

 Wawancara

 Pengamatan

 Surat menyurat

 Kuisioner

Data mentah yang diperoleh dapat disajikan sebagai statistika tataan (pengurutan data)
dalam bentuk tabel distribusi frekuensi,histogram, box plot, diagram dahan daun, dan lain-
lain.
I.5.2 Tabel Distribusi frekuensi

Tabel distribusi frekuensi adalah metode pengelompokan data ke dalam beberapa


kategori yang menunjukan banyaknya data dalam setiap kategori. Setiap data tidak dapat
dimasukan ke dalam dua atau lebih kategori agar data menjadi informatif dan mudah
dipahami. Data yang sudah dirangkum dalam distribusi frekuensi dinamakan data
berkelompok.
Tabel I.2 Contoh tabel distribusi frekuensi

Kelas interval Frekuensi


3–5 2
6–8 5
9 – 11 7
12 – 14 1
15 - 17 1

 Langkah-langkah distribusi frekuensi:


1. Mengurutkan data dari data terkecil hingga data terbesar atau sebaliknya.
2. Menentukan banyaknya kelas dengan menggunakan kaidah Sturges, yaitu

k = 1 + 3,3 log N

N : banyaknya pengamatan
Banyaknya kelas sebaiknya antara 5 sampai dengan 15

3. Menentukan interval kelas (KI), dengan rumus :


X maks−X min jangkauan
KI = =
k k
KI sebaiknya kelipatan 5.
4. Melakukan penturusan atau tabulasi dengan memasukan nilai ke dalam interval
kelas.
5. Untuk komposisi kelas,perhatikan bahwa kelas tidak tumpang tindih (lihat batas
atas dan batas bawah tiap kelasnya kelas).
6. Bila tabel distribusi frekuensi akan digunakan untuk membuat histogram atau
poligon, maka komposisinya diubah ke bentuk batas kelas, yaitu batas bawah
dikurangi ( ½ x satuan pengukuran terkecil dari data) dan batas atas ditambah (½ x
satuan pengukuran terkecil dari data).
Batas kelas adalah nilai terendah dan tertinggi dalam satu kelas tabel distribusi
frekuensi. Batas kelas dalam suatu interval kelas terdiri dari dua macam :

 Batas kelas bawah – lower class limit, yaitu nilai terendah dalam suatu interval
kelas

 Batas kelas atas – upper class limit, yaitu nilai tertinggi dalam suatu interval
kelas

Contoh Batas Kelas :

Kelas Interval Jumlah Frekuensi (F)


1 215 2122 14
2 2123 4030 4
3 4031 5938 1
4 5939 7846 1
5 7847 9754 1

Batas
kelas
bawah
Batas
kelas
atas
Nilai tengah adalah tanda atau perinci dari suatu interval kelas dan merupakan suatu
angka yang dapat dianggap mewakili suatu interval kelas. Nilai tengah kelas berada di
tengah-tengah pada setiap interval kelas.

Contoh nilai tengah:


Kelas Interval Nilai tengah
1 215 2122 1168.5
2 2123 4030 3076.5
3 4031 5938 4984.5
4 5939 7846 6892.5
5 7847 9754 8800.5 Nilai
tengah
Kelas
Nilai tepi kelas (Class Boundaries) adalah nilai batas antara kelas yang memisahkan
nilai antara kelas satu dengan kelas lainnya. Nilai tepi kelaske 1 dihutung dengan
ini dapat
penjumlahan nilai atas kelas dengan nilai bawah kelas diantaranya=dan[di 215
bagi dua.

+
2122] /
2
Contoh nilai tepi kelas : =
Jumlah Frekuensi Nilai
1168.5
Tepi
Kelas Interval
(F) Kelas

1 215 2122 14 214.5

2 2123 4030 3 2122.5

3 4031 5938 1 4030.5


Nilai4 5939 7846
No Perusahaan
1
Harga saham
5938.5

tepi 5 78471 Jababeka


9754
2 Indofarma
1 215
290
7846.5

kelas 34 Budi Acid


Kimia farma
310
365
9754.5

ke 2
5 Sentul City 530
6 Tunas Baru 580
Contoh 1 : 7 proteinprima 650
= 8 total
9 Mandiri
750
840
1.
[ 2122 10 Panin
11 Indofood
1200
1280

+2123 12 Bakrie
13 Berlian
1580
2050

] / 2 1516 Bumi
14 Niaga 2075
resources 2175
BNI 3150
= 1718 EnergiBCA
mega 3600
5350

2122,5 19 Bukit Asam


20 Telkom
6600
9750
2. N = 20

k = 1 + 3,322 Log 20

k = 1 + 3,322 (1,301)

k = 1 + 4,322

k = 5,322

3. Nilai tertinggi = 9750

Nilai terendah = 215

Interval kelas = [ 9750 – 215 ] / 5 = 1907

Jadi interval kelas 1907 yaitu jarak nilai terendah dan nilai tertinggi dalam suatu kelas
atau kategori
2122

2123

Nilai
tere
ndah
Kelas Interval
1 215 2122
Kela
2 2123 4030 s ke
3 4031 5938 2
4 5939 7846
5 7847 9754
=
2122 Nilai
tertin
4. Lakukan penturusan atau tabulasi data
+1
Kelas Interval Frekuensi = ggi :(F)
Jumlah Frekuensi

1 215 2122 IIIII 2123


IIIII IIII 14
=
215
2 2123 4030 III 3
+
3 4031 5938 I 1
1907
4 5939 7846 I 1 =
5 7847 9754 I 1 2122

I.5.3 Distribusi Frekuensi Relatif :


Distribusi frekuensi relatif adalah frekuensi setiap kelas dibandingkan dengan
frekuensi total. Tujuan pembuatan distribusi ini adalah untuk memudahkan membaca data
secara tepat dan tidak kehilangan makna dari kandungan data.
Contoh Distribusi Frekuensi Relatif :

Jumlah Frekuensi
Kelas Interval Frekuensi relatif (%)
(F)

1 215 2122 14 70

2 2123 4030 3 15

3 4031 5938 1 5

4 5939 7846 1 5

5 7847 9754 1 5

Frekuen
si relatif
(%)
= [ 14 /
20 ] x
100 %
= 70 %
I.5.4 Penyajian dalam Bentuk Grafik
Manusia pada umunya tertarik dengan gambar dan sesuatu yang ditampilkan delam
bentuk visual karena akan lebih mudah diingat dari pada dalam bentuk angka. Untuk itu
grafik dapat digunakan sebagai laporan. Grafik juga dapat digunakan untuk menarik
kesimpulan tanpa kehilangan makna yang sesungguhnya.

1. Grafik Histogram
Penyajian dalam bentuk histogram tidak lain merupakan pengembangan dari bentuk
tabel frekuensi. Bentuk histogram memberikan gambaran frekuensi untuk setiap nilai atau
selang nilai tertentu dari data. Gambaran ini akan lebih memudahkan pengguna dalam
mengungkap informasi yang terkandung dalam data. Histogram merupakan diagram yang
berbentuk balok. Histogram menghubungkan antara tepi kelas interval dengan pada sumbu
horizontal (X) dan frekuensi setiap kelas pada sumbu vertikal (Y).
Contoh Histogram:

Kelas Interval Jumlah Frekuensi (F)

1 215 2122 14

2 2123 4030 3

3 4031 5938 1

4 5939 7846 1

5 7847 9754 1

Gambar I.2 Contoh


15 Histogram

10
2. Grafik Polygon

5
Grafik polygon menggunakan garis
0 yang mengubungkan titik–titik yang
Tepi K... merupakan koordinat antara nilai tengah
kelas dengan jumlah frekuensi pada kelas
tersebut.

Contoh Grafik Polygon:


Kelas Nilai Jumlah

  Tengah Frekuensi (F)

1 1168.5 14

2 3076.5 3

3 4984.5 1

4 6892.5 1

5 8800.5 1

Gambar I.3 Contoh Grafik Polygon


Jumlah Frekuensi (F)

16
14
12
10
Jumlah
8
Frekuensi (F)
6
4
2
0
1 2 3 4 5

3. Kurva Ogif

Kurva ogif merupakan diagram garis yang menunjukan kombinasi antara interval
kelas dengan frekuensi kumulatif.
Contoh kurva ogif:

Interval Frekuensi kumulatif


Kelas Nilai Tepi Kelas
Bawah Atas Kurang dari Lebih dari

1 215 2122 214.5 0 20

2 2123 4030 2122.5 14 6

3 4031 5938 4030.5 17 3


4 5939 7846 5938.5 18 2

5 7847 9754 7846.5 19 1

9754.5 20 0

Gambar I.4 Contoh kurva ogif

25
Frekuansi Kumulatif

20
15 Kurang dari
10 Lebih dari
5
0
1 2 3 4 5 6
Interval kelas

4. Box plot
Dalam membuat boxplot, pendekatan yang digunakan adalah dengan membagi
kumpulan data yang telah diurutkan menjadi empat bagian sama banyak. Keempat bagian
tersebut mempunyai lima pembatas, yaitu : data terkecil (Xmin), K1, K2 atau median, K3,
dan data terbesar (Xmax) seperti terlihat di bawah ini :

25% 25% 25% 25%

Xmin K1 K2 K3 Xmax

Pembatas-pembatas tersebut biasa juga disebut dengan Statistik Lima Serangkai.

Kegunaan : Secara visual, boxplots dapat menggambarkan :

 Lokasi pemusatan, yang diwakili oleh nilai median


 Rentangan penyebaran, diperlihatkan oleh panjangnya kotak yang merupakan jarak
antara K1 dan K3
 Kemiringan pola sebaran data, ditunjukkan oleh letak median dalam kotak, letak
median lebih dekat ke K1 mencirikan suatu sebaran dengan kemiringan positif
(menjulur kekanan), dan kemiringan negatif terjadi bilaposisi median lebih dekat ke
K3.

Selain itu, dengan menggunakan boxplots kita dapat pula mendeteksi ada atau
tidaknya data pencilan (data ekstrim). Data pencilan dideteksi dengan menggunakan nilai-
nilai Pagar Dalam (PD) dan Pagar Luar (PL). Nilai-nilai pagar tersebut dihitung
menggunakan rumus :

Nilai data yang terletak antara PD dan PL dikategorikan sebagai data pencilan dekat
(∗), dan nilai data yang terletak di luar PL dikategorikan sebagai data pencilan jauh (ο).

Gambar I.5 contoh boxplot

5. Diagram dahan daun


Diagram dahan daun adalah suatu cara mencatat data secara tersusun. Diagram ini
sangat berguna pada saat kita ingin menyajikan data dalam bentuk gambar tentang bentuk
sebarannya tanpa kehilangan informasi nilai numerik dari data. Penggunaan diagram dahan-
daun memungkinkan kita untuk mengelompokkan data sekaligus memberi kita informasi
visual; panjang tiap baris memperlihatkan frekuensi tiap baris. Terdapat kesamaan fungsi
antara histogram dan diagram dahan-daun, yaitu mengelompokkan data, tetapi pada
histogram, kita kehilangan informasi tentang nilai numerik dari data.
Diagram dahan-daun sangat mudah dibuat. Angka-angka data kita bagi menjadi dua
bagian, bagian pertama menjadi dahan, dan bagian kedua menjadi daun. Angka yang menjadi
daun biasanya adalah satu atau dua angka terakhir.

Gambar I.6 contoh diagram batang daun

Stem-and-leaf of C1 N = 30
Leaf Unit = 1.0
3 0 333
5 0 45
7 0 66
11 0 8899
(6) 1 000011
13 1 2223
9 1 55
7 1 6
6 1 88
4 2 01
2 2
2 2 44
SOAL – SOAL SAMPLING

1. Jelaskan apa yang dimaksud dengan:


a) Sampling seadanya
b) Sampling purposif
c) Sampling pertimbangan
d) Sampling kuota
e) Sampling nonpeluang
f) Sampling peluang
g) Sampling acak
h) Sampling proporsional
i) Sampling petala
j) Sampling area
k) Sampling sistematik
l) Sampling ganda
m) Sampling tunggal
n) Sampling multiple
o) Sampling sekuensial
p) Sampling klaster

2. Apa yang dimaksud dengan kekeliruan sampling? Jelaskan pula apa yang dimaksud
dengan kekeliruan nonsampling!

3. Sebuah populasi berukuran N. Diambil sampel berukuran n dengan cara:


a) Pengembalian
b) Tanpa pengembalian
c) Ada berapa buah sampel yang mungkin?

4. Diberikan sebuah populasi dengan data:

23, 23, 21, 21, 22, 21, 20, 22, 23, 24

Diambil sampel berukuran dua.

a) Ada berapa buah sampel semuanya?


b) Berikan semua sampel yang mungkin!
c) Tentukan rata-rata tiap sampel!
d) Dari rata-rata yang didapat, hitunglah lagi rata-ratanya!
e) Hitunglah rata-rata populasi!
f) Bandingkan hasil poin d. dan poin e. Apa yang tampak?

5. PT Danun Jaya berlokasi di Jl. Solo Km 4 merupakan perusahaan batik sutera yang
relatif besar. Pada tahun 2003 terdapat 120 desain produk yang dihasilkan. Apabila
PT Danun Jaya ingin mengetahui keberhasilan dari setiap desain produk tersebut
dengan mengambil 10 sampel. Dengan menggunakan tabel acak, cobalah cari nomor
berapa saja yang menjadi sampel PT Danun Jaya dengan titik awal adalah baris dan
kolom ke-1.

6. PT Bawasda Tunggal Perkasa (BTP) merupakan produsen sepatu. PT BTP ingin


mengetahui permasalahan produksi yang dialami oleh 60 perusahaan bimbingannya.
Untuk keperluan tersebut dilakukan survei terhadap 30 perusahaan dengan
menggunakan metode terstruktur porporsional. Berikut adalah jumlah perusahaan
masing-masing strata, tentukan berapa jumlah sampel setiap stratanya.

Kelompok/Strata Jumlah Perusahaan

Tenaga kerja 1-5 5

Tenaga kerja 6-10 15

Tenaga kerja 11-15 20

Tenaga kerja 16-20 5

Tenaga kerja 21-25 10

Tenaga kerja >25 5

7. Diketahui populasi yang terdiri dari 4, 3, 9, 7.

Diambil sampel ukuran n=2. Jika diambil dengan pengembalian,

Carilah:

a) Rata2 dan simpangan baku populasi


b) Rata2 dan simpangan baku distribusi sampelnya.
c) Berapa prob. Rata2 sampel ukuran 2 akan akan mempunyai nilai minimal 6?

8. Diketahui data sbb:

Umur: 29 33 37 38 39 40 42 43 45 47 50 59

Frek.: 1 13 4 2 3 2 2 3 1 1 1

Buatlah diagram kotak garisnya /box plot


BAB II DISTRIBUSI SAMPLING

PENDAHULUA
N

Distribusi sampling didasarkan pada lima kategori sesuai dengan kondisi yang dihadapi
yaitu:

a) Distribusi sampling rataan Z


b) Distribusi sampling rataan T
c) Distribusi sampling proporsi
d) Distribusi sampling proporsi 2 populasi
e) Distribusi sampling variansi

TUJUAN INSTRUKSIONAL
UMUM

Setelah mempelajari materi ini mahasiswa dapat menggunakan dan menghitung berdasarkan
macam-macam distribusi sampling.

TUJUAN INSTRUKSIONAL KHUSUS


1. Mahasiswa dapat memahami konsep dasar distribusi sampling

2. Mahasiswa akan dapat mengetahui berbagai macam distribusi sampling

1………….
2………….
SKENARIO PEMBELAJARAN
3………….
4………….

Kegiatan perkuliahan dilaksanakan dengan skenario sebagai berikut:

1. Perkuliahan
2. Penjelasan tentang concept map (tunjukan di peta konsep dimana posisi materi yang
akan dibahas), pokok bahasan, dan kompetensi yang akan dicapai (TIU dan TIK)
3. Tes pendahuluan
4. Ringkasan materi disampaikan dengan metode ceramah, critical incident, diskusi dan
tanya jawab
5. Tes akhir
6. Evaluasi pencapaian
7. Penutup

RINGKASAN MATERI

Bidang statistika sering membahas mengenai generalisasi/penarikan kesimpulan dan


prediksi/ peramalan dari suatu kasus atau penelitian terhadap suatu populasi. Tetapi
Generalisasi dan prediksi tersebut sangat jarang melibatkan populasi karena keterbatasan
kemampuan penelitian dan begitu besarnya jumlah populasi, sehingga lebih sering
menggunakan sampel dari populasi tersebut.
Sebagai contoh, suatu mesin pelayanan minuman yang diatur rata-rata mengeluarkan
250 ml minuman per gelasnya. Kemudian seorang karyawan menghitung rataan 40 gelas
minuman yang dikeluarkan dari mesin tadi dan memperoleh x́ = 246 ml, dan berdasarkan
hasil ini diberikan kesimpulan bahwa mesin tadi masih mengeluarkan minuman dengan rata-
rata isi μ = 250 ml. ke 40 gelas minuman tadi merupakan sampel dari populasi minuman yang
tak terhingga dari kemungkinan isi minuman yang akan dikeluarkan mesin tadi. Kesimpulan
ini mungkin diambil karena karyawan tadi tahu dari teori sampling bahwa nilai sampel
seperti itu kemungkinan munculnya besar. Tetapi apabila nilai x́ yang didapat nantinya
berbeda jauh dari 250 ml maka petugas tadi akan mengambil tindakan memperbaiki mesin
tersebut. Hal ini dikarenakan statistik merupakan peubah acak yang tergantung hanya pada
sampel yang diamati, maka tentulah ada distribusi peluangnya. Distribusi peluang suatu
statistik disebut dengan distribusi sampel.

II.1 DISTRIBUSI SAMPLING RATAAN Z


Misalkan sampel acak n pengamatan diambil dari populasi normal dengan rataan μ dan
variansi σ2. Tiap pengamatan X́ i, i = 1,2,…,n, dari sampel acak tersebut akan berdistribusi
normal yang sama dengan populasi yang diambil sampelnya. Jadi, berdasarkan sifat
merambat distribusi normal, dapat disimpulkan bahwa

X 1+ X 2 +…+ X 3
X́ =
n

Berdistribusi normal dengan rataan

μ+ μ +…+ μ
μ X́ = =μ
n

Dan variansi

2 σ 2 +σ 2+ …+σ 2 σ 2
σ X́ = =
n2 n
CONTOH MENGHITUNG RETURN ON ASSET
Bank Retun On Asset %
Bank Bukopin 2
Bank BCA 4
Citi Bank 6
Bank Jabar 4
Bank Tugu 4

a. Nilai rata-rata populasi

 = X/N = 2 + 4 + 6 + 4 + 4 = 20/5 = 4
5
b. Nilai rata-rata populasi dan sampel apabila
diambil sampel 2 dari 5 bank

1) Kombinasi

N
C = N!/n! (N - n)! = 5!/2!(5 - 2)! = 10
n
CONTOH MENGHITUNG RETURN ON ASSET
2) Perhitungan rata-rata dari setiap sampel
Bank Kombinasi Retun On Asset % Rata-rata Hitung x
Bukopin-BCA 2+4 (6/2)= 3
Bukopin-Citibank 2+6 (8/2)= 4
Bukopin-Bank Jabar 2+4 (6/2)= 3
Bukopin-Bank Tugu 2+ 4 (6/2)= 3
BCA-Citibank 4+6 (10/2)= 5
BCA-Bank Jabar 4+4 (8/2)= 4
BCA-Bank Tugu 4+4 (8/2)= 4
Citi Bank-Bank Jabar 6+4 (10/2)= 5
Citi Bank-Bank Tugu 6+4 (10/2)= 5
Bank Jabar-Bank Tugu 4+4 (8/2)= 4

3) Nilai rata-rata sampel

1
X X
CnN

1
X 3  4  3  3  5  4  4  5  5  4  40/10  4
10
CONTOH MENGHITUNG RETURN ON ASSET

c. Nilai rata-rata populasi


Populasi Sampel
Nilai X Frekuensi Probabilitas Nilai Frekuensi Probabilitas
X
2 1 (1/5)= 0,20 3 3 (3/10)= 0,30
4 3 (3/5)= 0,60 X 4 4 (4/10)= 0,40
6 1 (1/5)=0,20 5 3 (3/10)= 0,30
Jumlah 5 1.00 10 1.00

Distribusi probabilitas dalam bentuk poligon

0,7 0,5
0,6
0,4
0,5
0,4 0,3
0,3 0,2
0,2
0,1
0,1
0 0
2 4 6 3 4 5
CONTOH MENGHITUNG RETURN ON ASSET

d. Standar deviasi populasi

 (X  ) 2

Standar deviasi populasi 


N
X (X - )
(X - ) (
(XX--)
2
) 2
2 -2 4
4 0 0
6 2 4
4 0 0
4 0 0
X = 20 ( X - ) 2= 8.0

 = 20/5 = 4  =  ( X - ) 2/N = 8/5 = 1,3


CONTOH MENGHITUNG RETURN ON ASSET

1
Standar deviasi sampel
  X  x
2
s
CNn

X (X - X ) ( X - X) 2
3 -1 1
4 0 0
3 -1 1
3 -1 1
5 1 1
4 0 0
4 0 0
5 1 1
5 1 1

X = 40 ( X -X) 2= 6,0
x = 40/10 = 4 x =  1/CN n ( X -x) 2 =6/10 = 0,77

HUBUNGAN STANDAR DEVIASI SAMPEL


DAN POPULASI

Hubungan antara  x dan  untuk populasi terbatas

 Nn
s
n N 1

Hubungan antara x dan  untuk populasi yang tidak terbatas


s 
n
Bila populasi yang diambil sampelnya dan tidak diketahui distirbusinya, berhingga atau tidak,
maka distribusi sampel X́ masih akan berdistribusi hampir normal dengan rataan μ dan
variansi σ2/n, asalakan ukuran sampelnya besar (n > 30). Hal ini dikenal dengan Teorema
Limit Pusat, yaitu bila X́ rataan sampel acak ukuran n yang diambil dari populasi dengan
rataan μ dan variansi σ2 yang berhingga, maka bentuk limit dari distribusi

X́−μ
Z=
σ /√n

bila n ∞, adalah distribusi normal baku n(z;0,1)

Hampiran normal untuk X́ umumnya cukup baik jika menggunakan sampel ukuran
besar (n > 30), terlepas dari bentuk populasi. Bila menggunakan sampel ukuran kecil (n <
30), hampirannya hanya akan baik bila populasinya tidak jauh berbeda dengan normal. Bila
populasinya normal, maka distribusi sampel X́ akan tepat berdistribusi normal, dan ukuran
sampelnya tidak menjadi masalah.

Contoh :

Suatu perusahaan memproduksi bola lampu yang umurnya berdistribusi hampir normal
dengan rataan 800 jam dan simpangan baku 40 jam. Hitunglah peluangnya bahwa
suatu sampel acak dengan 16 bola lampu akan mempunyai umur rata-rata kurang dari
775 jam.
Jawab :

Secara hampiran, distribusi sampel X́ akan normal dengan μ X́ = 800


dan σ X́ = 40 / √ 16 = 10. Peluang yang dicari diberikan oleh luas daerah
yang dihitami pada Gambar 1.1. Nilai z yang berpadanan dengan x́ =
775 adalah

775−800
z= =−2,5
10

Sehingga

P( X́ < 775) = P(Z < -2,5)

= 0,0062

Gambar 1.1

Sekarang misalkan ada dua populasi, yang pertama dengan rataan 1 dan variansi σ21,
dan yang kedua dengan rataan 2 dan variansi σ22. Misalkanlah statistik 1 menyatakan rataan
sampel acak ukuran n1 yang diambil dari populasi pertama, dan statistik 2 menyatakan
rataan sampel acak ukuran n2 yang diambil dari populasi kedua, dan kedua sampel bebas satu
sama lain. Maka distribusi sampel dari selisih rataan, , berdistribusi hampir normal
dengan rataan dan variansi :

μ X́ −X́ =μ1−μ 2
1 2

2 σ 21 σ 22
σ X́ −X́ = +
n1 n 2
1 2

σ X́ =10
Sehingga

( X́ 1− X́ 2 )−( μ 1−μ2 )
Z=
√ (σ 12 /n1 )+( σ 22 /n2 )

Secara hampiran merupakan peubah normal baku.

Jika (n1 dan n2 > 30), maka hampiran normal untuk distribusi X́ 1 − X́ 2 sangat baik tidak
tergantung dari bentuk kedua populasi. Tetapi, bila (n1 dan n2 < 30), maka hampiran normal
lumayan baik kecuali bila kedua populasi agak jauh dari normal. Tentu saja bila kedua
populasi normal, maka X́ 1 − X́ 2 berdistribusi normal terlepas dari ukuran n1 dan n2.

Contoh :

Suatu sampel berukuran n1 = 15 diambil secara acak dari populasi yang berdistribusi
normal dengan rataan μ1 = 50 dan variansi σ21 = 9, dan rataan sampel x́ 1 dihitung. Sampel
acak kedua berukuran n2 = 4 diambil, bebas dari yang pertama, dari populasi lain yang juga
berdistribusi normal, dengan rataanμ2 = 40 dan variansi σ21 = 4, dan rataan sampel x́ 2
dihitung. Cari nilai P( X́ 1 − X́ 2 < 8,2)!
SKEMA SELISIH POPULASI ATAU SAMPEL

Sampel 1
Populasi 1
berukuran
 1, 1
X 1, Sx1

Apakah
X1 , X 2   1 ,  2

Populasi 2 Sampel 2
 2, 2 berukuran
X 2 , Sx2

OUTLINE

X x1 x2  X1  X 1   1   2

Distribusi selisih rata-rata

Pp1  p 2  P p1  P p 2  p1  p 2

Distribusi selisih proporsi


Jawab :

Dari distribusi sampel X́ 1 − X́ 2 kita tahu bahwa distribusinya normal dengan :

Rataan : μ X́ −X́ =μ1−μ 2=50−40=10


1 2

2 σ 21 σ 22 9 4
Variansi : σ X́ − X́
= + = + =2,8
1 2
n1 n 2 5 4

Peluang yang dicari dinyatakan oleh luas daerah yang dihitami di Gambar 1.2.
berpadanan dengan nilai x́ 1−x́ 2 = 8,2, diperoleh

8,2−10
z= =−1,08
√2,8
Sehingga

P( X́ 1 − X́ 2 < 8,2) = P(Z < −1,08)

= 0,1401

DISTRIBUSI SAMPLING RATAAN t

Untuk ukuran sampel besar (n > 30), taksiran σ2 yang baik dapat diperoleh dengan
menghitung nilai S2. Bila ukuran sampelnya kecil (n < 30), nilai S2 akan berubah cukup besar

X́−μ
dari sampel ke sampel lainnya dan distribusi peubah acak ( ) menyimpang cukup jauh
σ /√ n
dari distribusi normal baku. Dalam hal ini kita menghadapi distribusi statistic yang
dinamakan distribusi t, dengan

X́−μ
t=
S/ √ n

Misalkan Z peubah acak normal baku dan V peubah acak khi-kuadrat dengan derajat
kebebasan v. bila Z dan V bebas, maka distribusi peubah acak T, bila

σ X́ − X́ =1,673
1 2
Z
T=
√V /v

Diberikan oleh

−(v+1 )/ 2
Г [ ( v +1 ) /2] t2
h(t)=
Г ( v +2 ) √ π v ( )
1+
v
, −∞<t <∞

Ini dikenal dengan nama distribusi t dengan derajat kebebasan v.

Dalam menurunkan distribusi sampel T, akan kita misalkan bahwa sampel acaknya berasal
dari populasi normal. Selanjutnya :

( X́ −μ)/(σ / √n) Z
T= 2 2
= ,
√ S /σ √V /(n−1)

Dengan

X́−μ
Z=
σ /√n

Berdistribusi normal baku, dan

( n−1) S 2
V=
σ2

Berdistribusi chi-kuadrat dengan derajat kebebasan v = n – 1. Jika sampel berasal dari


populasi normal maka dapat dibuktikan bahwa X́ dan S2 bebas, oleh karena itu Z dan V juga
bebas. Sekarang akan kita turunkan distribusi T.

Distribusi T mirip dengan distribusi Z, keduanya setangkup terhadap rataan nol. Keduanya
berbentuk lonceng, tapi distribusi t lebih berbeda satu sama lain karena nilai T tergantung
pada dua besaran yang berubah-ubah, X́ dan S2, sedangkan nilai Z hanya tergantung pada
perubahan X́ dari sampel ke sampel lainnya. Distribusi T dan Z berbeda karena variansi T
bergantung pada ukuran sampel n dan variansi ini selalu lebih besar dari 1. Hanya bila ukuran
sampel, n ∞, kedua distribusi menjadi sama. Gambar 1.3 di bawah memperlihatkan
hubungan antara distribusi normal baku (v = ∞) dan distribusi t untuk derajat kebebasan 2
dan 5.

V=5
V=2

Gambar 1.3 Kurva distribusi t

Distribusi t setangkup terhadap rataan nol, maka t 1−∝ =−t ∝, yaitu nilai t yang luas sebelah
kanannya 1−∝, atau luas sebelah kirinya ∝, sama dengan minus nilai t yang luas bagian
kanannya ∝

t 1−∝ =−t ∝ 0 t∝
Contoh :

Suatu pabrik bola lampu yakin bahwa bola lampunya akan tahan menyala rata-rata selama 500
jam. Untuk mempertahankan nilai tersebut, tiap bulan diuji 25 bola lampu. Bila nilai t
yang dihitung terletak antara -t0,05 dan t0,05 maka pengusaha pabrik tadi
akan mempertahankan keyakinannya. Kesimpulan apakah yang seharusnya dia ambil dari
sampel dengan rataan X́ = 518 jam dan simpangan baku s = 40 jam ? Anggap bahwa distribusi
waktu menyala ,secara hampiran,normal.

Jawab :

Dari tabel t, diperoleh t 0,05 = 1,711 untuk derajat


kebebasan v = 25 – 1 = 24. Jadi pengusaha tadi akan
puas dengan keyakinannya bila sampel 25 bola lampu
memberikan nilai t antara -1,711 dan 1,711. Bila
memang μ = 500, maka :

518−500
t= =2,25
40 / √ 25

Suatu nilai yang cukup jauh di atas 1,711. Peluang


mendapat nilai t, dengan derajat kebebasan v =
24, sama atau lebih besar dari 2,25, secara
hampiran adalah 0,02. Bila μ > 500, nilai t hasil
perhitungan dari sampel tadi akan terasa lebih wajar.
Jadi pengusaha tadi kemungkinan besar akan
menyimpulkan bahwa produksinya lebih baik daripada
yang didudaganya semula.

II.2 DISTRIBUSI SAMPLING PROPORSI


Bila populasi berukuran N mengandung jenis p sebanyak X, maka proporsi p adalah X/N.
Jika dari populasi tersebut diambil sampel berukuran n yang juga mengandung proporsi x/n
dan sampel diambil berulang maka distribusi sampel proporsinya mempunyai :

1. Rata-rata
X
μ ^p=μ p=
N
2. Simpangan baku jika populasi terbatas atau sampling tanpa pengembalian atau n/N
>5% :
p ( 1− p ) N −n
σ ^p=
√ n
.
N−1√
3. Simpangan baku jika populasi tidak terbatas, atau sampling dengan pengembalian
atau n/N < 5%
p ( 1− p )
σ ^p=
√ n
.

4. Variabel random
^p − p
Z=
σ ^p
Contoh :
Diketahui sebanyak 10% dari ibu-ibu rumah tangga di Bandung memakai detergen A untuk
mencuci pakaiannya. Jika dari populasi tersebut diambil sampel berukuran 100 :
a. Tentukan rata-rata dan simpangan baku sampel dari populasi ibu-ibu rumah tangga
yang memakai detergen A!
b. Bila dari sampel tersebut ternyata terdapat paling sedikit 15 ibu rumah tangga yang
memakai detergen A, tentuka probabilitasnya!

Jawab:

a. Rata-rata = 0,1
p ( 1− p ) 0,1.0,9
σ ^p=
√ n
=

100
=0,03

b. Proporsi yang memakai detergen A adalah 15/100 = 0,15


^p − p 0,15−0,1
Z= = =1,67
σ ^p 0,03
P(Z>1,67) = 0,5-0,4525 = 0,0475
II.3 DISTRIBUSI SAMPLING PROPORSI 2 POPULASI
Terdiri dari 2 populasi.
Populasi 1 berukuran N 1 terdapat jenis X 1 dengan proporsi X 1 / N 1
Populasi 2 berukuran N 2 terdapat jenis X 2 dengan proporsi X 2 / N 2
Bila populasi 1 diambil sampel acak berukuran n1 maka sampel ini akan mengandung
jenis x 1 dengan proposi x 1 / ¿ n1. Demikian juga dengan populasi 2 diambil sampel acak
berukuran n2 maka sampel ini juga akan mengandung jenis x 2 dengan proporsi x 2 /n2
Smapel 1 dan 2 dapat membentuk sampel acak baru yaitu sampel beda dua proporsi.
Distribusinya mempunyai :
a) Rata-rata
μ ^p − ^p = p1− p 2
1 2

b) Simpangan baku
p1 ( 1− p1 ) p2 ( 1− p2 ) ( N 1+ N 2) −( n 1+ n2 )
σ ^p −^p =
1

c) Variabe random
2
√ n1
+
n2
.
√ ( N 1−N 2 )−1

( ^p ¿ ¿ 1− ^p2 )−( p 1−p 2)


Z= ¿
σ ^p −^p
1 2

Contoh :

5% barang di gudang timur cacat, sedangkan barang yang cacat di gudang barat sebanyak
10%. Bila diambil sampel acak sebanyak 200 barang dari gudang timur dan 300 barang dari
gudang barat, tentukan probabilitas persentase barang yang cacat dalam gudang barat 2%
lebih banyak disbanding gudang timur!

Jawab :

Gudang barat : n1 =300 , p1=0,1

Gudang timur: n2 =200 , p2 =0,05

^p1 = proporsi barang yang cacat di gudang barat dalam sampel

^p2 = proporsi barang yang cacat di gudang timur dalam sampel

p1 ( 1− p1 ) p2 ( 1− p2 )
σ ^p −^p =
1 2
√ n1
+
n2
=
0,1 ( 0,9 ) 0,05 ( 0,95 )
300√ +
200
=0,023
( ^p ¿ ¿ 1− ^p2 )−( p 1−p 2) ( ^p ¿ 1− ^p2 )−(0,1−0,05)
Z= ¿= ¿ ¿
σ ^p −^p
1 2
0,023

Karena barang cacat di gudang barat 2% lebih banyak daripada di gudang timur maka
( ^p ¿ ¿ 1− ^p2 )¿ > 0,02 sehingga diperoleh :

0,02−0,05
z= =−1,3
0,023

Jadi probabilitasnya adalah P ( ^p ¿ ¿ 1− ^p2 >0,02)¿ = P (Z > -1,3) = 0,5 + 0,4032 = 0,9032 =
90,32 %

II.4 DISTRIBUSI SAMPLING VARIANSI


Bila sampel berukuran n diambil dari populasi normal dengan variansi σ 2, dan variansi
sampel s2 dihitung maka kita peroleh suatu nilai dari statistic S2. Variansi sampel hasil
perhitungan ini akan digunakan sebagai taksiran titik untuk σ 2. Karena itu statistic S2 disebut
penaksir σ 2.

Taksiran selang untuk σ 2 dapat diturunkan dengan menggunakan statistic.

(n−1)S 2
X2=
σ2

Contoh

Suatu pabrik baterai mobil menjamin bahwa baterai akan tahan rata-rata 3 tahun dengan
simpangan baku 1 tahun. Bila lima baterainya tahan 1,9,2,4,3,0,3,5,dan 4,2 tahun, apakah
pembuatnya masih yakin bahwa simpangan baku baterai tersebut 1 tahun?

Jawab

Mula-mula dihitung variansi sampel :

( 5 ) ( 48,26 ) −(15)2
s2= = 0,815
( 5 ) (4)

Kemudian

( 4 ) ( 0,815)
X2= =3,26
1
Merupakan suatu nilai distribusi khi-kuadrat dengan derajat kebebasan 4. Karena 95% nilai
X 2 dengan derajat kebebasan 4 terletak antara 0,484 dan 11.143, nilai perhitungan dengan
menggunakan σ 2 = 1 masih wajar,sehingga tidak ada alasan bagi pembuatnya untuk
mencurigai bahwa simpangan baku baterainya bukan 1 tahun
SOAL – SOAL

1. Sebuah populasi berukuran 80 mempunyai rata-rata 69,7 dan varians 3,50. Dengan
sampling pengembalian diambil 1000 buah sampel acak yang masing-masing berukuran
5. Untuk tiap sampel dihitung rata-rata dan variansnya. Berapa nilai yang kita harapkan
untuk :

a) rata-rata ke 1000 rata-rata?


b) varians ke 1000 rata-rata?
c) rata-rata ke 1000 varians?

2. Misalkan bahwa tinggi rata-rata mahasiswa Indonesia 162 cm dengan simpangan baku
6,5 cm. Sebuah sampel acak akan diambil dengan syarat bahwa galat baku rata-rata
maksimum 0,5 cm.

a) Berapa paling sedikit mahasiswa perlu diambil sebagai sampel?

Dengan ukuran sampel yang terkecil, tentukan peluang rata-rata tinggi mahasiswa :

a) Paling sedikit 155 cm


b) Paling besar 175 cm
c) Antara 158 cm dan 172 cm
d) Kurang dari 160 cm

3. Lihat soal nomer 2 diatas. Misalkan populasinya berdistribusi normal. Ada berapa buah
sampel diharapkan akan mempunyai rata-rata :

a) antara 62 dan 72
b) paling sedikit 72,5
c) kurang dari 67

5. Diberikan dua buah populasi dengan:

data populasi I: 3,2,3,5,4,8.


data populasi II: 10,12,15,10.

a) Dari populasi I diambil semua sampel acak berukuran 3 dan dari populasi II
semua yang berukuran 2. Tulislah semua sampelnya lalu :
b) Hitung rata-rata kedua populasi.
c) Hitung rata-rata distribusi sampling rata-rata dari kedua populasi itu. Sebut ini
µx dan µy.
d) Hitung µx - µy dan bandingkan dengan selisih rata-rata populasi I dan
populasi II. Apa yang nampak?
e) Bagaimana untuk µx + µy ?

6. Macam lampu A rata-rata menyala 1.400 jam dan macam lampu B menyala 1.300
jam. simpangan bakunya masing-masing 160 jam dan 125 jam. dari tiap populasi
diambil sebuah sampel acak yang berukuran 85 dari sampel lampu A dan 100 dari
sampel lampu B. Tentukan peluang rata-rata menyala lampu dalam sampel dari A
paling sedikit akan 50 jam lebihnya dari rata-rata menyala lampu dalam sampel dari
B.

7. Besi baja yang diproduksi perush A mempunyai rata-rata daya regang sebesar 4500
lbs dan variansi sebesar 40000 lbs. Sedangkan yang diproduksi perush. B mempunyai
rata-rata daya regang sebesar 4000 lbs dan variansi 90000 lbs. Misalkan sampel
random sebanyak n1= 50 diambil dari perush. B . Berapakah probabilitas rata-rata
daya regang beda dua rata-rata dari dua sampel itu yang lebih besar dari 600 lbs?

8. Berikut adalah harga saham dari 5 perusahaan dalam Industri pertanian di BEJ 12
Januari 2004.

Perusahaan Harga persaham

PT Rajawali 275

PT Bukaka Plantindo 280

PT London 500

PT Inti Boga 350

PT Surya Pangan 575


Nusantara

Apabila diambil sampel berukuran 2 untuk mengetahui kinerjanya, hitunglah rata-rata


hitung dan standar deviasi sampel serta populasi, dan berapa probabilitas perusahaan
dengan harga diatas 400 terpilih sebagai sampel?

8. Berikut adalah hasil investasi pada 5 perusahaan reksadana untuk tahun 2003

Perusahaan Hasil Investasi (%/tahun)

Nikko 17

Investa 15

GTF Tunai 10

Dana Investa 11

Phinis Dana Kas 14

Seorang investor ingin menanamkan modal di reksadana dengan mencoba survei pada 3
perusahaan reksadana. Hitunglah berapa nilai rata-rata dan standar deviasi dari distribusi
sampel rata-rata. Berapa peluang terpilihnya perusahaan untuk disurvey dengan harapan
perusahaan tersebut mempunyai hasil investasi di atas 13%.

9. PT Caraka Bumi merencanakan akan memergerkan dua perusahaan yaitu PT Indah


Karya dan PT Dharma Raya. PT Caraka Bumi juga merencanakan PHK dalam rangka
efisiensi yaitu pada PT Indah Karya sekitar 10% dan PT. Dharma Raya 15% dari total
karyawan yang ada. Untuk keperluan tersebut, dipanggil 100 karyawan dari PT Indah
Karya dan 200 dari PT Dharma Raya untuk wawancara. Berapa probabilitas beda
persentase tentang PHK di PT Indah Karya 5% akan lebih kecil dari PT Dharma
Raya?

10. PT PSK Jaya mempunyai dua anak perusahaan yaitu PT AYU yang bergerak dalam
konveksi dan PT NANI ABADI yang bergerak dalam realestate. Kedua diharapkan
mempunyai kinerja yang sama baiknya. Pengamatan selama 30 bulan PT AYU.
menunjukan keuntungan rata-rata 500 juta dengan standar deviasi 75 juta. Sedangkan
pengamatan terhadap PT NANI ABADI selama 50 bulan menunjukkan keuntungan
rata-rata 300 juta dengan standar deviasi 52 juta. Apabila PT PSK menginginkan
selisih dari kedua perusahaan kurang dari 150 juta, berapa peluang keinginan tersebut
tercapai?

11. Hitunglah peluang bahwa suatu sampel acak ukuran 25 pengamatan, diambil dari
populasi normal dengan variansi σ 2 = 6, akan mempunyai variansi s2
a) Lebih besar dari 9,1;
b) Antara 3,462 dan 10,745
c) Misalkan bahwa variansi sampel merupakan pengukuran yang kontinu.

12. Ada anggapan bahwa peluang usaha di Jawa untuk relatif berhasil lebih besar
dibandingkan dengan di luar Jawa. Sebuah survey menunjukkan bahwa 200 UKM di
Jawa, 45%-nya berhasil dan 100 UKM di luar Jawa, 30%-nya berhasil. Apabila
pemerintah menginginkan perbedaan di Jawa dan Luar Jawa hanya 5%, berapa
peluang keinginan tersebut tercapai.

13. Suatu perusahaan menyatakan bahwa baterai yang dipakai dalam mainan
elektroniknya akan tahan rata-rata 30 jam. Untuk mempertahankan nilai ini, 16
baterai diuji setipa bulan. Bila diperoleh nilai – t berada antara −t 0,025 dan t 0,025 maka
perusahaan puas dengan pernyataannya. Kesimpulan apa yang seharusnya diambil
perusahaan dari sampel acak yang mempunyai x́ = 27,5 jam dengan simpangan baku s
= 5 jam? Anggap baterai berdistribusi hampiran normal.

14. Suatu perusahaan rokok mengatakan bahwa rata-rata kadar nikotin rokoknya 1,83 mg.
Apakah anda setuju dengan pendapat pengusaha rokok tersebut bila suatu sampel
ukuran 8 rokok dari perusahaan tersebut mengandung kadar nikotin 2.0, 1.7, 2.1, 1.9,
2.2, 2.1, 2.0, dan 1.6 mg?

15. Dari sekelompok pegawai yang terdiri atas 40.000 orang telah diambil sekelompok
kecil sebanyak 100 orang . Yang menjadi perhatian disini ialah penghasilan pegawai
tiap bulan. Apabila ditaksir bahwa keseluruhan pegawai pukul rata mempunyai
pendapatan Rp. 27500 dengan simpangan baku Rp. 1000 maka:
a) Untuk kelompok kecil tadi , berapa rata-rata upahnya akan antara Rp.25000
dan Rp.30.000?
b) Seperti di a tapi paling rendah Rp. 20.000?
c) Apabila dikehendaki perbedaan rata-rata upah untuk tiap kelompok paling
besar Rp. 500, maka setiap kelompok itu paling sedikit harus terdiri atas
berapa orang pegawai yang perlu diambil secara acak?
16. Dalam setiap pengiriman gelas minum , biasanya 95% diterima dalam keadaan baik.
Pada suatu waktu telah dikirimkan 100.000. buah gelas. Berapa peluangnya untuk
pemeriksaan yang terdiri dari 60 buah gelas dari pengiriman itu, akan berisikan gelas
yang baik:
a) Antara 90% dan 98%?
b) Paling sedikit 97,5%?

17. A dan B menghasilkan dua macam kabel, yang daya tahannya masing-masing pukul
rata 4000 dan 4500 kg dengan simpangan baku berturut-turut 300 dan 200 kg. Jika
dari kabel yang dihasilkan oleh A diuji 100 potong sedangkan dari yang dihasilkan B
diuji 50 potong, maka tentukanlah peluangnya pukul rata daya tahan kabel B akan:
a) Paling sedikit 600 kg lebih daripada daya tahan kabel A?
b) Paling banyak 450 kg lebih daripada daya tahan kabel A?

18. Pengalaman memperlihatkan bahwa dikota A sekitar 65% dari para ibu ternyata lebih
menyenangi sabun mandi XYZ bila dibandingkan dengan sabun-sabun mandi merk
lain. Tentukanlah berapa peluangnya bahwa dua buah sampel acak yang terdiri atas
para ibu dikota itu, tiap sampel terdiri atas 200 ibu, akan memperlihatkan perbedaan
lebih dari 10% yang menyenangi sabun mandi XYZ.

19. Misalkan X peubah acak binomial dengan distribusi peluang :

3
f (x )=( )(2 /5 ) x (3/5)3−x
x x=0,1,2,3

= 0 untuk lainnya

2
Carilah distribusi peluang peubah acak Y = X

20. Misalkan x́ adalah rata-rata dari sampel acak ukuran 12 dari distribusi uniform
dengan interval (0,1) . Hitunglah P(1/2 ≤ x́ ≤ 2/3)

21. Diketahui Y = x1 + x2 +....+x15 adalah jumlah dari sampel acak dengan ukuran 15
dari distribusi yang pdf nya f(x) =3/2 x2; -1< x < 1. Hitunglah P(-0,3≤Y≤ 1,5¿

22. Diketahui x́ adalah rata-rata dari sampel acak ukuran 36 dari distribusi exponensial
dengan rata-rata 3. Hitunglah P(2,5 ≤ x́ ≤ 4)

23. Hitunglah P(39,75 ≤ x́ ≤ 41,25) dimana x́ adalah rata-rata dari sampel acak ukuran
32 dari distribusi dengan rata-rata µ = 40 dan var. σ 2=8
24. Sample acak ukurann n = 18 diambil dari distribusi dengan pdf

f(x) = {1-x/2 ; 0≤ x≤2

; 0 untuk yang lainnya

a) Hitung µ dan σ 2
b) Hitung P(2/3 ≤ x́ ≤ 5/6)

9.
BAB III TEORI ESTIMASI

PENDAHULUA
N

Teori estimasi adalah suatu ilmu yang menghususkan bagaimana caranya memperkirakan
besaran-besaran populasi yang tidak diketahui yang dihitung berdasarkan suatu sample.

Dalam bab ini akan dibahas tiga kategori sesuai dengan kondisi yang dihadapi:

a) Teori estimasi berdasarkan rataan


b) Teori estimasi berdasarkan proporsi
c) Terori estimasi berdasarkan variansi

Pokok bahasan pada materi “teori estimasi” dititik beratkan bedasarkan interval estimasi baik
untuk satu populasi ataupun dua populasi.

TUJUAN INSTRUKSIONAL
UMUM

Setelah mempelajari materi ini mahasiswa dapat mengestimasi parameter populasi yang tidak
diketahui berdasarkan statistik sampel.

TUJUAN INSTRUKSIONAL KHUSUS

1. Mahasiswa dapat memahami konsep dasar teori estimasi baik estimasi rataan,
proporsi dan variansi untuk satu dan dua populasi.
2. Mahasiswa diharapkan dapat menggunakan teori estimasi pada dunia nyata.
1………….
2………….
SKENARIO PEMBELAJARAN
3………….
4………….

Kegiatan perkuliahan dilaksanakan dengan skenario sebagai berikut:

1. Perkuliahan
2. Penjelasan tentang concept map (tunjukan di peta konsep dimana posisi materi yang
akan dibahas), pokok bahasan, dan kompetensi yang akan dicapai (TIU dan TIK)
3. Tes pendahuluan
4. Ringkasan materi disampaikan dengan metode ceramah, critical incident, diskusi dan
tanya jawab
5. Tes akhir
6. Evaluasi pencapaian
7. Penutup
RINGKASAN MATERI

SIFAT-SIFAT PENDUGA

 Penduga Tidak Bias


Penduga titik dikatakan tidak bias (unbiased estimator) jika di
dalam sampel random yang berasal dari populasi, rata-rata atau
nilai harapan (expexted value, X) dari statistik sampel sama dengan
parameter populasi () atau dapat dilambangkan dengan E(X ) = .

X X
E( ) = E( ) 

Gambar A Penduga Bersifat Tidak Bias Gambar B Penduga Bersifat Bias

SIFAT-SIFAT PENDUGA

 Penduga Efisien
Penduga yang efisien (efficient estimator) adalah penduga yang tidak bias dan
mempunyai varians terkecil (sx2) dari penduga-penduga lainnya.

sx12

sx12 < sx22


sx22
DEFINISI

 Penduga Konsisten
Penduga yang konsisten (consistent estimator) adalah nilai dugaan (X) yang semakin
mendekati nilai yang sebenarnya  dengan semakin bertambahnya jumlah sampel (n).

n tak terhingga

n sangat besar

n besar

n kecil
III.1 ESTIMASI RATAAN

III.1.1 Selang kepercayaan mean sampel

DEFINISI

Pendugaan interval:

Pendugaan interval adalah menyatakan jarak di dalam mana


suatu parameter populasi mungkin berada.

Estimator titik dari mean populasi µ adalah statistik X́ . Sebaran statistik ini berpusat
pada µ dan variansinya lebih kecil daripada estimator lain.

2 σ2
σ x́ = , sehingga semakin besar ukuran sampelnya akan menghasilkan variansi yang
n
semakin kecil.

Selang kepercayaan dari populasi yang terdistribusi normal atau jika ukuran sampelnya
cukup besar, dapat diturunkan sbb :

Dari gambar di atas

x́−µ
P (−z α / 2< Z < z α / 2 ) = 1 - α, dimana Z=
σ /√n
X−μ σ σ
Jadi P(−z α /2 < < z α / 2) atau P( X́ −z α /2 < μ< X́ + z α /2 )
σ /√n √n √n
Sampel acak berukuran n dari suatu populasi dengan variansi σ 2 yang diketahui dan mean x́
yang dihitung akan menghasilkan selang kepercayaan sebesar (1-α)100%.

σ σ
X́ −z α / 2 < μ< X́ + z α / 2
√n √n

III.1.2 Selang kepercayaan untuk µ; σ diketahui


Bila x́ rataan sampel acak berukuran n dari suatu populasi dengan variansi σ 2 yang
diketahui maka selang kepercayaan (1-α)100% untuk µ ialah

σ σ
x́−z α / 2 < μ < x́+ z α /2
√n √n
zα/2 adalah nilai sebaran normal yang menghasilkan luas α/2 di sebelah kanannya.

Contoh : mean dan simpangan baku dari IPK sebanyak 36 orang mahasiswa adalah 2.6 dan
0.3. tentukan selang kepercayaan 95% dan 99% untuk nilai mean-nya.

Jawab : titik estimasi adalah x́ = 2.6. karena sampel beukuran besar, simpangan baku σ dapat
didekati dengan s = 0.3. nilai z yang memberikan luas daerah dibawah kurva sebesar 0.025 di
sebelah kanan, atau 0.975 di sebelah kiri, adalah z0.025 = 1.96 (dari tabel). Oleh karena itu
selang kepercayaan 95% adalah

2.6 – (1.96) (0.3)/√ 36) < µ < 2.6 + (1.96) (0.3/√ 36) atau

2.50 < µ < 2.70

Dengan cara yang sama, selang kepercayaan 99% memerlukan z0.005 = 2.575 dan selang
kepercayaan ini adalah :

2.6 – (2.575) (0.3/√ 36) < µ < 2.6 + (2.575) (0.3/√ 36) atau

2.47 < µ < 2.73

Terlihat selang ini lebih lebar dari sebelumnya.

III.1.3 Kesalahan estimasi


DISTRIBUSI NORMAL DAN STANDAR DEVIASI
POPULASI TIDAK DIKETAHUI

Standar error untuk populasi tidak terbatas


S
S 
n
x

Standar error untuk populasi yang terbatas dan n/N > 0,05:
S N n
S 
n N 1
x

Distribusi normal standar

Distribusi t dengan n=25

Distribusi t dengan n=15

Distribusi t dengan n=5

Selang kepercayaan (1-α)100% memberikan ketelitian estimasi titik. Jika µ adalah titik pusat
selang, x́ mengestimasi µ tanpa kesalahan.

Pada umumnya akan ada kesalahan yang besarnya berbeda antara x́ dengan µ, dan kita
percaya (1-α)100% bahwa perbedaan ini kurang dari zα/2(σ/√ n).

Teorema : jika x́ digunakan sebagai estimasi dari µ, kita dapat percaya (1-α)100% bahwa
nilai kesalahannya akan kurang dari zα/2(σ/√ n).

Pada contoh soal sebelumnya, kita percaya 95% bahwa mean sampel x́ = 2.6 berbeda sebesar
0.1 dari nilai sebenarnya dan percaya 99% bahwa nilainya berbeda sebesar 0.13.

Seringkali kita ingin tahu seberapa besar sampel yang kita inginkan untuk memastikan bahwa
kesalahan estimasi dari µ kurang dari nilai tertentu e. Jadi kita harus memilih n sedemikian
hingga zα/2(σ/√ n) = e.

Teorema : jika x́ digunakan untuk mengestimasi µ, kita dapat percaya (1-α)100% bahwa
kesalahannya akan kurang dari nilai e tertentu jika jumlah sampelnya adalah

n=( z ∝/ 2 σ /e)2
Teorema di atas dapat diterapkan jika variansi populasi diketahui, atau tersedia n ≥ 30 untuk
melakukan estimasi variansi tersebut.

FAKTOR UKURAN SAMPEL

Faktor yang mempengaruhi jumlah sampel

1. Tingkat keyakinan yang dipilih.


2. Kesalahan maksimum yang diperbolehkan.
3. Variasi dari populasi.

Contoh : seberapa banyak jumlah sampel yang diperlukan pada contoh sebelumnya jika kita
ingin percaya 95% bahwa estimasi µ kita kurang dari 0.05?

Jawab : simpangan baku sampel s = 0.3 diperoleh dari sampel asal 36 akan dipakai untuk
menentukan σ. Sebelumnya juga telah diperoleh zα/2 = 1.96,maka berdasarkan teorema di atas

n = ( z ∝/2 σ /e)2 = [(1.96)(0.3)/0.05]2 = 138.3

dengan demikian, kita dapat percaya 95% bahwa sampel acak sebesar 139 akan memberikan
hasil estimasi x́ yang berbeda di bawah 0.05 dari µ.

III.1.4 Sampel sedikit


Bagaimana jika syarat n ≥ 30 untuk menghitung variansi populasi tidak dapat
dipenuhi? Gunakan distribusi T sebagai ganti distribusi Gauss. Disini

x́−μ
T=
S /√n

Prosedur lain sama dengan yang sebelumnya.


Mengacu pada gambar di atas, nilai peluang pada daerah diarsir

P(-tα/2<T< tα/2) = 1 – α

Di mana tα/2 adalah nilai t untuk derajat bebas n-1. Luas sebelah kanan nilai ini adalah α/2,
dan berdasarkan simetri, luas sebelah kiri dari -tα/2 juga α/2. Substitusi untuk T menghasilkan

X́−μ
P(-tα/2<( )< tα/2) = 1 – α
S/ √ n

S S
Maka diperoleh P( X́ −t ∝ /2 < μ< X́ +t ∝/ 2 ) = 1 – α
√n √n

Dengan demikian, untuk n sampel, mean x́ dan simpangan baku s, interval kepercayaan (1 –

S S
α)100% diberikan oleh X́ −t ∝ /2 < μ< X́ +t ∝/ 2
√n √n

III.1.5 Selang kepercayaan untuk µ; σ tidak diketahui.


Suatu selang kepercayaan (1 – α)100% untuk µ adalah:

S S
x́−t ∝/2 < μ< x́ +t ∝/2
√n √n
Dimana x́ dan s adalah mean dan simpangan baku sampel berukuran n < 30 dari suatu
populasi yang terdistribusi mendekati normal, dan t ∝/2 adalah nilai distribusi-t dengan derajat
bebas sebesar v=n-1 yang menghasilkan luas α/2 di sebelah kanannya.

Contoh : ada 7 kontainer serupa yang berisi asam sulfat dengan volume : 9.8, 10.2, 10.4, 9.8,
10.0, 10.2, dan 9.6 liter. Tentukan selang kepercayaan 95% untuk mean dari kontainer-
kontainer tersebut juka distribusinya mendekati normal.
Jawab : dari data yang diberikan,diketahui mean sampel x́=10.0 dan simpangan baku sampel
s=0.283. berdasarkan tabel T, kita dapatkan t0.025 = 2.447 untuk derajat bebas v=6. Karena itu,
selang kepercayaan 95% dari μ adalah

10.0 – (2.447) (0.283 / √ 7)<μ < 10.0 + (2.447) (0.283 / √ 7), atau

9.74< μ <10.26

Tambahan soal latihan estimasi rataan

1. Suatu mesin minuman diatur sedemikian rupa sehingga banyaknya minuman yang
dikeluarkannya berdistribusi hampir normal dengan simpangan baku 0,15 desiliter.
Hitunglah selang kepercayaan untuk rataan semua minuman yang dikeluarkan mesin
tersebut bila:
a) sampel acak 36 cangkir minuman berisi rata-rata 2,25 desiliter.
b) sampel acak 9 cangkir minuman berisi rata-rata 2,25 desiliter.

2. Seorang ahli dalam efisiensi ingin menentukan rata-rata waktu yan diperlukan untuk
membor tiga lubang pada sejenis kepitan logam. Berapa besar sampelkah yang dia
perlukan agar yakin 95% bahwa rataan sampelnya paling jauh 15 detik dari rataan
sesungguhnya? Misalkan dari penelitian sebelumnya diketahui bahwa σ=40 detik.

III.2 ESTIMASI PROPORSI


Penaksir titik untuk proporsi p dalam suatu percobaan binomial diberikan oleh statistic

X
P= dengan X menyatakan banyaknya yang berhasil dalam n usaha. Jadi, proporsi sampel
^
n

x
^p= akan digunakan sebagai taksiran titik untuk parameter p.
n

Bila proporsi p yang tak diketahui diharapkan tidak akan terlalu dekat dengan nol atau
1, maka selang kepercayaan untuk p dapat dicari dengan menggunakan distribusi sampel ^
P.
Dengan menyatakan suatu kegagalan dalam tiap usaha binomial dengan nilai 0 dan
keberhasilan dengan nilai 1 maka banyaknya yang berhasil , x, dapat ditafsirkan sebagai
jumlah dari n nilai yang terdiri atas hanya nol dan satu, maka ^p hanyalah rataan sampel dari n
nilai ini. Karena itu, menurut Teorema Limit Pusat, untuk n cukup besar,distribusi ^
P hampir
normal dengan rataan

μ ^p= E ( P
^ )=E
( Xn )= npn = p
Dan variansi

2 σ 2x npq pq
σ ^p=σ x/ n= 2 = 2 =
n n n

Dengan demikian dapat dituliskan

P(−z α /2 <Z < z α /2)=1−α

Dengan

^
P− p
Z=
√ pq /n

dan z α / 2 menyatakan nilai kurva normal baku yang di sebelah kanannya terdapat daerah

α
seluas . Gantikan Z dalam ketidaksamaan
2

P− p
^
(
P −z α /2 < )
< z =1−α
√ pq /n α /2

Kalikan tiap suku dalam ketidaksamaan √ pq /n, kemudian kurangi dengan ^P dan kalikan
dengan -1, diperoleh

^ α /2 pq < p< ^ pq
(
P P−z
n √ P+ z α / 2
n
=1−α
√ )
Ketidaksamaan ini sulit untuk disederhanakan untuk mendapat selang acak yang
kedua ujungnya tidak mengandung p, paremeter yang tidak diketahui. Tapi bila n besar,
galatnya kecil sekali bila p di bawah tanda akar diganti taksiran titik ^p=x /n. Dalam hal
demukian, maka dapat ditulis

^ α /2 p^ q^ < p< ^ ^p q^
(
P P−z
n √ P+ z α / 2
n √ )
=1−α
Untuk suatu sampel acak ukuran n, hitunglah proporsi sampel ^p=x /n, maka
hampiran selang kepercayaan (1-α) 100% untuk p dapat diperoleh.

Bila n kecil dan proporsi p yang tidak diketahui diyakini dekat ke 0 atau ke 1 maka cara
mencari selang kepercayaan ini tidak dapat diandalkan dan, karena itu, sebaiknya tidak
digunakan. Untuk menjamin hasil yang baik sebaiknyalah usahakan agar selalu n ^p dan n q^
lebih besar atau sama dengan 5. Cara penghitungan selang kepercayaan untuk parameter
binomial p juga dapat dipakai bila distribusi normal digunakan utnuk menghampiri distribusi
hipergeometrik, yaitu, bila n kecil dibandingkan dengan N seperti pada contoh 1

Selang kepercayaan sampel-besar untuk p

Bila ^
P menyatakan proporsi yang berhasil dalam sampel berukuran acak ukuran n, dan

q^ =1− ^p , maka hampiran selang kepercayaan (1-α) 100% untuk parameter binomial p adalah

^p q^ p^ q^
^
P−z α
2 √ n
<p< ^
P+ z α
2 √ n

dengan z α menyatakan nilai z sehingga luas di sebelah kanannya α/2.


2

Contoh 1

Pada suatu sampel acak n = 500 keluarga yang memiliki pesawat televise di kota Hamilton,
Kanada, ditemukan bahwa x = 340 memiliki tv berwarna. Carilah selang kepercayaan 95%
untuk proporsi sesungguhnya dari keluarga yang memiliki tv berwarna di kota tersebut.

Jawab

340
Taksiran titik untuk p ialah ^p= =0,68 . Dari table diperoleh z 0,025 =1,96. Jadi, selang
500
kepercayaan 95% untuk p adalah

( 0,68 ) ( 0,32) ( 0,68 )( 0,32)


0,68−1,96
√ 500
< p< 0,68+1,96
√ 500

Yang, bila disederhanakan akan menjadi


0,64 < p < 0,72

Bila p berada tepat di tengah selang kepercayaan (1-α) 100% maka ^p menaksir p
tanpa galat. Tapi, biasanya, ^p tidak akan tepat sama dengan p dan taksiran titik meleset

(mempunyai galat). Besarnya galat akan smaa dengan selisih positif antara ^p dan p, dan
dengan selang kepercayaan (1-α) 100% selisih ini akan lebih kecil dari z α / 2 √ ^p q^ / n.

Teorema 1

Bila ^p dipakai sebagai taksiran p, galatnya akan lebih kecil daripada z α / 2 √ ^p q^ /n

dengan kepercayaan (1-α) 100%.

Pada contoh 1 diatas, proporsi sampel ^p=0,68 berbeda dengan proporsi p yang
sesungguhnya tidak lebih dari 0,04 dengan kepercayaan 95%. Sekarang ingin ditentukan
berapa besarkah sampel yang diperlukan agar terjamin bahwa galat dalam menaksir p tidak
melebihi suatu besaran g. Menurut teorema 1, ini berarti n harus dipilih agar

z α / 2 √ ^p q^ /n=g

Teorema 2

Bila ^p dipakai sebagai taksiran p, maka dengan kepercayaan (1-α) 100% galat

z 2α /2 ^p q^
akan lebih kecil dari besaran tertentu g bila ukuran sampel sebesar n=
g2

Teorema 2 agak membingungkan karena untuk menentukan ukuran sampel n


digunakan ^p, padahal ^p dihitung dari sampel. Bila p dapat ditaksir secara kasar tanpa
mengambil sampel maka taksiran ini dapat dipakai untuk menentukan n. Bila ini tidak
tersedia, ambil sampel pendahuluan berukuran n ≥ 30 untuk menaksir p. Kemudian, dengan
menggunakan teorema 2, dapat ditentukan perkiraan besarnya sampel yang diperlukan agar
derajat ketepatan yang diinginkan tercapai. Sekali lagi, semua nilai pecahan n agar dibulatkan
ke bilangan bulat yang lebih besar terdekat.

Contoh 2

Berapa besarkah diperlukan sampel pada contoh 1 agar taksiran p meleset kurang dari 0,02
dengan kepercayaan 95%?

Jawab :

Pandanglah ke-500 keluarga sebagai sampel pendahuluan yang memberikan taksiran ^p=0,68
. Maka menurut teorema 3

( 1,96 )2 ( 0,68 ) (0,32)


n= =2090
(0,02)2

Jadi, bila taksiran p didasarkan atas sampel acak ukuran 2090 maka proporsi sampel tidak
akan berbeda lebih dari 0,02 dengan proporsi sesungguhnya, dengan kepercayaan 95%.

Terkadang tidak praktis mencari taksiran p untuk digunakan dalam menentukan


ukuran sampel n untuk suatu taraf kepercayaan tertentu. Bila ini terjadi, batas atas untuk n
dapat diperoleh dengan menyadari bahwa ^p q^ =^p ( 1−^p ) ≤ 1/4, karena ^p terletak antara 0 dan
1. Ini dapat dibuktikan dengan melengkapi kuadrat. Jadi

2
^p ( 1− ^p )=− ( ^p 2− ^p )= 1 − ^p2− ^p + 1 = 1 − p^ 2− 1 ,
(
4 ) 4 4 ( )
2

yang selalu lebih kecil dari 1/4 kecuali bila p = 1/2 yang mengakibatkan ^p q^ =1/4. Jadi, bila
dimasukkan ^p=1 /2 pada rumus n di teorema 3, padahal, sesungguhnya, p cukup berbeda
dengan 1/2, maka tentunya n akan melebihi dari yang diperlukan untuk taraf kepercayaan
yang ditetapkan dan sebagai akibatnya taraf kepercayaan yang diperoleh akan meningkat.

Teorema 3
Bila ^p dipakai sebagai taksiran p, maka dengan kepercayaan paling sedikit (1-α) 100%

z 2α /2
galat akan lebih kecil dari besaran tertentu g bila ukuran sampel n=
4 g2

Contoh 3

Berapa besarkah sampel yang diperlukan pada contoh 1 agar kita yakin paling sedikit dengan
kepercayaan 95% bahwa taksiran p melesat kurang dari 0,02?

Jawab

Berbeda dengan contoh2, disini kita anggap tidak ada sampel pendahuluan diambil untuk
menaksir p. Karena itu, dengan kepercayaan paling sedikit 95% proporsi sampel yang kita
peroleh tidak akan berbeda dari proporsi sesungguhnya melebihi 0,02 bila kita memilih

( 1,96)2
ukuran sampe ln= 2
=2401
4 ( 0,02 )

Dengan membandingkan contoh 2 dan contoh 3, terlihat bahwa keterangan (taksiran)


mengenai p, yang diperoleh dari sampel pendahuluan atau pun mungkin dari pengalaman
masa silam, dapat dipakai untuk menarik sampel yang lebih kecil dengan tetap
mempertahankan taraf ketelitian semula.

MENAKSIR SELISIH RATA-RATA.

Dalam hal ini kita berhubungan dengan dua buah populasi yang selisih rata-ratanya
( μ1 – μ2 ) akan kita taksir.

a. Interval taksiran untuk selisih rata-rata jika σ1 dan σ2 diketahui:

Bila x1 dan x2 masing-masing adalah rata-rata sampel acak berukuran n1 dan n2 yang

diambil dari populasi dengan simpangan baku σ1 dan σ2 diketahui.:

σ σ σ σ
( x1 − x 2 )− Z α / 2
√ 1
n1
2
+
n2
2
2
< μ1 − μ2 <( x 1− x 2 )+Z α /2
√ n1
1
2
+
n2
2
2

b. Interval taksiran untuk selisih rata-rata jika simpangan baku σ1


dan σ2 tidak diketahui tetapi σ1 = σ2 :

1 1 1 1
( x1 −x 2 )−t α / 2 Sp
√ + < μ1 −μ2 <( x1 −x 2 )+ t α /2 Sp
n1 n2
+
n 1 n2 √
dimana Sp= dugaan simpangan baku populasi

( n1−1) S 1 +( n 2−1 ) S2
2 2

Sp 2 =
n 1 +n2 −2
dengan dk = ν = n1 + n2 -2

c. jika simpangan baku σ1 dan σ2 tidak diketahui dan σ1 ≠ σ2 :

S S S S
( x1 − x 2 )−t α / 2
√ 1
n1
2
+
n2
2
2
< μ1 −μ 2 <( x 1 − x 2 )+t α / 2
√ n1
1
2
+
2
2

n2

( S 2 / n1 + S 2 / n2 )2
1 2
ν=
[ ( S 2 /n 1 )2 /( n1 −1) ]+[ ( S 2 / n2 )2 /( n 2−1 )]
dengan dk = 1 2

Contoh:

Masa pakai barang A yang dihasilkan oleh dua pengusaha akan diteliti. Dari barang yang
dihasilkan oleh pengusaha 1 diteliti 150 buah dan dicatat masa pakainya. Rata-ratanya
1400 jam dean simpangan baku 80 jam.Barang yang dihasilkan pengusaha II diteliti
sebanyak 100 buah. Ternyata rata-ratanya = 1300 jam dan S = 70 jam. Carilah interval
taksiran selisih rata-ratanya. dengan kepercayaan 95%.

Jawab:

Asumsi σ1 = σ2

( 150−1 )6400+( 100−1) 4900


Sp 2 = =5542
150+100−2
sehingga sp= 74,5

dari daftar t dengan kepercayaan 95% dan V= 248 didapat t0,05(248)= 1,96

1 1 1 1
( 1400−1300 )−1 , 96( 74 , 5 )
√ +
150 100
< μ 1− μ 2 <( 1400−1300)+1 , 96( 74 , 5 ) +
150 100√
84 , 2< μ1 −μ2 <115 , 8

Ditaksir bahwa selisih rata-rata masa pakai barang A yang dihasilkan oleh kedua
pengusaha terletak antara 84,2 s/d 115,8 jam dgan keyakinan 95%.

III.2.1 Estimasi Selisih Dua Proporsi


Pandang persoalan menafsir selisih dua parameter binomial p 1 dan p2 . Sebagai
contoh, misalkan p1 proporsi yang merokok dan terkena kanker paru-paru dan p 2 proporsi
yang tidak merokok dan terkena kanker paru-paru. Persoalannya ialah menaksir selisih kedua
proporsi itu. Pertama-tama, pilihlah sampel acak bebas masing-masing berukuran n 1 dan n2
dari dua populasi binomial dengan rataan n1p1 dan n2p2 serta variansi n1p1q1 dan n2p2q2,
kemudian tentukan jumlah x1 dan x2 dari orang yang terkena kanker paru-paru pada tiap
sampel, dan tentukanlah proporsi ^p1=x 1 /n1 dan ^p2=x 2 /n2 . Penaksir titik untuk selisih dua
proporsi p1- p2 adalah statistik ^ ^ 2. Jadi, selisih kedua proporsi sampel, ^p1− ^p2, akan
P 1− P
digunakan sebagai taksiran titik untuk p1- p2 .

Selang kepercayaan untuk p1- p2 dapat ditetapkan dengan menggunakan distribusi sampel
^P1− P
^ 2. Dari materi menaksir proporsi diketahui ^
P1dan ^P2masing-masing berdistribusi
hampir normal, dengan rataan p1 dan p2 , dan variansi p1q1 / n1 dan p2q2 / n2 . Dengan
mengambil kedua sampel secara bebas dari kedua populasi maka peubah ^ ^ 2 akan
P1 dan P
bebas satu sama lain, dank arena distribusi normal bersifat merambat, maka dapat
disimpulkan bahwa

^ ^ 2berdistribusi hampir normal dengan rataan


P 1− P

μ ^p − ^p = p1 – p2
1 2

dan variansi

2 p1 q1 p2 q2
σ ^p1− ^p2 = +
n1 n2

Dengan demikian dapat ditulis

P (−z α / 2< Z < z α / 2 )=1−α

Dengan

( ^P1− P^ 2 ) −( p1 −p 2)
z=
p1q1 p q
√( n1 )( )
+ 2 2
n2

Dan z α / 2 nilai kurva normal baku sehingga luas di sebelah kanannya α /2. Ganti Z pada rumus
di atas, maka dapat ditulis

( P^ 1− ^P2 )−( p1 −p 2 )

[
P −z α / 2<
p1q1
√( ) ( )
n1
p q
+ 2 2
n2 ]
< z α /2 =1−α

Setelah melakukan perhitungan seperti biasa,ganti p1 , p2 , q1 dan q2 yang berada di bawah


tanda akar dengan taksirannya ^p1=x 1 /n1 , ^p2=x 2 /n2, q^ 1=1− ^p1dan q^ 2=1− ^p2, asal saja
n1 ^p1 , n1 q^ 1 , n2 ^p 2dan n2 q^ 2 semuanya lebih besar atau sama dengan 5, maka diperoleh

hampiran selang kepercayaan (1-α) 100% untuk p1− p2.

Selang kepercayaan untuk p1− p2


Bila ^p1 dan p 2 menyatakan proporsi yang berhasil dalam sampel acak masing-masing ukuran
n1 dan n2 , q^ 1=1−^p 1 dan q^ 2=1− ^p2 , maka hampiran selang kepercayaan (1-α) 100% untuk
selisih kedua parameter binomial, p1− p2, adalah

^p 1 q^ 1 ^p 2 q^ 2 ^p q^ ^p q^
( ^p1− ^p2 )−z α / 2
√ n1
+
n2 √
< p1− p 2<(^p1− ^p2 )+ z α /2 1 1 + 2 2
n1 n2

Bila z α / 2 nilai kurva normal sehingga luas di sebelah kanannya α /2

Contoh 4

Suatu perusahaan dalam cara pembuatan suku cadang sedang direncanakan. Sampel diambil
dari cara lama maupun yang baru untuk melihat apakah cara baru tersebut memberikan
perbaikan. Bila 75 dari 1500 suku cadang yang berasal dari cara lama ternyata cacat dan 80
dari 2000 yang berasal dari cara baru ternyata cacat, carilah selang kepercayaan 90% untuk
selisih sesungguhnya proporsi yang cacat dalam kedua cara.

Jawab :

Misalkan p1 dan p2 masing-masing menyatakan proporsi yang sesungguhnya yang cacat


dalam cara lama dan baru. Jadi ^p1=75 /1500=0,05 dan ^p2=80 /200=0,04 , dan taksiran titik
untuk p1− p2 ialah ^p1− ^p2=0,05−0,04=0,01

Dari table diperoleh z 0,05=1,645. Jadi bila dimasukkan nilai ini ke dalam rumus di atas, maka
diperoleh kepercayaan 90%,

( 0,05 )( 0,95 ) ( 0,04 ) (0,96) ( 0,05 )( 0,95 ) ( 0,04 ) (0,96) ,


0,01−1,645
√ 1500
+
2000
< p1− p2 <0,01+1,645

1500
+
2000

Yang disederhanakan, menjadi

-0,0017 < p1 – p2 < 0,0217

Karena selang ini mengandung nilai 0, tak ada alasan mempercayai bahwa cara baru tersebut
memberikan penurunan yang berarti dalam proporsi suku cadang yang cacat disbanding
dengan cara lama.
Latihan soal

1. Dari suatu sampel acak 1000 rumah di suatu kota ternyata 228 menggunakan gas
Elpiji. Cari selang kepercayaan 99% untuk proporsi rumah di kota tadi yang
menggunakan gas Elpiji.

2. Suatu sistem peluncur roket tertentu sedang dipertimbangkan untuk dipakai


meluncurkan sejumlah roket jarak pendek. Sistem yang sekarang mempunyai peluang
berhasil meluncurkan sebuah roket p =0,8. Sampel 40 peluncuran percobaan dengan
sistem yang baru menunjukkan 34 yang berhasil.
a) Buatlah selang kepercayaan 95% untuk p
b) Apakah kenyataannya cukup besar untuk mendukung

3. Berapakah sampel yang diperlukan di soal 1 bila diinginkan yakin 99% bahwa
proporsi sampel paling banyak berjarak 0,05 dari proporsi sesungguhnya dari rumah
di kota tersebut yang menggunakan gas Elpiji.

4. Suatu penelitian ingin dilakukan untuk menaksir berapa persen penduduk suatu kota
yang memilih arinya diberi flour. Berapa besarkah sampel yang diperlukan bila
seseorang berharap yakin paling sedikit 95% taksirannya paling banyak sejauh 1%
dari presentasi sesungguhnya?

5. Suatu perusahaan rokok menyatakan bahwa rokoknya merek A terjual 8% lebih


banyak dari rokoknya merek B. Bila dari 200 perokok ada 42 yang lebih menyukai
merk A dan 18 dari 150 perokok lebih menyukai merek B, hitunglah selang
kepercayaan 94% untuk selisih antara proporsi penjualan kedua merek dan tentukan
apakah perbedaan 8% tersebut suatu pernyataan yang kena.
6. Dalam pengukuran waktu reaksi seseorang terhadap semacam stimulus, seorang ahli
psikologi memperkirakan bahwa simpangan bakunya 0,08 detik. Untuk menentukan
berapa orang yang perlu diukur agar didapat hasil rata-rata waktu reaksi dengan
kepercayaan 95%, dan kekeliruan penaksiran tidak melebihi 0,015 detik, asumsi
apakah yang harus diambil mengenai distribusi waktu reaksi? Tentukan berapa orang
yang perlu diukur! Bagaimana jika dikehendaki kepercayaan 99%? Apa yang tampak?

7. Telah ditimbang 10 buah tomat dengan hasil (dalam gram): 142, 157, 138, 175, 152,
149, 148, 200, 182, 164.

Jika berat tomat berdistribusi normal, tentukan interval kepercayaan, 95% untuk rata-
rata berat tomat.

8. Sampel acak yang terdiri atas 400 petani, ternyata 65% tidak memiliki tanah sendiri.
Tentukan interval kepercayaan 95% persentase sebenarnya untuk para petani yang
memiliki tanah sendiri. Bagaimana jika koefisien kepercayaannya diambil 0,99?
Jelaskan apa yang tampak?

9. Diberikan dua buah sampel dengan data:

Sampel I : 38, 42, 51, 47, 38, 60, 57, 58, 32, 45

Sampel II : 44, 49, 53, 46, 41, 47, 34, 60, 59, 63

yang diambil dari dua buah populasi.

Untuk menentukan batas-batas interval kepercayaan selisih rata-rata sebenarnya


antara kedua populasi, asumsi apa yang diambil? Tentukan interval kepercayaan 95%
untuk selisih tersebut jika:

a) Simpangan baku kedua populasi diketahui sama besar, yaitu 9,5.


b) Simpangan baku kedua populasi sama besar tetapi tidak diketahui nilainya.
c) Simpangan baku kedua populasi tidak sama besar.

10. Hasil dua jenis semacam tanaman tiap satuan luas tertentu, dalam satuan berat, adalah
sebagai berikut:
Jenis I : 39,3 – 45,5 – 41,2 – 53 – 44,2 – 42,5 – 63,9

Jenis II: 51,5 – 39,4 – 41,2 – 56,7 – 35,7

Tentukan jenis mana yang akan dipilih untuk ditaman selanjutnya!

11. Metode latihan pertama telah digunakan terhadap 250 orang dan 160 dinyatakan
berhasil. Metode latihan kedua dilakukan terhadap 300 orang dan 225 berhasil.
Tentukan interval kepercayaan 0,95 untuk selisih persentase sebenarnya bagi yang
berhasil, juga untuk interval kepercayaan 0,99! Apa yang tampak?
III.3 ESTIMASI VARIANSI
Bila sampel berukuran n diambil dari populasi normal dengan variansi σ 2 dan variansi
sampel S2 dihitung maka kita peroleh suatu nilai dari statistic S2. Variansi sampel hasil
perhitungan ini akan digunakan sebagai taksiran titik untuk σ 2. Karena itu statistik S2 disebut
penaksir σ 2.

Taksiran selang untuk σ 2 dapat diturunkan dengan menggunakan statistic

2 ( n−1 ) S 2
χ=
σ2

Statistik χ 2 berdistribusi khi-kuadrat dengan derajat kebebasan n – 1 bila sampel berasal dari
populasi normal.

Jadi, dapat ditulis

P ( χ 21−α / 2 < χ 2 < χ 2α / 2 )=1−α

Bila χ 21−α / 2 dan χ 2α /2 masing- masing menyatakan nilai distribusi khi-kuadrat dengan derajat
kebebasan n -1 , sehingga luas di sebelah kanannya 1- α /2 dan α /2. Ganti χ 2 dalam rumus di
atas, peroleh

( n−1 ) S 2 2
[
P χ 21−α / 2<
σ2 ]
< χ α /2 =1−α

Bagilah tiap suku dalam ketidaksamaan dengan (n-1) S 2 , dan kemudian balikkan tiap suku
(jadi ubah arah ketidaksamaan), maka diperoleh

( n−1 ) S 2 2 ( n−1 ) S 2
P
[ χ 2α /2
<σ < 2
χ 1−α /2 ]
=1−α

Untuk ukuran sampel n, hitunglah variansi sampel S2 , maka diperoleh selang kepercayaan (1-
α) 100% untuk σ 2.

Selang kepercayaan (1-α)100% untuk σ diperoleh dengan menarik akar setiap ujung selang
untuk σ 2.
Selang kepercayaan untuk σ 2

Bila S2 variansi sampel acak ukuran n dari populasi normal maka selang kepercayaan (1-α)
100% untuk variansi σ 2 diberikan oleh

( n−1 ) S 2 2 ( n−1 ) S 2
<σ < 2
χ 2α /2 χ 1−α /2

Bila χ 2α /2 dan χ 21−α / 2 menyatakan nilai distribusi khi-kuadrat dengan derajat kebebasan
υ=n−1 sehingga luas di sebelah kanannya, masing-masing sebesar α /2 dan 1 - α /2.

Contoh 5

Data berikut menyatakan berat, dalam gram, 10 bungkus bibit sejenis tanaman yang
dipasarkan oleh suatu perusahaan : 46,4, 46,1 , 45,8 , 47,0 , 46,1 , 45,9 , 45,8 , 46,9 , 45,2 dan
46, 0 . Carilah selang kepercayaan 95 % untuk variansi semua bungkusan bibit yang
dipasarkan perusahaan tersebut, anggap populasinya normal.

Jawab

Mula-mula hitunglah

n n 2

2
s=
n ∑ χi −
i=1
2
( )
∑ χi
i=1
=
( 10 ) ( 21273,12 )−( 461,2 )2
=0,286
n ( n−1 ) ( 10 ) ( 9 )

Untuk memperoleh selang kepercayaan 95%, ambil α = 0,05. Dari table chi-kuadrat untuk
derajat kebebasan ν=9 diperoleh χ 20,025 =19,023 dan χ 20,975 =2,700

Jadi, selang kepercayaan 95% untuk σ 2

( 9 ) (0,286) 2 ( 9 ) (0,286)
<σ <
19,023 2,700

atau

0,135 < σ 2 < 0,953


III.3.1 Estimasi Nisbah Dua Variansi
Taksiran titik untuk nisbah dua variansi populasi σ 12 / σ 22 diberikan oleh nisbah

variansi sampel s12 /s 22. Karena itu statistik S12 /S 22 disebut penaksir σ 12 / σ 22.

Bila σ 12 dan σ 22 variansi dua populasi normal, maka taksiran selang untuk σ 12 / σ 22 dapat
diperoleh dengan memakai statistic

σ 22 S12
F= 2 2
σ 1 S2

Menurut teorema 6.20, peubah acak F mempunyai distribusi-F dengan derajat kekebasan
ν1 =n1−1 dan ν 2=n2−1. Jadi, dapat ditulis (lihat gambar 7.8)

P [ f 1−α /2 ( ν 1 , ν 2 ) < F< f α /2 ( ν 1 , ν 2 ) ] =1−α , bila f 1−α / 2 ( ν 1 , ν 2 ) dan f α / 2 ( ν 1 , ν2 ) menyatakan nilai

distribusi F dengan derajat kebebasan ν1 dan ν 2 sehingga di sebelah kanannya, masing-


masing, luasnya 1- α /2 dan α /2. Ganti F dalam rumus di atas, diperoleh

σ 22 S 12
[
P f 1−α /2 ( ν 1 , ν 2 ) <
σ 12 S 22 ]
<f α / 2 ( ν 1 , ν 2 ) =1−α

Gambar 7.8

Kalikan tiap suku dalam ketidaksamaan dengan S22 /S 12 dan balikkan tiap suku (ubah arah
ketidaksamaan) diperoleh

S 12 σ 2 2 S1 2
P
[ S 22
1
< 2< 2
1
f α / 2 ( ν 1 , ν2 ) σ 1 S2 f 1−α /2 ( ν 1 , ν 2 )]=1−α

Hasil teorema 6.19 memungkinkan kita mengganti f 1−α / 2 ( ν 1 , ν 2 ) dengan 1/ f α / 2 ( ν 2 , ν1 ). Jadi

S 12 σ2 S2
P
[ S 22
1
]
< 22 < 12 f α / 2 ( ν 2 , ν1 ) =1−α
f α / 2 ( ν 1 , ν2 ) σ 1 S 2
Untuk dua sampel acak bebas ukuran n1 dan n2, yang diambil dari dua populasi normal,
hitunglah nisbah variansi sampel s12 /s 22, maka diperoleh selang kepercayaan (1-α) 100%

untuk σ 12 /σ 22.

Seperti pada pasal 7.10, selang kepercayaan (1- α) 100% untuk σ 1 /σ 2, dapat diperoleh dengan

mengambil akar setiap ujung selang untuk σ 12 /σ 22.

Selang kepercayaan untuk σ 12 /σ 22

Bila s12 dan s22 variansi dari sampel bebas masing-masing ukuran n 1 dan n2 dari populasi

normal maka selang kepercayaan (1-α) 100% untuk nisbah σ 12 / σ 22 adalah

s 12 1 σ 12 s12
2
< 2
< 2 f α / 2 ( ν 2 , ν 1)
s 2 f α / 2 ( ν 1 , ν 2) σ 2 s2

Bila f α / 2 ( ν 2 , ν1 ) menyatakan f1 dengan derajat kebebasan ν1 =n1−1 dan ν 2=n2−1, sehingga

luas di sebelah kanannya α /2 , dan f α / 2 ( ν 2 , ν1 ) menyatakan nilai f yang sama dengan derajat
kebebasan ν 2=n2−1 dan ν1 =n1−1

Contoh :

Suatu selang kepercayaan untuk perbedaan rataan kadar ortofosfor, diukur dalam mg per liter,
pada dua stasion di sungai James telah dihitung di contoh 7.8 dengan menganggap kedua
variansi populasi normal tidak sama. Beri dukungan atas anggapan ini dengan membuat
selang kepercayaan 98% untuk σ 12 /σ 22 dan untuk σ 1 /σ 2, bila σ 12 dan σ 22 variansi populasi kadar
ortofosfor masing-masing di stasion 1 dan 2.

Jawab

Dari contoh 7.8 diperoleh n1 = 15, n2 = 12, s1 = 3,07 dan s2 = 0,80 . Untuk selang kepercayaan
98%, α = 0,02. Dengan menggunakan interpolasi dari tabel, kita peroleh
f 0,01 ( 14,11 ) ≈ 4,3 dan f 0,01 ( 11,14 ) ≈ 3,87

Jadi, selang kepercayaan 98 % untuk σ 12 /σ 22 adalah


3,072 1 σ 21 3,072
( )< <
0,802 4,30 σ 22 0,802
(3,87)

Yang, bila disederhanakan, menjadi

σ 21
3,425< 2
< 56,991
σ2

Ambil akar batas kepercayaan selang ini maka diperoleh selang kepercayaan 98% untuk
σ 12 /σ 22 adalah

σ❑
1,851< 1❑ <7,549
σ2

Karena selang ini tidak mencakup kemungkinan σ 1 /σ 2 sama dengan 1, maka anggapan bahwa
σ 1 ≠ σ 2 atau σ 12 ≠ σ 22 di contoh 7.8 mendapat dukungan dari data

Sampai tahap ini semua selang kepercayaan yang disajikan berbentuk taksiran titik ± K g.b
(taksiran titik), K disini suatu tetapan (ataukah r ataupun titik perseratus normal). Hal ini
benar bila parameternya suatu rataan, selisih dua rataan, proporsi, atau selisih dua proporsi.
Akan tetapi, hal ini tidak berlaku untuk variansi dan nisbah dua variansi.
Latihan soal

1. Suatu perusahaan baterai mobil menyatakan baterainya tahan, pada rata-ratanya, 3


tahun dengan variansi 1 tahun. Bila 5 dari baterai ini tahan selama 1,9 , 2,4 , 3,0 , 3,5
dan 4,2 tahun, buatlah selang kepercayaan 95% untuk σ 2 dan jelaskan apakah
pernyataan perusahaan tadi bahwa σ 2 = 1 dapat dibenarkan. Anggap umur populasi
baterai berdistribusi hampiran normal.

2. Sarapan teratur sereal yang diberi pemanis sebelumnya menyebabkan kerusakan gigi,
sakit jantung, dan penyakit lainnya menurut penelitian yang dilakukan oleh Dr.W.H.
Bowen dari Institut Kesehatan Nasional dab Dr. J. Yudhen, Profesor Nutrisi dan Diet
di Universitas London. Dalam suatu sampel acak 20 porsi yang sama Alpha-Bits
(sejenis sereal) rata-rata kadar gulanya 11,3 gr dengan simpangan baku 2,45 gr. Bila
dimisalkan bahwa kadar gula berdistribusi normal, buatlah selang kepercayaan 95%
untuk σ !

3. Suatu percobaan yang dipopulerkan di Popular Science, tahun 1981, membandingkan


pemakaian bahan bakar dua jenis truk-mini diesel dengan perlengkapan yang sama.
Misalkan 12 truk VW dan 10 truk Toyota digunakan dalam uji coba pada kecepatan
tetap 90 km per jam. Bila ke 12 truk VW rata-rata menempuh 16 km per liter dengan
simpangan baku 1,0 liter per km dan 10 truk Toyota rata-rata 11 km per liter dengan
simpangan baku 0,8 km per liter, buatlah selang kepercayaan 98% untuk σ 1 /σ 2, bila
σ 1 dan σ 2 masing-masing simpangan baku dari jarak yang ditempuh per liter bahan
bakar oleh truk VW dan Toyota.

4. Suatu perusahaan taksi ingin menentukan apakah membeli ban merek A atau merek B
untuk armada taksinya. Untuk menaksir perbedaan kedua merek, dilakukan suatu
percobaan menggunakan 12 ban dari tiap merek. Ban dipakai sampai aus. Hasil merek
A : x́ 1=36.300 km , s1 = 5000 km ; merek B : x́ 2=38.100 km , s2 = 6100 km. Hitunglah
selang kepercayaan 90% untuk σ 12 / σ 22. Apakah anggapan bahwa σ 12=σ 22 mendapat
dukungan dalam membuat selang kepercayaan untuk μ1−μ 2?
5. Dari suatu sampel acak 1000 rumah di suatu kota ternyata 228 menggunakan gas
Elpiji.
a) Cari selang kepercayaan 99% bila taksiran proporsi rumah di kota tadi yang
menggunakan gas Elpiji.
b) Berapakah besar sampel yang diperlukan, jika diinginkan yakin 99% bahwa
proporsi sampel paling banyak berjarak 0.05 dari proporsi sesungguhnya dari
rumah di kota tersebut yang menggunakan gas Elpiji

6. Suatu sistem peluncur roket tertentu sedang dipertimbangkan untuk dipakai


meluncurkan sejumlah roket jarak pendek. Sistem yang sekarang mempunya
peluang berhasil meluncurka sebuah roket p=0.8. Sampel 40 peluncuran
percobaan dengan sistem yang baru menunjukkan 34 yang berhasil.
a) Buatlah selang kepercayaan 95% untuk p
b) Apakah kenyataannya cukup besar mendukung bahwa sistem yang baru ini lebih
baik? Jelaskan.

7. A. Menurut suatu laporan di koran Roanoke times & world news, 20 agustus
1981, sekitar 2/3 dari 1600 orang dewasa yang disigi lewat tilpon mengatakan
bahwa program pesawat ulang alik merupakan investasi yang baik bagi negara
(AS). Cari selang kepercayaan 95% untuk proporsi orang AS dewasa yang
berpendapat bahwa program pesawat ulang alik merupakan investasi yang baik
bagi negara.

B. Apa yang dapat dikatakan mengenai kemungkina besarnay galat denga


kepercayaan95% bila taksiran proporsi orang AS dewasa yang berpendapat
bahwa program pesawat ulang alik invesatasi yang baik sebesar 2/3

8. Washington University school of Dental Medicine di St. Louis, dua cangkir teh
hijau atau teh hitam Cina tiap hari sudah akan cukup memberi fluor untuk menjaga
gigi anda dari kerusakan. Mereka yang tidak suka teh dan tinggal di daerah yang
airnya tidak diberi fluor seharusnya meminta pemerintah daerahnya memberi
fluor pada airnya. Berapa besarkah sampel yang diperlukan untuk menaksir
persentasi penduduk di suatu kota tertentu yang memilih airnya diberi fluor bila
diinginkan paling sedikit 99% yakin bahwa taksirannya paling banyak sejauh 1% dari
presentasi sesungguhnya.

9. Suatu penelitian ingin dilakukan untuk menaksir proporsi penduduk di suatu kota dan
pinggirannya yang mendukung pendirian PLTN. Berapakah sampel yang
diperlukan agar yakin paling sedikit 95% bahwa taksirannya paling banyak
berjarak 0.04 dari proporsi sesungguhnya dari penduduk di kota tersebut dan
pinggirannya uang mendukung pendirian PLTN?

10. Seorang pimpinan perusahaan ingin mengetahui perbedaan rata-rata gaji bulanan
karyawan diperusahan A dan perusahan B. Untuk itu diambil sampel acak masung-
masing 9 orang karyawan dari dua perusahaan tersebut dan kemudian mereka
diwawancara satu persatu. Hasil wawancara menunjukan bahwa gaji perbulan (dalam
dolar) karyawan di dua perusahaan tersebut adalah sbb.:

Kywn 1 2 3 4 5 6 7 8 9

Gaji 40 46 50 36 38 34 42 44 30
perusahaan
A

Gaji 30 24 16 25 35 40 46 38 34
perusahaan
B

Simpangan baku populasi kedua perusahaan tidak diketahui dan diasumsikan sama.

Buatlah interval taksiran untuk menduga berapa sesungguhnya perbedaan rata-rata


gaji karyawanperbulan didua perusahaan tersebut.

11. Suatu perusahaan rokok menyatakan bahwa rokoknya merek A terjual 8% lebih
banyak dari rokoknya merek B. Bila dari 200 perokok ada 42 yang lebih
menyukai merek A dan 18 dari 150 perokok lebih menyukai merek B, hitunglah
selang kepercayaan 94% untuk selisih antara proporsi penjualan kedua merek
dan tentukan apakah perbedaan 8% tersebut suatu pernyataan yang kena.

12. Suatu perusahaan baterai mobil menyatakan bahwa baterainya tahan, pada rata-
ratanya, 3 tahun dengan variansi 1 tahun. Bila 5 dari baterai ini tahan selama 1,9, 2,4,
3,0, 3,5, dan 4,2 tahun, buatlah selang kepercayaan 95% untuk σ2 dan jelaskan apakah
pernyataan perusahaan tadi bahwa σ2 = 1 dapat dibenarkan. Anggap umur populasi
baterai berdistribusi hampiran normal.
13. Suatu penelitian bertujuan menentukan apakah cairan A mempunyai pengaruh
terhadap banyaknyalogam yang tersingkirkan jika logam itu direndam dalam cairan
tersebut. Suatu sampel acak 100 potong logam direndam selama 24 jam dalam cairan
lain dan menghasilkan rata-rata 12,2 mm logam yang tersingkir dengan simpangan
baku 1,1 mm. sampel kedua dengan 200 potong logam yang sma direndam selama 24
jam dalam cairan A menyingkirkan rata-rata 9,1 mm logam dengan simpangan baku
0,9 mm. hitunglah selang kepercayaan 98 % untuk selisih kedua rataan populasi.
Apakah cairan A menurunkan banyaknya logam yang tersingkir?

14. Dalam suatu penelitian yang dilakukan di Virginia Polytechnic Institute and State
University pada 1983 mengenai perkembangan ectomycorrhizal, hubungan simbiosis
antara akar pohon dan cendawan yang memindahkan mineral dari cendawan ke pohon
dan gula dari pohon ke cendawan. Untuk itu 20 bibit oak merah dengan cendawan
Pisolithus tinctorus ditanam dalam rumah kaca. Semua bibit ditanam dalam sejenis
tanah yang sama dan mendapat jumlah sinar matahari dan air yang sama. Setengahnya
sama sekali tidak mendapat nitrogen waktu penanaman yang bertindak sebagai
control dan setengah lainnya mendapat 368 ppm nitrogen dalam bentuk NaNO 3. Berat
batang, dalam gr, pada hari ke 140 tercatat sbb:

Tanpa Nitrogen Nitrogen

0,32 0,26

0,53 0,43

0,28 0,47

0,37 0,49

0,47 0,52

0,43 0,75

0,36 0,79

0,42 0,86

0,38 0,62

0,43 0,46

Buatlah selang kepercayaan 95% untuk selisih rataan berat batang antara bibit yang tidak
mendapat nitrogen dan yang mendapat 368 ppm nitrogen. Anggap populasinya
berdistribusi normal dengan variansi yang sama.
15. Data berikut, dalam hari menyatakan waktu yang diperlukan penderita sampai
sembuh, penderita dipilih secara acak untuk mendapat salah satu dari dua obat yang
dapat menyembuhkan infeksi berat pada saluran kencing;

Obat 1 Obat 2

N1= 14 N2= 116

ẋ1=17 ẋ2= 19

s12=1,5 s22= 1,8

Buat selang kepercayaan 99% untuk selisih rataan waktu sembuh untuk kedua obat
µ1- µ2, anggap populasinya berdistribusi normal dengan variansi yang sama.

16. Suatu percobaan yang dilaporkan di Popular Science, tahun 1981, membandingkan
pemakaian bahan bakar dua jenis truk-mini diesel dengan perlengkapan yang sama.
Misalkan 12 truk VW dan 10 truk Toyota digunakan dalm uji coba pada kecepatan 90
km/jam. Bila ke 12 truk VW rata-rata menempukh 16 km per liter dengan simpangan
baku 1,0 km per liter dan 10 truk Toyota rata-rata 11 km dengan simpangan baku 0,8
per liter. Buat lah selang kepercayaan 90% untuk selisih antara rataan km per liter
kedua jenis truk mini. Anggap bahwa jarak perliter untuk setiap model truk
berdistribusi normal dengan variansi yang sama.

17. Suatu perusahaan taksi ingin menentukan apakah membeli ban merek A atau merek B
untuk armada taksinya. Untuk menaksir perbedaan kedua merek, dilakukan suatu
percobaan menggunakan 12 ban dari tiap merek. Ban dipakai sampai aus. Hasil merek
A: x1= 36.300 km, s1= 5000 km; merek B x2= 38.100 km, s2=6100 km. hitunglah
selang kepercayaan 95% untuk µ1- µ2, anggap kedua populasi berdistribusi hamper
normal.

18. Data berikut menyatakan waktu putar film yang diproduksi dua perusahaan film
gambar hidup.

perusaha
Waktu (menit)
an

A 103 9 110 8 98 8 118


4 7 8
8 9
97 123 175
B 2 2

Hitunglah selang kepercayaan 90% untuk selisih kedua rataan waktu putar film yang
diproduksi kedua perusahaan. Anggap bahwa perbedaan waktu putar berdistribusi
normal.

19. Hitunglah selang kepercayaan 99% untuk µ1- µ2 bila suatu ban dari tiap merek
dipasang secara acak di roda belakang delapan taksi dan jarak yang di tempuh, dalam
km, adalah ;

21. M 22. M
20. T
e e
a
r r
k
e e
s
k k
i
A B

24. 3 25. 3
3 6
, ,
23. 1
4 7
0 0
0 0

27. 4 28. 4
5 6
, ,
5 8
0 0
26. 2 0 0

30. 3 31. 3
6 7
, ,
29. 3
7 7
0 0
0 0

32. 4 33. 3 34. 3


2 1
, ,
0 1
0 0
0 0

36. 4 37. 4
8 7
, ,
35. 5
4 8
0 0
0 0

39. 3 40. 3
2 6
, ,
8 4
0 0
38. 6 0 0

42. 3 43. 3
8 8
, ,
41. 7
1 9
0 0
0 0

45. 3 46. 3
0 1
, ,
1 5
0 0
44. 8 0 0

Anggap selisih jarak berdistribusi hampir normal.

20. Pemerintah memberikan dana ke jurusan pertanian Sembilan universitas untuk


menguji kemampuan menghasilkan dua varietas gandum yang baru. Tiap varietas di
tanam di petak sawah yang sama luasnya di tiap universitas dan hasilnya, dalam
kilogram per petak, adalah sebagai berikut;
Universitas
varietas
1 2 3 4 5 6 7 8 9

Varietas A 38 23 35 41 44 29 37 31 38

Varietas B 45 25 31 38 50 33 36 40 43

HItunglah selang kepercayaan 95% untuk rataan selisih hasil kedua jenis , anggap
bahwa distribusi hasil hampir normal, jelaskan mengapa kedua varietas perlu dibuat
berpasangan dalam soal ini.

21. Departemen Perindustrian dan Perdagangan ingin mengetahui pendapatan rata-rata


dari usaha UKM di Jawa Barat tahun 2003. Dari total 660 UKM di bawah bimbingan
Departemen, diambil sampel 120 UKM yang terdapat di Bogor, Cirebon, Tasikmalaya
dan Cianjur. Rata-rata pendapatan perbulannya ternyata meningkat menjadi 2,1 juta
dengan standar deviasi populasinya 0,8 juta. Dengan tingkat keyakinan 95%, buatlah
interval rata-rata kenaikan pendapatan UKM di Jawa Barat!

22. Pemerintah DKI Jakarta mengadakan program peningkatan usaha kecil dan
menengah dalam rangka peningkatan pendapatan golongan ekonomi lemah. Untuk
mengetahui apakah proyek ini berhasil atau tidak, maka akan dibedakan antara orang
yang mengikuti proyek dan tidak. Pendapatan 13 orang dari 67 peserta yang ikut proyek
sebesar 1,2 juta perbulan dengan standar deviasi sebesar 0,2 juta. Sedang pendapatan 5
orang dari 34 orang nonpeserta rata-rata sebesar 0,8 juta dengan standar deviasi 0,4.
Dengan menggunakan tingkat keyakinan 99%, buatlah interval keyakinan tentang
selisih dari kedua kelompok tersebut.

23. PT Lipo Karawaci yang merupakan perusahaan perumahan di Indonesia akan


membangun perumahan di Sentul, Bogor. Untuk keperluan tersebut diadakan survey
tentang daya beli masyarakat. Berdasarkan data di Kecamatan diketahui standar deviasi
pendapatan masyarakat sebesar 0,8 juta. Apabila diasumsikan bahwa kesalahan
penarikan sampel sebesar 0,1 juta, dengan tingkat kepercayaan 99%, berapa sampel
yang harus diambil oleh PT Lipo Karawaci?

24. PT. Islamic Net ingin mengetahui jumlah rata-rata nilai penjualan per hari dari
tenaga pemasaran sebagai dasar dari penentuan prestasinya. Hasil sementara
menunjukkan rata-rata perjalanan 150 ribu dengan standar deviasi 14 ribu. Berapa
sampel pramuniaga yang harus diambil, apabila diinginkan kesalahan yang ditoliler
adalah 2 ribu dan tingkat keyakinan 99%?

25. Sebuah mesin menghasilkan potongan logam yang berbentuk silinder.Sampel


beberapa potongan diukur, dan ternyata diameternya 1.01,0.97,1.03,1.04,0.99 ,
0.98,0.99,1.01, dan 1.03.Hitunglah selang kepercayaan 0.99% untuk rataan potongan
diameter yang dihasilkan mesin tersebut bila dimisalkan distribusinya hamper normal.

26. Pengukuran berikut memberikan waktu mengering, dalam jam, sejenis cat lateks
merek tertentu.

3 ,4 2,5 4,8 2,9 3,6

2,8 3,3 5,6 3,7 2,8

4,4 4,0 5,2 3,0 4,8

Bila dimisalkan pengukuran menyatakan sampel acak yang diambil dari populasi
normal, hitunglah batas toleransi 99% yang akan mengandung 95% waktu
mengering.

27. Sebuah mesin menghasilkan potongan logam yang berbentuk selinder. Sampel
beberapa potongan diukur dan ternyata diameternya :

1,01 0,97 1,03 1,04 0,99 0,98 0,99 1,01 dan 1,03 cm.

Hitunglah selang kepercayaan 99 % untuk rataan diameter potongan yang dihasilkan


mesin tersebut bila dimisalkan distribusinya hampir normal.

28. Diketahui x1 + x2 +......+ x7, diambil ample acak dari populasi yang mempunyai
rata-rata μ dan variansi σ 2. Perhatikan estimator µ sbagai berikut:

Ø´ 1 = (x1+x2+....+x7)/7

Ø´ 2 = (2x1 – x6 + x4)/2

Apakah kedua estimator unbiased?

Yang mana estimator terbaik?


29. Misalkan kita mempunyai sampel acak dengann ukuran n dari populasi yang
dinotasikan sebagaii x, dan E(x) = μ dan var x =σ 2.
2n n
1 1
Diketahui x́1 = ∑ xi dan x́2 = ∑ xi
2n i=1 n i=1

Adalah dua estimator μ . Yang mana estimator μ yang lebih baik? Jelaskan pilihan anda.

30. Misalkan θ´1 , θ´2∧θ3´ adalah estimator estimator θ . Kita tahu bahwa E(θ´1 ¿= E(
θ´2 ¿ dan = θ, E(θ´3 ¿≠θ, var θ´1 =12, var θ´2 =10 and E[θ´3 – θ]❑2 =6. Bandingkan ke tiga
estimator. Yang mana yang lebih baik? Kenapa?

31. In a binomial experiment exactly x successes are observed in n independent trials. The
following two statistics are proposed as estimators of the proportion parameter p: T1 =
x/n and T2 = (x+1)/(n+2)

Determine and compare the MSE for T1 and T2.

32. X1, X2, X3 and X4 adalah sample random dengan ukuran n= 4 dari suatu populasi
yang berdistribusi exponensial dengan parameter θ yang tidak diketahui.

Diantara:

T1= 1/6(x1+x2) + (1/3(x3+x4)

T2=(x1+2x2+3x3+4x4)/5

T3=(x1+x2+x3+x4)/4

Tentukan Statistik mana yang unbiased estimator dari θ?

Diantara estimator θ yang unbiased , tentukan estimator yang terbaik

33. Diketahui populasi 1 dengan rata-rata = 80 dan simpangan baku=5, dan populasi 2
dengan rata-rata = 75 dan simpangan baku = 3, diambil sampel masing-masing n1= 25
dan n2=36.

Ditanya: berapa probabilitas (3,4≤x́1-x́2≤5,9)


BAB IV UJI HIPOTESIS

PENDAHULUA
N

Dalam bab ini akan dibahas bagaimana cara menguji suatu statemen dimana statemen
tersebut belum tentu kebenarannya. Uji hipotesis yang akan dibahas antara lain :

a) Uji menyangkut rataan


b) Uji menyangkut proporsi
c) Uji menyangkut variansi

Baik untuk satu ataupun dua populasi.

TUJUAN INSTRUKSIONAL
UMUM

Setelah mempelajari materi ini mahasiswa dapat menguji berbagai pernyataan dan diharapkan
dapat digunakan dalam situasi nyata.

TUJUAN INSTRUKSIONAL KHUSUS

1. Mahasiswa dapat memahami konsep dasar uji hipotesis


2. Mahasiswa akan dapat mengetahui berbagai macam ilustrasi dalam penyelesaian
masalah menggunakan uji hipotesis
3. Mahasiswa diharapakan dapat mengidentifikasi terhadap masalah yang dihadapi
perusahaan
1………….
2………….
SKENARIO PEMBELAJARAN
3………….
4………….

Kegiatan perkuliahan dilaksanakan dengan skenario sebagai berikut:

1. Perkuliahan
2. Penjelasan tentang concept map (tunjukan di peta konsep dimana posisi materi yang
akan dibahas), pokok bahasan, dan kompetensi yang akan dicapai (TIU dan TIK)
3. Tes pendahuluan
4. Ringkasan materi disampaikan dengan metode ceramah, critical incident, diskusi dan
tanya jawab
5. Tes akhir
6. Evaluasi pencapaian
7. Penutup
RINGKASAN MATERI

IV.1 HIPOTESIS STATISTIK

DEFINISI

Pengujian hipotesa

Pengujian hipotesa adalah prosedur yang didasarkan pada


bukti sampel yang dipakai untuk menentukan apakah
hipotesa merupakan suatu pernyataan yang wajar dan oleh
karenanya tidak ditolak, atau hipotesa tersebut tidak wajar
dan oleh karena itu harus ditolak.

Pengujian hipotesis statistik merupakan suatu bidang besar inferensi statistik. Hipotesis
statistik adalah suatu anggapan, pernyataan atau dugaan, yang mungkin benar atau tidak,
mengenai satu atau lebih populasi. Pengujian hipotesis berhubungan dengan penerimaan atau
penolakan suatu hipotesis. Kebenaran suatu hipotesis tidak akan pernah diketahui dengan
pasti, kecuali kita memeriksa seluruh populasi. Namun, karena tidak memungkinkan
memeriksa seluruh populasi, maka kita dapat mengambil sampel acak dan menggunakan
informasi atau bukti dari sampel tersebut untuk menerima atau menolak suatu hipotesis.
Penerimaan suatu hipotesis terjadi karena TIDAK CUKUP BUKTI untuk MENOLAK
hipotesis tersebut dan BUKAN karena HIPOTESIS ITU BENAR dan penolakan suatu
hipotesis terjadi karena TIDAK CUKUP BUKTI untuk MENERIMA hipotesis tersebut dan
BUKAN karena HIPOTESIS ITU SALAH.
PENGERTIAN KESALAHAN JENIS I DAN II

Situasi H0 H0
Keputusan Benar Salah

Terima H 0 Keputusan tepat (1 – a) Kesalahan Jenis II (


Tolak H 0 Kesalahan Jenis I (a) Keputusan tepat (1

PENGERTIAN KESALAHAN JENIS I DAN II

Kesalahan Jenis I

Adalah apabila keputusan menolak H0, pada


hal seharusnya H0 benar"

Kesalahan Jenis II

Adalah apabila keputusan menerima H0,


padahal seharusnya H0 salah"
MERUMUSKAN HIPOTESA

Hipotesa nol

Satu pernyataan mengenai nilai parameter populasi

Hipotesa alternatif

Suatu pernyataan yang diterima jika data sampel


memberikan cukup bukti bahwa hipotesa nol adalah salah

Prosedur pengujian hipotesis diawali dengan perumusan Hipotesis Awal yang diharap
akan ditolak dan biasanya disebut dengan Hipotesis Nol (H 0). Hipotesis Nol ini juga sering
menyatakan kondisi yang menjadi dasar pembandingan dan harus menyatakan dengan pasti
nilai parameter. Penolakan H0 membawa kita pada penerimaan Hipotesis Alternatif (H1).
 H0 → ditulis dalam bentuk persamaan (=)
 H1 → ditulis dalam bentuk pertidaksamaan (< ; > ; ≠)

Contoh 1

Sebelum tahun 1993, pendaftaran mahasiswa Universtas GD dilakukan dengan pengisian


formulir secara manual. Pada tahun 1993, PSA Universitas GD memperkenalkan sistem
pendaftaran "ONLINE". Seorang Staf PSA ingin membuktikan pendapatnya “bahwa rata-rata
waktu pendaftaran dengan sistem ONLINE akan lebih cepat dibanding dengan sistem yang
lama”. Pada sistem lama, rata-rata waktu pendaftaran adalah 50 menit. Perumusan
hipotesisnya adalah sebagai berikut:

 H0 : µ = 50 menit (sistem baru dan sistem lama tidak berbeda)


 H1 : µ < 50 menit (sistem baru lebih cepat dibanding sistem lama)

IV.2 ARAH PENGUJIAN HIPOTESIS

Pengujian Hipotesis dapat dilakukan secara :


1. Uji Satu Arah (uji ekasisi)
2. Uji Dua Arah (uji dwisisi)
Hipotesis nol (H0), akan selalu dinyatakan dengan menggunakan tanda
kesamaan yang berarti menyatakan suatu nilai yang tunggal. Untuk penggunaan uji ekasisi
dan uji dwisisi tergantung pada kesimpulan yang akan diambil jika H 0 ditolak. Letak daerah
kritis (daerah penolakan H0) baru dapat ditentukan hanya setelah H1 ditentukan.

MENENTUKAN DAERAH KEPUTUSAN

Daerah Keputusan Uji Satu Arah

Daerah penolakan
Ho
Daerah tidak
menolak Ho

1,65 Skala z
Probabilitas 0,95 Probabilitas 0,5

Daerah Keputusan Uji Dua Arah

Daerah penolakan Daerah penolakan


Ho Ho
Daerah tidak
menolak Ho
0,025 0,95 0,025
-1,95 0 1,95

IV.2.1 Uji Ekasisi

Uji ekasisi ini digunakan apabila peneliti memiliki informasi mengenai arah
kecenderungan dari karakteristik populasi yang sedang diamati. Pengajuan H0 dan H1 dalam
uji satu arah adalah sebagai berikut:
 H0 : ditulis dalam bentuk persamaan (menggunakan tanda =)
 H1 : ditulis dalam bentuk lebih besar (>) atau lebih kecil (<)

Pada uji ini nilai α (taraf keberartian atau ukuran daerah kritis) tidak dibagi dua,
karena seluruh α diletakkan hanya di salah satu sisi selang.

Misalkan :
H0 : µ = µ0 (µ0 adalah suatu rata-rata yang diajukan dalam H0)

H1 : µ < µ0

Wilayah kritis : z < -zα atau t < -t(db;α) (pengunaan z atau t tergantung
pada ukuran sampel, sampel besar menggunakan z; sampel kecil
menggunakan t)

Gambar IV.7 Wilayah Kritis untuk Uji Ekasisi Kiri

OUTLINE

Daerah penolakan H0 Daerah penolakan H0

Tidak menolak H0 Tidak menolak H0

1,65 1,65

Gambar A Gambar B
H0 : mx £ 13,17 H0 : mpa– mpl ³ 0
H1 : mx > 13,17 H1 : mpa– mpl < 0
Daerah yang terarsir : daerah penolakan hipotesis (daerah kritis)

Daerah yang tidak terarsir : daerah penerimaan hipotesis

Misalkan :

H0 : µ = µ0 (µ0 adalah suatu rata-rata yang diajukan dalam H0)

H1 : µ < µ0

Wilayah kritis : z < -zα atau t < -t(db;α) (pengunaan z atau t tergantung pada
ukuran sampel, sampel besar menggunakan z; sampel kecil
menggunakan t)

Gambar IV.8 Wilayah Kritis untuk Uji Ekasisi Kanan

Daerah yang terarsir : daerah penolakan hipotesis (daerah kritis)

Daerah yang tidak terarsir : daerah penerimaan hipotesis


PROSEDUR PENGUJIAN HIPOTESA

Langkah 1. Merumuskan Hipotesa


(Hipotesa nol (H0) dan Hipotesa Alternatif (H1))

Langkah 2. Menentukan Taraf Nyata


(Probabilitas menolak hipotesa)

Langkah 3. Menentukan Uji statistik


(Alat uji statistik, uji Z, t, F, X2 dan lain-lain)

Langkah 4. Menentukan Daerah Keputusan


(Daerah di mana hipotesa nol diterima atau
ditolak))

Langkah 5. Mengambil Keputusan

Menolak H0 Menolak H0 Menerima H1

IV.2.2 Uji Dwisisi

Uji dwisisi digunakan apabila peneliti tidak memiliki informasi mengenai arah
kecenderungan dari karakteristik populasi yang sedang diamati. Pengajuan H0 dan H1 dalam
uji satu arah adalah sebagai berikut:
 H0 : ditulis dalam bentuk persamaan (menggunakan tanda =)
 H1 : ditulis dalam bentuk lebih besar (>) atau lebih kecil (<)

Pada uji ini nilai α (taraf keberartian atau ukuran daerah kritis) dibagi dua, karena α
diletakkan di kedua sisi selang.

Misalkan :

H0 : µ = µ0 (µ0 adalah suatu rata-rata yang diajukan dalam H0)

H1 : µ < µ0
α α
Wilayah kritis : z < -z atau t < -t(db; (pengunaan z atau t tergantung
2 2)
pada ukuran sampel, sampel besar menggunakan z; sampel kecil
menggunakan t)

Gambar IV.9 Wilayah Kritis untuk Uji Dwisisi

IV.3 KESALAHAN DALAM PENGUJIAN HIPOTESIS


Dalam mengambil kesimpulan untuk suatu uji hipotesis kita mungkin akan melakukan
kesalahan (kesalahan = error = galat), yaitu:
 Galat jenis 1 (α) : menolak H0 padahal H0 benar
 Galat jenis 2 (β) : menerima H0 padahal H0 salah

Tabel IV.3 Kemungkinan Kesalahan dalam Pengujian Hipotesis Statistik


Keadaan Sebenarnya
Kesimpulan
H0 benar H0 salah
Terima H0 Keputusan benar Galat jenis 2
Tolah H0 Galat jenis 1 Keputusan benar

Prinsip pengujian hipotesis yang baik adalah meminimalkan nilai α dan β. Dalam
perhitungan, nilai α dapat dihitung sedangkan nilai β hanya bisa dihitung jika nilai hipotesis
alternatif sangat spesifik.
Contoh 2

Sejenis vaksin flu diketahui hanya efektif 25% setelah jangka waktu 2 tahun. Untuk
menentukan apakah vaksin baru leih unggul daripada vaksin lama, dipilih 100 orang secara
acak dan diberi suntikan vaksin baru tersebut. Bila dalam waktu lebih dari 2 tahun, 36 orang
atau lebih tidak terserang virus, maka vaksin baru dianggap lebih unggul daripada vaksin

1
lama. Hitung galat jenis I (α) dan galat jenis II (β) dengan p = !
2

Jawab :

1
H0 : p =
4

1
H1 : p >
4

Daerah kritis : x > 36 daerah penerimaan : x ≤ 36

(gunakan pendekatan distribusi normal baku)

1 1 3
a. µ = n . p = 100 .
4
= 25

 = √ n . p . q = 100 . . = 4,33
4 4

Z= = = 2,66

x−µ 36,5−25
❑ 4,33

α
25
36,5

Gambar IV.10 Peluang Suatu Galat Jenis I

25 α = P (galat jenis I)

= P (H0 tolak H0 benar)


1
= P (x > 36 p = )
4
= P (Z > 2,66)
= 1 - P (Z < 2,66)
= 1 – 0,9961
= 0,0039
1 1 1
b. µ = n . p = 100 .
2
= 50

 = √ n . p . q = 100 . . = 5
2 2

Gambar IV. Peluang Suatu Galat Jenis II

x−µ 36,5−50
c. Z = = = -2,7
❑ 5
α = P (galat jenis II)
25

= P (H0 terima H0 salah)


1
= P (x ≤ 36 p = )
2
= P (Z < - 2,7)
= 0,0035

Sifat-sifat galat :

 Galat jenis I dan galat jenis II berkaitan. Memperkecil peluang yang satu dapat
biasanya memperbesar peluang yang lainnya.
 Ukuran daerah kritis, jadi juga peluang melakukan galat jenis I, selalu dapat
diperkecil dengan menyesuaikan nilai kritis.
 Menaikkan ukuran sampel nakan memperkecil α dan β secara serentak.
 Bila H0 salah, β akan mencapai maksimum bila nilai parameter sesungguhnya dekat
dengan nilai yang dihipotesiskan. Makin besar jarak antara nilai sesungguhnya
dengan nilai yang dihipotesiskan, maka makin kecil pula β.

Suatu pengertian yang amat penting yang berkaitan dengan kedua peluang galat ialah
perngertian kuasa uji. Kuasa suatu uji adalah peluang menolak H 0 bila suatu tandingan
tertentu benar. Kuasa suatu uji dapat dinotasikan dengan Ɣ dan dapat dihitung dengan 1 – β.

IV.4 LANGKAH PENGERJAAN UJI HIPOTESIS

Untuk melakukan suatu uji hipotesis, langkah-langkah yang harus dilakukan adalah
sebagai berikut :

1. Tentukan hipotesis nol (H0) dan hipotesis tandingan (H1).


2. Pilih taraf keberartian α
3. Tentukan arah pengujian (ekasisi atau dwisisi)
4. Tentukan daerah kritisnya
5. Pilih uji statistik yang sesuai
6. Hitunglah nilai uji statistik dari data sampel
7. Tentukan kesimpulan (tolak H0 bila uji statistik mempunyai nilai di dalam daerah
kritis dan terima H0 bila uji statistilk mempunyai nilai di luar daerah kritis)

Beberapa nilai Z yang sering digunakan:

z5% = z0.05 =1.645 z2.5% = z0.025 =1.96

z1% = z0.01 = 2.33 z0.5% = z0.005 = 2.575

IV.5 UJI MENYANGKUT RATAAN

Pengujian hipotesis yang menyangkut rataan terdiri dari berbagai macam cara,
diantaranya adalah uji menyangkut satu rataan dengan variansi diketahui, uji menangkut satu
rataan dengan variansi tidak diketahui, uji menyangkut dua rataan dengan variansi diketahui,
uji menyangkut dua rataan dengan variansi tidak diketahui tapi 1=2 atau 1 ≠ 2, dan uji
menyangkut rataan dengan pengamatan berpasangan.

Tabel IV.4 Uji Menyangkut Rataan


N H0 Statistik H1 Daerah Kritis
O
1.
z=
x́−μ <0 Z <- Z 
 =0 σ /√n >0 Z > Z
;  diketahui   0 Z <- Z /2 ;
Z > Z /2
2. x́−μ0 <0 t <- t
t= ;
 =0 S /√n >0 t>t
 tidak diketahui   0 t <- t /2 ;
v= n-1 t > t /2
3. ( x́ 1−x́ 2 )−d 0 1-2<d0 Z <- Z 
1-2=d0 z= ; 1-2>d0 Z > Z
( σ 21 /n1 )+ ( σ 22 /n2 )
√ 1-2  d0 Z <- Z /2 ;
1 dan 2 diketahui Z > Z /2
4. ( x́1 −x́2 ) −d 0 1-2<d0 t <- t
1-2=d0 t= 1-2>d0 t>t
S p √ ( 1/n 1) + ( 1/n1 )
; v = n1+ n2 -2
1-2  d0 t <- t /2 ;
t > t /2
1=2 tetapi tidak diketahui
( n1−1 ) s21 +(n2−1)s22
S2p=
n1 +n2−2
5. ( x́ 1−x́ 2) −d 0 1-2<d0 t <- t
1-2=d0 t= 1-2>d0 t>t
√ ( s 21 /n1 )+ ( s 22 /n2 ) 1-2  d0 t <- t /2 ;
1 ≠ 2 dan tidak diketahui t > t /2
2
( s21 /n1 + s22 /n2 )
υ= 2 2 2
( s 1 /n1 ) ( s 22 /n2 )
+
n1−1 n2−1
6. D=d0 d́ −d 0 D<d0 t <- t
t= D>d0 t>t
sd / √ n
v = n-1 1D  d0 t <- t /2 ;
pengamatan berpasangan t > t /2

Contoh 3. Uji menyangkut satu rataan dengan variansi diketahui

Sampel acak catatan 100 kematian di AS selama tahun lalu menunjukan rata-rata usia mereka
71,8 tahun. Andaikan simpangan bakunya 8,9 tahun, apakah ini menunjukan bahwa rata-rata
usia dewasa ini lebih dari 70 tahun? Gunakan taraf
keberartian (α) 0,05.

Jawab :

1. H0 : µ = 70 tahun
2. H1 : µ > 70 tahun
3. α = 0,05
daerah kritis z > 1,645 Gambar IV.11 Daerah Kritis contoh 3.

4. perhitungan : x́ = 71,8 tahun ;  = 8,9 tahun

x−µ 71,8−70
Z = = = 2,02
¿ √ n 8,9/ √ 100
5. Keputusan : Tolak H0
6. Kesimpulan : rata-rata usia dewasa ini lebih dari 70 tahun.

Contoh 4. Uji menyangkut dua rataan dengan variansi tidak diketahui

Suatu percobaan dilakukan untuk membandingkan keausan, karena gosokan dua bahan yang
dilapisi. Dua belas potong bahan diuji dengan memasukan tiap potong bahan ke dalam mesin
pengukur aus. Sepuluh potong bahan 2 diuji dengan cara yang sama. Sampel bahan 1
memberikan rata-rata keausan sebanyak 85 satuan dengan simpangan baku 4 sedangkan
sampel bahan 2 memberikan rata-rata keausan sebanyak 81 dengan simpangan baku sampel
5. Dapatkah disimpulkan bahwa pada taraf kepercayaan 0,05 keausan bahan 1 melampaui
keausan bahan 2 sebanyak lebih dari 2 satuan? Anggaplah populasi hampir normal dengan
variansi yang sama.

Jawab :

Misalkan µ1 dan µ2 masing-masing menyatakan rataan populasi keausan bahan 1 dan bahan 2.
1. H0 : µ1 - µ2 = 2
2. H1 : µ1 - µ2 > 2
3. α = 0,05
4. daerah kritis t > 1,725
5. perhitungan : x́ 1 = 85 ; s1 = 4 ; n1 = 12 ; x́ 2 = 81 ; s2 = 5 ; n2 = 10
( 1 2−1 ) 16+(10−1)25
sp =
√ 12+10−2
= 4,478

(85−81)−2
t = 1 1 = 1,04
4,478/ +
12 10√
6. Keputusan : Terima H0
7. Kesimpulan : tidak dapat disimpulkan bahwa keausan bahan 1 melampaui bahan 2
lebih dari 2 satuan.
Contoh 5. Uji menyangkut rataan dengan pengamatan berpasangan

Dalam makalah ‘Influence of Physical Restraint and Restraint-Facilitating Drugs on Blood


Measuraments of White-Tailed Deer and Other Selected Mammals’, Virginia Polythechnic
Institue and State University (1976), J.A. Wesson memeriksa pengaruh obat succinylcholine
terhadap kadar peredaran androgen dalam darah. Sampel darah dari rusa liar yang hidup
bebas diambil melalui urat nadi leher segera serelah disuntikan succinylcholine pada otot
menggunakan panah dan senapan penangkap. Risa kemudian diambil lagi darahnya kira-kira
30 menit setelah suntikan dan kemudian dilepaskan. Kadar androgen pada waktu ditangkap
dan 30 menit kemudian diukur dalam nanogram per ml (ng/ml) untuk 15 rusa adalah sebagai
berikut: (anggap populasi androgen berdistribusi normal)

Rusa Androgen (ng/ml) di


Waktu 30 menit setelah
suntikan suntikan
1 2,76 7,02 4,26
2 5,18 3,10 -2,08
3 2,68 5,44 2,76
4 3,05 3,99 0,94
5 4,10 5,21 1,11
6 7,05 10,26 3,21
7 6,60 13,91 7,31
8 4,79 18,53 13,74
9 7,39 7,91 0,52
10 7,30 4,85 -2,45
11 11,78 11,10 -0,68
12 3,90 3,74 -0,16
13 26,00 94,03 68,03
14 67,48 94,03 26,55
15 17,04 41,70 24,66

Dengan menggunakan taraf keberartian 0,05, apakah konsentrasi androgen berubah setelah
ditunggu 30 menit?
Jawab :

Misalkan µ1 dan µ2 masing-masing menyatakan rataan konsentrasi androgen pada waktu


suntikan dan 30 menit setelah suntikan.
1. H0 : µ1 = µ2 atau HD : µ1 - µ2 = 0
2. H1 : µ1 ≠ µ2 atau HD : µ1 - µ2 ≠ 0
3. α = 0,05
4. daerah kritis t < -2,145 dan t > 2,145 v = 14
5. perhitungan : rataan sampel dan simpangan baku untuk nilai di adalah d́ = 9,848 dan
sd = 18,474
9,848−0
t = = 2,06
18,474/ √ 15
6. Keputusan : Terima H0
7. Kesimpulan : ada kenyataan tentang adanya perbedaan dalam rataan kadar peredaran
androgen.

IV.6 UJI MENYANGKUT PROPORSI

Uji hipotesis yang manyangkut proporsi banyak dipakai dalam berbagai bidang.
Sebagai contoh, politisi tentunya tertarik untuk mengetahui berapa bagian dari pemilih yang
akan mendukungnya dalam pemilihan. Uji hipotesis ini terdiri dari uji menyangkut proporsi
dan uji menyangkut selisih proporsi.

Tabel IV.5 Uji Menyangkut Proporsi


Ho Statistik H1 Daerah Kritis
p<p0 Z <- Z 
p=p0 p−p 0 p>p0 Z > Z
z=
√ p 0 q 0 /n p p0 Z <- Z /2 ;
Z > Z /2
p1<p2 Z <- Z 
p1=p2 p1 − p 2 p1>p2 Z > Z
z=
p1  p2 Z <- Z /2 ;
√ pq / ( 1/n +1/n )
1 2
Z > Z /2
p1=p2=.....=pk 2 ( oi−ei )
2
Tidak semuanya 2 >2
χ =∑ sama
ei

SEMAKIN BANYAK SAMPEL MENDEKATI NORMAL

Distribusi Z

Distribusi t, v= n - 1= 25

Distribusi t, v= n- 1= 15

Distribusi t, v= n - 1= 2

Contoh 6. Menguji proporsi dengan sampel kecil

Suatu perusahaan tv menyatakan bahwa 70% tv di kota B berasal dari perusahaan tersebut.
Apakah anda setuju dengan pernyataan itu bila suatu sampel acak di kota B menunjukan
bahwa 8 dari 15 tv berasal dari perusahaan tadi? Gunakan taraf keberartian 0,01.

Jawab :

1. H0 : p = 0,7
2. H1 : p ≠ 0,7
3. α = 0,10
4. uji statistik: peubah binomial X dengan p = 0,7 dan n = 15
5. perhitungan : x = 8 dan npo = (15)(0.7) = 10,5
P = 2P(X ≤ 8 bila p = 0,7)
8
= 2 ∑ b ( x ; 15 ; 0,7)
x=10

= 0,2622 > 0,10


6. Keputusan : Terima H0
7. Kesimpulan : tidak cukup alasan meragukan pernyataan perusahaan tersebut.

Contoh 7. Menguji proporsi

Suatu obat yang biasa dijual untuk mengurangi ketegangan syaraf diyakini manjur hanya
60%. Hasil percobaan dengan obat baru yang dicobakan pada sampel acak 100 orang dewasa
yang menderita ketegangan syaraf menunjukan bahwa 70 merasa tertolong. Apakah
kenyataan ini cukup untuk menyimpulkan bahwa obat baru tadi lebih unggul dari yang biasa/
gunakan taraf keberertian 0,05.

Jawab :

1. H0 : p = 0,6
2. H1 : p > 0,6
3. α = 0,05
4. daerah kritis z > 1,645
5. perhitungan : x = 70 ; n = 100 ; npo = (100)(0,6) = 60
70−60
Z = = 2,04
√100.0,6 .0,4
6. Keputusan : Tolak H0
7. Kesimpulan : obat baru lebih unggul.
Contoh 8. Menguji selisih dua proporsi

Pemungutan suara diambil dari suatu kotamadya dan kabupaten di sekitarnya untuk
menentukan apakah suatu rencana pembangunan pabrik kimia boleh diteruskan. Daerah
industri tersebut masih berada dalam batas kota dan karena itu banyak penduduk kabupaten
merasa bahwa rencana itu akan disetujui karena proporsi terbesar penduduk kota menyetujui
pembangunan pabrik tersebut. Untuk menentukan apakah ada perbedaan yang berarti antara
proporsi penduduk kota dan kabupaten yang meng=dukung rencana tersebut, suatu pol
diadakan. Bila 120 dari 200 penduduk kota yang setuju dan bila 240 dari 500 penduduk
kabupaten yang menyetujuinya, apakah anda sependapat bahwa proporsi penduduk kota yang
setuju lebih besar dari proporsi penduduk kabupaten yang setuju? Gunakan taraf keberartian
0,025.

Jawab :

Misalkan p1 dan p2 menyatakan proporsi sesungguhnya penduduk kota dan kabupaten yang
menyetujui rencana tersebut.
1. H0 : p1 = p2
2. H1 : p1 > p2
3. α = 0,025
4. daerah kritis z > 1,96
5. perhitungan :
x 1 120
^p1 = = = 0,6
n 1 200
x 2 240
^p2 = = = 0,48
n 2 500
x 1+ x 2 120+240
^p = = = 0,51
n 1+n 2 200+500
0,6−0,48
Z =
√ ( 2001 )+( 5001 ) = 2,9
0,51.0,49{

6. Keputusan : Tolak H0
7. Kesimpulan : penduduk kota yang menyetujui rencana tersebut lebih besar dari proporsi
penduduk kabupaten yang tidak menyetujui.

IV.7 UJI MENYANGKUT VARIANSI

Pengujian hipotesis mengenai variansi populasi atau simpangan baku berarti kita ingin
menguji hipotesis mengenai keseragaman suatu populasi ataupun barangkali membandingkan
keseragaman suatu populasi dengan populasi lainnya. Statistik yang cocok sebagai dasar
keputusan adalah statistik chi-square dan statistik F.

Tabel IV.6 Uji Menyangkut Variansi


Ho Statistik H1 Daerah Kritis

=0 ( n−1 ) s2 <0 2 <2


χ 2=
σ 20 >0 2 >2
 = n-1   0 2<2/2
2>2/2
1=2 s 21 1<2 f < f1- (1,2)
f= 2 1<2 f > f (1,2)
s2
1 = n1-1 1  2 f < f1-/2(1,2)
1 = n1-1 f > f/2 (1,2)

Contoh 9. Menguji variansi

Suatu perusahaan baterai mobil menyatakan bahwa umur baterainya berdistribusi hampir
normal dengan simpangan baku 0,9 tahun/ Bila sampel acak 10 beterai tersebut menghasilkan
simpangan baku 1,2 tahun, apakah anda setuju bahwa > 0,9 tahun? Gunakan taraf
keberartian 0,05.

Jawab :
1. H0 : ❑2= 0,81.
2. H1 : ❑2 > 0,81.
3. α = 0,05.
4. Daerah kritis 2 > 16,919 dengan derajat kebebasan v = 9
5. Perhitungan s2 = 1,44, n = 10
( 9 ) (1,44)
2 = = 16,0
0,81
6. Keputusan : Statistik x 2 tidaklah berarti pada taraf 0,05. Akan tetapi, ada sedikit
kenyataan bahwa > 0,9.

Contoh 10. Menguji selisih dua variansi

Dalam menguji selisih keausan kedua bahan di contoh V.2, dianggap bahwa kedua variansi
populasi yang tidak diketahui sama besarnya. Apakah anggapan seperti ini beralasan ?

Jawab :

1. H0 : σ 12= σ 22
2. H1 : σ 12≠ σ 22
3. α = 0,10
4. Daerah kritis :
f0,05 (11,9) = 3,11
1
f0,95 (11,9) = = 0,34
f 0,05(11,9)
Jadi, hipotesis nol ditolak bila f < 0,43 atau f > 3,11, untuk f = s21 /s 22 dengan derajat
kebebasan v1 = 9 dan v2 = 9
5. Perhitungan s21 = 16, s21= 25, jadi
16
f= = 0,64
25
6. Keputusan : terima H0.
7. Kesimpulan : tidak cukup kenyataan untuk menyatakan bahwa variansinya berbeda.

Latihan Soal

1. Proporsi keluarga yang membeli susu dari perusahaan A di suatu kota ditaksir sebesar p =
0,6. Bila sampel acak 10 keluarga menunjukan bahwa hanya 3 atau kurang yang membeli
susu dari perusahaan A maka hipotesis bahwa p = 0,6 akan ditolak dan tandingan p < 0,6
didukung.
a. Carilah peluang melakukan galat jenis I bila proporsi sesungguhnya p = 0,6.
b. Carilah peluang melakukan galat jenis II untuk tandingan p = 0,3, p = 0,4, dan p = 0,5.

2. Proporsi orang dewasa yang tamat perguruan tinggi yang tinggal di suatu kota ditaksir
sebanyak p = 0,3. Untuk menguji hipotesis ini sampel acak 200 orang dewasa dipilih. Bila
banyaknya yang tamat perguruan tinggi dalam sampel tadi antara 48 dan 72, maka
hipotesis nol bahwa p = 0,3 diterima. Jika tidak, maka disimpulkan bahwa p ≠ 0,3.
a. Carilah α kalau p = 0,3.
b. Carilah β untuk tandingan p =0,2 dan p = 0,4.

3. Suatu perusahaan alat listrik menghasilkan bola lampu yang umurnya berdistribusi hampir
normal dengan rataan 800 jam dan simpangan baku 40 jam. Ujilah hipotesis bahwa µ =
800 jam lawan tandingan µ ≠ 800 jam bila sampel acak 30 bola lampu mempunyai rata-
rata umur 788 jam. Gunakan taraf keberartian 0,04.

4. Suatu pernyataan menyatakan bahwa rata-rata sebuah mobil dikendarai sejauh 20.000 km
setahun di suatu daerah. Untuk menguji pernyataan ini sampel acak sebanyak 100
pengemudi mobil diminta mencatat jumlah kilometer yang mereka tempuh. Apakah anda
setuju dengan pernyataan di atas bila sampel tadi menunjukan rata-rata 23.500 km dan
simpangan baku 3900 km? Gunakan taraf keberartian 0,05.

5. Suatu pabrik menyatakan bahwa daya rentang rata-rata benang A melebihi daya rentang
rata-rata benang B paling sedikit 12 kg. Untuk menguji pernyataan ini, 50 potong benang
dari tiap jenis diuji dalam keadaan yang sama. Benang jenis A mempunyai rata-rata daya
rentang 86,7 dengan simpangan baku 6,28 kg, sedangkan benang jenis B mempunyai rata-
rata daya rentang 77,8 dengan simpanagn baku 5,61 kg. Ujilah pernyataan pengusaha tadi
dengan menggunakan taraf keberartian 0,05.

6. Untuk menentukan apakah suatu serum baru akan memperlambat leukemia, 9 tikus dipilih
yang semuanya telah kena penyakit tersebut pada tahap yang lanjut. Lima tikus mendapat
serum tadi dan empat lainnya tidak. Umur, dalam tahun, sejak permulaan percobaan
sebagai berikut:
perlakuan 2,1 5,3 1,4 4,6 0,9
Tanpa perlakuan 1,9 0,5 2,8 3,1

Pada taraf keberartian 0,05 dapatkah disimpulkan bahwa serum tadi menolong? Anggap
kedua populasi berdistribusi normal dengan variansi yang sama.

7. Data berikut memberikan waktu putar film yang dihasilkan oleh dua perusahaan film
gambar hidup:
Perusahaan Waktu (menit)
A 102 86 98 109 92
B 81 165 97 134 92 87 114

Ujilah hipotesis bahwa rata-rata waktu putar film hasil perusahaan B lebih 10 menit dari
rata-rata waktu putar film hasil perusahaan A lawan tandingan ekapihak bahwa selisihnya
melebihi 10 menit. Gunakan taraf keberartian 0,1 dan anggaplah kedua distribusi tersebut
hampir normal dengan variansi tidak sama.
8. Dari penelitian ‘Comparison of Sorbic Acid in Countri Ham Before and After Storage’
yang dilakukan di Virginia Polythecnic Institute and State University pada tahun 1983,
diperoleh data berikut yang menyangkut perbandingan sisa asam sorbat dinyatakan dalam
bagian per sajuta, dalam daging ham segera setelah dicelupkan dalam larutan sorbat dan
setelah disimpan 60 hari dicatat:
Potongan Sisa asam sorbat dalam ham
Sebelum disimpan Setelah disimpan
1 224 116
2 270 96
3 400 239
4 444 329
5 590 437
6 660 597
7 1400 689
8 680 576

Bila dianggap kedua populasinya berdistribusi normal, apakah terdapat kenyataan yang
cukup, pada taraf keberartian 0,05, untuk menyatakan bahwa lamanya penyimpanan
mempengaruhi konsentrasi sisa asam sorbat?

9. Misalkan bahwa dulu 40% dari semua orang dewasa menyetujui hukuman mati. Apakah
cukup ada kenyataan untuk mendukung bahwa proporsi orang dewasa sekarang yang
menyetujui hukuman mati lebih banyak bila dalam suatu sampel acak 15 orang dewasa, 8
yang menyetujui hukuman mati? Gunakan taraf keberartian 0,05.

10. Diduga paling sedikit 60% rumah tangga di suatu daerah memiliki pesawat televisi.
Kesimpulan apakah yang akan anda ambil bila hanya 110 dalam sampel 200 keluarga
yang memiliki televisi? Gunakan taraf keberartian 0,04.

11. Suatu perusahaan rokok memasarkan dua merek rokok. Bila diketahui bahwa 56 dari 200
perokok lebih menyenangi merek A dan 19 dari 150 perokok lebih menyenangi merek B,
dapatkah disimpulkan pada taraf keberartian 0,06 bahwa merek A lebih laris daripada B?
12. Pengalaman menunjukan bahwa waktu yang diperlukan murid kelas 3 SMA untuk
menyelesaikan suatu ujian baku merupakan suatu peubah acak normal dengan simpangan
baku 6 menit. Ujilah hipotesis bahwa  = 6 lawan tandingan bahwa  < 6 bila sampel
acak 20 murid SMA kelas 3 mempunyai simpangan baku s = 4,51. Gunakan taraf
keberartian 0,05.

13. Data masa lalu menunjukan bahwa uang yang disumbangkan oleh karyawan di suatu
kota pada PMI berdistribusi normal dengan simpangan baku 1,40 ribu rupiah. Ada
dugaan bahwa sumbangan dari para pedagang pada PMI mempunyai simpangan baku
1,75 ribu rupiah. Dapatkan disimpulkan, pada taraf keberartian 0,01, bahwa simpangan
baku sumbangan dari para pedagang lebih besar daripada para karyawan di kota
tersebut?

14. Suatu mesin minuman dikatakan diluar kendali bila variansi isi minuman yang
dikeluarkannya melebihi 1,15 desiliter. Bila sampel acak 25 cangkir minuman dari
mesin ini mempunyai variansi 2,03 desiliter, apakah ini menunjukan, pada taraf
keberartian 0,05, bahwa mesin diluar kendali? Anggap bahwa isi cangkir berdistribusi
hampir normal.

15. Seorang ahli mengemukakan kepada manajer bahwa dengan mengadakan perubahan-
perubahan tertentu dalam proses produksi akan meningkatkan efisiensi, karena rata-
rata persentase kerusakan produksi tiap mesin akan berkurang.
Perubahan-perubahan akan memerlukan biaya sehingga percobaan perlu diadakan
terlebih dahulu sebelum dilakukan secara menyeluruh dalam proses produksi.
Percobaan terhadap 6 unit proses produksi (dalam persen), sebagai berikut:
8,2 – 7,9 – 8 – 8,4 – 8,3 – 7,8
Manajer hanya akan melakukan perubahan-perubahan apabila dalam proses baru terjadi
rata-rata kerusakan paling banyak 8%. Atas dasar hasil di atas, tentukanlah keputusan
apa yang dapat diambil oleh manajer disertai besar resiko yang diperkirakan!

16. Dari pengalaman masa lampau ternyata sekitar 40% mahasiswa tingkat pertama lulus
mata kuliah A. jika tahun ini 496 dari 1.078 lulus mata kuliah A, dapatkah kita
menyimpulkan bahwa pola masa lampau masih berlaku?
Ambil Taraf nyata 0,05 dan 0,01 lalu bandingkan!

17. Suhu udara di kota B selama 60 bulan terakhir mencapai simpangan baku 0,8°
Celsius. Pengamatan pada tiap tengah bulan selama satu tahun mencapai rata-rata
suhu (dalam ° Celsius): 28,4 – 30,7 – 30,2 – 29,4 – 29,9 – 31,2 – 27,9 – 29,8 – 30,9 –
29,2 – 28 – 30,2.
Tentukanlah apakah variabilitas suhu udara berubah atau tidak jika dibandingkan
dengan selama 60 bulan terakhir tersebut. Ambil taraf nyata 0,05.

18. Sepuluh orang pasien melakukan diet. Berat badan sebelum diet dan sesudahnya
ditimbang untuk mengetahui apakah diet itu berhasil atau tidak. Hasilnya (dalam kg)
sebagai berikut:

Pasien Berat Sebelum Diet Berat Sesudah Diet

1 78,3 77,4
2 84,7 83,2
3 77,4 75,7
4 95,6 92,4
5 82,0 80,2
6 69,4 68,1
7 79,7 76,9
8 85,6 83,9
9 92,8 90,4
10 99,2 95,2

Asumsi apa yang harus diambil mengenai distribusi berat badan?

Ujilah terlebih dahulu apakah simpangan baku berat badan sebelum dan sesudah diet
sama besar!

Dapatkah disimpulkan bahwa diet yang telah dilakukan itu berhasil?

19. Sampel-sampel acak yang masing-masing berukuran 100 mengenai pendapatan


bulanan pegawai (dalam ribuan rupiah dan disimbolkan dengan Yij), telah diambil
dari tiga kota. Hasilnya sebagai berikut:

Kota Ukuran Sampel Σj Yij Σj Yij2


I 100 475,0 5.001,25
II 100 526,5 5.948,50
III 100 507,5 5.678,25

Misalkan bahwa pendapatan bulanan itu berdistribusi normal. Dengan taraf nyata 0,05
ujilah apakah varians pendapatan pegawai itu sama besar ataukah tidak!
BAB V UJI CHI-SQUARE

PENDAHULUA
N

Yang akan dibaha sdalam bab ini antara lain pengujian:

a) Goodest of fit test


b) Indepedent (uji kebebasan)

TUJUAN INSTRUKSIONAL
UMUM

Setelah mempelajari materi ini mahasiswa dapat menganalisis dan menguji baik kecocokan
ataupun kebebasan dengan menggunakan uji Chi- Square.

TUJUAN INSTRUKSIONAL KHUSUS

1. Mahasiswa dapat memahami konsep dasar uji chi-square


2. Mahasiswa akan dapat mengetahui berbagai macam ilustrasi dalam penyelesaian
masalah
3. Mahasiswa diharapkan dapat mengimplementasikan terhadap masalah yang dihadapi
perusahaan

1………….
2………….
SKENARIO PEMBELAJARAN
3………….
4………….

Kegiatan perkuliahan dilaksanakan dengan skenario sebagai berikut:

1. Perkuliahan
2. Penjelasan tentang concept map (tunjukan di peta konsep dimana posisi materi yang
akan dibahas), pokok bahasan, dan kompetensi yang akan dicapai (TIU dan TIK)
3. Tes pendahuluan
4. Ringkasan materi disampaikan dengan metode ceramah, critical incident, diskusi dan
tanya jawab
5. Tes akhir
6. Evaluasi pencapaian
7. Penutup
RINGKASAN MATERI

Uji Chi Square adalah pengujian hipotesis mengenai perbandingan antara frekuensi
observasi atau frekuensi aktual dengan frekuensi harapan atau frekuensi ekspektasi.
Frekuensi obserfasi diperoleh dari nilai pada hasil percobaan, sedangkan frekuensi harapan
diperoleh dari perhitungan secara teoritis. Bentuk distribusi Chi Square dinotasikan dengan
X 2 oleh karena itu nilainya selalu positif.

V.1 GOODNESS OF FIT TEST

Goodness of fit test atau uji kebaikan suai merupakan pengujian terhadap kecocokan
atau baiknya kesesuaian antara frekuensi terjadinya pengamatan pada sampel teramati dengan
frekuensi harapan yang diperoleh dari distribusi yang dihipotesiskan.  Uji goodness of fit
antara frekuensi pengamatan dan frekuensi harapan didasarkan pada besaran:

k
X 2 =∑ ¿ ¿ ¿ ¿
i=1

X2 : nilai peubah acak yang distribusi sampelnya didekati oleh distribusi Chi-Kuadrat
dengan derajat kebebasan v=k-1

k : jumlah sel atau kelas

oi : frekuensi amatan
ei : frekuensi harapan

Bila frekuensi amatan dekat dengan frekuensi harapan, maka nilai X 2 akan kecil. Hal
ini menunjukkan adanya kesesuaian yang baik antara frekuensi amatan dengan frekuensi
harapan. Tetapi jika frekuensi amatan cukup berbeda dengan frekuensi harapan maka nilai X 2
akan besar dan hal ini menunjukkan kesesuaiannya jelek. Kesesuaian yang baik akan
mendukung penerimaan terhadap H0, sedangkan keseuaian yang jelek akan mendukung
penolakan terhadap H0.

Daerah kritis berada pada ujung kanan distribusi Chi-Kuadrat. Untuk taraf keberartian
α, ditemukan nilai kritis X 2α dari tabel, maka daerah kritisnya adalah X 2 > X 2α. Uji goodness
of fit sebaiknya digunakan jika setiap frekuensi harapan paling sedikit 5. Jika kurang dari 5,
maka dilakukan penggabungan sel yang berdampingan, yang berakibat pada pengurangan
besarnya derajat kebebasan.

Contoh 1

Pada percobaan pelemparan dadu sebanyak 120 kali, dihipotesiskan bahwa dadu tersebut
setangkup. Ini berarti sama saja menguji hipotesis bahwa distribusi hasil pelemparan dadu
tersebut adalah distribusi seragam (uniform) diskret. Maka :

H0 = Hasil pelemparan dadu setangkup

H1 = Hasil pelemparan dadu tidak setangkup

1
f(x) = x = 1,2,…,6
6

Secara teoritis apabila dadu tersebut seimbang maka diharapkan bahwa kemunculan setiap
muka sebanyak 20 kali. Hasilnya diberikan pada tabel berikut :
Tabel V.7 Frekuensi Amatan dan Harapan dari Lantunan Dadu 120 Kali

MUKA
1 2 3 4 5 6
Amatan 20 22 17 18 19 24
Harapan 20 20 20 20 20 20

Dari tabel tersebut diperoleh nilai X 2 adalah:

(20−20)2 (22−20)2 (17−20)2 (18−20)2 (19−20)2 (24−20)2


2
X = + + + + + = 1,7
20 20 20 20 20 20

Apabila ditetapkan taraf keberartian, α = 5% maka dari tabel distribusi Chi-Kuadrat diperoleh
:

X 2α =11.070 dengan derajat kebebasan v = 5

Gambar V.12 Daerah Kritis Distribusi Chi-Square X 2α

Karena nilai X 2 < X 2α , maka H0 diterima.


Jadi dapat disimpulkan hasil pelemparan dadu tersebut setangkup.

Contoh 2
Akan diuji hipotesis bahwa distribusi frekuensi umur baterai dapat dihampiri dengan
distribusi normal dengan rataan µ = 3,5 dan simpangan baku σ = 0,7. Distribusi frekuensi
umur baterai disajikan dalam tabel berikut :

Tabel V.8 Frekuensi Umur Baterai

Selang
Titik Tengah Kelas Frekuensi
Kelas
1,5 – 1,9 1,7 2
2,0 – 2,4 2,2 1
2,5 – 2,9 2,7 4
3 – 3,4 3,2 15
3,5 – 3,9 3,7 10
4,0 – 4,4 4,2 5
4,5 – 4,9 4,7 3

Frekuensi harapan untuk 7 kelas (sel) diperoleh dengan menghitung luas di bawah
kurva normal yang dihipotesiskan yang berada antara berbagai batas kelas.

Sebagai contoh, nilai z pada kedua batas kelas keempat adalah

x 1−μ 2.95−3,5 x 2−μ 3.45−3,5


Z1 = = = -0,79 Z2 = = = -0,07
σ 0,7 σ 0,7

Dari tabel distribusi normal maka dapat diperoleh luas antara z1 = -0,79 dengan z2 = -0,07.
Luas = P(-0,79 < Z < -0,07)

= P(Z<-0,07) – P(Z<-0,79)

= 0,4721 – 0,2148

= 0,2573

Frekuensi harapan untuk kelas keempat adalah


e4 = luas x total frekuensi

= 0,2573 x 40

= 10,3

Frekuensi biasanya dibulatkan ke persepuluhan.

Frekuensi harapan untuk selang pertama diperoleh dengan menghitung luas di bawah
kurva normal di sebelah kiri batas 1,95. Sedangkan untuk kelas terakhir, hitung luas di bawah
kurva normal di sebelah kanan batas 4,45. Semua frekuensi harapan kelas lainnya dapat
dihitung dengan cara yang sama pada kelas keempat.

Tabel V.9 Frekuensi Amatan dan Harapan Umur Baterai Bila Distribusinya Normal

Batas Kelas oi ei
1,45 – 1,95 2 0,5
1,95 – 2,45 1 7 2,1 8,5
2,45 – 2,95 4 5,9
2,95 – 3,45 15 10,3
3,45 – 3,95 1 10,7
3,95 – 4,45 5 8
7,0 10,5
4,45 – 4,95 3 3,5

Pada kelas pertama, frekuensi harapan yang diperoleh kurang dari 5, maka dilakukan
penggabungan dengan kelas yang berdekatan yaitu kelas kedua dan ketiga. Begitu juga
dengan kelas keenam dan ketujuh. Karena penggabungan tersebut, jumlah kelas (sel)
berkurang dari 7 kelas menjadi 4 kelas.

(7−8,5)2 (15−10,3)2 (1−10,7)2 (8−10,5)2


X2 = + + + = 3,05
8,5 10,3 10,7 10,5
Dengan taraf keberartian, α = 5% maka dari tabel distribusi Chi-Kuadrat diperoleh :

X 2α =7,815 dengan derajat kebebasan v = 3. Artinya tidak ada alas an untuk menolak hipotesis
nol, dan dapat disimpulkan bahwa distribusi normal dengan µ = 3,5 dan simpangan baku σ =
0,7 mempunyai kesesuaian yang baik untuk distribusi umur baterai.

LATIHAN SOAL
1. Suatu mesin seharusnya mencampur kacang tanah, kemiri, mete, dan kenari dalam
perbandingan 5 : 2 : 2 : 1. Suatu kaleng yang berisi 500 keempat jenis kacang ini
ditemukan mengandung 269 kacang tanah, 112 kemiri, 74 mete, dan 45 kenari. Pada taraf
keberartian 0,05, uji hipotesis bahwa mesin tersebut mencampur kacang dalam
perbandingan 5 : 2 : 2 : 1.

2. Tiga kartu diambil dari sekotak kartu bridge, dengan pengembalian. Y adalah banyaknya
kartu spade yang terambil. Setelah percobaan sebanyak 64 kali diperoleh hasilnya sebagai
berikut :
Y 0 1 2 3
F 21 31 12 0

Ujilah hipotesis pada taraf keberartian 0,01 bahwa data yang diperoleh sesuai dengan
distribusi binomial b(y; 3, ¼), y = 0, 1, 2, 3

3. Tiga kelereng diambil dari sebuah botol yang berisi 5 kelereng merah dan 3 kelereng
hijau. X adalah banyaknya kelereng merah yang terambil, kelereng kemudian
dikembalikan lagi dan percobaan diulangi sebanyak 112 kali. Hasil yang diperoleh adalah
sebagai berikut :
X 0 1 2 3
F 1 31 55 25

Ujilah hipotesis pada taraf keberartian 5% bahwa data di atas sesuai dengan distribusi
hipergeometrik h(x,N,n,k)dimana N = 8, n = 3, k = 5.
4. Skor berikut menyatakan nilai ujian akhir mata kuliah statistika.

23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 76
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61

a. Berdasarkan data tersebut buatlah tabel distribusi frekuensi data berkelompok


Ujilah kebaikan suai kelompok amatan dengan frekuensi harapan padanannya dari distribusi
normal dengan µ = 65 dan σ = 21 dengan menggunakan taraf keberartian 0,05.

5. Barang rusak setiap hari yang dihasilkan oleh tiga buah mesin ternyata berdistribusi
Poisson. Pengamatan telah dilakukan selama enam hari dan terdapatnya barang rusak
setiap hari dalam ketiga mesin itu dapat dilihat di bawah ini.

Mesin Banyak barang rusak tiap hari

1 4, 3, 4, 6, 3, 5
2 3, 2, 3, 6, 5, 2
3 5, 5, 3, 4, 4, 6

Dapatkah disimpulkan bahwa rata-rata dihasilkannya barang rusak setiap hari oleh
ketiga mesin itu sama besar?

6. Hasil kuisioner terhadap dua kelompok pegawai (laki-laki dan perempuan) mengenai
pendapat tentang peraturan baru adalah sebagai berikut.

Pegawai
Laki- Laki Perempuan

Pendapat

Setuju 102 88
Tak Setuju 78 136

Tak Peduli 20 76

Apakah jenis kelamin menentukan pendapat tentang peraturan baru tersebut?

7. Dikatakan bahwa obat A dapat menyembuhkan pilek dalam tempo lima hari.
Percobaan terhadap 158 orang yang pilek telah dilakukan. Setengahnya diberi obat A
dan sisanya diberi obat gula. Pada akhir hari kelima sejak pengobatan dimulai,
hasilnya dicatat dan diberikan dalam daftar berikut.

Sembuh Bertambah Tidak

payah berubah

Obat A 54 10 15

Obat gula 48 12 19

Ujilah hipotesis bahwa obat A dan obat gula menghasilkan reaksi yang sama.
V.2 INDEPENDENSI (UJI KEBEBASAN)
Uji kebebasan ini digunakan untuk memeriksa kebebasan atau independensi dari dua
variabel (frekuensi observasi dan frekuensi harapan) sehingga kita dapat menyimpulkan
apakah kedua peubah tersebut saling bebas (tidak berpengaruh) ataukah keduanya saling
bertalian (berpengaruh).

Data untuk menguji kebebasan dua variabel tersebut disajikan dalam bentuk Tabel
Kontingensi atau Tabel Berkemungkinan yang umumnya berukuran r baris x k kolom.
Sebelum melakukan pengujian, terlebih dahulu kita harus mendefinisikan Hipotesis Awal
(H0) dan Hipotesis Alternatif (H1), yaitu:

 H0 : variabel-variabel saling bebas


 H1 : variabel-variabel tidak saling bebas

Biasanya Tabel Kontingensi berisikan data berupa frekuensi observasi yang diperoleh
dari suatu pengujian. Untuk itu, kita perlu mencari frekuensi ekspektasi terlebih dahulu
sebelum melakukan pengujian.

( total kolom ) x (total baris)


Frekuensi ekspektasi =
total observasi

Uji kebebasan dirumuskan dalam:

r,k
X2= ∑ ¿ ¿ ¿ ¿
i , j =1

X2 : nilai peubah acak yang distribusi sampelnya didekati oleh distribusi Chi-Kuadrat
dengan derajat kebebasan v=(r-1)(k-1)

k : jumlah kolom

r : jumlah baris

oij : frekuensi observasi baris ke-i, kolom ke-j

eij : frekuensi ekspektasi baris ke-i, kolom ke-j


Contoh 1

Kita akan menguji kebebasan antara faktor gender (jenis kelamin) dengan jam kerja di suatu
pabrik. Data yang diperoleh disajikan dalam tabel berikut:

Pria Wanita Total Baris


< 25 jam/minggu 2 3 5
25-50 jam/minggu 7 6 13
> 50 jam/minggu 5 7 12
Total Kolom 14 16 Total Observasi=30

Apakah ada kaitan antara gender dengan jam kerja? Gunakan taraf uji 0,05.

Jawab :

1. H0 : gender dan jam kerja saling bebas


2. H1 : gender dan jam kerja tidak saling bebas
3. α = 0,05
4. Daerah kritis 2 > 5,99147 dengan derajat kebebasan v =(3-1)(2-1)= 2
5. Perhitungan 2
Frekuensi harapan untuk:
14 x 5 16 x 5
- Pria, < 25 jam = = 2,33 - Wanita, < 25 jam = = 2,67
30 30
14 x 13 16 x 13
- Pria, 25-50 jam = = 6,07 - Wanita, 25-50 jam = = 6,93
30 30
14 x 12 16 x 12
- Pria, > 50 jam = = 5,60 - Wanita, >50 jam = = 6,40
30 30

kategori oij eij (oij - eij) (o ij−e ij)2 (o ij−e ij)2/ eij

P, < 25 2 2,33 -0,33 0,1089 0,0467

P, 25-50 7 6,07 0,93 0,8649 0,1425

P, > 50 5 5,60 -0,60 0,36 0,0643

W, < 25 3 2,67 0,33 0,1089 0,0408

W, 25-50 6 6,93 -0,93 0,8649 0,1249

W, > 50 7 6,40 0,60 0,36 0,0563

∑ 2 hitung = 0,4755

6. Keputusan : 2 hitung < 2 tabel, H0 diterima


7. Kesimpulan : gender dan jam kerja saling bebas

Contoh 2

Suatu percobaan dilakukan untuk mengetahui apakah pendapat penduduk pemilih di negara
bagian Illinois mengenai perubahan pajak baru tidak ada hubungannya dengan tingkat
penghasilannya. Suatu sampel acak 1000 pemilih yang tercatat di Illinois dikelompokan
menurut apakah penghasilan mereka rendah, sedang, atau tinggi, dan apakah mereka setuju
atau tidak terhadap perubahan pajak baru dalam tabel kontingensi berikut: (gunakan taraf uji
0,05)

Perubahan Tingkat Pendapatan Total


Pajak R (Rendah) M (Menengah) B (Berada)
Setuju 182 213 203 598
Tidak Setuju 154 138 110 402
Total 336 351 313 1000

Jawab :

1. H0 : pendapat penduduk pemilih di negara bagian Illinois mengenai perubahan pajak


baru dan tingkat penghasilannya saling bebas
2. H1 : pendapat penduduk pemilih di negara bagian Illinois mengenai perubahan pajak
baru dan tingkat penghasilannya tidak saling bebas
3. α = 0,05
4. Daerah kritis 2 > 5,991 dengan derajat kebebasan v =(2-1)(3-1)= 2
5. Perhitungan 2
Frekuensi harapan untuk:
336 x 598 336 x 402
- Setuju, R = = 200,9 - Tidak Setuju, R = = 135,1
1000 1000
351 x 598 351 x 402
- Setuju, M = = 209,9 - Tidak Setuju, M = = 141,1
1000 1000
313 x 598 313 x 402
- Setuju, B = = 187,2 - Tidak Setuju, B = = 125,8
1000 1000

(oij - eij) (o ij−e ij)2 (o ij−e ij)2/ eij


kategori oij eij

-18,9 357,21 1,78


Setuju, R 182 200,9

3,1 9,61 0,05


Setuju, M 213 209,9
15,8 249,64 1,33
Setuju, B 203 187,2

18,9 357,21 2,64


Tidak Setuju, R 154 135,1

-3,1 9,61 0,07


Tidak Setuju, M 138 141,1

-15,8 249,64 1,98


Tidak Setuju, B 110 125,8
∑ 2 hitung = 7,85

6. Keputusan : 2 hitung > 2 tabel, H0 ditolak


7. Kesimpulan : pendapat penduduk pemilih di negara bagian Illinois mengenai
perubahan pajak baru dan tingkat penghasilannya tidak saling bebas.

Latihan Soal

1. Dalam percobaan untuk meneliti kaitan hipertensi dengan kebiasaan merokok, diperoleh
data berikut yang menyangkut 180 orang:
Bukan Perokok Perokok Sedang Perokok Berat
Hipertensi 21 36 30
Tidak hipertensi 48 26 19

Ujilah hipotesis bahwa ada tidaknya hipertensi tidak tergantung pada kebiasaan
merokok. Gunakan taraf keberartian 0,05.

2. Suatu sampel acak 200 pria yang telah berkeluarga, semuanya sudah pensiun, dibagi
menurut pendidikan dan jumlah anak:
Pendidikan Ayah Jumlah Anak
0-1 2-3 Lebih dari 3
Sekolah Dasar 14 37 32
Sekolah Menengah 19 42 17
Perguruan Tinggi 12 17 10

Ujilah hipotesis, pada taraf keberartian 0,05, bahwa banyaknya anak tidak tergantung
pada tinggi pendidikan yang dicapai oleh ayah.

3. Seorang kriminolog melakukan sigi untuk menentukan apakah terjadinya berbagai


kejahatan tertentu berbeda dari satu bagian ke bagian lain suatu kota besar. Kejahatan
yang ingin diselidiki ialah penodongan, pembongkaran, pencurian, dan pembunuhan.
Tabel berikut menunjukan banyaknya kejahatan yang terjadi di 4 bagian kota tahun lalu.
Daerah Jenis Kejahatan
Penodongan Pembongkaran Pencurian Pembunuhan
1 162 118 451 18
2 310 196 996 25
3 258 193 458 10
4 280 175 390 19

Dapatkah disimpulkan dari data ini pada taraf keberartian 0,01 bahwa terjadinya
kejahatan tersebut bergantung pada daerah di kota itu?
BAB VI
ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

6.0. Tujuan Pembelajaran:


Mahasiswa Mampu:
1. Menghitung dan menginterpretasikan korelasi sederhana antara dua variabel
2. Mengetahui hubungan dua variabel yang tidak linier

3. Menentukan korelasi dan mengujinya


4. Menghitung dan menginterpretasikan persamaan regresi linier sederhana
5. Mengetahui asumsi yang digunakan dalam analisa regresi
6. Menentukan Model Regresi yang Layak
7. Menghitung dan Menginterpretasikan Interval Keyakinan untuk Koefisien
Regresi
8. Mengetahui bahwa analisis regresi dapat digunakan sebagai alat prediksi
9. Mengetahui bagaimana menerapkan kasus nyata yang berhubungan dengan
analisis regresi secara benar
6.1. Scatter Plot
Sebelum menentukan bentuk hubungan dengan analisis regreis linier atau
sebelum mengukur keeratan hubungan antara dua variabel, harus dilihat
apakah variabel-variabel tersebut mempunyai hubungan linier atau tidak
dengan menggunakan scatter plot seperti yang dibawah ini:

Grafik 1.Scatter Plot (Diagram Pencar)

Scatter Plot
Tidak Ada Hub.linier
Hubungan Linier Positif

Tidak ada Hubungan


Hubungan Linier Negatif

© 2010 Hermita Dyah Puspita BAB 11-

Dalam scatter plot diatas ada empat kriteria,yaitu:

Bila titik-titik menggerombol mengikuti sebuah garis lurus dengan kemiringan


positif, maka kedua variabel dinyatakan memiliki hubungan linier positif
Bila titik-titik menggerombol mengikuti sebuah garis lurus dengan kemiringan
negatif, maka kedua variabel dinyatakan memiliki hubungan linier negatif
Bila titik-titik menggerombol tidak mengikuti garis lurus, maka kedua variabel
dinyatakan tidak memiliki hubungan yang linier
Bila titik-titik memencar atau membentuk suatu garis lurus mengikuti sebuah
pola yang acak atau tidak ada pola, maka kedua variabel dinyatakan tidak
memilki hubungan.
  6.2. Analisis Korelasi
Analisis korelasi digunakan untuk mengukur kekuatan hubungan linier antara
dua variabel. Koefisien korelasi populasi ρ (rho) adalah ukuran kekuatan
hubungan linier antara dua variabel dalam populasi sedangkan koefisien
korelasi sampel r adalah estimasi dari ρ dan digunakan untuk mengukur
kekuatan hubungan linier dalam sampel observasi. Untuk selanjutnya r disebut
Koefisien Korelasi Pearson Product Momernt.

6.2.1. Korelasi Pearson (Product Moment)

Korelasi pearson sering juga disebut sebagai korelasi produk-momen atau


korelasi saja. Korelasi pearson termasuk ke dalam statistika parametrik.
Besarnya koefisien menggambarkan seberapa erat hubungan linear antara dua
variabel, bukan hubungan sebab akibat. Variabel yang terlibat dua-duanya
bertipe numerik (interval atau rasio), dan menyebar normal jika ingin
pengujian terhadapnya sah.

Berikut ini pedoman menentukan kuat tidaknya korelasi antara dua


variabel menurut Walpole :

Tabel 1.

Interval Koefisien Tingkat Hubungan

0.00 – 0.199 Sangat rendah


0.20 – 0.399 Rendah
0.40 – 0.599 Cukup
0.60 – 0.799 Kuat
0.80 – 1.000 Sangat Kuat

Menurut Sarwono (2006) Batas-batas nilai koefisien korelasi diinterpretasikan


sebagai berikut:
Tabel 2.

Interval Hubungan Tingkat Hubungan

0 Tidak ada korelasi antara dua


variabel
>0 – 0,25 Korelasi sangat lemah
>0,25 – 0,5 Korelasi cukup
>0,5 – 0,75 Korelasi  kuat
>0,75 – 0,99 Korelasi  sangat kuat
1

Korelasi sempurna

Hasil dari analisis korelasi menunjukkan kekuatan atau kelemahan dari suatu
hubungan.Nilai koefisien korelasi ini akan berada pada kisaran -1 sampai
dengan +1. Koefisien korelasi minus menunjukkan hubungan yang
terbalik, dimana pengaruh yang terjadi adalah pengaruh negatif. Dalam
pengaruh yang negatif ini kenaikan suatu variabel akan menyebabkan
penurunan suatu variabel yang lain, sedangkan penurunan suatu variabel akan
menyebabkan kenaikan variabel yang lain.
Koefisien korelasi positif menunjukkan hubungan yang searah dari dua
variabel, dimana kenaikan suatu variabel akan menyebabkan kenaikan
variabel yang lain dan sebaliknya penurunan suatu variabel akan
menyebabkan penurunan variabel yang lain.
Koefisien korelasi sebesar nol menunjukkan tidak adanya hubungan antara
dua variabel, dengan kata lain kenaikan atau penurunan suatu variabel tidak
mempengaruhi variabel yang lain, jadi berapapun perubahan harga pada suatu
variabel tidak akan mempengaruhi variabel yang lain karena nilainya yang
tetap.
Terdapat bermacam-macam analisis korelasi yang dapat digunakan untuk
mengukur hubungan asosiatif dari suatu variabel. Korelasi yang akan
digunakan tergantung pada jenis data yang akan dianalisis. Korelasi
berdasarkan tingkatan data dapat dilihat pada tabel berikut ini:

Tabel.3 Korelasi Berdasarkan Tingkatan Data

Teknik Korelasi yang


Tipe / Tingkat Data
Digunakan

Nominal Koefisien Kontingensi

Spearman Rank
Ordinal
Kendal Tau

Pearson / Produk Momen


Interval dan rasio Korelasi Ganda
Korelasi Parsial.

Koefisien korelasi pearson diformulasikan sebagai berikut:

r=
∑ ( x− x̄ )( y − ȳ )
√[ ∑ ( x− x̄)2 ][ ∑ ( y− ȳ )2 ]
Atau: n ∑ xy−∑ x ∑ y
r=
√[ n( ∑ x2 )−( ∑ x )2 ][ n( ∑ y2 )−(∑ y)2 ]
S xx S xy
Atau: r =b
√ =
S yy √ S xx S yy
dimana:
r = Koefisien Korelasi Sampel
n = Ukuran Sampel
x = Nilai dari Variabel Independen
y = Nilai Variabel dependen

Dari persaamaan korelasi yang terakhir tersebut dapat dilihat adanya


hubungan antara b dan r. r digunakan untuk mengukur hubungan linier antara
x dan y, sedangkan b mengukur perubahan dalam y akibat perubahan setiap
unit x.
Dalam kasus dimanai r1 = 0,3 dan r2 = 0,6 hanya berarti bahwa terdapat
korelasi positif dimana r2 lebih kuat daripada r1. Adalah salah jika
menyimpulkan bahwa r2 mengindikasikan hubungan linier dua kali lebih baik
dibandingkan dengan r1.

6.2.2.Koefisien Determinansi
Koefisien determinansi adalah salah satu alat analisis yang dapat digunakan
untuk mengetahui lebih jauh hubungan antar variabel. Koefisien determinansi
disimbolkan dalam R2 yang menyatakan proporsi variansi keseluruhan dalam
nilai variabel dependen yang dapat diterangkan oleh hubungan linier dengan
variabel independen atau menunjukkan proporsi total variasi dalam nilai
variabel dependen yang dapat dijelaskan oleh hubungan linier dengan nilai
variabel independen. Nilai koefisien determinansi ini berkisar :0 ≤ R 2 ≤ 1
R2 juga dapat digunakan untuk mempertimbangkan sebuah model regresi. Jika
R2 suatu model besar belum tentu model tersebut adalah model yang baik,
tetapi jika MSE model kecil maka model teresbut adalah model regresi yang
terbaik.
Koefisien determinasi biasanya dinyatakan dengan persen. Sedangkan
penafsirannya jika 0.994 sehingga R2 = 0.989 atau 98.9% adalah pengaruh
variabel bebas terhadap perubahan variabel terikat adalah 98,9%, sedangkan
sisanya sebesar 1,1% dipengaruhi oleh variabel lain selain variabel bebas X.
Koefisien determinasi banyak digunakan dalam penjelasan tambahan untuk
hasil perhitungan koefisien regresi.
6.2.3. Korelasi Ganda
Korelasi ganda adalah korelasi yang menunjukkan arah dan kuatnya hubungan
antara dua atau lebih variabel terikat secara bersama-sama dengan variabel
yang lain (variabel bebas). Contohnya: hubungan antara kesejahteraan
pegawai, hubungan dengan pemimpin, dan pengawasan dengan efektivitas
kerja.
Korelasi berganda merupakan korelasi dari beberapa variabel bebas secara
serentak dengan variabel terikat. Misalkan ada k variabel bebas,

X 1 , X 2 ,..., X k dan satu variabel terikat Y dalam suatu persamaan regresi linear

maka besarnya korelasi bergandanya adalah :

a1 ∑ x 1 y+ a2 ∑ x2 y +…+ ak ∑ xk y
ry,x 1 ,… , x n
=
∑ y2

dengan
∑ X 1∑ Y
∑ x 1 y=∑ X 1 Y − n
∑ Xk ∑ Y
∑ x k y=∑ X k Y − n
2
2 2 (∑ Y )
∑ y =∑ Y −
n

6.2.4. Korelasi Parsial


Korelasi parsial adalah korelasi yang menunjukkan arah dan kuatnya
hubungan atau pengaruh antara dua variabel atau lebih (variabel bebas dan
terikat) setelah satu variabel yang diduga dapat mempengaruhi hubungan
variabel tersebut dikendalikan untuk dibuat tetap keberadaannya.
Persamaan korelasi antara x1 dengan y, bila variabel x1 dikendalikan atau
korelasi antara x1 dengan y bila x2 tetap yaitu :
(r ¿ ¿ y x2 ×r x x )
ry,x , x2 =r y x − 1 2
¿
2 2
√ (1−r )(1−r
1 1

x1 x2 y x2 )

Dimana :
ry,x 1 , x2 = korelasi antara x1 dengan x2 secara bersama-sama dengan variabel y
r y x = korelasi product moment antara x1 dengan y
1

r y x = korelasi product moment antara x2 dengan y


2

rx 1 x2 = korelasi product moment antara x1 dengan x2

6.3. Uji Hipotesis Korelasi

Pengujian hipotesis korelasi bertujuan untuk mengetahui apakah terdapat


hubungan antara dua variabel tertentu.

 Perumusan hipotesis untuk korelasi adalah sebagai berikut:


H0: Tidak ada hubungan linier yang signifikan antara dua variabel
H1: Ada hubungan linier yang signifikan antara dua variabel

Atau H0 :ρ=0

H1 :ρ≠0
 Statistik uji:
Statistik uji menggunakan uji-T, yakni dengan menggunakan rumus sebagai
berikut:
b SSR
t hitung = =√
S S
r n−2
t hitung = √ 2
√ 1−r
atau
S xx

t tabel=t α dimana df =n−2


( ;df )
2

 Kriteria uji
Tolak H0 jika thitung > ttabel atau thitung < -ttabel
 Kesimpulan
Sementara untuk menguji hipotesis koefisien korelasi dengan menggunakan
koefisien korelasi taksiran ( ρ0 ¿, dapat digunakan hipotesis sebagai berikut:
 H 0 : ρ=ρ 0 dimana ρ0 ≠ 0

H 1 : ρ≠ ρ0

 Statistik uji:

( 1+ r ) ( 1−ρ0 )
z hitung = √
n−3
2
ln
[
(1−r ) ( 1+ ρ0 ) ]
z tabel =z α (uji satu sisi) atau z tabel =z α (uji dua sisi)
2

 Kriteria uji:
Tolak H0 jika zhitung > ztabel atau zhitung < -ztabel
 Kesimpulan

6.4.Analisis Regresi
Dalam kehidupan sehari-hari, seringkali dijumpai kasus yang berhubungan dengan
dua variabel atau lebih. Hubungan tersebut dapat berupa hubungan kausal atau
hubungan fungsional. Hubungan kausal misalnya : hubungan antara panas dengan
tingkat muai panjang, sedangkan hubungan fungsional contohnya: hubungan antara
kepemimpinan dengan tingkat kepuasan kerja pegawai.
Secara umum terdapat dua macam hubungan antara dua variabel atau lebih, yaitu :
Keeratan hubungan dapat diketahui dengan analisis korelasi (bukan hubungan
sebab-akibat)
Bentuk hubungan dapat diketahui dengan analisis regresi

6.4.1. Sejarah Regresi


Sejarah Regresi dimulai ketika Sir Francis Galton (1822-1911) yang
membandingkan tinggi badan anak laki-laki dengan tinggi badan ayahnya. Galton
menunjukkan bahwa tinggi anak laki-laki dari ayah yang tinggi setelah beberapa
generasi cenderung mundur (regressed) mendekati nilai populasi. Dengan kata lain,
anak laki- laki dari ayah yang badannya sangat tinggi, cenderung lebih pendek dari
ayahnya. Sedangkan anak laki-laki dari ayah yang badannya sangat pendek
cenderung lebih tinggi dari ayahnya. Sekarang istilah regresi diterapkan pada semua
peramalan.

6.4.2. Definisi Regresi


Regresi merupakan salah satu metoda dalam analisis statistika yang digunakan untuk
menganalisis dan memodelkan secara matematis hubungan diantara dua variabel
atau lebih. Pada analisis regresi ini dikenal adanya variabel dependen (variabel tak
bebas/variabel tergantung/Unknown Variable/Response Variable) dan variabel
independen (variabel bebas/ Explanatory Variable/Regressor Variable/Predictor
Variabls/). Regresi dipakai untuk mengukur besarnya pengaruh perubahan pada
variabel dependen yang diakibatkan perubahan pada variabel independen.
Menurut Gujarati (2006) analisis regresi merupakan suatu kajian terhadap hubungan
satu variabel yang disebut sebagai variabel yang diterangkan (the explained
variabel) dengan satu atau dua variabel yang menerangkan (the explanatory).
Variabel pertama disebut juga sebagai variabel tergantung dan variabel kedua
disebut juga sebagai variabel bebas. Jika variabel bebas lebih dari satu, maka analisis
regresi disebut regresi linear berganda. Disebut berganda karena pengaruh beberapa
variabel bebas akan dikenakan kepada variabel tergantung. Saat ini, analisis regresi
banyak digunakan untuk menelaah hubungan dua variabel atau lebih dan
menentukan pola hubungan yang modelnya belum diketahui, sehingga regresi secara
aplikatif lebih bersifat eksploratif.

6.4.3. Asumsi

Penggunaan regresi linear sederhana didasarkan pada asumsi diantaranya sbb:


 Error (ε) independen secara statistik
 Distribusi probabilitas dari Error berdistribusi Normal
 Distribusi probabilitas dari Error(*) mempunyai variansi yang konstan
 Ada hubungan linier antara kedua variabel
Catatan (*):

 Residual adalah selisih antara nilai duga (predicted value) dengan nilai
pengamatan sebenarnya apabila data yang digunakan adalah data sampel.
 Error adalah selisih antara nilai duga (predicted value) dengan nilai pengamatan
yang sebenarnya apabila data yang digunakan adalah data populasi.
 Persamaan keduanya : merupakan selisih antara nilai duga (predicted value)
dengan pengamatan sebenarnya.
 Perbedaan keduanya: residual dari data sampel, error dari data populasi.

6.4.5. Analisis Regresi Linier Sederhana


Regresi linier sederhana ini bertujuan untuk mempelajari hubungan antara dua
variabel yaitu satu variabel bebas/variabel independen (X) dan variabel
terikat/variabel dependen (Y). Bentuk umum dari pesamaan regresi linier sederhana
dari populasi adalah: y=α+βx+ε

Persamaan garis regresi sampel memberikan estimasi garis regresi populasi sebagai
berikut:
^y i=a+ bx
Keterangan :
y i = nilai estimasi dari variabel bebas. Ŷ juga merupakan variabel terikat (dependen
^
variable)
a = konstanta yang merupan nilai estimasi ^y jika nilai x=0 (intercept)
b = koefisien regresi/gradient garis regresi (slope)
x = variabel bebas (independent variable)

6.4.5.1. Metode Kuadarat Terkecil (Least-Squares Method)


Metode untuk menaksir α dan β sehingga jumlah kuadrat dari deviasi simpangan
antara observassi-observasin dan garis regresi menjadi minimum:
n ❑
SSE=L=∑ e 2i =∑ ¿ ¿ ¿ ¿
i=1 i=1

Dimana ε adalah nilai sisaan/galat/error yang merupakan penyimpangan model


regresi dari nilai yang sebenaranya.
Gambar VI.2 Grafik Regresi Linier dengan Nilai ε

Dengan cara mendeferensialkan persamaan di atas terhadap α dan kemudian


terhadap β, kemudian menyamakan hasil pendeferensilan itu dengan nol, maka:
n
∂L
=−2 ∑ (Y i−a−b ( xi −x́ ¿ ))=0 ¿
∂a i=1
n
∂L
=−2 ∑ (Y i−a−b ( xi −x́ ¿ ))(x i−x́)=0 ¿
∂b i=1

Penyederhanaan dua persamaan tersebut di atas menghasilkan persamaan normal

kuadrat terkecil sebagai berikut:


n n
na+ b ∑ xi =∑ y i
i=1 i=1

dan
n n n

Dari persamaan di atas,∑ x i y i=a


maka diperoleh ∑ x i2
∑ x i +bpersamaan:
i=1 i=1 i=1

∑ ( x− x̄ )(S xyy− ȳ )
b= atau b= S 2atau
( x− x̄xx)

n ∑ xy−∑ x ∑ y
atau b= 2
2
n∑ x − (∑ x )
Dari persamaan di atas disubstitusi, maka diperoleh persamaan untuk menentukan

n n

∑ yi ∑ xi
nilai a: a = i=1
−b i=1
n n
atau:
a = ý – bx́
Dimana:
ý = rata – rata yi
x́ = rata – rata xi

6.4.5.2. Partisi dari Varians Total

Estimasi parameter σ 2 menghasilkan variansi yang disebabkan karena kesalahan


model dan variansi yang disebabkan karena kesalahan eksperimen. Dekomposisi
varians dapat dijabarkan sebagai berikut:

SST = SSR + SSE


Keterangan:
SST = Sum of Square Total / Jumlah Kuadrat Total = S yy
SSR = Sum of Square Regression / Jumlah Kuadrat Regresi = b S xy

SSE = Sum of Square Eror / Jumlah Kuadrat Eror = S yy −¿ b S xy

Dimana : S xx =∑ x i2−n x́ 2
S yy =∑ y i2−n ý 2
S xy =∑ x i yi −n x́ ý
6.4.5.3. Estimasi dari σ 2
Sum of Square Error (SSE) merupakan variansi yang menggambarkan
penyimpangan dari nilai–nilai observasi di sekitar garis regresi sampel. Nilai SSE (
Se ) atau yang biasa disebut MSE (Mean Squared Error) adalah estimasi dari σ 2 dan
diestimasi dengan persamaan berikut:

∑ ( y− ^y )2 = SSE S −b S xy
Se = S =
√ n−2 √ n−2 √
= yy
n−2

Standar Error Koefisien Regresi


Jika diambil sampel x dan y dari populasi, maka masing–masing sampel tersebut
memiliki gradien/slope (b) sendiri. Gradien sampel tersebut akan bervariasi disekitar
nilai koefisien regresi tersebut. Maka perlu diketahui variasi koefisien regresi
tersebut dengan persamaan berikut:

s sε sε
s b= = =
S
√ xx √ ∑ ( x− x̄ )2
( ∑ x )2
√ 2
∑x − n
6.4.5.3. Standar Error untuk ý bila nilai x diketahui
Jika nilai x dimasukkan berulang–ulang pada persamaan regresi, maka nilai rata–rata
yang diperoleh tidak akan sama, yang artinya nilai ý bervariasi. Sehingga nilai
standar error ý dapat ditentukan dengan persamaan berikut (bila x diketahui):

2
S ý = S
e (√( 1 ( x 0−x́ )
n
+
S xx ))
6.4.6.Uji Parsial Parameter Regresi

Digunakan untuk menguji apakah parameter β berarti pada model secara parsial.
Tahapan uji yang dilakukan:
 Hipotesis:
H0 : β = 0
H1 : β ≠ 0
 Statistik Uji:
b−β 0 b− β0
t= =
s / √ S xx Sb
 Pengambilan Keputusan:

Tolak H0 jika thitung > t a/2(df= n-2) pada selang kepercayaan α

 Kesimpulan

6.4.7. Uji Intersep Model Regresi


Tahapan uji yang dilakukan:

 Hipotesis:
H0 : α = 0
H1 : α ≠ 0
 Statistik Uji:
a−α
t=
∑ xi
s
√ n S xx
 Pengambilan Keputusan
Tolak H0 jika thitung > t a/2(db= n-2) pada selang kepercayaan α
 Kesimpulan

6.4.8. Selang Kepercayaan

Selang Kepercayaan untuk α:

a±t α /2
S √∑ x i 2
√ nS xx
Selang Kepercayaan untuk β:

b±t α /2 s b
6.4.9.Prediksi

Estimasi selang keyakinan untuk Rata-rata y, diberikan pada saat xp

2
1 ( x p − x̄ )
^y ±t α /2 s ε
√ +
n ∑ ( x− x̄ )2
Estimasi selang keyakinan untuk Nilai individual y diberikan pada saat xp
2
1 ( x p − x̄ )
^y ±t α /2 s ε
√ 1+ +
n ∑ ( x− x̄ )2

6.5. Pemilihan Model Regresi

Penentuan model regresi linier sederhana ditekankan pada konsep linieritasnya


dengan asumsi awal bahwa hubungan tersebut linier diparamater regresinya.
Pemilihan variabel independen yang kurang tepat dapat menimbulkan bias
dalam estimasinya.
Tahapan uji yang dilakukan:

 Hipotesis
H0 : β = 0
H1 : β ≠ 0
 Tentukan daerah kritis dengan Level of Significance (α) yang biasa
digunakan adalah 0,01 atau 0,05

Tabel VI.10 Analysis of Variance

Sumber
Variansi SS df MS Fhitung
Regresi SSR 1 MSR = SSR/1 MSR/s2
Error SSE n–2 S2 = SSE/n-2
Total SST n–1
 Pengambilan Keputusan
Tolak H0 jika Fhitung > Ftabel(1 , n-2) pada selang kepercayaan (level of significance)
α
 Kesimpulan

6.5.1 Pendekatan Analisis Varians (Anova)

Untuk menguji kelayakan dari suatu model regresi digunakan pendekatan analisis
varians.Analisis varians adaah suatu prosedur membagi variansi total variabel
dependen menjadi dua komponen, yaitu: variansi model sistematik dan variansi
error.

6.6. Analisis Residual

Analisis residual dapat dilakukan dengan:

a. Pengujian Unequal variances: Varians pada setiap nilai x harus identik,


yaitudengan melakukan plot e^i dengan ^y , apabila terdapat pola-pola tertentu
berarti varians tidak identik sehingga perlu distabilkan dengan transformasi.

b. Pengujian Non normal error,yaitu dengan:


 Stem and leaf
 Histogram
 Dot diagram
 Plot normal (Normal Probability Plot)
c. Jika terdapat extreme skewness (kemiringan yang ekstrim) pada data, maka tidak
berdistribusi normal.
d. Pengujian Correlated Error (independent), yaitu dengan melihat plot e^i dengan
time order (i). Jika ada pola tertentu, maka terjadilah dependent residual dimana
penyebabnya dapat karena kesalahan eksperimen atau kesalahan dalam
pembentukan model atau karena variabel prediktor yang diabaikan.
e. Pengecekan Ouliers residual yaitu dengan cara plot residual dalam batas
pengujian ±3σ ( plot e^i dengan ^y ).Apabila residual terletak di luar batas 3σ atau
nilainya lebih besar dari 3σ, maka ada indikasi outlier.

6.7. Pengujian Linieritas Regresi:untuk data dengan observasi berulang


Pada beberapa percobaan untuk mendapatkan hasil yang akurat seringkali dilakukan
pengulangan observasi untuk setiap nilai x, sehingga perlu dilakukan pengujian
apakah model yang dihasilkan sudah memenuhi atau tidak. Untuk menggambarkan
kondisi tersebut diatas dilakukan pengujian kecocokan model dengan pendekatan
Lack Of Fit.

6.7.1. Pengujian Lack Of Fit


Sum of squared error terdiri atas dua komponen, yaitu variasi random yang
muncul antar nilai y untuk setiap nilai x (pure experimental error) dan komponen
yang dikenal dengan istilah Lack Of Fit (LoF), untuk mengukur ketepatan model.
Prosedur Pengujian:

 Hipotesis
H0 : Tidak ada LoF
H1 : Ada LoF Model Linier tidak sesuai
 Tentukan daerah kritis dengan Level of Significance (α) yang biasa digunakan
adalah 0,01 atau 0,05
 Hitung Pure Error sum of square ( SSpe)

k n
SS pe =∑ ∑ ¿ ¿ ¿ ¿ dengan df = n – k
i=1 i=1

Tabel VI.2 Analysis of Variance

Sumber
Variansi SS df MS Fhitung
Regresi SSR 1 MSR = SSR/1 MSR/s2
Error: SSE n – S2 = SSE(/n-2)
2
Lof SSE - SSpe k-2 (SSE – SSpe ¿/(k−2) SSE−SSpe
Pure error SSpe n-k S2= SSpe /(n-k) S 2( k−2)
Total SST n

 Pengambilan Keputusan

Tolak H0 jika Fhitung > Ftabel(k-2 , n-k) pada selang kepercayaan (level of significance) α

 Kesimpulan

Contoh 1
nilai 9 mahasiswa dari suatu kelas pada ujian tengah semester (x) dan pada ujian akhir
semester (y) sebagai berikut :

n 1 2 3 4 5 6 7 8 9

xi 77 50 71 72 81 94 96 99 67

yi 82 66 78 34 47 85 99 99 68
a. Tentukan persamaan garis regresi linear.
b. Tentukan nilai ujian akhir seorang murid yang mendapat nilai 85 pada ujian
tengah semester.
Jawab :
persamaan regresi linear

n 1 2 3 4 5 6 7 8 9 Σ
xi 77 50 71 72 81 94 96 99 67 707
yi 82 66 78 34 47 85 99 99 68 658
xiyi 631 3300 5538 2448 3807 7990 9504 9801 4556 53258
4
xi2 592 2500 5041 5184 6561 8836 9216 9801 4489 57557
9

( 9 ) ( 53.258 )−( 707 ) (658)


Sehingga b = = 0,777142
( 9 ) ( 57.557 )−(707)2

dan

658−( 0,777142 ) (707)


a= = 12,06232
9
jadi, persamaan regresi linear adalah
^y = 12,06232 + 0,777142x

x = 85

^y = 12,06232 + (0,777142)(85) = 78,11936


Contoh 2
Lakukan uji regresi dengan pendekatan ANOVA pada :

x 3,4 2,8 2,5 3,7 3,2 3,1 2,9 3 2,2 2,4 2,7

y 25 20 18 25 21 22 30 22 10 20 17
Jawab :
Σx = 31,9 Σy = 230 Σ xiyi = 675,5
Σ xi2 = 94,49 Σ yi2 = 4866
x́ = 2,9 ý = 20,9091
b = 0,777142
a = 12,06232
Sxx = Σ xi2 – n(x́)2 = 1,98
Sxy = Σ xiyi – n(x́ ý)= 8,4997
Syy = Σ yi2 – n( ý)2 = 56,9049
SSR = b2 Sxx = 36,4894
SSE = Syy – SSR = 20,4155

 Hipotesis
H0 : β = 0
H1 : β ≠ 0
α = 0.05
 Tabel Anaysis of Variance

KomponenRe SS df MS Fhitung
gresi
Regresi 36,4 1 36,49
9 16,08
2
7
6

Error 20,4 9
2 2,27

Total 56,9 10
0
4
9
 Pengambilan Keputusan
F tabel = F(0.05;1,9) = 5,12
Karena Fhitung > Ftabel maka Ho ditolak
 Kesimpulan:Model Regresi linier sesuai

Contoh 3
Berikut adalah data jumlah biaya promosi (x) dan jumlah penjualan (y) pada perusahaan
ABC.

Tahu
Jumlah Biaya Promosi x) Jumlah Penjualan (y)
n

2005 22 30

2006 36 38

2007 31 35

2008 32 37

2009 31 34

2010 32 38

Tentukanlah apakah terdapat hubungan antara biaya promosi dengan penjualan


menggunakan uji korelasi Spearman Rank dan tingkat kesalahan 1%!
Jawab:

Jumlah
Jumlah
Biaya Range Range
Tahun Penjuala d i=R ( x )−R( y) d i 2 
Promos x y
n (y)
i (x)

2005 22 30 1 1 0 0

2006 36 38 6 5.5 0.5 0.25

2007 31 35 2.5 3 -0.5 0.25

2008 32 37 4.5 4 0.5 0.25

2009 31 34 2.5 2 0.5 0.25

2010 32 38 4.5 5.5 -1 1

∑ 2

6 (2) 12
r s=1− 2
=1− =1−0 , 057=0 , 943
6(6 −1) 210
Uji Hipotesis:
H0 : Tidak ada hubungan yang signifikan antara variabel biaya promosi dengan variabel
penjualan
H1 : Ada hubungan yang signifikan antara variabel biaya promosi dengan variabel
penjualan.

Statistika uji:
r √n−2 ( 0 ,943 ) √ 6−2 1 , 886
t hitung = 2
= 2
= =17 , 03
1−r 1−( 0 , 943 ) 0 ,11075
t tabel=t =4 ,604
( 0 ,01
2
; 4)

Kriteria uji: Karena thitung > ttabel maka tolak H0


Kesimpulan: Karena tolak H0 maka terima H1 yakni ada hubungan yang signifikan antara
variabel biaya promosi dengan variabel penjualan

LATIHAN SOAL:

1. Data berikut menyatakan IQ=X untuk kelompok anak berumur tertentu dan hasil ujian
prestasi pengetahuan umum (Y).

Xi Yi Xi Yi Yi Yi

114 29 130 71 96 45
110 41 142 68 89 32
113 48 137 69 105 50
137 73 140 66 125 57
116 55 125 39 107 59
132 80 134 78 97 48
90 40 106 49 134 55
121 75 121 59 106 45
107 43 111 66 99 47
120 64 126 67 98 59
125 53 95 46 117 47
92 31 105 47 100 49

a. Gambar diagram pencarnya.


b. Tentukn regresi linear Y atas X lalu gambarkan.
c. Jelaskan arti koefisien arah yang didapat.
d. Berapa rata-rata prestasi anak dapat diharapkan jika IQ nya 120?
e. Tentukan interval kepercayaan 95% untuk rata-rata prestasi anak dengan IQ=120.
Jelaskan artinya!
f. Tentukan interval kepercayaan 95% untuk seorang anak dengan IQ=120. Jelaskan
artinya!
g. Tentukan interval kepercayaan 95% untuk perubahan rata-rata prestasi jika IQ
berubah dengan satu unit.
h. Perlukah diambil model berbentuk lain?
i. Asumsi apakah yang harus diambil untuk menyelesaikan pertanyaan-pertanyaan
diatas?

2. Dari tabel berikut ini:

X (oC) Y (gram)

0 8 6 8

15 12 10 14

30 25 21 24

45 31 33 28

60 44 39 42

75 48 51 44

Carilah persamaan garis regresi


Gambarkan garis tersebut pada diagram pencar
Taksirlah banyaknya senyawa yang larut dalam 100 g air pada 50oC.
3. Lakukan uji model regresi pada soal no.1. dengan pendekatan anava

4. Berikut adalah data banyaknya modal (dalam juta rupiah) dan keuntungan yang
diperoleh
(dalam juta rupiah) yang dihasilkan dalam waktu 10 bulan.

Modal (x) 189 204 192 214 218 178 189 167 180 194
Keuntungan 10 15 13 17 19 14 13 11 13 15
(y)

a. Hitunglah koefisien korelasi Pearson dan determinasi berdasarkan data di atas dan
ujiah!
b. Tentukan apakah pernyataan bahwa koefisien korelasi antara jumlah karyawan dan
keuntungan tidak lebih dari 0,7 adalah benar! Gunakan tingkat kesalahan 5%!

5. Hitunglah koefisien korelasi kondisi temperatur (x) dan kepuasan pekerja (y) serta
apakah
ada hubungan yang signifikan antara keduanya dengan menggunakan teknik korelasi
pearson!

Kondisi temperatur KepuasanKerja


n
(x) (y)

1 8 20

2 12 20
3 10 17

4 7 18

5 8 19

6 7 20

7 12 18

8 10 19

9 12 16

10 9 17

11 10 16

12 12 17

13 12 18

14 12 12

15 12 17
6. Dibawah ini diberikan data yang secara acak diambil dari populasi normal bervariabel
dua (X dan Y).

X Y X Y X Y

15 108 8 56 17 153
13 106 11 75 6 73
10 99 17 137 8 95
11 110 20 163 5 26
16 135 12 84 3 24
12 97 18 149 6 50
9 74 16 140 14 96
12 98 13 137 5 35
4 20. 18 170 15 132
8 69 11 109 16 141
V.2.1 Regresi Linier Berganda

Analisis regresi linier berganda digunakan untuk menganalisis hubungan antara


variabel bebas (x) dan variabel terikat (y). Namun pada regresi linier berganda ini, variabel
bebas (x) yang digunakan lebih dari dari satu. Bentuk persamaan umum untuk model regresi
linier berganda:
^y = a + b 1 x 1+ b2 x 2 +… …+ bn x n
Keterangan:
^y = nilai dari variabel terikat
a = konstata nilai estimasi ^y jika nilai x=0 (intercept)
b i = koefisien regresi gradient garis regresi (slope)
x n = variabel bebas

V.2.1.1 Metode Kuadarat Terkecil (Least-Squares Method)

Untuk setiap pengamatan {( x1 i , x 2 i ; y i ) ; i=1 , 2 ,… , n ¿ } akan memenuhi persamaan:


^y = a + b 1 x 1+ b2 x 2 +… …+ bn x n +e i
Dengan menggunakan metode kuadrat terkecil, maka diperoleh persamaan:
e i= ^y - a - b 1 x 1−b2 x 2−… …−bn x n

Dengan syarat meminimasikan nilai a, b 1, dan b 2 penurunannya, maka diperoleh persamaan:


n n

∑ yi = an + b 1 ∑ x i 1 + b 1 ∑ x i 2
i=1 i=1

n n n n

∑ x 1 i y i = a∑ x 1 i + b 1 ∑ x 2i 1 + b 2 ∑ x i 1 x i 2
i=1 i=1 i=1 i=1

n n n n

∑ x 2 i yi = a∑ x 2 i + b 2 ∑ x 2i 2 + b 1 ∑ x i 1 x 2 i
i=1 i=1 i=1 i=1

Asumsi yang digunakan dalam analisis regresi linier berganda antara lain:
a. Setiap nilai error berdistribusi normal dengan rata–rata 0 dan dan varians σ2
b. Bersifat homoskedastisitas
c. Kovarian error = 0, tidak terjadi autokorelasi
d. Tidak terdapat multikolinieritas, artinya tidak terdapat hubungan linier yang sempurna
diantara variabel–variabel bebas.

Latihan soal

1. Dari tabel berikut ini:

X (oC) Y (gram)
0 8 6 8
15 12 10 14
30 25 21 24
45 31 33 28
60 44 39 42
75 48 51 44
a. Carilah persamaan garis regresi
b. Gambarkan garis tersebut pada diagram pencar
c. Taksirlah banyaknya senyawa yang larut dalam 100 g air pada 50oC.

2. Lakukan uji model regresi pada soal no.1.


BAB VI ANOVA (ANALISA VARIANS)
PENDAHULUA
N

Dalam bab ini akan dibahas mengenai rancangan percobaan baik satu factor ( one way
ANOVA) dan dua factor (two way ANOVA).

TUJUAN INSTRUKSIONAL
UMUM

Setelah mempelajari materi ini mahasiswa dapat membuat rancangan percobaan dan
menyelesaikannya baik satu factor ataupun dua faktor.

TUJUAN INSTRUKSIONAL KHUSUS

Mahasiswa mampu:

1. Mengetahui konsep desain eksperimen


2. Mengetahui asumsi yang harus dipenuhi dalam analisa varians (Anova)
3. Mengetahui penggunaan One Way Anova untuk menguji perbedaan rata-rata dari
beberapa populasi
4. Mengetahui penggunaan Random Block Design/Two Way Anova
5. Mahasiswa diharapkan dapat mengiplementasikan terhadap masalah yang dihadapi
didunia nyata.
6.
1………….
2………….
SKENARIO PEMBELAJARAN
3………….
4………….
Kegiatan perkuliahan dilaksanakan dengan skenario sebagai berikut:

1. Perkuliahan
2. Penjelasan tentang concept map (tunjukan di peta konsep dimana posisi materi yang
akan dibahas), pokok bahasan, dan kompetensi yang akan dicapai (TIU dan TIK)
3. Tes pendahuluan
4. Ringkasan materi disampaikan dengan metode ceramah, critical incident, diskusi dan
tanya jawab
5. Tes akhir
6. Evaluasi pencapaian
7. Penutup

RINGKASAN MATERI

Anova (Analysis of Variance) merupakan salah satu Uji Hipotesis pada Statistika
Parametrik, untuk melakukan pengujian terhadap interaksi antara dua faktor dalam suatu
percobaan dengan membandingkan rata-rata dari lebih dua sampel.

Dalam banyak kasus penelitian seringkali ditemukan jumlah variabel yang


diuji lebih dari dua atau cukup besar, penggunaan uji t dan uji z tidak akan efektif
karena memakan waktu cukup lama dalam perhitungan dimana perhitungan
dilakukan secara berpasangan untuk masing-masing variabel.Andaikan saja akan
dilakukan pengujian terhadap lima variabel, maka harus dilakukan pengujian dengan
uji t sebanyak sepuluh kali pasangan variabel.Selain banyak menghabiskan waktu
untuk pengerjaannya, maka kemungkinan terjadi kesalahan baik itu kesalahan dalam
perhitungan, pembandingan ataupun pengulangan menjadi semakin besar.
Anova (Analysis of Variance) merupakan salah satu metode dalam statistika
parametrik.. `Tujuan dari analisis varians adalah untuk dapat menemukan variabel
independen dalam penelitian dan mengetahui bagaimana interaksi antar variabel dan
bagaimana pengaruhnya terhadap suatu perlakuan.
Keunggulan dari analisis varians selain mampu melakukan perbandingan
untuk banyak variabel juga antar replikasi (pengulangan) observasi serta dapat
mengurangi sejumlah kesalahan yang mungkin terjadi dalam perhitungan.
Sebagai dasar dalam pengambilan keputusan dari analisis varians digunakan
distribusi F. Distribusi F ini diturunkan oleh R. A. Fisher dan George W. Snedecor
(tahun 1950), oleh karena itu dinamakan distribusi F (Fisher-Snedecor Distribution).
7.1.2. Asumsi

Penggunaan analisis Anova didasarkan pada asumsi diantaranya sbb:

1. Data berdistribusi normal


2. Skala pengukuran minimal interval
3. Varians homogen
4. Pengambilan sampel secara acak dan masing-masing sampel independen

Asumsi kenormalan distribusi memberi penjelasan terhadap karakteristik data


setiap kelompok. Asumsi adanya homogenitas varians menjelaskan bahwa variansi
dalam masing-masing kelompok dianggap sama. Sedangkan asumsi
bebas (independen) menjelaskan bahwa variansi masing-masing terhadap rata-ratanya
pada setiap kelompok bersifat saling bebas.

7.1.3. One Way ANOVA (Complete Random Design/CRD)


Analisis variansi satu arah atau yang sering disebut sebagai rancangan acak
lengkap adalah suatu prosedur untuk menguji perbedaan rata-rata/ pengaruh
perlakuan dari beberapa populasi (lebih dari dua) dari suatu percobaan yang
menggunakan satu faktor,dimana satu faktor tersebut memiliki 2 atau lebih level.
Disebut juga Desain Seimbang jika seluruh level faktor mempunyai ukuran sampel
yang sama. Dalam analisis variansi satu arah ini sampel acak yang berukuran n
diambil masing-masing dari k populasi. Ke k populasi yang berbeda ini
diklasifikasikan menurut perlakuan atau grup yang berbeda.

Model perbandingan k teratment (perlakuan):

y ij =μ+∝ j + eij

Dimana:

µ = Mean
∝ j = efek perlakuan ke-j

e ij͠ IIDN(0,σ)

Prosedur pengujian dalam analisis varians ini adalah:

 Pengujian hipotesis:
H 0 : µ1= µ2=…= µk ,
H 1 : paling sedikit dua diantara rataan tersebut tidak sama.
 Tentukan daerah kritis dengan Level of Significance (α) yang biasa digunakan
adalah 0,01 atau 0,05
 Hitung dengan menggunakan tabel Anova
 Pengambilan Keputusan:

Tolak H0 jika Fhitung > Ftabel((k-1) , k(n-1)) pada selang kepercayaan (level of
significance) α

 Kesimpulan

Ada dua cara dalam melakukan perhtiungan untuk mendapatkan tabel Anova, yaitu:

1. Dengan cara Matriks


2. Dengan Cara rumus

Tabel VIII.11 k sampel acak

Perlakuan
1 2 … j … K
y 11 y 12 … y1 j … y1 k
y 21 y 22 … y2 j … y2k
… … …
yn1 yn 2 … y nj … y nk
Jumlah T .1 … T .j … T .k T..
Rataan ý .1 ý .2 … ý . j … ý . k ý..
Keterangan:
y ij : menyatakan pengamatan ke i dalam perlakuan ke j.

T . j : menyatakan jumlah semua pengamatan dalam sampel dari perlakuan ke i.

ý . j : menyatakan rataan semua pengamatan dalam sampel dari perlakuan ke j.

T.. : jumlah semua nk pengamatan.


ý.. : rataan semua nk pengamatan

Dengan cara matriks:

Observasi = Grand Mean + Deviasi Treatment + Deviasi Residual


y ij = y´.. + ( y´. j − y´..) + ( y ij- y´. j ¿

( y ij- y´..¿ = ¿ + ( y ij- y´. j ¿

( y ij- y´..¿ ² = ( y´. j − ý ..)² + ( y ij- y´. j ¿ ² + 2( y´. j − y´..) ( y ij- y´. j ¿

=0

k n k n

∑ ∑ ¿ ¿¿ + ∑ ∑ ( y ij− y´. j )²
j=1 i=1 j=1 i=1

SST SSA
SSE

Keterangan:

SST = Sum Square Total

SSA = Sum Square of Treatment

SSE = Sum Square of Error

Atau dengan cara rumus perhitungan jumlah kuadrat dengan ukuran sampel sama adalah:
k n
2 T ..2
SST = ∑ ∑ y ij−¿ ¿
i=1 j=1 nk
k

∑ T . j2
SSA = i=1 T ..2

n nk
SSE = SST – SSA

Tabel VII.12 Analisis Variansi untuk Klasifikasi satu arah

Sumber
variansi SS Df MS F hitung
Perlakua SSA k-1 SSA MSA
MSA=
k −1 MSE
n

Error SSE k(n-1) SSE


MSE=
k (n−1)
Total SST nk-1

Contoh 1:
Berikut adalah data kecepatan merakit produk (dlm menit) yang dihasilkan oleh 4
macam operator:

Mesin

1 2 3 4 Total

12 22 19 11

10 13 14 13

14 16 20 16

13 15 19 12
11 14 18 18

Total 60 80 90 70 300

Rataan 12 16 18 14 15

Ujilah dengan taraf keberartian 0,05 apakah rata-rata kecepatan merakit produk yang
dihasilkan beberapa mesin tersebut berbeda!
Jawab:
H 0 : µ1= µ2=…= µ4,
H 1 : paling sedikit dua rataan tersebut tidak sama.
Daerah kritis: f hitung > f tabel= 3,24 dengan derajat kebebasan v1 =3 dan v 2=16

Dengan cara matriks:

Observasi = Grand Mean + Deviasi Treatment + Residual


y ij = ý .. + ( y´. j − ý) + ( y ij- y´. j ¿
¿

(dikuadratkan)=100 (dikuadratkan)=116

SSA SSE

SST = SSA +SSE = 216

Dengan cara rumus:


3002
SST= 122 +222+ …+182− =216
20
602 +802 +802 +702 3002
SSA= − =¿100
5 20
SSE= 216-100=116
Tabel Anova

Sumber
variansi SS df MS Fhitung

Perlakuan 100 3 33,3333 4,5977

Error 116 16 7,25

Total 216 19

Dari perhitungan dengan cara matrik dan cara rumus untuk tabel Anova didapatkan hasil
yang sama, sehingga untuk melakukan perhitungan boleh dilakukan dengan salah satu
cara tersebut.
Karena f hitung=4,5977 > f tabel= 3,24
Keputusan: tolak H 0 dan disimpulkan bahwa keempat mesin tidak mempunyai rataan
yang sama (Mesin memang berpengaruh)

Latihan soal:

1. Uji hipotetis pada taraf 0,01 bahwa rata-rata aktivitas khusus sama saja untuk
keempat konsentrasi.

Konsentrasi NaCl
A B C D
11,0 11,38 11,02 6,04
1
12,0 10,67 10,67 8,65
9
10,5 12,33 11,50 7,76
5
11,2 10,08 10,31 10,13
6
2. Enam mesin sedang dipertimbangkan untuk dipakai dalam pembuatan karet penutup.
Mesin tersebut dibandingkan berdasarka daya rentang barang yang dihasilkan.
Sampel acak empat karet penutup dari tiap mesin dipakai untuk menentukan apakah
rataan daya rentang tiap mesin berbeda. Berikut ini ialah pengukuran daya rentang
dalam kg per cm2 x 10−1 .

Mesin
1 2 3 4 5 6
17,5 16,4 20,3 14,6 17,5 18,3
16,9 19,2 15,7 16,7 19,2 16,2
15,8 17,7 17,8 20,8 16,5 17,5
18,6 15,4 18,9 18,9 205 20,1

Kerjakan analisi variansi pada taraf keberartian 0,05 dan tentukanlah apakah rataan
daya rentang ke 6 mesin berbeda secara berarti. ANALISIS VARIANS!

3. Tiga cara mengajar matematika telah diberikan kepada tiga kelompok anak SD kelas
V, satu cara hanya diberikan pada satu kelompok.Hasil ujian pada akhir pengajaran
dengan cara tersebut diberikan dalam daftar berikut.

Cara I Cara II Cara III

89 67 64
93 90 69
75 79 78
69 75 92
83 86 81
99 94 70

Anggap hasil ini sebagai sampel hasil belajar matematika dengan cara mengajar
masing-masing.
Ujilah dengan ANOVA apakah ada perbedaan efek dari ketiga cara mengajar? Gunakan
alpha 0.05.
4. Tiga cara mengajar matematika telah diberikan kepada tiga kelompok anak SD kelas
V, satu cara hanya diberikan pada satu kelompok.Hasil ujian pada akhir pengajaran
dengan cara tersebut diberikan dalam daftar berikut.

Cara I Cara II Cara III

89 67 64
93 90 69
75 79 78
69 75 92
83 86 81
99 94 70
69 84
57
85

Anggap hasil ini sebagai sampel hasil belajar matematika dengan cara mengajar
masing-masing.Sebutkan syarat-syarat yang harus dipenuhi agar percobaan ini sah
untuk dibandingkan hasilnya. Berikan analisis lengkap mengenai hasil belajar
matematika menggunakan ketiga cara tersebut. Ujilah persyaratan yang perlu
menggunakan data yang diberikan.

7.1.4 TWO WAY ANOVA

Two Way Anova dikenal juga dengan factorial design atau Randomized Block
Design. Sama dengan One Way Anova dasar perhitungan yang digunakan adalah
Distribusi F. Pada Two way Anova pengujian dilakukan dengan tidak hanya melihat
satu faktor atau perlakuan saja, tetapi juga dengan mempertimbangkan faktor blok.
Uji blok dilakukan untuk mengetahui pengaruh blok terhadap perbedaan rata-rata.
Uji blok ini akan mengurangi kombinasi kesalahan.

Model random Block experiment untuk perbandingan k tratment (perlakuan):

y ij =μ+∝i + β j +e ij

Dimana:

µ = Mean

∝i= efek perlakuan ke-i

β j = efek blok ke-j

e ij͠ IIDN(0,σ)

Prosedur pengujian dalam analisis varians dua arah ini adalah:

 Pengujian hipotesis untuk treatment:


 H 0 : Tidak ada pengaruh treatment / perlakuan
H 1 : Ada pengaruh treatment
 Tentukan daerah kritis dengan Level of Significance (α) yang biasa digunakan
adalah 0,01 atau 0,05
 Hitung dengan menggunakan tabel Anova
 Pengambilan Keputusan:

MSA
Tolak H0 jika Fhitung = > Ftabel (k-1 ,(b-1)(k-1)) pada selang kepercayaan (level
MSE

of significance) α

 Kesimpulan
 Pengujian hipotesis untuk blok:
 H 0 : Tidak ada pengaruh blok
H 1 : Ada pengaruh blok
 Tentukan daerah kritis dengan Level of Significance (α) yang biasa digunakan
adalah 0,01 atau 0,05
 Hitung dengan menggunakan tabel Anova
 Pengambilan Keputusan:
MSB
 Tolak H0 jika Fhitung = > Ftabel(k-1 ,(b-1)(k-1)) pada selang kepercayaan (level
MSE
of significance) α
 Kesimpulan

Proses perhitungan Two Way Anova hampir sama dengan One Way Anova dimana
ada dua cara dalam perhtiungan tabel Anova, yaitu:

1. Dengan cara Matriks


2. Dengan Cara rumus

Tabel VII.13 Tabel Random Block Design( Two Way ANOVA)

Treatment (A)
Block
Jml Mean
(B)
1 2 … a

1 y11 y12 … y1a T1. ý 1.

2 y21 y22 … Y2a T2. ý 2.


: : : :

b Yb1 Yb2 … yba Tb.. ý b .

Jml T.1 T.2 … T.a T..

Mean ý .1 ý .2 ý . a ý ..

Dengan cara matriks:


Observasi = Mean + Deviasi Treatment + Deviasi Block + Residual
y ij = y´.. + ( y´. j − y´..) + ( y´i . − y´..) + ( y ij- y´. j ¿
( y ij- y´..¿ = ¿) + ( y´i . − y´..)+ ( y ij − y´i .- ý . j + y´.. ¿
a b b a b

∑ ∑ ¿ ¿¿ + a ∑ ( ý . j− y´..) ²+∑ ∑ ( y ij± ý i .+ ý . j + ý ..)²


i=1 j=1 j=1 i=1 j=1

a b
SST =∑ ∑ ¿ ¿ ¿
i=1 j=1

a
SSA = b ∑ ( ý i .− y´..)²
i=1

b
SSB = a ∑ ( y´. j− y´..) ²
j=1

a b
SSE = ∑ ∑ ( y ij ± ý i . + ý . j + ý ..)²
i=1 j=1

Dengan cara rumus:


a b
T ..2
2
SST =∑ ∑ y ij
i=1 j=1 ab
a

∑ T 2i .. T . .2
SSA= i=1 −
b ab
b

∑ T 2. j T . .2
SSB= j=1 −
a ab
SSE=SST −SSA−SSB

Jumlah kuadrat diperoleh dengan membentuk tabel jumlah berikut :

Tabel VIII.14 Two Way Anova

SS df MS f hitung
Sumber Variasi

SSA MSA
A (Treatment) SSA a-1 MSA= f A=
a−1 MSE
SSB MSB
B (Block) SSB b-1 MSB= f B=
b−1 MSE
SSE
Error SSE (a-1) (b-1) MSE=
( a−1 ) ( b−1 )

Total SST (ab-1)

Contoh 2:
Suatu percobaan dilakukan untuk menentukan yang mana yang lebih baik dari tiga
sistem rudal yang berlainan, diukur laju pembakaran bahan bakar dari 24 penembakan
statis.Empat Jenis bahan bakar yang berlainan dicoba.Berikut adalah datanya :
Sistem Jenis bahan bakar
Rudal 1 2 3 4
1 12 20 13 11
2 2 14 7 5

3 8 17 13 10

4 1 12 8 3

5 7 17 14 6

Gunakan taraf keberartian 5% untuk menguji hipotesis berikut :

a. Apakah ada pengaruh jenis bahan bakar?


b. Apakah ada pengaruh faktor Sistem Rudal?

Jawab :

Jenis bahan bakar


Sistem Rudal Jml Mean
1 2 3 4
1 12 20 13 11 56 14

2 2 14 7 5 28 7
48 12
3 8 17 13 10
24 6
4 1 12 8 3
44 11
5 7 17 14 6
200
Jumlah 30 80 55 35
10
Mean 6 16 11 7

Hipotesis
a. H0 = α1 = α1 = α3 = 0 (Tidak ada pengaruh jenis bahan bakar)
H1 = Paling sedikit salah satu αi tidak sama dengan nol(Ada pengaruh)
b. H0 = β1 = β1 = β3 = 0 (Tidak ada pengaruh sistem rudal)
H1 = Paling sedikit salah satu βj tidak sama dengan nol(Ada pengaruh)

Dengan cara matriks:

Observasi = Grand Mean + Deviasi Treatment + Deviasi Block + Residual


y ij = ý .. + ( y´. j − ý) + ( y ij- y´. j ¿

4 44 4

¿
[ ]
−3−3−3−3
22 22
−4−4−4−4
11 11

(dikuadratkan)=310 (dikuadratkan)=184
SSA SSB
0 6 1−3

+
[
−2 −3 −4−1
2 0 22
1 −1 1−2
−1 −2 0 4
] (dikuadratkan)= SSE= 24

SST = SSA +SSB+SSE = 518

Dengan cara rumus:

a b
T ..2
2 2002
SST =∑ ∑ y ij = 2518 - = 518
i=1 j=1 ab 20

∑ T 2i .. 302 802 552 352 2002


SSA= i=1
b

T ..2 =
ab
[ 5
+
5
+
5
+
5
- ]
20
= 2310 – 2000 = 310
b

∑ T 2. j 56 2 282 482 24 2 44 2 2002


SSB= j=1
a

T .. =
ab
2
[ 4
+
4
+
4
+
4
+
4
- ]
20
=2184 – 2000 = 184

SSE=SST −SSA−SSB= 518 – 310 -184 = 24

Tabel analisis variansi

Sumber Variasi SS df MS F Hitung


Jenis bahan
310 3 103,3 51,7
bakar
Sistem rudal 184 4 46 23
Error 24 12 2
Jumlah 518 19

 Keputusan-1:
Tolak H0 jika f hitung > f tabel(0,05;4;12)
51,1 > 3,49  Tolak H0
 Kesimpulan-1:
Rataan laju pembakaran bahan bakar tidak sama untuk keempat jenis bahan bakar
 Keputusan-2:

Tolak H0 jika f hitung > f tabel(0,05;3;12)

23 > 3,26  Tolak H0

 Kesimpulan-2:

Sistem rudal yang berlainan menghasilkan rataan laju pembakaran yang berbeda

Latihan soal

1. Suatu percobaan diadakan untuk meneliti pengaruh suhu dan jenis tungku terhadap
umur sejenis suku cadang tertentu yang diuji. Empat jenis tungku dan tiga taraf suhu
dipakai dalam percobaan tersebut. 24 buah suku cadang dibagi secara acak, dua pada
tiap kombinasi perlakuan, dan hasilnya diterakan berikut :
Suhu Tungku
(0C) T1 T2 T3 T4
500 227 214 223 240
550 187 181 232 246

600 202 194 213 219

Gunakan taraf keberartian 0,05, ujilah apakah :


a. Ada pengaruh suhu?
b. Ada pengaruh tungku?

2. Untuk menetukan otot mana yang perlu mendapat program latihan untuk
meningkatkan kemampuan melakukan servis datar dalam tenis, penelitian ‘An
Electromoygraphic-Cinematrographic Analysis of the Tennis Serve” telah dilakukan
oleh Jurusan Kesehatan di Virginia Polytechnic Institute and State University di
tahun 1978. Lima otot yang berbeda tersebut adalah : Anterior deltoid,Pectorial
mayor,Posterior deltoid,Deltoid tengah,Trisep. Data elektromyograf, tercatat waktu
servis, adalah sebagai berikut :

Otot
Orang
1 2 3 4 5
59 1.5 61 10 20
1
60 9 78 61
2 61

3 47 42 23 55 95

Dengan α= 0,01 ujilah apakah:


a. Ada pengaruh orang (Ketiga orang mempunyai pengukuran elektromygraf yang
sama)?
b. Ada pengaruh otot (Otot yang berbeda tidak mempunyai pengaruh pada
pengukuran elektromygraf)?
VI.1.1 Two Way Anova dengan n replikasi

Tabel VII.15 Two Way Anova dengan n replikasi

Derajat
Sumber Variasi Jumlah Kuadrat Rataan Kuadrat f hitungan
Kebebasan
Pengaruh
Utama
JKA
2 S 21
A JKA a-1 S= 1 f 1= 2
a−1 S
JKB S 22
B JKB b-1 S22= f 2= 2
b−1 S
Interaksi
dwifaktor
2
2 JK ( AB ) S3
AB JK(AB) (a-1) (b-1) S= 3 f 3= 2
( a−1 ) ( b−1 ) S
JKG
Galat JKG ab(n-1) S2 =
ab ( n−1 )
JKT abn-1

Jumlah kuadrat diperoleh dengan membentuk tabel jumlah berikut :

Tabel VII.16 Tabel Penjumlahan Two Way ANOVA


B Jumlah
A
1 2 … b
1 T11. T12. … T1b. T1…
2 T21. T22. … T2b. T2…
: :
A Ta1. Ta2. … Tab. Ta…
Jumlah T.1. T.2. … T.b. T…

Keterangan:
a b n
2 T2
JKT=∑ ∑ ∑ y −¿
ijk ¿
i=1 j=1 k=1 abn

∑ T 2i..
T .2
JKA= i=1 −
bn abn

∑ T 2j .
T .2
JKB= j=1 −
an abn

a b a b

∑ ∑ T 2ij ∑ T 2i .. ∑ T 2. j . T 2…
JK ( AB )= i=1 j=1
− i=1 − j=1 +
n bn an abn
JKG=JKT −JKA−JKB−JK ( AB)

Contoh 2:

Dalam suatu percobaan yang dilakukan dalam menentukan yang mana yang lebih baik dari
tiga sistem rudal yang berlainan, diukur laju pembakaran bahan bakar dari 24 peembakan
statis. Empat Jenis bahan bakar yang berlainan dicoba. Percobaan menghasilkan replikasi
pengamatan laju pembakaran pada tiap kombinasi perlakuan. Berikut adalah datanya :

Sistem Jenis Bahan Bakar


Rudal b1 b2 b3 b4
34,0 30,1 29,8 29,0
a1
32,7 32,8 26,7 28,9
32,0 30,2 28,7 27,6
a2
33,2 29,8 28,1 27,8
28,4 27,3 29,7 28,8
a3
29,3 28,9 27,3 29,1

Gunakan taraf keberartian 5% untuk menguji hipotesis berikut :


a. H0 = Tidak ada beda antara rataan laju pembakaran bahan bakar bila digunakan sistem
rudal yang berlainan.
b. H0 = Tidak ada beda antara rataan laju pembakaran keempat jenis bahan bakar
c. H0 = Tidak ada interaksi sistem rudal yang berlainan dengan jenis bahan bakar yang
berlainan.

Jawab :

1. Hipotesis
a. H0 = α1 = α1 = α3 = 0
H1 = Paling sedikit salah satu αi tidak sama dengan nol
b. H0 = β1 = β1 = β3 = 0
H1 = Paling sedikit salah satu βj tidak sama dengan nol
c. H0 = (αβ)11 = (αβ)12 = … = (αβ)34 = 0
H1 = Paling sedikit salah satu (αβ)ij tidak sama dengan nol
2. Taraf keberartian = 5%
3. Daerah kritis (penentuan f tabel)
a. f1 = f9.05 (a-1,ab(n-1)) = f9.05 (2,12) = 3,89
b. f2 = f9.05 (b-1,ab(n-1)) = f9.05 (3,12) = 3,49
c. f3 = f9.05 ((a-1)(b-1),ab(n-1)) = f9.05 (6,12) = 3,00
4. Tabel jumlah

b1 b2 b3 b4 Jumlah
a1 66,7 62,9 56,5 57,9 244,0
a2 65,2 60,0 56,8 55,4 237,4
a3 57,7 56,2 57,0 57,9 228,8
Jumlah 189,6 179,1 170,3 171,2 710,2

5. Tabel analisis variansi

Jumlah Derajat Rataan


Sumber Variasi f Hitungan
Kuadrat Kebebasan Kuadrat
Sistem rudal 14,52 2 7,26 5,85
Jenis bahan
40,08 3 13,36 10,77
bakar
Interaksi 22,17 6 3,70 2,98
Galat 14,91 12 1,24
Jumlah 91,68 23

6. Statistik Uji
Tolak H0 jika f hitung > f tabel
7. Kesimpulan
a. 5,85 > 3,89  Tolak H0
Kesimpulan : Sistem rudal yang berlainan menghasilkan rataan laju pembakaran
yang berbeda.
b. 10,77 > 3,49  Tolak H0
Kesimpulan : Rataan laju pembakaran bahan bakar tidak sama untuk keempat
jenis bahan bakar.
c. 2,98 < 3,00  Terima H0
Kesimpulan : Tidak ada interaksi sistem rudal yang berlainan dengan jenis bahan
bakar yang berlainan.

Latihan soal

1. Suatu percobaan diadakan untuk meneliti pengaruh suhu dan jenis tungku terhadap umur
sejenis suku cadang tertentu yang diuji. Empat jenis tungku dan tiga taraf suhu dipakai
dalam percobaan tersebut. 24 buah suku cadang dibagi secara acak, dua pada tiap
kombinasi perlakuan, dan hasilnya diterakan berikut :
Tungku
Suhu (0C)
T1 T2 T3 T4
227 214 225 260
500
221 159 236 229
187 181 232 246
550
208 179 198 273
174 198 178 206
600
202 194 213 219

Gunakan taraf keberartian 0,05, uji hipotesi bahwa :


a. Suhu yang berbeda tidak berpengaruh pada umur suku cadang tersebut
b. Tungku yang berlainan tidak berpengaruh pada umur suku cadang tersebut
c. Jenis tungku dan suhu tidak berinteraksi

2. Untuk menetukan otot mana yang perlu mendapat program latihan untuk meningkatkan
kemampuan melakukan servis datar dalam tenis, penelitian ‘An Electromoygraphic-
Cinematrographic Analysis of the Tennis Serve” telah dilakukan oleh Jurusan Kesehatan
di Virginia Polytechnic Institute and State University di tahun 1978. Lima otot yang
berbeda tersebut adalah :
a. Anterior deltoid,
b. Pectorial mayor,
c. Posterior deltoid,
d. Deltoid tengah,
e. Trisep
Diuji pada masing-masing tiga orang, dan percobaan dilakukan tiga kali untuk tiap
kombinasi perlakuan. Data elektromyograf, tercatat waktu servis, adalah sebagai
berikut :

Otot
Orang
1 2 3 4 5
32 5 58 10 19
1 59 1.5 61 10 20
38 2 66 14 23
63 10 64 45 43
2 60 9 78 61 61
50 7 78 71 42
43 41 26 63 61
3 54 43 29 46 85
47 42 23 55 95

Gunakan taraf keberartian 0,01 untuk menguji hipotesis bahwa:


a. Ketiga orang mempunyai pengukuran elektromygraf yang sama
b. Otot yang berbeda tidak mempunyai pengaruh pada pengukuran elektromygraf
c. Orang dan jenis otot tidak berinteraksi
BAB VIII

STATISTIKA NON-PARAMETRIK

8.0 Tujuan Pembelajaran


Mahasiswa mampu :

1. Membedakan prosedur uji parametrik dan nonparametrik


2. Menjelaskan macam-macam uji nonparametrik
3. Menjelaskan asumsi-asumsi yang harus dipenuhi dalam beberapa uji
nonparametrik
4. Menyelesaikan problem yang menggunakan uji nonparametrik
5. Menghitung korelasi peringkat/rank Spearman

8.1 Statistika Nonparametrik


Salah satu karakteristik prosedur-prosedur dalam metode statistika adalah kelayakan
penggunaannya untuk tujuan inferensia (penyimpulan) selalu bergantung pada
asumsi-asumsi tertentu yang kaku. Prosedur dalam analisa varians, misalnya :
mengasumsikan bahwa sampel harus diambil dari populasi-populasi yang
berdistribusi normal dan mempunyai varians yang sama.

Jika populasi yang dikaji tidak dapat memenuhi asumsi-asumsi yang mendasari uji-
uji parametrik,maka statistika nonparametrik dapat memenuhi kebutuhan tersebut
dan tetap sah meski hanya berlandaskan pada asumsi-asumsi yang sangat umum.
Ringkasnya, bila uji parametriknya dan nonparametrik dapat digunakan untuk data
yang sama, kita seharusnya menghindari uji nonparametrik yang “cepat dan mudah”
ini dan mengerjakannya dengan teknik parametrik yamg lebih efisien. Akan tetapi,
karena asumsi kenormalan seringkali tidak dapat dijamin berlakunya, dan juga
karena kita tidak selalu mempunyai hasil pengukuran yang kuantitatif sifatnya, maka
beruntunglah telah disediakan sejumlah prosedur nonparametrik yang bermanfaat.

Kelebihan prosedur nonparametrik:


1. Prosedur nonparametrik memerlukan asumsi dalam jumlah yang minimum, sehingga
kemungkinan untuk digunakan secara salah pun relatif kecil (Uji-ujinya disertai
dengan asumsi-asumsi yang jauh tidak mengikat dibandingkan dengan uji
parametrik padanannya)
2. Perhitungan-perhitungannya dapat dilakukan secara cepat dan mudah
3. Konsep-konsep dan metode-metode prosedur nonparamterik mudah dipahami bagi
peneliti yang dasar matematika dan statistikanya kurang
4. Dapat diterapkan pada data dengan skala pengukuran yang lemah (Datanya tidak
harus merupakan pengukuran kuantitatif tetapi dapat berupa respon yang kualitatif)

Kelemahan prosedur nonparamtrik:

1. Tidak menggunakan semua informasi dari sampel (kurang efisien)


2. Tidak seteliti pengujian parametrik, sehingga untuk mencapai β (peluang terjadinya
kesalahan type kedua) yang sama diperlukan sampel yang besar

8.2. Uji Tanda (Sampel Tunggal)

Uji tanda merupakan prosedur nonparametrik yang paling sederhana untuk


diterapkan, pada sembarang data yang bersifat dikotomi yaitu data yang tidak dapat
dicatat pada skala numerik tetapi yang hanya dapat dinyatakan melalui respons positif dan
negatif. Misalnya : percobaan yang responsnya bersifat kualintatif seperti “cacat” atau
“tidakt”, atau dalam percobaan yang berhubungan dengan indera perasa yang responsnya
berupa tanda plus bila penyicip rasanya dapat mengidentifikasi bumbu yang digunakan,
atau minus bila tidak berhasil mengidentifikasi bumbu tersebut.

Asumsi yang digunakan dalam uji tanda adalah:

1. Sampel yang diukur adalah sampel acak dari suatu populasi dengan median yang
belum diketahui
2. Variabel yang diukur minimal mempunyai skala pengukuan ordinal
3. Varianel yang diukur adalah variabel kontinyu

Prosedur pengujian dalam uji tanda ini adalah:

 Pengujian hipotesis:
H :~
0 μ=~ μ0
H1 : ~
μ ≠ ~μ0
 Tentukan Level of Significance (α)
 Tentukan daerah kritis:
1. Satu arah : P(X≤ x́ H 0 benar ¿≤ α
2. Dua arah : 2 P(X≤ x́ H 0 benar ¿≤ α

Dimana x : banyaknya tanda plus

 Perhitungan Statistik Uji:


3. Hitung semua selisih dari pengurangan masing-masing nilai sampel
dengan median hipotesis
4. Beri tanda (+) jika selisih > 0 dan beri tanda (-) jika selisih < 0
5. Jika ada selisih = 0, buang dan ukuran sampel harus dikurangi
6. Hitung P(X≤ x́ n ; 0,5 ¿ dengan distribusi binomial dan bandingkan
dengan α untuk n ≤ 10
7. Jika n >10 dan p = 0,5 atau jika np = nq > 5, maka dapat didekati
dengan distribusi normal dengan memberikan faktor koreksi
kontinuitas yaitu:

( x ± 0,5 )−0,5 n
. Z=
0,5 √ n

 Pengambilan Keputusan:

Tolak H0 jika masuk dalam daerah kritis, dan terima H0 jika diluar daerah kritis

 Kesimpulan:

Menerima Ho menunjukkan bahwa tidak ada perbedaan, sedang menolak Ho

menunjukkan adanya perbedaan antara subyek.


Contoh-1

Berikut ini adalah data lama waktu (dalam jam,)sebuah alat listrik pencukur rambut dapat
digunakan sebelum harus diisi tenaga listrik kembali:

1.5, 2.2, 0.9, 1.3, 2.0, 1.6, 1.8, 1.5, 2.0, 1.2, dan 1.7.

Gunakan uji tanda untuk menguji hipotesis pada taraf nyata 0.05 bahwa alat pencukur ini
secara rata-rata dapat bekerja 1.8 jam sebelum harus diisi tenaga listrik kembali.

Jawab:

 Pengujian hipotesis:
H0 : ~
μ=1,8
H1 : ~
μ ≠ 1,8
 Dengan Level of Significance (α)=0,05

Dimana x : banyaknya tanda plus

 Perhitungan Statistik Uji:

Data 1.5 2.2 0.9 1.3 2.0 1.6 1.8 1.5 2.0 1.2 1.7
Tand - + - - + - 0 - + - -
a
*Median = 1,8
X=3; n= 10; p=0,5
 P=2P(X <=3 , p=0,5)
 P=2 ∑b(x;10;0,5) = 2(0,1719)= 0,3438 > 0,05
 Keputusan:

Terima H0

 Kesimpulan:

Median waktu operasi berbeda dari 1,8 jam adalah tidak signifikan.
Uji tanda juga bisa digunakan untuk menguji hipotesis nol (median 1 – median 2 =
do) untuk observasi berpasangan. Dimana di= selisih mediannya.

Contoh:

Sebuah perusahaan taksi hendak menetukan apakah akan menggunakan ban radial atau
ban biasa untuk meningkatkan penghematan bahan bakar. Duabelas mobil dipasang
dengan ban radial dan kemudian dicoba pada sebuah lintasan tertentu. Tanpa mengganti
supirnya, mobil-mobil yang sama kemudian dipasang dengan ban biasa dan dicoba sekali
lagi pada lintasan yang sama. Konsumsi bahan bakar, dalam kilometer per liter, tercatat
sebagai berikut:

Mobil Ban radial Ban biasa


1 4.2 4.1
2 4.7 4.9
3 4.6 6.2
4 7.0 6.9
5 6.7 6.8
6 4.5 4.4
7 5.7 5.7
8 6.0 5.8
9 7.4 6.9
10 4.9 4.9
11 6.1 6.0
12 5.2 4.9

Dapatkah kita menyimpulkan pada taraf nyata 0.05 bahwa mobil yang dilengkapi dengan
ban radial lebih hemat bahan bakar dari pada mobil dengan ban biasa? Gunakan hampiran
normal terhadap sebaran binom.

Jawab:

 Pengujian hipotesis:
H :~
0 μ −~
R μ =0
B

H 1 :~
μ R− ~
μ B <0
perhitungan:

Ban 6.
4.2 4.7 6.6 7.0 7 4.5 5. 6.0 7.4 4.9 6.1 5.2
Radia
7
l
Ban
Biasa 4.1 4.9 6.2 6.9 6.8 4.4 5. 5.8 6.9 4.9 6.0 4.9
7
Tanda + - + + - + 0 + + 0 + +

Perhitungan: Didapat jumlah = 8 tanda plus, 2 tanda minus dan 2 tanda nol.

Setelah tanda nol dibuang, n = 10 dan x = 8.

Karena n > 10 dan p = 0,5 maka dapat didekati dengan distribusi normal dengan memberikan
faktor koreksi kontinuitas yaitu:

( x ± 0,5 )−0,5 n
Z=
0,5 √ n

( 8−0,5 )−0,5∗10
 Z Hitung= = 1,581
0,5 √ ( 10 )
Maka: P=P(X>=11)=P(Z<1,581)
 Daerah Kritis: z > 1.645

 Keputusan: Karena Z Hitung <Z Tabel , maka terima Ho


 Kesimpulan :Rata-rata ban radial tidak meningkatkan penghematan bahan
bakar.

8.3. Uji wilcoxon bagi pengamatan Berpasangan (uji peringkat bertanda wilcoxon)

Asumsi yang digunakan dalam uji tanda adalah:

1. Sampel yang diukur adalah sampel acak yang terdiri dari n pasangan hasil
pengukuran dimana masing-masing pasangan pengukurannya dilakukan
terhadap subyek yang sama
2. Variabel yang diukur minimal mempunyai skala pengukuan ordinal
3. Variabel yang diukur adalah variabel kontinyu
4. Ke-n pasangan hasil pengukuran independen

Prosedur pengujian dalam uji tanda ini adalah:

 Pengujian hipotesis:
H :~
0μ −~
1μ =d = 0
2 i

H 1 :~
μ1 −~
μ2≠ 0
 Tentukan Level of Significance (α)
 Tentukan daerah kritis:
a. Satu arah : P(X≤ x́ H 0 benar ¿≤ α
b. Dua arah : 2 P(X≤ x́ H 0 benar ¿≤ α

Dimana x : banyaknya tanda plus/minus manapun yang lebih kecil

 Perhitungan Statistik Uji:


 Untuk masing-masing pengamatan, hitung selisih dari masing-masing
nilai dari dua sampel berpasangan.
 Beri tanda (+) jika selisih > 0 dan beri tanda (-) jika selisih < 0
 Jika ada selisih = 0, buang dan ukuran sampel harus dikurangi
 Untuk n ≤ 20 dan pengujian dilakukan dengan dua arah hitung 2P(X
≤ x́ n∗0,5 ¿ dengan distribusi binomial dan bandingkan dengan α
 Jika n >20 dan p = 0,5 atau jika np = nq > 5, maka dapat didekati dengan
distribusi normal dengan memberikan faktor koreksi kontinuitas yaitu:

( x ± 0,5 )−0,5 n
. Z=
0,5 √ n

 Pengambilan Keputusan:

Tolak H0 jika masuk dalam daerah kritis, dan terima H0 jika diluar daerah kritis

 Kesimpulan:

Menerima Ho menunjukkan bahwa tidak ada perbedaan, sedang menolak Ho

menunjukkan adanya perbedaan antara subyek.

Contoh-3

Seorang peneliti mempelajari efek kebersamaan terhadap denyut jantung tikus. Denyut
jantung 10 tikus dicatat, baik ketika masing-masing tikus sedang sendiri maupun ketika
sedang bersama-sama. Hasil studi tersebut dicatat seperti data dibawah ini (dalam menit):

Tikus 1 2 3 4 5 6 7 8 9 10
X 463 462 462 456 450 426 418 415 409 402
Y 523 494 461 535 476 454 448 408 470 437
*X=Ketika tikus sendiri

Y= Ketika tikus berkumpul


Ujilah dengan level significance 5% apakah kebersamaan meningkatkan denyut jantung
tikus-tikus?

Jawab:

 Pengujian hipotesis:
H :~
μ −~μ =00
0 y x

H 1 :~
μ y −~μ x >¿ 0

Tikus 1 2 3 4 5 6 7 8 9 10
X 463 462 462 456 450 426 418 415 409 402
Y 523 494 461 535 476 454 448 408 470 437
di -60 -32 +1 -79 -26 -28 -30 +7 -61 -35
Tanda - - + - - - - + - -

 Dua arah : 2 P(X≤ 2́10 ; 0,5 ¿=0,0547

P(X≤ 2́10∗0,5 ¿=0,02735≤ α =0,05

 Keputusan:

Tolak H0

 Kesimpulan:

Kebersamaan tidak meningkatkan denyut jantung tikus-tikus tsb.

8.5. Uji Wilcoxon untuk Pengamatan Berpasangan

Uji tanda hanya menunjukkan tanda-tanda plus dan minus yang diperoleh dari
selisih antara pengamatan dan median dalam kasus satu-sampel, atau tanda plus dan
minus yang diperoleh dari selisih antara pasangan pengamatan dalam kasus sampel-
berpasangan, tetapi tidak memperhitungkan besarnya selisih-selisih tersebut. Sebuah uji
yang memanfaatkan baik arah maupun besar arah itu ditemukan pada tahun 1945 oleh
Frank Wilcoxon, dan sekarang uji ini dikenal sebagai uji peringkat-bertanda wilcoxon,
atau dalam kasus pengamatan berpasangan disebut juga uji Wilcoxon bagi pengamatan
berpasangan.

Asumsi yang digunakan dalam uji Wilcoxon untuk Pengamatan Berpasangan adalah:
1. Data terdiri atas n buah selisih di = Yi - Xi setiap pengukuran (Xi,Yi) diperoleh dari
pengamatan terhadap subyek yang sama/terhadap subyek yang telah dipasangkan
dalam sampel ini diperoleh dengaan cara acak
2. Data minimal mempunyai skala pengukuran interval
3. Variabel selisih yang diukur adalah variabel acak kontinyu
4. Selisih-selisih tsb independen
5. Distribusi selisih populasi tsb setangkup/simetrik

Prosedur pengujian dalam uji Wilcoxon untuk Pengamatan Berpasangan ini adalah:

 Pengujian hipotesis:
H :~
0 μ −~μ =d
1 2 0

H 1 :~
μ1 −~
μ2≠ d0
 Tentukan Level of Significance (α)
 Tentukan daerah kritis:
a. Semua nilai W yang memenuhi P(W≤ w´ H 0 benar ¿< α , jika n < 5 dan
ujinya satu arah
b. Semua nilai W yang memenuhi 2 P(W≤ w´ H 0 benar ¿< α , jika n < 5 dan
ujinya dua arah
c. Semua nilai W ≤ Nilai kritis yang sesuai dalam tabel a.16 (buku Walpole),
jika 5 ≤ n ≤ 30
 Perhitungan Statistik Uji:
 Hitung selisih dari setiap pasangan hasil pengukuran dan perhatikan
tandanya : di = Yi - Xi
 Singkirkan semua selisih yang besarnya nol, meskipun ukuran sampel n
akan berkurang
 Berilah ranking/peringkat pada ke-n selisih d1-d0 tanpa memperhatikan
tandanya
 Hitung jumlah peringkat yang bertanda positif (w+) dan jumlah peringkat
yang bertanda negatip (w-), kemudian ambil nilai w yang terkecil
 Bandingkan w terkecil dengan tabel 17 (buku Walpole)
 Jika n > 15, distribusi W dapat didekati dengan distribusi Normal dengan:

n (n+1) n ( n+ 1 ) (2 n+ 1)
μw = dan σ 2w =
4 24
Dan Statitik Ujinya adalah:

( w−μw )
Z=
σw

 Pengambilan Keputusan:

Tolak H0 jika masuk dalam daerah kritis, dan terima H0 jika sebaliknya

 Kesimpulan:

Contoh-5

Sekelompok peneliti mengkaji perubahan-perubahan hemodinamik pada pasien-pasien


dengan pulmonary thromboembolism yang akut. Berikut ini adalah data yang
memperlihatkan tekanan arteri paru-paru rata-rata yang telah diobservasi oleh peneliti-
peneliti tsb sebelum dan setelah terapi urokinase

Tekanan arteri paru-paru rata-rata (dlm milimeter Hg)


Pasien 1 2 3 4 5 6 7 8 9
0 Jam (X) 33 17 30 25 36 25 31 20 18
24 Jam (Y) 21 17 22 13 33 20 19 13 9

Ingin diketahui apakah data ini menyediakan cukup bukti untuk menunjukkan bahw terapi
urikinase menurunkan tekanan arteri paru, gunakan α = 5 %

Jawab:

H 0 :~
μ yi−~
μ xi=d i ≥ 0
H 1 :~
μ yi−~
μ xi ≠ d i <0

Tekanan arteri paru-paru rata-rata (dlm milimeter Hg)


Terapi Pasien
1 2 3 4 5 6 7 8 9
0 Jam (X) 33 17 30 25 36 25 31 20 18
24 Jam (Y) 21 17 22 13 33 20 19 13 9
di = Y i – Xi -12 0 -8 -12 -3 -5 -12 -7 -9
Peringkat/ranking 7 4 7 1 2 7 3 5

buang
 Keputusan:

Dengan n =8 memperlihatkan bahwa peluang untuk mendapatkan w+ = 0 dan


W tabel (daerah kritis) ≤ 6 , sehingga tolak H0

 Kesimpulan:

Terapi urokinase benar-benar menurunkan tekanan arteri paru-paru

8.4. Uji Jumlah Peringkat-Bertanda Wilcoxon (Wilcoxon Rank Sum Test)

Uji Peringkat-Bertanda Wilcoxon adalah metode nonparametrik yang sangat


sederhana yang ditemukan oleh Frank Wilcoxon pada tahun 1945 untuk membandingkan
nilai tengah dua populasi bukan normal yang kontinu. Jadi singkatnya uji ini digunakan
untuk menguji hipotesis mengenai beda lokasi median.

Asumsi yang digunakan dalam uji Wilcoxon Rank Sum Test adalah:

1. Data merupakan sampel acak hasil pengamatan X1,X2,..., Xn dari populasi satu dan
sampel acak hasil pengamatan lain Y1,Y2,...,Yn
2. Variabel yang diukur minimal mempunyai skala pengukuan ordinal
3. Variabel yang diukur adalah variabel kontinyu
4. Kedua sampel independen

Prosedur pengujian dalam uji Wilcoxon Rank Sum Test ini adalah:

 Pengujian hipotesis:
H :~
0 μ =~
1 μ 2

H 1 :~
μ1 ≠ ~
μ2
 Tentukan Level of Significance (α)
 Tentukan daerah kritis:
a. Semua nilai U yang memenuhi P(U≤ u´ H 0 benar ¿<α , jika n2 ≤ 8 dan
ujinya satu arah
b. Semua nilai U yang memenuhi 2 P(U≤ u´ H 0 benar ¿<α , jika n2 ≤ 8 dan
ujinya dua arah
c. Semua nilai U ≤ Nilai kritis yang sesuai dalam tabel 17 (buku Walpole),
jika 9 ≤ n2 ≤ 20
 Perhitungan Statistik Uji:
 Tentukan n1 (ukuran sampel yang lebih kecil) dan n2
 Urutkan semua n1 + n2 pengamatan dengan urutan dari kecil ke besar
dan beri ranking 1,2,3 ...n1+n2 pada tiap pengamatan dan jika terdapat
pengamatan yang besarnya sama, maka pengamatan tsb diganti dengan
rata-rata ranking
 Hitung W1= Jumlah ranking pada n1

W2= Jumlah ranking pada n2

( n1+ n2 ) (n1 +n 2+1)


W 1 +W 2 =
2

n1 (n1 +1)
U1 = W 1 -
2

n2 (n2 +1)
U2 = W 2 -
2

 Dan jika n >20 distribusi sampel U 1 dan U2 dapat didekati dengan


distribusi normal dengan:

n1 n2 2 n1 n2 (n1 +n 2+1)
. μU 1= dan σ U1 =
2 12

 Pengambilan Keputusan:

Tolak H0 jika U masuk dalam daerah kritis, dan terima H0 jika U diluar daerah
kritis

 Kesimpulan:

Contoh-4

Berikut ini adalah data kekuatan dua jenis lempeng baja :

Lempeng Baja-X 75 46 57 43 58 32 61 56 34 65
Lempeng Baja-Y 52 41 43 47 32 49 52 44 57 60
Ujilah dengan level signivicance 5% apakah kedua lempeng tsb mempunyai kekuatan yang
berbeda?

Jawab: H 0 :~
μ x =~
μy

H 1 :~
μx ≠ ~
μy

Lempeng Baja-X 75 46 57 43 58 32 61 56 34 65
Ranking 20 8 14,5 5,5 16 1,5 18 13 3 19
Lempeng Baja-Y 52 41 43 47 32 49 52 44 57 60
Ranking 11,5 4 5,5 9 1,5 10 11,5 7 14,5 17

W1 = 1,5+3+5,5+8+13+14,5+16+18+19+20=118,5

( n1+ n2 ) (n1 +n 2+1) – W1 = ( 20 ) (21)


W 2= −118,5=91,5
2 2

n1 (n1 +1) ( 10 ) (11)


U1 = W1 - = 118,5 – =63,5
2 2

n2 (n2 +1) ( 10 ) (11)


U2 = W2 - = 91,5 – =36,5
2 2

 Keputusan:

U2 < U1  Ambil U= 36,5 dimana U tabel = 23

Karena U hitung > U tabel  terima H0

 Kesimpulan:

Tidak terdapat perbedaan kekuatan antara kedua baja tsb atau dengan kata lain
kekuatan lempeng baja X = kekuatan lempeng baja Y

8.7. Uji Kruskal-Wallis

Uji Kruskal-Walls merupakan generalisasi uji dua sampel Wilcoxon untuk k > 2 sampel.
Diperkenalkan pada tahun 1952 oleh W. H Kruskal dan W. A. Wallis, Uji ini digunakan
untuk menguji hipotesis nol (H0) bahwa k sampel bebas berasal dari populasi yang
identik. Uji nonparametrik ini merupakan alternatif bagi uji F untuk pengujian kesamaan
beberapa nilai tengah dalam analisis variansi jila ingin menghindar dari asumsi bahwa
sampel diambil dari populasi normal.

Asumsi yang harus dipenuhi dalam uji Kruskal Wallis adalah:

1. Data untuk analisis terdiri dari k sampel acak yang berukuran n1,n2,n3...,nk
2. Pengamatan-pengamatan bebas baik di dalam maupun diantara sampel-sampel
3. Variabel yang diukur kontinyu
4. Skala pengukuran minimal ordinal
5. Populasi-populasi identik kecuali dalam hal lokasi yang berbeda untuk sekurang-
kurangnya satu populasi

Struktur data dalam uji Kruskal Wallis:

Sampel
1 2 … … k
y 11 y 12 … … y1 k
y 21 y 22 … … y2k
… … …
yn1 yn2 … … y nk

Prosedur untuk memperoleh Statistik Uji:

1. Gabungkan semua sampel n = n1 + n2 + n3+... + nk


2. Urutkan dari kecil ke besar dan beri peringkat, jika terdapat pengamatan yang
sama ambil rata-rata rank/peringkatnya
3. Jumlah peringkat/rank semua pengamatan ni dan nyatakan dengan Ri
4. Hitung :

12
k
Ri 2
H= ∑ −3(n+1)
n( n+1) i=1 ni

5. Jika H jatuh dalam daerah kritis  H > χ α 2 dengan v=k-1 tolak H0, dan jika
sebaliknya terima H0

Contoh- 8

Dalam percobaan untuk menetukan sistem peluru kendali mana yang lebih baik, dilakukan
pengukuran pada laju pembakaran bahan bakarnya. Datanya, setelah dikodekan, diberikan
dalam Tabel 13.3. Gunakan uji Kruskal-Wallis dan taraf nyata α = 0.05 untuk menguji
hipotesis bahwa laju pembakaran bahan bakar sama untuk ketiga sistem tersebut.
Tabel 13.3 Laju Pembakaran Bahan Bakar
Sistem Peluru Kendali
1 2 3
24.0 23.2 18.4
16.7 19.8 19.1
22.8 18.1 17.3
19.8 17.6 17.3
18.9 20.2 19.7
17.8 18.9
18.8
19.3

Jawab

H0: Ketiga populasi identik (mempunyai median yang sama)


H1: Ketiga populasi tidak memiliki median yang sama

Perhitungan: dalam tabel 13.4 kita ubah pengamatan itu menjadi peringkat dan
kemudian menjumlahkan semua peringkat untuk masing-masing sistem.

Tabel 13.Peringkat Bagi Data Laju Pembakaran bahan bakar

Sistem Peluru kendali


1 2 3
19 18 17
1 14.5 11
17 6 2.5
14.5 4 2.5
9.5 16 13
5 9.5
R1 = 61.0 8
R2 = 63.5 12

R3 = 65.5

Sekarang, dengan mensubtitusikan n1 = 5, n2 = 6, n3 = 8, r1 = 63.0, r2 = 63.5, dan r3 = 65.6,


maka kita memperoleh nilai statistik uji H yaitu :

12
k
Ri 2
H= ∑ −3(n+1)
n( n+1) i=1 ni

12 612 63.52 65.52


H= [
19(19+1) 5
+
6
+
8 ]
−3 (19+1)

H = 1.6586

Keputusan: karena H tidak jatuh dalam wilayah kritisnya, yaitu H > 5.991, berarti
tidak cukup bukti untuk menolak hipotesis bahwa laju pembakaran bahan bakar sama
untuk ketiga sistem peluru kendali itu., dengan kata lain terima H0. Jadi ketiga sistem
peluru kendali mempunyai median yang sama.

8.6. Uji Runtun Sampel Tunggal (One Sample Run Test)

Uji runtun adalah uji yang didasarkan atas urutan pengambilan sampel pengamatan. Uji
ini berguna untuk menguji bahwa pengamatan memang diambil secara acak.

Tidak peduli apakah pengamatan tsb kuantitatif atau kualitatif, uji runtun membagi data
menjadi dua kelompok yang saling eksklusif, seperti: laki-laki atau perempuan, cacat
atau tidak cacat, gambar atau angka, diatas atau dibawah median dan lain sebagainya.
Dengan demikian, barisan hasil percobaaanya hanya terdiri atas dua lambang. Jadi
andaikan bahwa n adalah ukuran sampel total, maka n 1 adalah banyaknya lambang yang
lebih sedikit, dan n2 adalah banyaknya lambang yang lebih banyak, maka ukuran sampel
total n = n1 + n2.
Prosedur pengujian dalam uji Runtun ini adalah:

 Pengujian hipotesis:
H 0 : Sampel berasal dari proses acak
H 1 : Sampel tidak berasal dari proses acak
 Tentukan Level of Significance (α)
 Tentukan daerah kritis:
a. Semua nilai V yang memenuhi P(V ≤ v H 0 benar ¿< α , jika n1 dan n2 ≤ 10
dan ujinya satu arah
b. Semua nilai V yang memenuhi 2 P(V≤ v ´ H 0 benar ¿< α , jika jika n1 dan
n2 ≤ 10 dan ujinya dua arah
 Perhitungan Statistik Uji:
 Hitung runtun dari barisan sampel
 Lihat tabel 19 (buku Walpole) dengan n1 dan n2 serta α sesuai dengan
kasus
 Jika n1 dan n2 > 10, distribusi V dapat didekati dengan distribusi Normal
dengan:

2 n1 n2
μv =1+
[ ]
n1+ n2
dan σ 2v =
2 n1 n2 (2 n1 n2−n 1−n2 )
¿¿

Dan Statitik Ujinya adalah:

( V −μ v )
Z=
σv
 Pengambilan Keputusan:

Jika P (Z ) < α maka tolak H0, dan terima H0 jika sebaliknya

 Kesimpulan

Sebagai ilustrasi, misalkan dari 12 orang yang telah disurvey dan ditanyai pendapatnya
terhadap suatu produk tertentu, dan seandainya dari 12 orang tsb ternyata berjenis
kelamin yang sama, hal tersebut pastilah jelas sangat kecil kemungkinannya dihasilkan
dari suatu proses pengambilan yang acak dan sangat diragukan kevalidannya. Di bawah
ini adalah urutan barisan dari kedua belas orang tsb yang diwawancarai, jenis kelamin
laki-laki dilambangkan dengan huruf L dan perempuan dengan lambang huruf P,
L L P P P L L P P L L L

Barisan di atas terdiri dari sampel n = 12, dengan 5 runtun, dimana runtun yang pertama
berupa dua L , yang kedua tiga P, yang ketiga dua L dan demikian seterusnya.

Uji runtun untuk memeriksa keacakan didasarkan pada peubah acak V , yaitu banyaknya
runtun total dalam hasil percobaan atau sampel. Dalam buku Walpole tabel
A.19,menyediakan nilai-nilai P(V ≤ v* bila h0 benar) diberikan untuk v* = 2, 3, ...., 20
runtun, dan nilai-nilai n1 dan n2 yang lebih kecil atau sama dengan 10. Nilai kritis di
salah satu ujung sebaran V dapat diperoleh dari tabel tsb.

Dalam ilustrasi diatas, didapatkan lima P dan tujuh L. Dengan demikian, dengan n 1 = 5
dan n2 = 7, dari Tabel A.19 (buku Walpole)didapatkan bahwa:

P(V ≤ 5 bila h0 benar) = 0.197 untuk pengujian satu arah dan untuk pengujian dua arah

2 P(V ≤ 5 bila h0 benar) = 2( 0.197) = 0.394 > α

Dengan α = 0.05 tidak cukup alasan untuk menolak hipotesis bahwa sampel berasal dari
proses acak (terima H0)

Uji runtun juga dapat digunakan untuk memeriksa sifat keacakan suatu barisan hasil
pengamatan atau percobaan menurut waktu, yang disebabkan oleh kecenderungan atau
periodisitas. Dengan menggantikan setiap pengamatan sesuai dengan urutan terjadinya
dengan tanda plus bila terletak diatas median dan tanda minus bila dibawah median, dan
membuang semua pengamatan yang persis sama dengan median, maka kita mendapatkan
suatu barisan tanda-tanda plus dan minus yang dapat diuji sifat keacakannya seperti
diilustrasikan dalam contoh berikut.

Contoh-6

Sebuah mesin diatur sehingga secara otomatis mengeluarkan minyak pengencer cat ke
dalam sebuah kaleng. Dapatkah kita mengatakan bahwa banyaknya pengencer yang
dikeluarkan oleh mesin ini bervariasi secara acak bila isi 15 kaleng berikut, berturut-
turut, adalah 3.6, 3.9, 4.1, 3.6, 3.8, 3.7, 3.4, 4.0, 3.8, 4.1, 3.9, 4.0, 3.8, 4.2, dan 4.1 liter?
Gunakan taraf nyata 0.1.

Jawab.:

H0: Data diambil secara acak dari sebuah populasi

H1: Data tidak diambil secara acak

Langkah untuk mendapatkan statistik uji :

1. Tulis data hasil pengamatan dalam sampel menurut urutan didapatnya/urutan


terjadinya
2. Tentukan besarnya median sampel
3. Data yang harganya lebih besar dari median diberi tanda positif dan jika sebaliknya
beri tanda negatif
4. Tentukan n1 (misal yang bertanda positif) dan n2 yang bertanda negatif
5. Hitung banyaknya runtun (V)
6. Cari P(V ≤ α bila H0 benar) dengan melihat tabel
7. Jika P(V ≤ α bila H0 benar) ≤ α Tolak H0 untuk uji satu arah dan untuk uji dua arah
Tolak H0 jika 2 P(V ≤ α bila H0 benar) ≤ α

Perhitungan untuk contoh-7 tersebut diperoleh median = 3.9. kemudian dengan


mengganti setiap pengamatan dengan tanda “-“ bila lebih kecil dari 3.9, dan
membuang pengamatan yang sama dengan 3.9, maka diperoleh barisan :

+ - - - - + + + + - + +

dimana didapatkan n1 = 6, n2 = 7, dan v = 6.

Keputusan: P(V ≤ α bila H0 benar) =0.296 > α  Terima H0 (lihat Tabel A.19 buku
Wallpole dengan n1 = 6, n2 = 7, dan v = 6)

Kesimpulan: Karena v = 6 jatuh dalam wilayah penerimaan, maka terima hipotesis


bahwa isi kaleng itu memang bervariasi secara acak.

Uji runtun, meskipun kuasa ujinya lebih rendah, dapat juga digunakan sebagai pilihan
lain bagi uji jumlah peringkat Wilcoxon untuk menguji bahwa dua sampel acak
berasal dari dua populasi yang sama sehingga mempunyai nilai tengah yang sama.
Bila populasinya setangkup, penolakan pendapat bahwa sebenarnya sama setara
dengan penerimaan hipotesis akternatif bahwa kedua nilai tengah tidak sama. Untuk
melakukan uji ini,berikut adalah langkah-langkah pengujiannya:

 Tentukan hipotesis :

H0: Kedua sampel berasal dari populasi yang diambil secara acak

H1: Kedua sampel tidak berasal dari populasi yang diambil secara acak

 Langkah :
1. Gabungkan kedua sampel menjadi sampel berukuran n1 + n2
2. Tulis ke (n1+n2) buah data dari sampel gabungan menurut urutan nilainya
3. Nyatakan data dari sampel ke-1 dengan A dan data dari sampel ke-2 dengan B
4. Hitung banyaknya runtun (v)
5. Cari P(V ≤ α bila H0 benar) dengan melihat tabel
6. Daerah kritis (Daerah penolakan):
 Tolak H0 jika P(V ≤ α bila H0 benar) ≤ α untuk uji satu arah
 Tolak H0 jika 2 P(V ≤ α bila H0 benar) ≤ α untuk uji dua arah
Jika n1 dan n2 > 10 dapat didekati dengan distribusi normal dengan :

2n 1 n2 2n 1 n2 (2 n1 n2−n1−n2 )
μV =
[ ] n1 +n2
+1 dan
2
σ V= 2
( n 1+ n2 ) (n1 +n2 −1)

( V −μV )
Z=
σV

Contoh-7

Data berikut memperlihatkan penyimpangan-penyimpangan temperatur dari suhu


normal, yang setiap hari dicatat di daerah Bandung dan daerah Jakarta selama bulan
April 2010:

Hari 1 2 3 4 5 6 7 8 9 10 11
Bandun Penyimpangan 7 6 5 -2 -1 3 2 -6 -5 8 -4
g Tanda + + + - - + + - - + -
Hari 1 2 3 4 5 6 7 8 9 10 11
Jakarta Penyimpangan 5 8 -3 -7 -9 8 -1 -2 -3 2 3
Tanda + + - - - + - - - + +

Jawab:

H0: Kedua sampel berasal dari populasi yang diambil secara acak

H1: Kedua sampel tidak berasal dari populasi yang diambil secara acak

n1= 11 n2=11 karena n1 dan n2 > 10, sehingga dapat didekati dengan distribusi
normal, dengan:

2 ( 11 ) (11)
μV = [ 11+ 11 ]+1 = 12

2 ( 11 )( 11)( 2(11)(11)−11−11)
σ 2V = = 5.238  σ V =2.2887
( 11+11 )2( 11+11−1)

( V −μV ) (11−12)
Z= = = -0.4369 ≈ -0.44
σV 2,2887

P(Z< -0.44) = 0.33 > α  Terima H0

Kesimpulan: Kedua sampel memang berasal dari populasi yang diambil secara acak

8.8 Koefisien Korelasi Peringkat/ Rank Spearman


Ada kalanya ingin diketahui korelasi antara dua variabel tidak berdasarkan pada
pasangan data dimana nilai sebenarnya diketahui, tetapi menggunakan urutan-urutan nilai
tertentu atau biasa disebut Rank. Teknik korelasi ini digunakan untuk variabel dengan
data bertipe ordinal dan tidak berdistribusi normal, dimana korelasi spearman rank ini
masuk dalam statistika nonparametrik. Selain itu dengan menggunakan teknik ini tidak
lagi harus diasumsikan bahwa hubungan yang mendasari variabel yang satu dengan
variabel yang lain harus linier.

Koefisien korelasi Sperman rank (rs) dapat dihitung dengan menggunakan rumus :

∑ (d ¿¿i )2
i=1
r s=1−6 ¿
n(n2−1)

Dengan:

d i=disparitas/selisih tiap pasang rank

n=banyaknya pasangan data

Dalam prakteknya, rumus diatas tetap digunakan meskipun terdapat nilai-nilai yang sama
diantara pengamatan-pengamatan x atau y. Untuk pengamatan-pengamatan demikian ini
peringkatnya diberikan seperti dalam uji peringkat bertanda Wilcoxon, yaitu dengan
merata-ratakan peringkat yang diberikan seandainya ada pengamatan yang sama.

Nilai rs biasanya dekat dengan nilai r yang diperoleh berdasarkan pengukuran numerik
dan ditafsirkan secara sama pula. Nilai rs dapat terjadi dari – 1 sampai +1. Nilai +1 atau
-1 menunjukkan adanya hubungan yang sempurna antara X dan Y, tanda plus dapat
diartikan bahwa pemberian peringkat itu sejalan, sedangkan tanda minus berarti bahwa
pemberian peringkat itu bertolak belakang. Bila rs dekat dengan nol, dapat disimpulkan
bahwa kedua peubah tidak berkorelasi.
Ada beberapa keuntungan penggunaan rs dibandingkan dengan penggunaan r. Sebagai
contoh, tidak lagi harus mengasumsikan bahwa hubungan yang mendasari antara X dan
Y harus linear. Ini berarti bila datanya menunjukkan adanya hubungan yang kurvilinear,
maka korelasi peringkat cenderung lebih dapat dipercaya daripada korelasi biasa.
Keuntungan kedua adalah tidak perlu mengasumsikan bahwa sebaran bagi X dan Y
adalah normal.

Untuk melakukan uji nyata bagi koefisien korelasi peringkat, harus diketahui sebaran
bagi nilai-nilai rs dibawah asumsi X dan Y bebas. Nilai kritis untuk α = 0.05, 0.025, 0.01,
dan 0.005 telah dihitung dan diberikan dalam Tabel A.22. Tabel ini dibuat menyerupai
tabel nilai kritis bagi sebaran t, kecuali bahwa kolom paling kiri berisi banyaknya
pasangan pengamatan dan bukan derajat bebas. Karena sebaran nilai-nilai rs setangkup
terhadap rs = 0, maka nilai rs yang memberikan luas daerah sebesar α disebelah
kanannya. Bila hipotesis alternatifnya dua-arah, daerah kritis sebesar α dibagi dua sama
besar di kedua ekor sebarannya. Bila hipotesis alternatifnya negatif, maka daerah
kritisnya jatuh seluruhnya di ekor kiri sebaran, dan bila hipotesis alternatifnya positif,
daerah kritisnya jatuh seluruhnya di ekor kanan sebarannya.

Contoh 9

Hitunglah koefisien korelasi antara hasil produksi departemen A dengan departemen B


menggunakan teknik korelasi Spearman Rank!

Hasil Produksi (ton)


Sample
Ke-
Departemen A (x) Departemen B (y)

1 141.8 89.7

2 140.2 74.4
3 131.8 83.5

4 132.5 77.8

5 135.7 85.8

6 141.2 86.5

7 143.2 89.4

8 140.2 89.3

9 140.8 88

10 131.7 82.2

11 130.8 84.6

12 135.6 84.4

13 143.6 86.3

14 133.2 85.9
Jawab:

Sampel Rank Rank


X Y d i=R ( x )−R( y) d i2
ke- (x) (y)

1 141.8 89.7 12 14 -2 4

2 140.2 74.4 8.5 1 7.5 56.25

3 131.8 83.5 3 4 -1 1

4 132.5 77.8 4 2 2 4

5 135.7 85.8 7 7 0 0

6 141.2 86.5 11 10 1 1

7 143.2 89.4 13 13 0 0

8 140.2 89.3 8.5 12 -3.5 12.25

9 140.8 88 10 11 -1 1

10 131.7 82.2 2 3 -1 1

11 130.8 84.6 1 6 -5 25

12 135.6 84.4 6 5 1 1

13 143.6 86.3 14 9 5 25
14 133.2 85.9 5 8 -3 9

∑ 140.5

6 (140,5) 700
r s=1− 2
=1− =1−0,256=0,744
14(14 −1) 2730

Yang menunjukkan adanya korelasi positif yang tinggi antara hasil produksi dari
departemen A dan hasil produksi dari departemen B.

SOAL-SOAL LATIHAN

1. Dari 12 kali berobat ke dokter, seorang pasien harus menunggu 17, 32, 25, 15, 28, 25, 20,
12, 35, 20, 26, dan 24 menit diruang tunggu. Gunakan uji tanda dengan α = 0.05 untuk
menguji pernyataan dokter itu bahwa secara rata-rata pasiennya tidak menunggu lebih
dari 20 menit sebelum dipanggil ke ruang periksa.
2. Data berikut menyatakan lama latihan terbang, dalam jam, yang dijalani 18 calon pilot
dari seorang instruktur sebelum penerbangan solo mereka yang pertama: 9, 12, 13, 12,
10, 11, 18, 16, 13, 14, 11, 15, 12, 9, 13, 14, 11, dan 14. Gunakan uji tanda dengan α
=0.02 untuk menguji pernyataan instruktur tersebut bahwa secara rata-rata calon pilot
bimbingannya berhasil terbang solo setelah 12 jam latihan terbang.

3. Seorang petrugas memeriksa 15 botol selai cap tertentu untuk menetukan persentase
bahan campurannya. Data yang diperoleh adalah sebagai berikut: 2.4, 2.3, 1.7, 1.7, 2.3,
1.2, 1.1, 3.6, 3.1, 1.0, 4.2, 1.6, 2.5, 2.4, dan 2.3. dengan menggunakan hampiran normal
bagi sebaran binom, lakukan uji tanda pada taraf nyata 0.01 untuk menguji hipotesis nol
bahwa presentase bahan campurannya adalah 2.5% lawan alternatifnya bahwa presentase
bahan campuran rata-rata bukan 2.5%.

4. Sebuah perusahaan elektronik internasional sedang mempertimbangkan untuk


memberikan perjalan memberikan liburean berikutnya biayanya bagi para staf
eksekutifsenior dan keluarganya. Untuk menentukan preferensi antara seminggu di
Hawaii atau seminggu di Spanyol, suatu contoh acak 18 staf eksekutif ditanyai
pilihannya. Dengan menggunakan hampiran normal bagi sebaran binom, lakukan uji
tanda taraf nyata 0.05 untuk menguji hipotesis nol bahwa kedua lokasi itu sama- sama
disukai lawan alternatifnya bahwa preferensinya mereka berbeda, bila ternyata 4 diantara
18 yang ditanyai lebih menyukai Spanyol.

5. Seorang pengusaha cat mengeluh bahwa lamanya mengering cat akrilik produksinya
telah berkurang karena adanya sesuatu bahan kimia yang baru. Untuk menguji pendapat
ini, 12 papan kayu dicat, separuh cat lama dan separuh lagi dengan cat baru. Lamanya
mengering, dalam jam, tercatat sebagai berikut:
Papan Lamanya mengering
(jam)
Cat baru Cat lama
1 6.4 6.6
2 5.8 5.8
3 7.4 7.8
4 5.5 5.7
5 6.3 6.0
6 7.8 8.4
7 8.6 8.8
8 8.2 8.4
9 7.0 7.3
10 4.9 5.8
11 5.9 5.8
12 6.5 6.5

Gunakan uji tanda pada taraf nyata 0.05 untuk menguji hipotesis bahwa bahan kimia
baru itu tidak lebih dari yang lama dalam menguramgi lamanya mengering cat jenis ini.

6. Suatu program diet baru dikatakan dapat mengurangi bobot seseorang secara rata-rata 4.5
kilogram dalam waktu 2 minggu. Bobot 10 wanita yang mengikuti program diet ini
dicatat sebelum dan sesudah periode 2 minggu, berikut adalah datanya :
Wanit Bobot sebelum Bobot sesudah
a
1 58.5 60.0
2 60.3 54.9
3 61.7 58.1
4 69.0 62.1
5 64.0 58.5
6 62.6 59.9
7 56.7 54.5
8 63.6 60.2
9 68.2 62.3
10 59.2 58.7

Gunakan uji tanda pada taraf nyata 0.05 untuk menguji hipotesis bahwa diit itu dapat
mengurangi bobot badan seseorang sebanyak 4.5 kilogram, lawan alternatifnya bahwa
pengurangan bobot itu kurang dari 4,5 kilogram.

7. Dua jenis alat untuk mengukur kadar sulfur monoksida di udara hendak dibandingkan.
Berikut ini diberikan hasil pencatatan oleh kedua alat tersebut selama periode 2 minggu:
Hari Sulfur monoksida
Alat A Alat B
1 26.46 25.41
2 17.46 22.53
3 16.32 16.32
4 20.19 27.48
5 19.84 24.97
6 20.65 21.77
7 28.21 28.17
8 33.94 32.02
9 29.32 28.96
10 19.85 20.45
11 28.35 23.67
12 22.78 18.96
13 21.64 19.88
14 18.93 23.44

Dengan menggunakan hampiran normal, kerjakan uji tanda untuk menentukan apakah
kedua alat itu memberikan hasil yang berbeda. Gunakan taraf nyata 0.01.

8. Analisislah data pada soal 1 dengan menggunakan uji peringkat-bertanda Wilcoxon

9. Analisislah data pada soal 2 dengan menggunakan uji peringkat-bertanda Wilcoxon.

10. Bobot badan, dalam kilogram, sepuluh orang sebelum dan sesudah berhenti merokok
tercatat sebagai berikut:
BB sebelum 58 60 62 69 70 64 76 72 66 75
BB setelah 60 55 58 65 69 64 70 67 61 70

Gunakan uji peringkat-bertanda Wilcoxon untuk menguji hipotesis, pada taraf nyata
0.05, bahwa berhenti merokok tidak dapat berpengaruh pada bobot badan seseorang,
lawan alternatifnya bahwa bobot badan seseorang akan bertambah bila ia berhenti
merokok.
11. Analisislah data pada soal 5 dengan menggunakan uji peringkat-bertanda Wilcoxon.

12. Kerjakan kembali pada soal 6 dengan menggunakan uji peringkat-bertanda Wilcoxon.

13. Dari sebuah kelas matematika yang terdiri atas 12 siswa dengan kemampuan yang
hampir sama, 5 orang diambil secara acak dan diberi pelajaran tambahan oleh guru.
Hasil ujian akhir mereka adalah sebagai berikut :

Nilai

Dengan pelajaran tambahan 87 69 78 91 80 85 78


75 88 64 82 93 79 67
Tanpa pelajaran tambahan

Gunakan uji jumlah peringkat Wilcoxon dengan α = 0.05 untuk menetukan apakah
pelajaran tambahan mempengaruhi nilai.

14. Data berikut menyatakan berapa lama, dalam jam, 3 jenis kalkulator ilmiah dapat
digunakan sebelum harus diisi tenaga listrik kembali :

Kalkulator
A B C
4.9 5.5 6.4
6.1 5.4 6.8
4.3 6.2 5.6
4.6 5.8 6.5
5.3 5.5 6.3
5.2 6.6
4.8

Gunakan uji Kruskal-Wallis, pada taraf nyata 0.01, untuk menguji hipotesis bahwa
lamanya ketiga kalkulator itu dapat digunakan sebelum harus diisi listrik kembali
adalah sama.

15. Empat rokok cap A, B, C, dan D hendak dibandingkan kadar tarnya. Data berikut
menunjukkan berapa miligram tar itu ditemukan dalam 16 batang rokok yang dicoba:
Cap A Cap B Cap C Cap D

14 16 16 17
10 18 15 20
11 14 14 19
13 15 12 21
Gunakan uji Kruskal-Wallis, pada taraf nyata 0.05, untuk menguji apakah ada beda
nilaitengah kadar tar yang nyata antar 4 rokok tersebut.

16. Dalam soal 4 halaman 395-6, gunakan uji Kruskal-Wallis, pada taraf nyata 0.05,
untuk menetukan apakah sebaran nilai yang diberikan oleh ketiga dosen itu berbeda
nyata.

17. Dalam latihan 7 halaman 396-7, gunakan uji Kruskal-Wallis, pada taraf nyata 0.05,
untuk menetukan apakah analisis kimia yang dilakukan oleh keempat labolatorium itu
secara rata-rata memberikan hasil yang sama.

18. Suatu contoh acak 15 orang dewasa disuatu kota kecil diambil untuk menduga
proporsi mereka yang mendukung calon walikota yang baru. Selain itu dinyatakan
pula apakah ia sarjana atau bukan. Dengan melambangkan Y bila responden itu
sarjana dan T bila bukan sarjan, diperoleh barisan seperti berikut ini :
TTTTYYTYYTYTTTT
Gunakan uji runtunan pada taraf nyata 0.1 untuk menetukan apakah barisan itu
menunjang pendapat bahwa contohnya bersifat acak atau tidak.

19. Suatu proses pelapisan-perak digunakan untuk melapisi nampan atau baki. Bila
prosesnya terkendali dengan baik, tebal lapisan peraknya bervariasi secara acak
mengikuti sebaran normal dengan nilaitengah 0.02 milimiter dan simpangan baku
0.005 milimiter. Misalkan bahwa dari 12 baki yang diperiksa berikutnya tebal lapisan
peraknya adalah: 0.019, 0.021, 0.020, 0.019, 0.020, 0.018, 0.023, 0.021, 0.024, 0.022,
0.023, 0.022. gunakan uji runtunan untuk menetukan apakah fluktuasi ketebalan itu
masih bersifat acak. Gunakan α = 0.05

20. Gunakan uji runtun pada soal 3 pada halaman 445.

21. Dalam suatu proses produksi, diadakan pemeriksaan secara berkala untuk mengetahui
cacat tidaknya barang yang dihasilkan. Berikut ini adalah barisan barang yang cacat
C, dan yang yidak cacat T yang dihasilkan oleh proses tersebut:
CCTTTCTTCCTTTT
TCCCTTCTTTTCTC
Dengan menggunakan hampiran berdasarkan contoh berukuran besar, lakukan uji
runtunan dengan taraf nyata 0.05, untuk menetukan apakah barang yang cacat terjdi
secara acak atai tidak
22. Bila data dalam Latihan 6 pada halaman 65 dicatat dari kiri ke kanan sesuai dengan
urutan asalnya, gunakan uji runtun dengan α = 0.05 untuk menguji hipotesis bahwa
data itu merupakan suatu barisan yang acak.

23. Data berikut adalah nilai kalkulus pada ujian tengah semester dan ujian akhir bagi 10
mahasiswa :

Mahasiswa UTS UAS

L.S.A 84 73
W.P.B 98 63
R.W.K 91 87
J.R.L 72 66
J.K.L 86 78
D.L.P 93 78
B.L.P 80 91
D.W.M 0 0
M.N.M 92 88
R.H.S 87 77

a. Hitunglah koefisiensi korelasi peringkatnya


b. Ujilah hipotesis bahwa koefisien korelasi peringkatnya sama dengan nol lawan
alternatifnya bahwa koefisien itu lebih besar dari nol. Gunakan α = 0.025.

24. Untuk bobot badan dan ukuran dada bayi dalam saol 6 pada halaman 378
a. Hitunglah koefisien korelasi peringkatnya
b. Ujilah hipotesis pada taraf nyata 0.025 bahwa koefisien korelasi peringkatnya
sama dengan nol lawan alternatifnya bahwa koefisien itu lebih besar dari nol.

25. Hitunglah koefisien korelasi peringkat bagi curah hujan harian dan banyaknya debu
yang terbawa dalam Latihan 8 pada halaman 346.
Suatu lembaga konsumen memeriksa sembilan oven-gelombang-mikro untuk
menentukan kualitasnya. Hasil peringkat berikut harga ecerannya tercantum dibawah
ini:

Pabrik Peringkat Harga (dlm $)

A 6 480
B 9 395
C 2 575
D 8 550
E 5 510
F 1 545
G 7 400
H 4 465
I 3 420

Apakah ada hubungan yang nyata antara kualitas dan harga oven-gelombang-mikro?

26. Dua juri dalam suatu pawai memberi peringkat pada 8 mobil berhias sebagai berikut:

Mobil Berhias
1 2 3 4 5 6 7 8
Juri A 5 8 4 3 6 2 7 1
Juri B 7 5 4 2 8 1 6 3

a. Hitunglah koefisien korelasi peringkatnya.


b. Ujilah hipotesis bahwa koefisien korelasi peringkat populasinya sama dengan
nol lawan hipotesis alternatifnya bahwa koefisien itu lebih besar dari nol.
Gunakan α = 0.05
c. Ujilah hipotesis bahwa X dan Y bebas lawan aktewrnatifnya bahwa kedua
peubah itu tidak bebas, bila dari suatu contoh n = 50 pasangan pengamatan
diperoleh rs = -0.29. gunakan α = 0.05.

27. Dua macam makanan A dan B diberikan kepada ayam secara terpisah untuk jangka
waktu tertentu. Ingin diketahui apakah ada perbedaan yang berarti mengenai
pertambahan berat daging ayam yang dikarenakan kedua macam makanan itu ataukah
tidak. Pertambahan berat badan ayam (dalam ons)pada akhir percobaan adalah
sebagai berikut :

Makanan A 3,1 3,0 3,3 2,9 2,6 3,0 3,6 2,7 3,8 4,0 3,4

Makanan B 2,7 2,9 3,4 3,2 3,3 2,9 3,0 3,0 3,6 3,7 3,5

Selidikilah hal tersebut dengan menggunakan uji tanda.

28. Sepuluh pasang suami istri telah menilai perlombaan memasak. Dalam bentuk
peringkat, hasilnya diberikan dibawah ini.

Suami 5 8 10 6 9 3 4 7 2 1

Istri 8 5 10 1 7 4 6 9 2 3

Apakah nampak sifat “independen” penilaian yang dilakukan oleh suami istri?

29. Diberikan data berikut :

A 1,32 1,28 1,22 1,23 1,16 1,31 1,06 1,23


B 0,99 1,08 0,98 0,96 0,97 0,98 0,89 1,01

Berikanlah analisisnya dengan menggunakn uji median.

30. Sederetan tanaman telah diperiksa yang menghasilkan urutan :

26, 35, 27, 29, 30, 19, 32, 43, 18, 26, 27, 25, 35, 40,26, 25, 22, 20, 17, berasal dari
sebuah populasi dengan median sama dengan 23?

REFERENSI

1. Box,G.E.P , Hunter,Willam, Hunter, J.Stuart : “Statistics For Experimenters”, John


Wiley & Sons.1978
2. Draper, N.R : “ Applied Regression Analysis (Second Edition), John Wiley & sons,
1981
3. Daniel, Wayne.W : “ Applied Nonparametric Statistics, Houghton Mifflin Company,
1978
4. Hogg, Robert V., and Elliot A. Tanis: “Probability and Statistical Inference”, Pearson
Education, 2006
5. Ledolter. J, Hogg, Robert V. : “ Applied Statistics fot Engineers and Physical
Scientists”, Pearson Prentice Hall, 2010.
6. Walpole, Ronald E., et all: “Probability & Statistics for Engineers & Scientists”,
Prentice Hall, 2007
7. Spiegel, Murray R.: “Seri Buku Schaum: Teori dan Soal-Soal Statistika”, Erlangga
(Terjemahan), 1988
8.
9.

Anda mungkin juga menyukai